بحث و تبادل نظر درمورد سری 700 انویدیا (کپلر بزرگ)
Big Kepler
درود - شرمنده دوستان این چند مدت مشغول کارهایی بودم نتونستم خدمت برسم
GTC 2012 نزدیکه و باز هم شایعات شکل گرفتن - شایعاتی که قدیم هم ایجاد شد و AMD fan ها نه تنها اینجا در ایران بلکه در سایر نقاط دنیا هم با قدرت تمام شروع به مسخره کردن اونها کردن و گفتن (چطور جرات میکنید در مورد این مزخرفات حرف بزنید؟)
خوب مزخرفاتی مثل اینکه 1536 هسته قراره در تراشه ای جای بگیره که از Tahiti هم کوچکتره (اون زمان براورد 320mm2 بود بعد شد 294mm2 و خیلی این رو شوخی قرن دونستن) بعد هم شایعات اغلب میگفت تراشه کمی قویتر از 7950 هست و اصلا در حد تاهیتی xt نیست - عرضه شد و به طور میانگین تا 17% از رقیب سریعتر بود.)
خلاصه این ها همه شایعات بودن و GK104 کوچولوی سری کپلر تمام براورد هارو بهم زد و افسانه ای خلق کرد . اما حقیقتا راستش رو بخواید من اصلا از GK104 یا همون GTX660 واقعی که به نام 680 عرضه شده خوشم نمیومد - این برای Midrange کاران و کسایی که سیستمی در حد مصرف کم و اما کارایی بالا میخوان مناسب بوده و خوب 36% افزایش نسبت به GTX580 و حدود 17% نسبت به حریف بزرگتر - 3GB و 384bit ای خودش تاهیتی با مصرف و دمای تولیدی بسیار کمتر شاهکار مهندسی انودیا برای این رده بود.اما این اصلا برای منی که عادت به تراشه های وحشی و پر سر وصدا پر مصرف دارم راضی کننده نیست
هرچند بارها خدمت دوستان گفتم GK104 جایگاهش اینجا نیست و شاید اگر AMD پرچمدار خودش رو با قدرت خیلی بیشتری ارائه میکرد - انودیا هم مجبور میشد چیزی به نام GK100 رو به عنوان Flag ship سری 600 خودش رونمایی کنه.که متاسفانه این نشد و amd نه تنها این کارو نکرد بلکه قیمت 7970 از 680 هم بالاتر (حدود50$) و هم پر مصرف تر - کند تر - پر صرو صدا تر و .... که این باعث شد انودیا با خیال راحت رده های قیمتی خودش رو توی سر AMD بزنه.
بگذریم . حالا اخبار جدید چی هستن ؟؟ چه خبر از کپلر اصلی ؟؟؟
7Billion transsistor Chip just rumors
6 میلیارد رو فراموش کنید - بیاید فکر کنیم با 7 میلیارد ترانزیستور چه میشه کرد
نظرتون در مورد تراشه ای با 7 میلیارد ترانزیستور چیه؟؟ به نظرتون چنین هیولایی با معماری کپلر چه کارها میتونه بکنه؟؟
خوب انودیا با 3.5 میلیارد ترانزیستور GK104 رو خلق کرد - تراشه ای بسیار کارامد و چندین برابر براورد ها - طوری که حتی هواداران خود انودیا هم فکر همچین چیزیو نمیکردن.اما این 3.5 میلیارد تنها برای رده میانی انودیا بوده .
کوچولو رو فراموش کنید و به Big Kepler بیاندیشید.تراشه ای که طبق شایعات تایید نشده قراره داخل اون از پردازنده های ARM استفاده بشه و هم برای گیمینگ - هم برای Quadro و اعمال GPGPU ,و هم در ابر کامپیوتر های Tesla از اون استفاده بشه.
طبق شایعان در کنفراتس GTC قراره تراشه ای با چنین مشخصاتی رونمایی بشه :
[ برای مشاهده لینک ، با نام کاربری خود وارد شوید یا ثبت نام کنید ]
چیزی که در خبر های مختلف پیش از کنفرانس GTC 2012 عنوان شده اینه که این تراشه بسیار بزرگ خواهد بود و انودیا در طراحی اون ار هیچ تکنولوژی کم کسر نخواهد گذاشت.
تراشه ای که به قول شایعات قدیم توانایی Autonomously processing بالایی به لطف پردازنده arm که در اون وجود داره بهره مند هست و این تراشه درواقع اوج نبوغ مهندسین انودیا خواهد بود.
برخی اطلاعات کلی دیگر :
GeForce GTX 680's GPU core code is GK104. The numerals normally indicate that the GPU is just a 'mid-range' contender
GK110 / GK100 has long been the rumored flagship core code for the Kepler series
195W TDP of the GeForce GTX 680 is yet another telling sign even though it could match and surpass 250W TDP cards from AMD (Radeon HD 7970)
Only 256-bit wide graphics memory interface - again a trait of mid-range GPUs (which luckily for the GTX 680 is somewhat sufficient)
Spare space for extra graphics Molex power connector
خوب نظر شما در مورد شکل کلی اون چه خواهد بود ؟؟
ایا گسترش یافته GK104 و طبق شایعات با 12 فروند : دی SMX که مجموع هسته های اون رو به عدد 2304 عدد میرسونه؟؟
تصویر GF104 منبع طراحی نسل کپلر GK104 که در زیر هست:
تصویر GK104 با 8SMX گسترش یافته نسل GF104/114
تصویر احتمالی و فیک GK110 با 12SMX
خوب طبق براورد ها در بدترین حالت اضافه کردن 50% هسته های بیشتر یعنی اضافه کردن 505 ترانزیستور بیشتر و این برای تصویر بالا یعنی تنها 5.3 میلیارد ترانزیستور -. اگر قرار به افزایش SCALE این gk104 باشه و طبق شایعات قراره با 7 میلیارد ترانزیستور - یعنی 100% افزایش تعداد ترانزیستور ها .پس میتونیم تراشه ای با 14SMX متصور بشیم.
(هرچند بسیار بسیار بعید هست)
تصویر فیک و احتمالی GK110 با 14SMX :
خوب تا اینجا همه چیز احتمال بود و البته شایعات . اما تجریه نشون داده انودیا در نود های مختلف از یک معماری استفاده نمیکنه.این نکته ای هست که باید توجه داشت.
به چند دلیل احتمال حقیقی شدن تصاویر بالا بسیار بعیده به دلایل زیر:
1: تکنیک smx های موجود در GK104 بسیار مناسب هست و برای بازی بازدهی وحشتناکی داره - اما برای اعمال gpgpu-computing قطعا بازدهی خوبی نداره.
2: احتمال بسیار زیاد GK110 بر اساس نوع گسترش یافته GF100/110 خواهد بود نه GK104 که گسترش یافته GF104/114 هست.
3:کپلر بزرگ یا BigK قراره هم توان GPGPU خوبی داشته باشه هم توان گیمینگ - این وظیفه قطعا از عهده smx های با control unit ضعیف نسبت به نسل فرمی بر نمیاد و انودیا به دنبال SM هایی با Control unit پیشرفته در حد نسل فبلی خواهد بود.
4: احتمال زیاد تعداد هسته ها 2048 عدد خواهد بود - هر sm در فرمی 32 هسته داشت و 4 برابر اون میشه sm هایی با 128 هسته. اگر 16sm در تراشه باشه تعداد هسته ها به 2048 میرسه.
5:یه احتمال دیگه هم گزارش نزدیک به 2500 هسته بودن GK110 رو داده که اگر تعداد هسته ای هر SM رو به 160 عدد برسونیم بر پایه GF100/110 اونوقت به 2560 هسته این کانفیگ هم نزدیک میشیم.
حرف اخر:
GK110 هر چیز باشه قطعا هیولایی خواهد بود که انودیا رو در بازار HPC-Quadro ها سربلند خواهد کرد و فروش خودش رو در اون بخش ها طبق پیش بینی انتظار HPC سازان براورد خواهد کرد.
تا کنفرانس GTC 2012 صبر میکنیم ببنیم BIG K چه از اب در خواهد امد.
------------------------------------
خلاصه ویژگی های احتمالی Big Kepler : (احتمالی و شایعات)
1: در این تراشه قراره از پردازنده های ARM به منظور توان خودکفایی GPU بدون نیاز به CPU برای انجام اعمال مورد خودش نیازش استفاده بشه.0احتمال 99% از نسل Cortex A15 هست چون A9 کلا برای Node 40nm هست.
2: در این تراشه چیزی بین 6 الی 7 میلیارد ترانزیستور قراره استفاده بشه ( 2برابر GK104 در رده میانی انودیا)
3: این تراشه هم برای GPGPU - HPC ها مناسب خواهد بود و هم برای مصارف Gaming
4: توان مصرفی این تراشه جیزی بین 250w-300w هست .
5:این تراشه طبق برنامه ها برای اگوست اماده به کار هست اما زمان عرضه اون دقیق مشخص نیست.
وقتی مدیرعامل AMD هم انودیا فن میشود :دی
ایا CEO برند AMD جناب روری رید هم انودیا فن میشود؟؟ خوب اگر انسان ازاده ای باشه چرا که نه ؟؟اگر پیشرفت حریف اونقدر زیاد باشه که از تمام براورد تحلیلگران هم بیشتر خوب چرا که نه. :mrgreen:
خیلی وقت پیش بعد از شروع درگیری های مناقصه American Exa scale SC برای دارپا چندین شرکت و دانشگاه ها و موسسات معتبر امریکایی وارد گود رقابت شدن تا برای طراحی تراشه هایی با توان محاسباتی موثر بالا و مصرف بسیار پایین به نسبت بازدهی با هم رقابت کنن.(دانشگا ها و موسساتی مثل MIT و Sandia National Labs و یا شرکت های طراح تراشه مثل INTEL و NVIDIA از جمله رقبای مهم هستن)
چیزی که مشخص بود انودیا همیشه خودش رو به عنوان World leader off visual computing معرفی کرده و خوب با سرمایه و تجربه عظیم این شرکت قطعا هیچ کدوم شانس زیادی در برابر انودیا نداشتن - انودیا با ارائه Echelon project اولین قدم های ultra high perfomence computing chip رو برداشته و تراشه ای طراحی کرد که بیش از 20 برابر فرمی performenc/watt داشت و مشخصات اون فعلا در حوصله اینجا نمیگنجه و این موضوع خیلی قدیمی هست. بعد اگر علاقه ای وجود داشت شاید بیشتر درمورد طرح های نسل اینده انودیا صحبت میکنم.
اما خوب این بحث ها چه ربطی به GK110 داشت؟؟ همونطور که میدونیم طبق نقشه راه انودیا انویدیا با سرعت وحشتناکی به سمت Performance/Watt بالا حرکت میکنه طوری که dp/watt برای کپلر بین 5-6 برابر پیش بینی میشد و برای ماکسول هم تا 16 برابر نسل فرمی-تسلا .
اما ایا این واقعا امکان پذیره؟؟
خوب بیاید با هم به خبر های (البته بیشتر شایعات) جدید نگاهی کنیم ببنیم که ایا امکان پذیر هست یا نه.
-----------------------------------------------------------------------------------------------
Monstrous Kepler
2304 هسته یا 2506 هسته رو فراموش کنیم. نظر شما در باره 3072 هسته چی هست؟؟؟
طبق شایعات مشخصات جدید اینها هستن:
3072 هسته
1 : این 3072 هسته در 6 کلاستر یعنی 6GPC قرار گرفتن.
2: هر GPC شامل 512 هسته هست .
3 : هر GPC متشکل از 4 عدد SMK هست ( نام حدید SM های GK110 که در GK104 با نام SMX دیدیم)
4 : هر SMK شامل 128 هسته هست که در 4 گروه 32 تایی قرار گرفتن.
5 : 2 تا از هر یک از اون گروه ها توانایی محاسبه dp floating point هارو دارن.
6 : هر SMK دارای یک پردازشگر فیزیک مخصوص به خود هست :eek:
این هم تصویر فرضی و کاملا fake چون اینجا هر sm داری 96 هسته هست.اما خوب 6GPC بودن و هر GPC دارای 4 SM بودن کمی اونو شبیه میکنه.
اینم مشخصات :
3072 ALUs
-> 6x GPCs (à 512 SPs)
--> 4 SMK to each GPC, 128 ALUs/SMK
--> each SMK has
---> 4 groups of 32 ALUs
----> two of which are 64 Bit capable, re-using data-paths from the other ALUs
----> two groups share a quad TMU
----> 4x 32 kiB L1-Cache shared among the ALU blocks, configurable as scratchpad memory in block sizes of 32 kiB.
512 Bit MI
-> 8x 64-Bit memory partitions
-> 4 GiB default memory size for gaming cards, twice for Tesla, Quadro
-> (probably) 2048, rather still 1024 kiB L2-Cache
فرکانس هسته تراشه روی 850mhz هست و احتمالا TDP کارت چیزی در حد 300W هست .
چنین تراشه ای با این مشخصات در فرکانس 1GHZ احتمالا میتونه تا 20% از GTX690 سریعتر باشه .(خواب نمیبینید با این مشخصه ها یک Single GPU میتونه 2 هسته ای هم نسل خودش رو نابود کنه-)
علتش هم اینه که SMK ها کوچک ترن پس نرخ Core starvation بسیار کمتری نسبت به GK104 داره . بنابر این به طور کلی Core occupation تراشه نسبت به GK104 بسیار بالاست. چنین تراشه ای بشدت EU intensivity اش کاهش پیدا میکنه و حجم EU/CU اون بالانس میشن که نتیجش قدرتی مهیب(به معنای واقعی کلمه مهیب) میشن.شما اگر صاحب برند رقیب amd هم باشی باید برای چنین چیزی سر خم کنی واقعا واجب السجوده :mrgreen:
اگر انودیا بتونه چنین مشخصاتی رو در GK110 قرار بده از فردا روی بازوی rory read مدیر عامل amd و دشمن خونی nvidia هم مثل Jen-Hsun Huang باید مثل تصویر زیر خالکوبی انودیا ببنیم: (بلاخره انسان های ازاده هم تغییر میکنن :mrgreen: )
[ برای مشاهده لینک ، با نام کاربری خود وارد شوید یا ثبت نام کنید ]
من شخصا ارزوم اینه که اینها واقعی باشه اما راستش قلبا میدونم خیلی بعیده (عللش بسیار زیاد و مفصله و راستش حوصله گفتن ندارم:smile: )
اما خوب از انودیا همه چی بر میاد چه از 3 برابر کردن تعداد هسته ها تنها با افزایش 16% تعداد ترانزیستور.اما اینجا تعداد SM ها بسیار بیشتر شدن و خوب نرخ CU ]ا بسیار زیاد شدن بنا بر این خیلی خیلی این مشخصات بعیده.
حالا صبر میکنیم ببنیم حقیقت پیدا میکنه یا نه