هزینه سنگین انویدیا برای تأمین ویفرهای ۵ نانومتری TSMC در نسل جدید
ظاهراً انویدیا برای پیش خرید ویفرهای ۵ نانومتری TSMC مورد استفاده در نسل جدید پردازندههای گرافیکی GeForce RTX 40 هزینه زیادی را متحمل شده است.
همانطور که احتمالاً اطلاع دارید، نسل جدید تراشههای گرافیکی انویدیا موسوم به Ada Lovelace، توان پردازش گرافیکی محصولات سری GeForce RTX 40 را تأمین میکنند و براساس اطلاعاتی که تاکنون بهدست ما رسیده، قرار است در معماری این GPUها از لیتوگرافی ۵ نانومتری TSMC استفاده شود. هر دو شرکت AMD و انویدیا در نسل جدید محصولات گرافیکی خود از این فرایند تولید استفاده میکنند اما بهنظر میرسد که انویدیا قاطعانه در پی کسب اطمینان از تأمین ویفرهای مورد استفادهی خود به میزان کافی است. آنها برای این منظور، چندین میلیارد دلار بهعنوان پیش پرداخت خرید ویفرهای ۵ نانومتری به این سازندهی تایوانی تراشههای نیمه رسانا پرداخت کردند.
براساس گزارش وبسایت MyDrivers، انویدیا تاکنون ۱.۶۴ میلیارد دلار را در سهماهه سوم سال ۲۰۲۱ به TSMC پرداخت کرده و در ادامه قرار است ۱.۷۹ میلیارد دلار دیگر را در سهماهه نخست سال ۲۰۲۲ به حساب این شرکت واریز کند. قرارداد مولتی میلیاردی بین دو شرکت، درنهایت ۶.۹ میلیارد دلار هزینه را برای تیم سبز بهدنبال خواهد داشت که خیلی بیشتر از چیزی است که سال گذشته برای این منظور هزینه کردند. درواقع انویدیا این رویکرد را علاوهبر TSMC در قبال سامسونگ نیز در پیش گرفته اما بهنظر میرسد که بخش زیادی از این هزینهها به تکنولوژی ۵ نانومتری TSMC اختصاص خواهد یافت.
کارت گرافیک NVIDIA GeForce RTX 4090، پرچمدار نسل Ada Lovelace مبتنی بر پردازنده گرافیکی AD102
براساس شایعاتی که قبلاً در این خصوص منتشر شده، نسل جدید پردازندههای گرافیکی انویدیا براساس پروسس نود N5 شرکت TSMC شامل مدل پرچمدار AD102 است که در کارت گرافیک رده بالای GeForce RTX 4090 مورد استفاده قرار گرفته و از یک طراحی کاملاً یکپارچه برخوردار است. گفته میشود حداکثر فرکانس عملکرد تراشهی گرافیکی AD102 به ۲.۵ گیگاهرتز میرسد که مقدار متوسط آن در حالت بوست ۲.۳ گیگاهرتز خواهد بود. البته در متن دقیق این توییت که از سوی یک منبع غیررسمی منتشر شده، به رقم ۲.۳ گیگاهرتز یا بالاتر اشاره شده که فعلاً بهعنوان معیار پیشبینیها در نظر گرفته میشود.
تاکنون گفته شده که تراشهی AD102 از ۱۸۴۳۲ هسته CUDA برخوردار است که البته این رقم همچنان قابل تغییر است، اما همین تعداد هستهی محاسباتی در قالب ۱۴۴ واحد SM قرار گرفته و تقریبا ۲ برابر تعداد هستههای به کار رفته در پرچمدار سری Ampere است که تا همین حالا هم جهش بزرگی نسبت به نسل Turing محسوب میشد. سرعت ۲.۳ تا ۲.۵ گیگاهرتز این پردازنده از نظر تئوری به ۸۵ تا ۹۲ ترافلاپس توان پردازش گرافیکی منجر میشود که بیش از دو برابر توان عملکرد ۳۶ ترافلاپسی کارت گرافیک قدرتمند RTX 3090 در نسل فعلی خواهد بود.
پیشرفت ۱۵۰ درصدی عملکرد پردازندههای گرافیکی انویدیا، جهش بزرگی محسوب میشود اما بهخاطر داشته باشید که انویدیا در نسل فعلی کارت گرافیک RTX نیز بهبود قابل توجهی را نسبت به نسل قبل تجربه کرده بود. تراشهی پرچمدار GA102 که در کارت گرافیک RTX 3090 مورد استفاده قرار میگیرد، از ۳۶ ترافلاپس توان پردازش گرافیکی برخوردار است. درحالی که تراشهی TU102 در کارت گرافیک پرچمدار RTX 2080 Ti تنها ۱۳ ترافلاپس توان پردازش گرافیکی را ارائه میکرد.
این موضوع نشان میدهد که خانوادهی امپر از نظر تئوری بیش از ۱۵۰ درصد قویتر از سری تورینگ شده بود، درحالیکه این اختلاف در واقعیت به ۵۰ تا ۶۰ درصد میرسید. بنابراین باید بهخاطر داشته باشیم که این روزها عدد ترافلاپس مستقیماً بیانگر عملکرد یک پردازنده گرافیکی نخواهد بود. علاوهبراین، نمیدانیم که عدد ۲.۳ تا ۲.۵ گیگاهرتزی دقیقاً مربوطبه سرعت کلاک متوسط این کارت است یا به حداکثر سرعت بوست آن تعلق دارد که نشان میدهد پتانسیل توان محاسباتی AD102 میتواند بالاتر از اینها باشد.
علاوهبراین، افشا کنندهی این اطلاعات ادعا میکند که پرچمدار سری NVIDIA GeForce RTX 40 مشابه RTX 3090 از یک رابط گذرگاه ۳۸۴ بیت برخوردار است. اما جالب اینجا است که در اینجا به G6X اشاره شده که یعنی انویدیا در نسل جدید هم به سراغ استاندارد حافظهی جدید نخواهد رفت، تا بعد از سری Ada Lovelace از یک تکنولوژی جدیدتر (مثلاً GDDR7) برای این منظور استفاده کند. این کارت از ۲۴ گیگابایت حافظه استفاده میکند که باید انتظار ماژولهای یک طرفهی ۱۶ گیگابیتی DRAM را داشته باشیم یا ماژولهای دو طرفهی ۸ گیگابیتی (به بیان دیگر ۱۲ تراشه حافظه در یک طرف برد یا ۲۴ تراشه در دو طرفِ برد).
مقایسه نسل به نسل پردازندههای گرافیکی انویدیا
نام GPU | TU102 | GA102 | AD102 |
معماری | Turing | Ampere | Ada Lovelace |
فناوری ساخت | TSMC 12nm NFF | Samsung 8nm | 5nm |
کلاسترهای پردازش گرافیکی (GPC) | 6 | 7 | 12 |
کلاسترهای پردازش تکسچرها (TPC) | 36 | 42 | 72 |
مولتی پردازندههای جریانی | 72 | 84 | 144 |
تعداد هسته های CUDA | 4608 | 10752 | 18432 |
ترافلاپس تئوری | 16.1 | 37.6 | 90 |
نوع حافظه | GDDR6 | GDDR6X | GDDR6X |
گذرگاه حافظه | 384bit | 384bit | 384bit |
ظرفیت حافظه | 11GB (2080 Ti) | 24GB (3090) | 24GB (4090?) |
مدل پرچمدار | RTX 2080 Ti | RTX 3090 | RTX 4090 |
توان مصرفی | 250W | 350W | 450-650W |
زمان عرضه | Sep. 2018 | Sept. 20 | 2022 |
پردازندههای گرافیکی Ada Lovelace انویدیا، در نسل جدید کارت گرافیکهای GeForce RTX 40 به رقابت مستقیم با تراشههای مبتنیبر معماری RDNA 3 شرکت AMD در کارت گرافیک Radeon RX 7000 خواهند رفت. هنوز هم گمانهزنیهایی مبنیبر احتمال استفادهی انویدیا از سبک معماری MCM شنیده میشود. پردازندهی گرافیکی Hopper با ساختار MCM بهطور ویژه برای دیتاسنترها و تجهیزات مبتنیبر هوش مصنوعی توسعه داده شده و بهزودی فرایند طراحی آنها تکمیل خواهد شد. البته گفته میشود که انویدیا فعلاً طراحی MCM را به همین محصولات محدود کرده و در سری Ada Lovelace مورد استفاده قرار نخواهد داد.
در پایان میتوانید نظرات خود را در اینباره با زومجی و سایر کاربران در میان بگذارید.