// چهار شنبه, ۸ دی ۱۴۰۰ ساعت ۲۳:۵۸

هزینه سنگین انویدیا برای تأمین ویفرهای ۵ نانومتری TSMC در نسل جدید

ظاهراً انویدیا برای پیش خرید ویفرهای ۵ نانومتری TSMC مورد استفاده در نسل جدید پردازنده‌های گرافیکی GeForce RTX 40 هزینه زیادی را متحمل شده است.

همان‌طور که احتمالاً اطلاع دارید، نسل جدید تراشه‌های گرافیکی انویدیا موسوم به Ada Lovelace، توان پردازش گرافیکی محصولات سری GeForce RTX 40 را تأمین می‌کنند و براساس اطلاعاتی که تاکنون به‌دست ما رسیده، قرار است در معماری این GPUها از لیتوگرافی ۵ نانومتری TSMC استفاده شود. هر دو شرکت AMD و انویدیا در نسل جدید محصولات گرافیکی خود از این فرایند تولید استفاده می‌کنند اما به‌نظر می‌رسد که انویدیا قاطعانه در پی کسب اطمینان از تأمین ویفرهای مورد استفاده‌ی خود به میزان کافی است. آن‌ها برای این منظور، چندین میلیارد دلار به‌عنوان پیش پرداخت خرید ویفرهای ۵ نانومتری به این سازنده‌ی تایوانی تراشه‌های نیمه رسانا پرداخت کردند.

براساس گزارش وبسایت MyDrivers، انویدیا تاکنون ۱.۶۴ میلیارد دلار را در سه‌ماهه سوم سال ۲۰۲۱ به TSMC پرداخت کرده و در ادامه قرار است ۱.۷۹ میلیارد دلار دیگر را در سه‌ماهه نخست سال ۲۰۲۲ به حساب این شرکت واریز کند. قرارداد مولتی میلیاردی بین دو شرکت، درنهایت ۶.۹ میلیارد دلار هزینه را برای تیم سبز به‌دنبال خواهد داشت که خیلی بیشتر از چیزی است که سال گذشته برای این منظور هزینه کردند. درواقع انویدیا این رویکرد را علاوه‌بر TSMC در قبال سامسونگ نیز در پیش گرفته اما به‌نظر می‌رسد که بخش زیادی از این هزینه‌ها به تکنولوژی ۵ نانومتری TSMC اختصاص خواهد یافت.

کارت گرافیک NVIDIA GeForce RTX 4090، پرچم‌دار نسل Ada Lovelace مبتنی بر پردازنده گرافیکی AD102

کارت گرافیک RTX 30

براساس شایعاتی که قبلاً در این خصوص منتشر شده، نسل جدید پردازنده‌های گرافیکی انویدیا براساس پروسس نود N5 شرکت TSMC شامل مدل پرچم‌دار AD102 است که در کارت گرافیک رده بالای GeForce RTX 4090 مورد استفاده قرار گرفته و از یک طراحی کاملاً یکپارچه برخوردار است. گفته می‌شود حداکثر فرکانس عملکرد تراشه‌ی گرافیکی AD102 به ۲.۵ گیگاهرتز می‌رسد که مقدار متوسط آن در حالت بوست ۲.۳ گیگاهرتز خواهد بود. البته در متن دقیق این توییت که از سوی یک منبع غیررسمی منتشر شده، به رقم ۲.۳ گیگاهرتز یا بالاتر اشاره شده که فعلاً به‌عنوان معیار پیش‌بینی‌ها در نظر گرفته می‌شود.

تاکنون گفته شده که تراشه‌ی AD102 از ۱۸۴۳۲ هسته CUDA برخوردار است که البته این رقم همچنان قابل تغییر است، اما همین تعداد هسته‌ی محاسباتی در قالب ۱۴۴ واحد SM قرار گرفته و تقریبا ۲ برابر تعداد هسته‌های به کار رفته در پرچم‌دار سری Ampere است که تا همین حالا هم جهش بزرگی نسبت به نسل Turing محسوب می‌شد. سرعت ۲.۳ تا ۲.۵ گیگاهرتز این پردازنده از نظر تئوری به ۸۵ تا ۹۲ ترافلاپس توان پردازش گرافیکی منجر می‌شود که بیش از دو برابر توان عملکرد ۳۶ ترافلاپسی کارت گرافیک قدرتمند RTX 3090 در نسل فعلی خواهد بود.

کارت گرافیک Nvidia RTX

پیشرفت ۱۵۰ درصدی عملکرد پردازنده‌های گرافیکی انویدیا، جهش بزرگی محسوب می‌شود اما به‌خاطر داشته باشید که انویدیا در نسل فعلی کارت گرافیک‌ RTX نیز بهبود قابل توجهی را نسبت به نسل قبل تجربه کرده بود. تراشه‌ی پرچم‌دار GA102 که در کارت گرافیک RTX 3090 مورد استفاده قرار می‌گیرد، از ۳۶ ترافلاپس توان پردازش گرافیکی برخوردار است. درحالی که تراشه‌ی TU102 در کارت گرافیک پرچم‌دار RTX 2080 Ti تنها ۱۳ ترافلاپس توان پردازش گرافیکی را ارائه می‌کرد.

این موضوع نشان می‌دهد که خانواده‌ی امپر از نظر تئوری بیش از ۱۵۰ درصد قوی‌تر از سری تورینگ شده بود، درحالی‌که این اختلاف در واقعیت به ۵۰ تا ۶۰ درصد می‌رسید. بنابراین باید به‌خاطر داشته باشیم که این روزها عدد ترافلاپس مستقیماً بیانگر عملکرد یک پردازنده گرافیکی نخواهد بود. علاوه‌براین، نمی‌دانیم که عدد ۲.۳ تا ۲.۵ گیگاهرتزی دقیقاً مربوط‌به سرعت کلاک متوسط این کارت است یا به حداکثر سرعت بوست آن تعلق دارد که نشان می‌دهد پتانسیل توان محاسباتی AD102 می‌تواند بالاتر از این‌ها باشد.

علاوه‌براین، افشا کننده‌ی این اطلاعات ادعا می‌کند که پرچم‌دار سری NVIDIA GeForce RTX 40 مشابه RTX 3090 از یک رابط گذرگاه ۳۸۴ بیت برخوردار است. اما جالب اینجا است که در اینجا به G6X اشاره شده که یعنی انویدیا در نسل جدید هم به سراغ استاندارد حافظه‌ی جدید نخواهد رفت، تا بعد از سری Ada Lovelace از یک تکنولوژی جدیدتر (مثلاً GDDR7) برای این منظور استفاده کند. این کارت از ۲۴ گیگابایت حافظه استفاده می‌کند که باید انتظار ماژول‌های یک طرفه‌ی ۱۶ گیگابیتی DRAM را داشته باشیم یا ماژول‌های دو طرفه‌ی ۸ گیگابیتی (به بیان دیگر ۱۲ تراشه حافظه در یک طرف برد یا ۲۴ تراشه در دو طرفِ برد).

کارت گرافیک های GeForce RTX 40

مقایسه نسل به نسل پردازنده‌های گرافیکی انویدیا

نام GPU	TU102	GA102	AD102
معماری	Turing	Ampere	Ada Lovelace
فناوری ساخت	TSMC 12nm NFF	Samsung 8nm	5nm
کلاسترهای پردازش گرافیکی (GPC)	6	7	12
کلاسترهای پردازش تکسچرها (TPC)	36	42	72
مولتی پردازنده‌های جریانی	72	84	144
تعداد هسته های CUDA	4608	10752	18432
ترافلاپس تئوری	16.1	37.6	90
نوع حافظه	GDDR6	GDDR6X	GDDR6X
گذرگاه حافظه	384bit	384bit	384bit
ظرفیت حافظه	11GB (2080 Ti)	24GB (3090)	24GB (4090?)
مدل پرچم‌دار	RTX 2080 Ti	RTX 3090	RTX 4090
توان مصرفی	250W	350W	450-650W
زمان عرضه	Sep. 2018	Sept. 20	2022

پردازنده‌های گرافیکی Ada Lovelace انویدیا، در نسل جدید کارت گرافیک‌های GeForce RTX 40 به رقابت مستقیم با تراشه‌های مبتنی‌بر معماری RDNA 3 شرکت AMD در کارت گرافیک‌ Radeon RX 7000 خواهند رفت. هنوز هم گمانه‌زنی‌هایی مبنی‌بر احتمال استفاده‌ی انویدیا از سبک معماری MCM شنیده می‌شود. پردازنده‌ی گرافیکی Hopper با ساختار MCM به‌طور ویژه برای دیتاسنترها و تجهیزات مبتنی‌بر هوش مصنوعی توسعه داده شده و به‌زودی فرایند طراحی آن‌ها تکمیل خواهد شد. البته گفته می‌شود که انویدیا فعلاً طراحی MCM را به همین محصولات محدود کرده و در سری Ada Lovelace مورد استفاده قرار نخواهد داد.

در پایان می‎‌توانید نظرات خود را در اینباره با زومجی و سایر کاربران در میان بگذارید.