جزئیات جدید از کارت گرافیک‌ پرچمدار نسل بعد؛ RX 7900 XT در برابر RTX 4090

جمعه 21 آبان 1400 - 20:24

مطالعه 6 دقیقه

شایعات جدیدی در خصوص مشخصات فنی کارت گرافیک پرچم‌دار GeForce RTX 4090 و Radeon RX 7900 XT منتشر شده که اینباره به جزئیات معماری RDNA 3 و Ada Lovelace می‌پردازد.

تبلیغات

Greymon55 در توییتر جزئیات تازه‌ای از مشخصات پرچمداران نسل بعد انویدیا و AMD را به اشتراک گذاشته است. این منبع غیررسمی، مدتی است که به انتشار اطلاعات موثق در رابطه با انواع پردازنده‌های جدید و عرضه نشده می‌پردازد. براین‌اساس گفته می‌شود که کارت گرافیک پرچم‌دار GeForce RTX 4090 مبتنی‌بر پردازنده‌های گرافیکی AD102 با معماری Ada Lovelace تولید می‌شود و در ساختار پرچم‌دار AMD، یعنی Radeon RX 7900 XT نیز از یک پردازنده Navi 31 با معماری RDNA 3 استفاده خواهد شد.

از هر دو GPU انتظار می‌رود پیشرفت چشمگیری را نسبت به نسل قبل ایجاد کرده و البته متعاقبا به پرمصرف‌ترین پردازنده‌های گرافیکی تا به امروز تبدیل شوند.درحالی که انویدیا همچنان طراحی یکپارچه‌ی تراشه‌های گرافیکی خود را در معماری Ada Lovelace حفظ خواهد کرد، AMD قصد دارد با به کارگیری سبک طراحی MCM یا «مولتی چیپ ماژول»، تجربه‌ی موفق خود در عرضه‌ی پردازنده‌های قدرتمند Aldebaran با معماری CDNA 2 برای دیتاسنترها را در محصولات گیمینگ خود نیز تکرار کند.

AMD امسال سبک MCM را هم برای محصولات عمومی و هم برای تراشه‌های رده بالای گیمینگ خود به کار می‌گیرد. حالا و با اشاره به یک پیش زمینه‌ اولیه، به سراغ جزئیات جدیدی که توسط این منبع فاش کننده منتشر شده خواهیم رفت.

کارت گرافیک AMD Radeon RX 7900 XT مبتنی بر پردازنده گرافیکی پرچم‌دار Navi 31 با معماری RDNA 3

پردازنده گرافیکی AMD Navi 31، پرچمداری سری RDNA 3 محسوب می‌شود که در نسل جدید توان گرافیکی Radeon RX 7900 XT را تأمین خواهد کرد. قبلاً شنیده شده که AMD در این نسل CU یا واحدهای محاسباتی را کنار گذاشته و به‌جای آن از WGP یا Work Group Processors استفاده می‌کند. از آنجایی که Navi 31 یک پردازنده MCM محسوب می‌شود، از دو کلید IP برخوردار است شامل یک GCD (یا Graphics Core Die) براساس فرایند ۵ نانومتری TSMC و یک MCD (یا Multi-Cache Die) براساس فناوری ۶ نانومتری TSMC می‌شود. شایعات قبلی از تکمیل فرایند توسعه‌ی تراشه‌های Navi 31 توسط AMD حکایت دارند.

همان‌طور که گفته شد، پیکربندی تراشه‌های Navi 31 شامل دو بخش GCD و یک بخش MCD است که هریک از دای‌های GCD از ۳ شیدر انجین (در مجموع شش Shader Engine) و هر شیدر انجین متشکل از دو آرایه شیدر (Shader Array) است. (در مجموع ۱۲ آرایه SA) اما هریک از این آرایه‌های شیدر میزبان ۵ WGP هستند (تعداد کل WGP ها به ۶۰ عدد می‌رسد) و هر WGP متشکل از ۸ واحد SIMD32 با ۳۲ واحد ALU خواهد بود. (یعنی در جمعا ۴۸۰ واحد SIMD32) این واحدهای SIMD32 نیز با هم تلفیق شده و ۷۶۸۰ هسته در هریک از قسمت‌های GCD و ۱۵۳۶۰ هسته به‌طور کلی را شکل می‌دهند.

از نظر عملکرد این تراشه‌ها نیز باید گفت که انتظار می‌رود سرعت کلاک این GPU به ۲.۴ تا ۲.۵ گیگاهرتز رسیده و عملکرد گرافیکی آن را از نظر تئوری به ۷۵ ترافلاپس برساند. یعنی یک پیشرفت خیره کننده‌ی ۲۲۶ درصدی نسبت به چیزی که در Radeon RX 6900 XT شاهد آن هستیم. دای MCD در تراشه‌های RDNA 3 ازطریق یک رابط داخلی Infinity Fabric به واحد دوگانه‌ی GCD متصل می‌شود که متشکل از ۲۵۶ تا ۵۱۲ مگابایت حافظه Infinity Cache خواهد بود.

علاوه‌براین هر GPU باید از ۴ لینک اتصال حافظه (۳۲ بیت) برخوردار باشد که در نتیجه به ۸ کنترلر حافظه ۳۲ بیت در یک رابط اینترفیس ۲۵۶ بیتی منجر خواهد شد. ادعا شده که این کارت به حداکثر ۳۲ گیگابایت حافظه GDDR6 مجهز خواهد شد که با سرعت پین ۱۸ گیگابیت بر ثانیه و پهنای باند ۵۷۶ گیگابایت بر ثانیه عمل می‌کند. شایعات دیگری که در این خصوص منتشر شده، از به کارگیری فناوری 3D Infinity Cache در محصولات سری RDNA 3 حکایت دارد. در این فناوری تراشه‌های جدید حافظه در یک ساختار عمودی روی GPU قرار می‌گیرند. شبیه به چیزی که در حافظه کش L3 تراشه‌های Vermeer-X شاهد آن بودیم.

مقایسه نسل به نسل پردازنده‌های گرافیکی RDNA

نام GPU	Navi 10	Navi 21	Navi 31
فرایند تولید	7nm	7nm	5nm (6nm?)
پکیج GPU	یکپارچه	یکپارچه	MCD
Shader Engine	2	4	6
WGP	20	40	60
SP به ازای WGP	128	128	256
واحدهای محاسباتی (در هر Die)	40	80	240
تعداد هسته (در هر Die)	2560	5120	15360
گذرگاه حافظه	256bit	256bit	256bit
نوع حافظه	GDDR6	GDDR6	GDDR6
حجم حافظه	8GB	16GB	32GB
Infinity Cache	8GB	16GB	32GB
مدل پرچمدار	Radeon RX 5700 XT	Radeon RX 6900 XTX	Radeon RX 7900 XT
توان مصرفی	225W	330W	350-550W
زمان عرضه	Q3 2019	Q4 2020	Q4 2022

کارت گرافیک GeForce RTX 4090 مبتنی بر پردازنده نسل جدید AD102 با معماری Ada Lovelace

براساس شایعات قبلی، گفته می‌شود که انویدیا در این نسل از پردازنده‌های گرافیکی خود از فناوری تولید ۵ نانومتری TSMC استفاده می‌کند. این موضوع شامل پردازنده AD102 که از یک طراحی کاملاً یکپارچه برخوردار است نیز می‌شود. Greymon55 در توییت جدید خود و جایی که از جزئیات این GPU صحبت کرده، به سرعت کلاک ۲.۵ گیگارهرتز (با سرعت میانگین بوست ۲.۳ گیگارهرتز) تراشه‌ی AD102 اشاره کرده است. بنابراین این مقدار را به‌عنوان اساس محاسبات و پیش‌بینی عملکرد این GPU قرار داده و ادامه می‌دهیم.

ظاهراً پردازنده AD102 از ۱۸۴۳۲ هسته‌ی CUDA برخوردار است که ۱۴۴ واحد SM این تراشه‌ را تشکیل می‌دهند. یعنی حدود دو برابر تعداد هسته‌های پرچم‌دار سری Ampere که همین حالا هم ارتقاء چشمگیری نسبت به سری Turing محسوب می‌شوند. سرعت ۲.۳ تا ۲.۵ گیگاهرتز این پردازنده از نظر تدوری به ۸۵ تا ۹۲ ترافلاپس توان پردازش گرافیکی منجر می‌شود که بیش از دو برابر توان عملکرد ۳۶ ترافلاپسی کارت گرافیک قدرتمند RTX 3090 در نسل فعلی خواهد بود.

پیشرفت ۱۵۰ درصدی عملکرد پردازنده‌های گرافیکی انویدیا، جهش بزرگی محسوب می‌شود اما به‌خاطر داشته باشید که انویدیا در نسل فعلی کارت گرافیک‌های RTX نیز بهبود قابل توجهی را نسبت به نسل قبل تجربه کرده بود. تراشه‌ی پرچم‌دار GA102 که در کارت گرافیک RTX 3090 مورد استفاده قرار می‌گیرد، از ۳۶ ترافلاپس توان پردازش گرافیکی برخوردار است. درحالی که تراشه‌ی TU102 در کارت گرافیک پرچم‌دار RTX 2080 Ti تنها ۱۳ ترافلاپس توان پردازش گرافیکی را ارائه می‌کرد.

این موضوع نشان می‌دهد که خانواده‌ی امپر از نظر تئوری بیش از ۱۵۰ درصد قوی‌تر از سری تورینگ شده بود، درحالی که این اختلاف در واقعیت به ۵۰ تا ۶۰ درصد می‌رسید. بنابراین باید به‌خاطر داشته باشیم که این روزها عدد ترافلاپس مستقیماً بیانگر عملکرد یک پردازنده گرافیکی نخواهد بود. علاوه‌براین، نمی‌دانیم که عدد ۲.۳ تا ۲.۵ گیگاهرتزی دقیقاً مربوط‌به سرعت کلاک متوسط این کارت است یا به حداکثر سرعت بوست آن تعلق دارد که نشان می‌دهد پتانسیل توان محاسباتی AD102 می‌تواند بالاتر از این‌ها باشد.

علاوه‌براین، افشا کننده‌ی این اطلاعات ادعا می‌کند که پرچم‌دار سری NVIDIA GeForce RTX 40 مشابه RTX 3090 از یک رابط گذرگاه ۳۸۴ بیت برخوردار است. اما جالب اینجا است که در اینجا به G6X اشاره شده که یعنی انویدیا در نسل جدید هم به سراغ استاندارد حافظه‌ی جدید نخواهد رفت، تا بعد از سری Ada Lovelace از یک تکنولوژی جدیدتر (مثلاً GDDR7) برای این منظور استفاده کند. این کارت از ۲۴ گیگابایت حافظه استفاده می‌کند که باید انتظار یک ماژول یک طرفه‌ی ۱۶ گیگابایتی DRAM را داشته باشیم یا یک ماژول ۲ دوگانه‌ی ۸ گیگابایتی DRAM.

مقایسه نسل به نسل پردازنده‌های گرافیکی انویدیا

نام GPU	TU102	GA102	AD102
معماری	Turing	Ampere	Ada Lovelace
فناوری ساخت	TSMC 12nm NFF	Samsung 8nm	5nm
کلاسترهای پردازش گرافیکی (GPC)	6	7	12
کلاسترهای پردازش تکسچرها (TPC)	36	42	72
مولتی پردازنده های جریانی	72	84	144
تعداد هسته های CUDA	4608	10752	18432
ترافلاپس تئوری	16.1	37.6	90TFLOPs
نوع حافظه	GDDR6	GDDR6X	GDDR6X
گذرگاه حافظه	384bit	384bit	384bit
ظرفیت حافظه	11GB (2080 Ti)	24GB (3090)	24GB (4090?)
مدل پرچمدار	RTX 2080 Ti	RTX 3090	RTX 4090
توان مصرفی	250W	350W	450-650W
زمان عرضه	Sep. 2018	Sept. 20	2022

پردازنده‌های گرافیکی Ada Lovelace انویدیا، در نسل جدید کارت گرافیک‌های GeForce RTX 40 به رقابت مستقیم با تراشه‌های مبتنی بر معماری RDNA 3 شرکت AMD در کارت گرافیک‌ Radeon RX 7000 خواهند رفت. هنوز هم گمانه‌زنی‌هایی مبنی‌بر احتمال استفاده‌ی انویدیا از سبک معماری MCM شنیده می‌شود. پردازنده‌ی گرافیکی Hopper با ساختار MCM به‌طور ویژه برای دیتا سنترها و تجهیزات مبتنی‌بر هوش مصنوعی توسعه داده شده و به‌زودی فرایند طراحی آن‌ها تکمیل خواهد شد. البته گفته می‌شود که انویدیا فعلاً طراحی MCM را به همین محصولات محدود کرده و در سری Ada Lovelace مورد استفاده قرار نخواهد داد.

وضعیت عملکرد پردازنده های گرافیکی نسل بعد

در پایان می‌‌توانید نظرات خود را در اینباره با زومجی و سایر کاربران در میان بگذارید.

مقاله رو دوست داشتی؟

نظرت چیه؟

مهدی اسدی

داغ‌ترین مطالب روز