نویسنده: مهدی اسدی
// جمعه, ۲۱ آبان ۱۴۰۰ ساعت ۲۰:۲۴

جزئیات جدید از کارت گرافیک‌ پرچمدار نسل بعد؛ RX 7900 XT در برابر RTX 4090

شایعات جدیدی در خصوص مشخصات فنی کارت گرافیک پرچم‌دار GeForce RTX 4090 و Radeon RX 7900 XT منتشر شده که اینباره به جزئیات معماری RDNA 3 و Ada Lovelace می‌پردازد.

Greymon55 در توییتر جزئیات تازه‌ای از مشخصات پرچمداران نسل بعد انویدیا و AMD را به اشتراک گذاشته است. این منبع غیررسمی، مدتی است که به انتشار اطلاعات موثق در رابطه با انواع پردازنده‌های جدید و عرضه نشده می‌پردازد. براین‌اساس گفته می‌شود که کارت گرافیک پرچم‌دار GeForce RTX 4090 مبتنی‌بر پردازنده‌های گرافیکی AD102 با معماری Ada Lovelace تولید می‌شود و در ساختار پرچم‌دار AMD، یعنی Radeon RX 7900 XT نیز از یک پردازنده Navi 31 با معماری RDNA 3 استفاده خواهد شد.

از هر دو GPU انتظار می‌رود پیشرفت چشمگیری را نسبت به نسل قبل ایجاد کرده و البته متعاقبا به پرمصرف‌ترین پردازنده‌های گرافیکی تا به امروز تبدیل شوند.درحالی که انویدیا همچنان طراحی یکپارچه‌ی تراشه‌های گرافیکی خود را در معماری Ada Lovelace حفظ خواهد کرد، AMD قصد دارد با به کارگیری سبک طراحی MCM یا «مولتی چیپ ماژول»، تجربه‌ی موفق خود در عرضه‌ی پردازنده‌های قدرتمند Aldebaran با معماری CDNA 2 برای دیتاسنترها را در محصولات گیمینگ خود نیز تکرار کند.

AMD امسال سبک MCM را هم برای محصولات عمومی و هم برای تراشه‌های رده بالای گیمینگ خود به کار می‌گیرد. حالا و با اشاره به یک پیش زمینه‌ اولیه، به سراغ جزئیات جدیدی که توسط این منبع فاش کننده منتشر شده خواهیم رفت.

کارت گرافیک AMD Radeon RX 7900 XT مبتنی بر پردازنده گرافیکی پرچم‌دار Navi 31 با معماری RDNA 3

کارت گرافیک نسل جدید AMD

پردازنده گرافیکی AMD Navi 31، پرچمداری سری RDNA 3 محسوب می‌شود که در نسل جدید توان گرافیکی Radeon RX 7900 XT را تأمین خواهد کرد. قبلاً شنیده شده که AMD در این نسل CU یا واحدهای محاسباتی را کنار گذاشته و به‌جای آن از WGP یا Work Group Processors استفاده می‌کند. از آنجایی که Navi 31 یک پردازنده MCM محسوب می‌شود، از دو کلید IP برخوردار است شامل یک GCD (یا Graphics Core Die) براساس فرایند ۵ نانومتری TSMC و یک MCD (یا Multi-Cache Die) براساس فناوری ۶ نانومتری TSMC می‌شود. شایعات قبلی از تکمیل فرایند توسعه‌ی تراشه‌های Navi 31 توسط AMD حکایت دارند.

همان‌طور که گفته شد، پیکربندی تراشه‌های Navi 31 شامل دو بخش GCD و یک بخش MCD است که هریک از دای‌های GCD از ۳ شیدر انجین (در مجموع شش Shader Engine) و هر شیدر انجین متشکل از دو آرایه شیدر (Shader Array) است. (در مجموع ۱۲ آرایه SA) اما هریک از این آرایه‌های شیدر میزبان ۵ WGP هستند (تعداد کل WGP ها به ۶۰ عدد می‌رسد) و هر WGP متشکل از ۸ واحد SIMD32 با ۳۲ واحد ALU خواهد بود. (یعنی در جمعا ۴۸۰ واحد SIMD32) این واحدهای SIMD32 نیز با هم تلفیق شده و ۷۶۸۰ هسته در هریک از قسمت‌های GCD و ۱۵۳۶۰ هسته به‌طور کلی را شکل می‌دهند.

از نظر عملکرد این تراشه‌ها نیز باید گفت که انتظار می‌رود سرعت کلاک این GPU به ۲.۴ تا ۲.۵ گیگاهرتز رسیده و عملکرد گرافیکی آن را از نظر تئوری به ۷۵ ترافلاپس برساند. یعنی یک پیشرفت خیره کننده‌ی ۲۲۶ درصدی نسبت به چیزی که در Radeon RX 6900 XT شاهد آن هستیم. دای MCD در تراشه‌های RDNA 3 ازطریق یک رابط داخلی Infinity Fabric به واحد دوگانه‌ی GCD متصل می‌شود که متشکل از ۲۵۶ تا ۵۱۲ مگابایت حافظه Infinity Cache خواهد بود.

علاوه‌براین هر GPU باید از ۴ لینک اتصال حافظه (۳۲ بیت) برخوردار باشد که در نتیجه به ۸ کنترلر حافظه ۳۲ بیت در یک رابط اینترفیس ۲۵۶ بیتی منجر خواهد شد. ادعا شده که این کارت به حداکثر ۳۲ گیگابایت حافظه GDDR6 مجهز خواهد شد که با سرعت پین ۱۸ گیگابیت بر ثانیه و پهنای باند ۵۷۶ گیگابایت بر ثانیه عمل می‌کند. شایعات دیگری که در این خصوص منتشر شده، از به کارگیری فناوری 3D Infinity Cache در محصولات سری RDNA 3 حکایت دارد. در این فناوری تراشه‌های جدید حافظه در یک ساختار عمودی روی GPU قرار می‌گیرند. شبیه به چیزی که در حافظه کش L3 تراشه‌های Vermeer-X شاهد آن بودیم.

مقایسه نسل به نسل پردازنده‌های گرافیکی RDNA

نام GPU

Navi 10Navi 21Navi 31
فرایند تولید7nm7nm5nm (6nm?)
پکیج GPUیکپارچهیکپارچهMCD
Shader Engine246
WGP204060
SP به ازای WGP128128256
واحدهای محاسباتی (در هر Die)4080240
تعداد هسته (در هر Die)2560512015360
گذرگاه حافظه 256bit256bit256bit
نوع حافظهGDDR6GDDR6GDDR6
حجم حافظه8GB16GB32GB
Infinity Cache8GB16GB32GB
مدل پرچمدار Radeon RX 5700 XTRadeon RX 6900 XTXRadeon RX 7900 XT
توان مصرفی225W330W350-550W
زمان عرضهQ3 2019Q4 2020Q4 2022

کارت گرافیک GeForce RTX 4090 مبتنی بر پردازنده نسل جدید AD102 با معماری Ada Lovelace

کارت گرافیک پرچمدار انویدیا

براساس شایعات قبلی، گفته می‌شود که انویدیا در این نسل از پردازنده‌های گرافیکی خود از فناوری تولید ۵ نانومتری TSMC استفاده می‌کند. این موضوع شامل پردازنده AD102 که از یک طراحی کاملاً یکپارچه برخوردار است نیز می‌شود. Greymon55 در توییت جدید خود و جایی که از جزئیات این GPU صحبت کرده، به سرعت کلاک ۲.۵ گیگارهرتز (با سرعت میانگین بوست ۲.۳ گیگارهرتز) تراشه‌ی AD102 اشاره کرده است. بنابراین این مقدار را به‌عنوان اساس محاسبات و پیش‌بینی عملکرد این GPU قرار داده و ادامه می‌دهیم.

ظاهراً پردازنده AD102 از ۱۸۴۳۲ هسته‌ی CUDA برخوردار است که ۱۴۴ واحد SM این تراشه‌ را تشکیل می‌دهند. یعنی حدود دو برابر تعداد هسته‌های پرچم‌دار سری Ampere که همین حالا هم ارتقاء چشمگیری نسبت به سری Turing محسوب می‌شوند. سرعت ۲.۳ تا ۲.۵ گیگاهرتز این پردازنده از نظر تدوری به ۸۵ تا ۹۲ ترافلاپس توان پردازش گرافیکی منجر می‌شود که بیش از دو برابر توان عملکرد ۳۶ ترافلاپسی کارت گرافیک قدرتمند RTX 3090 در نسل فعلی خواهد بود.

پیشرفت ۱۵۰ درصدی عملکرد پردازنده‌های گرافیکی انویدیا، جهش بزرگی محسوب می‌شود اما به‌خاطر داشته باشید که انویدیا در نسل فعلی کارت گرافیک‌های RTX نیز بهبود قابل توجهی را نسبت به نسل قبل تجربه کرده بود. تراشه‌ی پرچم‌دار GA102 که در کارت گرافیک RTX 3090 مورد استفاده قرار می‌گیرد، از ۳۶ ترافلاپس توان پردازش گرافیکی برخوردار است. درحالی که تراشه‌ی TU102 در کارت گرافیک پرچم‌دار RTX 2080 Ti تنها ۱۳ ترافلاپس توان پردازش گرافیکی را ارائه می‌کرد.

این موضوع نشان می‌دهد که خانواده‌ی امپر از نظر تئوری بیش از ۱۵۰ درصد قوی‌تر از سری تورینگ شده بود، درحالی که این اختلاف در واقعیت به ۵۰ تا ۶۰ درصد می‌رسید. بنابراین باید به‌خاطر داشته باشیم که این روزها عدد ترافلاپس مستقیماً بیانگر عملکرد یک پردازنده گرافیکی نخواهد بود. علاوه‌براین، نمی‌دانیم که عدد ۲.۳ تا ۲.۵ گیگاهرتزی دقیقاً مربوط‌به سرعت کلاک متوسط این کارت است یا به حداکثر سرعت بوست آن تعلق دارد که نشان می‌دهد پتانسیل توان محاسباتی AD102 می‌تواند بالاتر از این‌ها باشد.

علاوه‌براین، افشا کننده‌ی این اطلاعات ادعا می‌کند که پرچم‌دار سری NVIDIA GeForce RTX 40 مشابه RTX 3090 از یک رابط گذرگاه ۳۸۴ بیت برخوردار است. اما جالب اینجا است که در اینجا به G6X اشاره شده که یعنی انویدیا در نسل جدید هم به سراغ استاندارد حافظه‌ی جدید نخواهد رفت، تا بعد از سری Ada Lovelace از یک تکنولوژی جدیدتر (مثلاً GDDR7) برای این منظور استفاده کند. این کارت از ۲۴ گیگابایت حافظه استفاده می‌کند که باید انتظار یک ماژول یک طرفه‌ی ۱۶ گیگابایتی DRAM را داشته باشیم یا یک ماژول ۲ دوگانه‌ی ۸ گیگابایتی DRAM.

مقایسه نسل به نسل پردازنده‌های گرافیکی انویدیا

نام GPU

TU102GA102AD102
معماری TuringAmpereAda Lovelace
فناوری ساختTSMC 12nm NFFSamsung 8nm5nm
کلاسترهای پردازش گرافیکی (GPC)6712
کلاسترهای پردازش تکسچرها (TPC)364272
مولتی پردازنده های جریانی7284144
تعداد هسته های CUDA46081075218432
ترافلاپس تئوری16.137.690TFLOPs
نوع حافظه GDDR6GDDR6XGDDR6X
گذرگاه حافظه 384bit384bit384bit
ظرفیت حافظه 11GB (2080 Ti)24GB (3090)24GB (4090?)
مدل پرچمدارRTX 2080 TiRTX 3090RTX 4090
توان مصرفی250W350W450-650W
زمان عرضهSep. 2018Sept. 202022

پردازنده‌های گرافیکی Ada Lovelace انویدیا، در نسل جدید کارت گرافیک‌های GeForce RTX 40 به رقابت مستقیم با تراشه‌های مبتنی بر معماری RDNA 3 شرکت AMD در کارت گرافیک‌ Radeon RX 7000 خواهند رفت. هنوز هم گمانه‌زنی‌هایی مبنی‌بر احتمال استفاده‌ی انویدیا از سبک معماری MCM شنیده می‌شود. پردازنده‌ی گرافیکی Hopper با ساختار MCM به‌طور ویژه برای دیتا سنترها و تجهیزات مبتنی‌بر هوش مصنوعی توسعه داده شده و به‌زودی فرایند طراحی آن‌ها تکمیل خواهد شد. البته گفته می‌شود که انویدیا فعلاً طراحی MCM را به همین محصولات محدود کرده و در سری Ada Lovelace مورد استفاده قرار نخواهد داد.

وضعیت عملکرد پردازنده های گرافیکی نسل بعد

در پایان می‎‌توانید نظرات خود را در اینباره با زومجی و سایر کاربران در میان بگذارید.


منبع wccftech
اسپویل
برای نوشتن متن دارای اسپویل، دکمه را بفشارید و متن مورد نظر را بین (* و *) بنویسید
کاراکتر باقی مانده