جزئیات جدید از کارت گرافیک پرچمدار نسل بعد؛ RX 7900 XT در برابر RTX 4090
Greymon55 در توییتر جزئیات تازهای از مشخصات پرچمداران نسل بعد انویدیا و AMD را به اشتراک گذاشته است. این منبع غیررسمی، مدتی است که به انتشار اطلاعات موثق در رابطه با انواع پردازندههای جدید و عرضه نشده میپردازد. برایناساس گفته میشود که کارت گرافیک پرچمدار GeForce RTX 4090 مبتنیبر پردازندههای گرافیکی AD102 با معماری Ada Lovelace تولید میشود و در ساختار پرچمدار AMD، یعنی Radeon RX 7900 XT نیز از یک پردازنده Navi 31 با معماری RDNA 3 استفاده خواهد شد.
از هر دو GPU انتظار میرود پیشرفت چشمگیری را نسبت به نسل قبل ایجاد کرده و البته متعاقبا به پرمصرفترین پردازندههای گرافیکی تا به امروز تبدیل شوند.درحالی که انویدیا همچنان طراحی یکپارچهی تراشههای گرافیکی خود را در معماری Ada Lovelace حفظ خواهد کرد، AMD قصد دارد با به کارگیری سبک طراحی MCM یا «مولتی چیپ ماژول»، تجربهی موفق خود در عرضهی پردازندههای قدرتمند Aldebaran با معماری CDNA 2 برای دیتاسنترها را در محصولات گیمینگ خود نیز تکرار کند.
AMD امسال سبک MCM را هم برای محصولات عمومی و هم برای تراشههای رده بالای گیمینگ خود به کار میگیرد. حالا و با اشاره به یک پیش زمینه اولیه، به سراغ جزئیات جدیدی که توسط این منبع فاش کننده منتشر شده خواهیم رفت.
کارت گرافیک AMD Radeon RX 7900 XT مبتنی بر پردازنده گرافیکی پرچمدار Navi 31 با معماری RDNA 3
پردازنده گرافیکی AMD Navi 31، پرچمداری سری RDNA 3 محسوب میشود که در نسل جدید توان گرافیکی Radeon RX 7900 XT را تأمین خواهد کرد. قبلاً شنیده شده که AMD در این نسل CU یا واحدهای محاسباتی را کنار گذاشته و بهجای آن از WGP یا Work Group Processors استفاده میکند. از آنجایی که Navi 31 یک پردازنده MCM محسوب میشود، از دو کلید IP برخوردار است شامل یک GCD (یا Graphics Core Die) براساس فرایند ۵ نانومتری TSMC و یک MCD (یا Multi-Cache Die) براساس فناوری ۶ نانومتری TSMC میشود. شایعات قبلی از تکمیل فرایند توسعهی تراشههای Navi 31 توسط AMD حکایت دارند.
همانطور که گفته شد، پیکربندی تراشههای Navi 31 شامل دو بخش GCD و یک بخش MCD است که هریک از دایهای GCD از ۳ شیدر انجین (در مجموع شش Shader Engine) و هر شیدر انجین متشکل از دو آرایه شیدر (Shader Array) است. (در مجموع ۱۲ آرایه SA) اما هریک از این آرایههای شیدر میزبان ۵ WGP هستند (تعداد کل WGP ها به ۶۰ عدد میرسد) و هر WGP متشکل از ۸ واحد SIMD32 با ۳۲ واحد ALU خواهد بود. (یعنی در جمعا ۴۸۰ واحد SIMD32) این واحدهای SIMD32 نیز با هم تلفیق شده و ۷۶۸۰ هسته در هریک از قسمتهای GCD و ۱۵۳۶۰ هسته بهطور کلی را شکل میدهند.
از نظر عملکرد این تراشهها نیز باید گفت که انتظار میرود سرعت کلاک این GPU به ۲.۴ تا ۲.۵ گیگاهرتز رسیده و عملکرد گرافیکی آن را از نظر تئوری به ۷۵ ترافلاپس برساند. یعنی یک پیشرفت خیره کنندهی ۲۲۶ درصدی نسبت به چیزی که در Radeon RX 6900 XT شاهد آن هستیم. دای MCD در تراشههای RDNA 3 ازطریق یک رابط داخلی Infinity Fabric به واحد دوگانهی GCD متصل میشود که متشکل از ۲۵۶ تا ۵۱۲ مگابایت حافظه Infinity Cache خواهد بود.
علاوهبراین هر GPU باید از ۴ لینک اتصال حافظه (۳۲ بیت) برخوردار باشد که در نتیجه به ۸ کنترلر حافظه ۳۲ بیت در یک رابط اینترفیس ۲۵۶ بیتی منجر خواهد شد. ادعا شده که این کارت به حداکثر ۳۲ گیگابایت حافظه GDDR6 مجهز خواهد شد که با سرعت پین ۱۸ گیگابیت بر ثانیه و پهنای باند ۵۷۶ گیگابایت بر ثانیه عمل میکند. شایعات دیگری که در این خصوص منتشر شده، از به کارگیری فناوری 3D Infinity Cache در محصولات سری RDNA 3 حکایت دارد. در این فناوری تراشههای جدید حافظه در یک ساختار عمودی روی GPU قرار میگیرند. شبیه به چیزی که در حافظه کش L3 تراشههای Vermeer-X شاهد آن بودیم.
مقایسه نسل به نسل پردازندههای گرافیکی RDNA
نام GPU | Navi 10 | Navi 21 | Navi 31 |
---|---|---|---|
فرایند تولید | 7nm | 7nm | 5nm (6nm?) |
پکیج GPU | یکپارچه | یکپارچه | MCD |
Shader Engine | 2 | 4 | 6 |
WGP | 20 | 40 | 60 |
SP به ازای WGP | 128 | 128 | 256 |
واحدهای محاسباتی (در هر Die) | 40 | 80 | 240 |
تعداد هسته (در هر Die) | 2560 | 5120 | 15360 |
گذرگاه حافظه | 256bit | 256bit | 256bit |
نوع حافظه | GDDR6 | GDDR6 | GDDR6 |
حجم حافظه | 8GB | 16GB | 32GB |
Infinity Cache | 8GB | 16GB | 32GB |
مدل پرچمدار | Radeon RX 5700 XT | Radeon RX 6900 XTX | Radeon RX 7900 XT |
توان مصرفی | 225W | 330W | 350-550W |
زمان عرضه | Q3 2019 | Q4 2020 | Q4 2022 |
کارت گرافیک GeForce RTX 4090 مبتنی بر پردازنده نسل جدید AD102 با معماری Ada Lovelace
براساس شایعات قبلی، گفته میشود که انویدیا در این نسل از پردازندههای گرافیکی خود از فناوری تولید ۵ نانومتری TSMC استفاده میکند. این موضوع شامل پردازنده AD102 که از یک طراحی کاملاً یکپارچه برخوردار است نیز میشود. Greymon55 در توییت جدید خود و جایی که از جزئیات این GPU صحبت کرده، به سرعت کلاک ۲.۵ گیگارهرتز (با سرعت میانگین بوست ۲.۳ گیگارهرتز) تراشهی AD102 اشاره کرده است. بنابراین این مقدار را بهعنوان اساس محاسبات و پیشبینی عملکرد این GPU قرار داده و ادامه میدهیم.
ظاهراً پردازنده AD102 از ۱۸۴۳۲ هستهی CUDA برخوردار است که ۱۴۴ واحد SM این تراشه را تشکیل میدهند. یعنی حدود دو برابر تعداد هستههای پرچمدار سری Ampere که همین حالا هم ارتقاء چشمگیری نسبت به سری Turing محسوب میشوند. سرعت ۲.۳ تا ۲.۵ گیگاهرتز این پردازنده از نظر تدوری به ۸۵ تا ۹۲ ترافلاپس توان پردازش گرافیکی منجر میشود که بیش از دو برابر توان عملکرد ۳۶ ترافلاپسی کارت گرافیک قدرتمند RTX 3090 در نسل فعلی خواهد بود.
پیشرفت ۱۵۰ درصدی عملکرد پردازندههای گرافیکی انویدیا، جهش بزرگی محسوب میشود اما بهخاطر داشته باشید که انویدیا در نسل فعلی کارت گرافیکهای RTX نیز بهبود قابل توجهی را نسبت به نسل قبل تجربه کرده بود. تراشهی پرچمدار GA102 که در کارت گرافیک RTX 3090 مورد استفاده قرار میگیرد، از ۳۶ ترافلاپس توان پردازش گرافیکی برخوردار است. درحالی که تراشهی TU102 در کارت گرافیک پرچمدار RTX 2080 Ti تنها ۱۳ ترافلاپس توان پردازش گرافیکی را ارائه میکرد.
این موضوع نشان میدهد که خانوادهی امپر از نظر تئوری بیش از ۱۵۰ درصد قویتر از سری تورینگ شده بود، درحالی که این اختلاف در واقعیت به ۵۰ تا ۶۰ درصد میرسید. بنابراین باید بهخاطر داشته باشیم که این روزها عدد ترافلاپس مستقیماً بیانگر عملکرد یک پردازنده گرافیکی نخواهد بود. علاوهبراین، نمیدانیم که عدد ۲.۳ تا ۲.۵ گیگاهرتزی دقیقاً مربوطبه سرعت کلاک متوسط این کارت است یا به حداکثر سرعت بوست آن تعلق دارد که نشان میدهد پتانسیل توان محاسباتی AD102 میتواند بالاتر از اینها باشد.
علاوهبراین، افشا کنندهی این اطلاعات ادعا میکند که پرچمدار سری NVIDIA GeForce RTX 40 مشابه RTX 3090 از یک رابط گذرگاه ۳۸۴ بیت برخوردار است. اما جالب اینجا است که در اینجا به G6X اشاره شده که یعنی انویدیا در نسل جدید هم به سراغ استاندارد حافظهی جدید نخواهد رفت، تا بعد از سری Ada Lovelace از یک تکنولوژی جدیدتر (مثلاً GDDR7) برای این منظور استفاده کند. این کارت از ۲۴ گیگابایت حافظه استفاده میکند که باید انتظار یک ماژول یک طرفهی ۱۶ گیگابایتی DRAM را داشته باشیم یا یک ماژول ۲ دوگانهی ۸ گیگابایتی DRAM.
مقایسه نسل به نسل پردازندههای گرافیکی انویدیا
نام GPU | TU102 | GA102 | AD102 |
---|---|---|---|
معماری | Turing | Ampere | Ada Lovelace |
فناوری ساخت | TSMC 12nm NFF | Samsung 8nm | 5nm |
کلاسترهای پردازش گرافیکی (GPC) | 6 | 7 | 12 |
کلاسترهای پردازش تکسچرها (TPC) | 36 | 42 | 72 |
مولتی پردازنده های جریانی | 72 | 84 | 144 |
تعداد هسته های CUDA | 4608 | 10752 | 18432 |
ترافلاپس تئوری | 16.1 | 37.6 | 90TFLOPs |
نوع حافظه | GDDR6 | GDDR6X | GDDR6X |
گذرگاه حافظه | 384bit | 384bit | 384bit |
ظرفیت حافظه | 11GB (2080 Ti) | 24GB (3090) | 24GB (4090?) |
مدل پرچمدار | RTX 2080 Ti | RTX 3090 | RTX 4090 |
توان مصرفی | 250W | 350W | 450-650W |
زمان عرضه | Sep. 2018 | Sept. 20 | 2022 |
پردازندههای گرافیکی Ada Lovelace انویدیا، در نسل جدید کارت گرافیکهای GeForce RTX 40 به رقابت مستقیم با تراشههای مبتنی بر معماری RDNA 3 شرکت AMD در کارت گرافیک Radeon RX 7000 خواهند رفت. هنوز هم گمانهزنیهایی مبنیبر احتمال استفادهی انویدیا از سبک معماری MCM شنیده میشود. پردازندهی گرافیکی Hopper با ساختار MCM بهطور ویژه برای دیتا سنترها و تجهیزات مبتنیبر هوش مصنوعی توسعه داده شده و بهزودی فرایند طراحی آنها تکمیل خواهد شد. البته گفته میشود که انویدیا فعلاً طراحی MCM را به همین محصولات محدود کرده و در سری Ada Lovelace مورد استفاده قرار نخواهد داد.
در پایان میتوانید نظرات خود را در اینباره با زومجی و سایر کاربران در میان بگذارید.