جزئیات جدید از کارت گرافیک‌ پرچمدار نسل بعد؛ RX 7900 XT در برابر RTX 4090

جمعه ۲۱ آبان ۱۴۰۰ - ۲۰:۲۴
مطالعه 6 دقیقه
معماری پردازنده های گرافیکی
شایعات جدیدی در خصوص مشخصات فنی کارت گرافیک پرچم‌دار GeForce RTX 4090 و Radeon RX 7900 XT منتشر شده که اینباره به جزئیات معماری RDNA 3 و Ada Lovelace می‌پردازد.
تبلیغات

Greymon55 در توییتر جزئیات تازه‌ای از مشخصات پرچمداران نسل بعد انویدیا و AMD را به اشتراک گذاشته است. این منبع غیررسمی، مدتی است که به انتشار اطلاعات موثق در رابطه با انواع پردازنده‌های جدید و عرضه نشده می‌پردازد. براین‌اساس گفته می‌شود که کارت گرافیک پرچم‌دار GeForce RTX 4090 مبتنی‌بر پردازنده‌های گرافیکی AD102 با معماری Ada Lovelace تولید می‌شود و در ساختار پرچم‌دار AMD، یعنی Radeon RX 7900 XT نیز از یک پردازنده Navi 31 با معماری RDNA 3 استفاده خواهد شد.

از هر دو GPU انتظار می‌رود پیشرفت چشمگیری را نسبت به نسل قبل ایجاد کرده و البته متعاقبا به پرمصرف‌ترین پردازنده‌های گرافیکی تا به امروز تبدیل شوند.درحالی که انویدیا همچنان طراحی یکپارچه‌ی تراشه‌های گرافیکی خود را در معماری Ada Lovelace حفظ خواهد کرد، AMD قصد دارد با به کارگیری سبک طراحی MCM یا «مولتی چیپ ماژول»، تجربه‌ی موفق خود در عرضه‌ی پردازنده‌های قدرتمند Aldebaran با معماری CDNA 2 برای دیتاسنترها را در محصولات گیمینگ خود نیز تکرار کند.

AMD امسال سبک MCM را هم برای محصولات عمومی و هم برای تراشه‌های رده بالای گیمینگ خود به کار می‌گیرد. حالا و با اشاره به یک پیش زمینه‌ اولیه، به سراغ جزئیات جدیدی که توسط این منبع فاش کننده منتشر شده خواهیم رفت.

کارت گرافیک AMD Radeon RX 7900 XT مبتنی بر پردازنده گرافیکی پرچم‌دار Navi 31 با معماری RDNA 3

کارت گرافیک نسل جدید AMD

پردازنده گرافیکی AMD Navi 31، پرچمداری سری RDNA 3 محسوب می‌شود که در نسل جدید توان گرافیکی Radeon RX 7900 XT را تأمین خواهد کرد. قبلاً شنیده شده که AMD در این نسل CU یا واحدهای محاسباتی را کنار گذاشته و به‌جای آن از WGP یا Work Group Processors استفاده می‌کند. از آنجایی که Navi 31 یک پردازنده MCM محسوب می‌شود، از دو کلید IP برخوردار است شامل یک GCD (یا Graphics Core Die) براساس فرایند ۵ نانومتری TSMC و یک MCD (یا Multi-Cache Die) براساس فناوری ۶ نانومتری TSMC می‌شود. شایعات قبلی از تکمیل فرایند توسعه‌ی تراشه‌های Navi 31 توسط AMD حکایت دارند.

همان‌طور که گفته شد، پیکربندی تراشه‌های Navi 31 شامل دو بخش GCD و یک بخش MCD است که هریک از دای‌های GCD از ۳ شیدر انجین (در مجموع شش Shader Engine) و هر شیدر انجین متشکل از دو آرایه شیدر (Shader Array) است. (در مجموع ۱۲ آرایه SA) اما هریک از این آرایه‌های شیدر میزبان ۵ WGP هستند (تعداد کل WGP ها به ۶۰ عدد می‌رسد) و هر WGP متشکل از ۸ واحد SIMD32 با ۳۲ واحد ALU خواهد بود. (یعنی در جمعا ۴۸۰ واحد SIMD32) این واحدهای SIMD32 نیز با هم تلفیق شده و ۷۶۸۰ هسته در هریک از قسمت‌های GCD و ۱۵۳۶۰ هسته به‌طور کلی را شکل می‌دهند.

از نظر عملکرد این تراشه‌ها نیز باید گفت که انتظار می‌رود سرعت کلاک این GPU به ۲.۴ تا ۲.۵ گیگاهرتز رسیده و عملکرد گرافیکی آن را از نظر تئوری به ۷۵ ترافلاپس برساند. یعنی یک پیشرفت خیره کننده‌ی ۲۲۶ درصدی نسبت به چیزی که در Radeon RX 6900 XT شاهد آن هستیم. دای MCD در تراشه‌های RDNA 3 ازطریق یک رابط داخلی Infinity Fabric به واحد دوگانه‌ی GCD متصل می‌شود که متشکل از ۲۵۶ تا ۵۱۲ مگابایت حافظه Infinity Cache خواهد بود.

علاوه‌براین هر GPU باید از ۴ لینک اتصال حافظه (۳۲ بیت) برخوردار باشد که در نتیجه به ۸ کنترلر حافظه ۳۲ بیت در یک رابط اینترفیس ۲۵۶ بیتی منجر خواهد شد. ادعا شده که این کارت به حداکثر ۳۲ گیگابایت حافظه GDDR6 مجهز خواهد شد که با سرعت پین ۱۸ گیگابیت بر ثانیه و پهنای باند ۵۷۶ گیگابایت بر ثانیه عمل می‌کند. شایعات دیگری که در این خصوص منتشر شده، از به کارگیری فناوری 3D Infinity Cache در محصولات سری RDNA 3 حکایت دارد. در این فناوری تراشه‌های جدید حافظه در یک ساختار عمودی روی GPU قرار می‌گیرند. شبیه به چیزی که در حافظه کش L3 تراشه‌های Vermeer-X شاهد آن بودیم.

مقایسه نسل به نسل پردازنده‌های گرافیکی RDNA

نام GPU

Navi 10

Navi 21

Navi 31

فرایند تولید

7nm

7nm

5nm (6nm?)

پکیج GPU

یکپارچه

یکپارچه

MCD

Shader Engine

2

4

6

WGP

20

40

60

SP به ازای WGP

128

128

256

واحدهای محاسباتی (در هر Die)

40

80

240

تعداد هسته (در هر Die)

2560

5120

15360

گذرگاه حافظه

256bit

256bit

256bit

نوع حافظه

GDDR6

GDDR6

GDDR6

حجم حافظه

8GB

16GB

32GB

Infinity Cache

8GB

16GB

32GB

مدل پرچمدار

Radeon RX 5700 XT

Radeon RX 6900 XTX

Radeon RX 7900 XT

توان مصرفی

225W

330W

350-550W

زمان عرضه

Q3 2019

Q4 2020

Q4 2022

کارت گرافیک GeForce RTX 4090 مبتنی بر پردازنده نسل جدید AD102 با معماری Ada Lovelace

کارت گرافیک پرچمدار انویدیا

براساس شایعات قبلی، گفته می‌شود که انویدیا در این نسل از پردازنده‌های گرافیکی خود از فناوری تولید ۵ نانومتری TSMC استفاده می‌کند. این موضوع شامل پردازنده AD102 که از یک طراحی کاملاً یکپارچه برخوردار است نیز می‌شود. Greymon55 در توییت جدید خود و جایی که از جزئیات این GPU صحبت کرده، به سرعت کلاک ۲.۵ گیگارهرتز (با سرعت میانگین بوست ۲.۳ گیگارهرتز) تراشه‌ی AD102 اشاره کرده است. بنابراین این مقدار را به‌عنوان اساس محاسبات و پیش‌بینی عملکرد این GPU قرار داده و ادامه می‌دهیم.

ظاهراً پردازنده AD102 از ۱۸۴۳۲ هسته‌ی CUDA برخوردار است که ۱۴۴ واحد SM این تراشه‌ را تشکیل می‌دهند. یعنی حدود دو برابر تعداد هسته‌های پرچم‌دار سری Ampere که همین حالا هم ارتقاء چشمگیری نسبت به سری Turing محسوب می‌شوند. سرعت ۲.۳ تا ۲.۵ گیگاهرتز این پردازنده از نظر تدوری به ۸۵ تا ۹۲ ترافلاپس توان پردازش گرافیکی منجر می‌شود که بیش از دو برابر توان عملکرد ۳۶ ترافلاپسی کارت گرافیک قدرتمند RTX 3090 در نسل فعلی خواهد بود.

پیشرفت ۱۵۰ درصدی عملکرد پردازنده‌های گرافیکی انویدیا، جهش بزرگی محسوب می‌شود اما به‌خاطر داشته باشید که انویدیا در نسل فعلی کارت گرافیک‌های RTX نیز بهبود قابل توجهی را نسبت به نسل قبل تجربه کرده بود. تراشه‌ی پرچم‌دار GA102 که در کارت گرافیک RTX 3090 مورد استفاده قرار می‌گیرد، از ۳۶ ترافلاپس توان پردازش گرافیکی برخوردار است. درحالی که تراشه‌ی TU102 در کارت گرافیک پرچم‌دار RTX 2080 Ti تنها ۱۳ ترافلاپس توان پردازش گرافیکی را ارائه می‌کرد.

این موضوع نشان می‌دهد که خانواده‌ی امپر از نظر تئوری بیش از ۱۵۰ درصد قوی‌تر از سری تورینگ شده بود، درحالی که این اختلاف در واقعیت به ۵۰ تا ۶۰ درصد می‌رسید. بنابراین باید به‌خاطر داشته باشیم که این روزها عدد ترافلاپس مستقیماً بیانگر عملکرد یک پردازنده گرافیکی نخواهد بود. علاوه‌براین، نمی‌دانیم که عدد ۲.۳ تا ۲.۵ گیگاهرتزی دقیقاً مربوط‌به سرعت کلاک متوسط این کارت است یا به حداکثر سرعت بوست آن تعلق دارد که نشان می‌دهد پتانسیل توان محاسباتی AD102 می‌تواند بالاتر از این‌ها باشد.

علاوه‌براین، افشا کننده‌ی این اطلاعات ادعا می‌کند که پرچم‌دار سری NVIDIA GeForce RTX 40 مشابه RTX 3090 از یک رابط گذرگاه ۳۸۴ بیت برخوردار است. اما جالب اینجا است که در اینجا به G6X اشاره شده که یعنی انویدیا در نسل جدید هم به سراغ استاندارد حافظه‌ی جدید نخواهد رفت، تا بعد از سری Ada Lovelace از یک تکنولوژی جدیدتر (مثلاً GDDR7) برای این منظور استفاده کند. این کارت از ۲۴ گیگابایت حافظه استفاده می‌کند که باید انتظار یک ماژول یک طرفه‌ی ۱۶ گیگابایتی DRAM را داشته باشیم یا یک ماژول ۲ دوگانه‌ی ۸ گیگابایتی DRAM.

مقایسه نسل به نسل پردازنده‌های گرافیکی انویدیا

نام GPU

TU102

GA102

AD102

معماری

Turing

Ampere

Ada Lovelace

فناوری ساخت

TSMC 12nm NFF

Samsung 8nm

5nm

کلاسترهای پردازش گرافیکی (GPC)

6

7

12

کلاسترهای پردازش تکسچرها (TPC)

36

42

72

مولتی پردازنده های جریانی

72

84

144

تعداد هسته های CUDA

4608

10752

18432

ترافلاپس تئوری

16.1

37.6

90TFLOPs

نوع حافظه

GDDR6

GDDR6X

GDDR6X

گذرگاه حافظه

384bit

384bit

384bit

ظرفیت حافظه

11GB (2080 Ti)

24GB (3090)

24GB (4090?)

مدل پرچمدار

RTX 2080 Ti

RTX 3090

RTX 4090

توان مصرفی

250W

350W

450-650W

زمان عرضه

Sep. 2018

Sept. 20

2022

پردازنده‌های گرافیکی Ada Lovelace انویدیا، در نسل جدید کارت گرافیک‌های GeForce RTX 40 به رقابت مستقیم با تراشه‌های مبتنی بر معماری RDNA 3 شرکت AMD در کارت گرافیک‌ Radeon RX 7000 خواهند رفت. هنوز هم گمانه‌زنی‌هایی مبنی‌بر احتمال استفاده‌ی انویدیا از سبک معماری MCM شنیده می‌شود. پردازنده‌ی گرافیکی Hopper با ساختار MCM به‌طور ویژه برای دیتا سنترها و تجهیزات مبتنی‌بر هوش مصنوعی توسعه داده شده و به‌زودی فرایند طراحی آن‌ها تکمیل خواهد شد. البته گفته می‌شود که انویدیا فعلاً طراحی MCM را به همین محصولات محدود کرده و در سری Ada Lovelace مورد استفاده قرار نخواهد داد.

وضعیت عملکرد پردازنده های گرافیکی نسل بعد

در پایان می‌‌توانید نظرات خود را در اینباره با زومجی و سایر کاربران در میان بگذارید.

مقاله رو دوست داشتی؟
نظرت چیه؟
داغ‌ترین مطالب روز
تبلیغات

نظرات