
پرچمداران کارتهای گرافیکی توسط شرکای تجاری انویدیا با امکانات بیشتر معرفی شدهاند. در اینجا به بررسی یکی از جالبتوجهترین مدلهای سفارشی GeForce RTX 3080 میپردازیم.
همانطور که حتما میدانید، چند ماهی از عرضهی کارتهای گرافیکی پرچمدار انویدیا از نسل جدید آمپر به بازار میگذرد و علیرغم عرضهی بسیار محدود و تقاضای بالا برای این مدلها، بسیاری از سازندگان مطرح و قدیمی قطعات پیسی هم مدلهای اختصاصی خود را بر مبنای این کارتهای گرافیکی معرفی کرده و به فروش میرسانند. اما از سوی دیگر کاربران در سرتاسر دنیا با دشواریهای فراوانی برای دسترسی به این محصولات مواجه شدند و کمبود عرضه مزیدِ بر این علت شد که قیمت این محصولات به میزان سرسامآوری کاذب و دو تا سه برابر قیمت اصلی فروخته شود. از مدلهای تاکنون عرضه شده، GeForce RTX 3080 بعد از GeForce RTX 3090، قویترین مدل از کارتهای پرچمدار نسل آمپر است. اکنون نمونهای از کارت AORUS RTX 3080 Master برای بررسی در اختیارِ زومجی گذاشته شده که در اینجا قصد داریم به ویژگیها و امکانات اختصاصی و جنبی این مدل و بررسی راندمان آن در عناوین مطرح بازیهای روز بپردازیم و ببینیم که نسبت به نسل قبلی چه پیشرفتهایی داشته است.
مشخصات فنی GeForce RTX 3080
کارت گرافیک GeForce RTX 3080 اولین کارت گرافیکی بود که در رویداد اختصاصی انویدیا رونمایی شد و از آن به عنوان پرچمدار جدید یاد شد، محصولی که راندمانی بسیار بالاتر از پرچمدار نسل قبلی دارد و از همه مهمتر با قیمتِ رسمی معقولتر از نسل قبلی به فروش میرسد. RTX 3080 با قیمت پایهی ۶۹۹ دلاری برای مدل Founders Edition ساخت انویدیا، در تاریخ ۲۷ شهریورماه عرضه شد. این کارت ۱۰ گیگابایت حافظهی کاملا جدید GDDR6X ساخت شرکت مایکرون را در جوار GPU در بر دارد و توان محاسباتی آن برای FP32 روی واحدهای Shader یا سایهزن سنتی حدود ۳۰ ترافلاپس عنوان شده است. توان محاسباتی واحد رهگیری پرتو هم بر خلاف نسل تورینگ با ترافلاپس ارائه شده و میزان آن برای RTX 3080 برابر با ۵۸ ترافلاپس است. در آخر واحدهای هوش مصنوعی و یادگیری ماشینی Tensor هم ۲۳۸ ترافلاپس توان محاسباتی را در اختیار دارند.
کارت گرافیک RTX 3080 از همان تراشهی GA102، اما با تعداد واحدهای پردازشی کمتر نسبت به RTX 3090 بهره میبرد. تعداد واحدهای پردازشی فعال CUDA در اینجا ۸۷۰۴ واحد است که نسبت به ۱۰۴۹۶ واحد در RTX 3090، به میزان ۱۷۹۲ واحد یا حدود ۱۸ درصد کمتر است. همچنین این محصول با گذرگاه ۳۲۰ بیتی به ۱۰ تراشهی یک گیگابایتی GDDR6X متصل شده است. در نتیجه شاهد ۱۰ گیگابایت حافظهی پرسرعت گرافیکی برای RTX 3080 هستیم که پهنای باندی برابر با ۷۶۰ گیگابایت بر ثانیه دارد. این پهنای باند هنوز هم از پهنای باند ۶۱۶ گیگابایت بر ثانیهایِ کارت RTX 2080 Ti به میزان ۱۴۴ گیگابایت بر ثانیه سریعتر است.
تراشهی Ampere GA102
بیشتر پردازشهای گرافیکی از عملیات بر مبنای اعداد اعشاری ۳۲ بیتی یا FP32 تشکیل شدهاند. واحد Streaming Multiprocessor یا به اختصار SM در معماری گرافیکی GA10x، برای پشتیبانی از پردازش دو برابریِ عملیات FP32 طراحی شده است. در نسل تورینگ، هر ۴ واحد SM (که پارتیشن هم گفته میشوند) دارای دو مسیر دادهای اولیه بودند، اما فقط یکی از آنها میتوانست عملیات FP32 را پردازش کند. مسیر دادهی دوم به عملیات عدد صحیح یا INT محدود بود. در GA10x پردازش روی هر دو مسیر دادهای برای FP32 ممکن است و به همین دلیل حداکثر نرخ پردازش عملیات FP32 دو برابر شده است. در نتیجهی این طراحی، کارت GeForce RTX 3090 بیش از ۳۵ ترافلاپس توان پردازشی را ارائه میکند که بیش از دو برابر بیشتر از تراشههای گرافیکیِ Turing است.
بلاک دیاگرام تراشهی GA102 استفاده شده در کارت گرافیک RTX 3080
مانند GPU-های قبلی انویدیا، GA102 از کلاسترهای پردازش گرافیکی (Graphics Processing Clusters یا به اختصار GPC)، واحدهای پردازش بافت (Texture Processing Cluster یا به اختصار TPC)، واحدهای SM، واحدهای ترسیم (Raster Operator یا به اختصار ROP) و کنترلرهای حافظه تشکیل شده است. یک تراشهی کامل GA102 دارای ۷ واحد GPC، تعداد ۴۲ واحد TPC و ۸۴ واحد SM میشود که مطابق قسمتهای قرمزرنگ شده در دیاگرام فوق، برخی قسمتهای آن برای استفاده در تراشهی GA102-200 در قلبِ RTX 3080 غیر فعال شده است. همچنین هر SM هم ۱۲۸ هستهی CUDA و ۴ هستهی Tensor دارد و ۱ هستهی RT و ۴ واحد پردازش بافت یا همان TU را در خود جای میدهد. تراشهی GA102-200 به میزان ۸۷۰۴ کیلوبایت حافظهی کش L1 و ۵۱۲۰ کیلوبایت حافظهی کش L2 در اختیار دارد.
نسل دوم RT
هستههای RT (مخفف Ray Tracing یا رهگیریِ پرتو) جدید برخی پیشرفتها را شامل میشوند که در ترکیب با بهینهسازیهای صورت گرفته روی زیرسیستمِ حافظهی کَش، به صورت موثر میتواند تا دو برابر افزایش راندمان را نسبت به هستههای RT در معماری تورینگ به همراه داشته باشد. بهعلاوه، واحدهای SM در معماری آمپر توانایی اجرای همزمان کارهای هستهی RT + گرافیک یا هستهی RT + محاسبه (Compute) را در اختیار دارد که به میزان قابل توجهی پردازشهای رهگیری پرتو را شتاب میبخشد.
نسل سوم Tensor
نسلِ سوم و جدید هستههای Tensor انواع دادهای (Data Type) جدیدی را برای افزایش راندمان، بهرهوری و انعطاف در برنامه نویسی پشتیبانی میکند که میتواند تا سقف دو برابر راندمان بالاتر در پردازشهای هوش مصنوعی مانند DLSS عرضه کند.
حافظههای GDDR6X با افزایش سرعت انتقال دادهها برای اولین بار با کارتهای نسل آمپر معرفی و استفاده شدهاند و کارتهای سری RTX 3000 برای اولین بار در محصولات انویدیا از گذرگاه PCI express 4.0 هم پشتیبانی میکنند. فناورهای جانبی دیگری نیز معرفی شدهاند که در ادامه بررسی آنها میپردازیم.
NVIDIA RTX IO
امروزه ذخیرهسازها با وجود پیشرفت زیاد و استفاده از SSD-های سریع، هنوز هم ضعیفترین قسمت رایانهها محسوب میشوند. سرعت SSD-های مدرن با بهره گیری از توانِ کامل گذرگاه PCIe در هر نسل افزایش مییابد و در PCIe نسل چهارم، سرعت این گذرگاه به ۶۴ گیگابیت بر ثانیه (۸ گیگابایت بر ثانیه) در دو جهت رسیده است. هماینک شرکت ایامدی پلتفرم مبتنی بر PCIe 4.0 را عرضه کرده، اما اینتل فقط در پلتفرم نسل یازدهم موبایلی از آن استفاده کرده و قرار است آن را همزمان با عرضهی پردازندههای نسل یازدهمِ دسکتاپی با نام Rocket Lake، به کاربران رایانههای رومیزی نیز عرضه کند.
با اینکه افزایش پهنای باند ذخیرهساز امری مثبت تلقی میشود، اما پردازش اطلاعات باینری صفر و یک ذخیره شده روی بخش فیزیکی دیسکها هنوز بر عهدهی پردازندهی مرکزی یا CPU است. با افزایش پهنای باند ذخیرهسازها، بار پردازشیِ عملیات ورودی/خروجی یا I/O هم به همان نسبت روی پردازنده به تدریج افزایش پیدا میکند و به جایی میرسد که راندمان را تحت تاثیر قرار میدهد. مایکروسافت راه حل رابط برنامهنویسی DirectStorage را برای حل این معضل در نظر گرفته و انویدیا هم فناوری RTX IO را بر مبنای همین API ابداع کرده است.
انویدیا میگوید دادههای غیر فشرده حداکثر با سرعت ۷ گیگابایت بر ثانیه از یک SSD از نوع NVMe و روی گذرگاه PCIe 4.0 خوانده میشوند و برای پردازش در این سرعت به توان کاملِ دو هستهی پردازنده نیاز دارند. اما اگر همین اطلاعات بصورت فشرده شده و محتوایی مانند دادههای بازی باشند، به هزاران درخواست I/O و منابع متعددی نیاز است تا اطلاعات از حالت فشرده، به حداکثر ۱۴ گیگابایت بر ثانیه در حالت غیرِ فشرده تبدیل شوند. سربار ناشی از درخواستهای مضاعف I/O و توان مورد نیاز برای خواندن دادهها از داخل فایلهای متعدد و بارگذاری آنها در بافر کارت گرافیکی، توان پردازشی مورد نیاز در سمت پردازنده را به ۲۴ هسته افزایش میدهد. اینجا DirectStorage وارد عمل میشود و مسیری را برای دسترسی مستقیم به منابع مورد نیاز و برداشتن سربار پردازنده ایجاد میکند.
همچنین RTX IO به عنوان لایهی بیرونی DirectStorage که برای بازیها و معماری تراشههای گرافیکی انویدیا بهینه شده، غیر فشرده کردن دادههای فشرده شده را به صورت سختافزاری روی GPU انجام میدهد. انویدیا ادعا میکند که این فناوری تا ۲ برابر راندمان عملیات ورودی/خروجی با ذخیرساز را افزایش میدهد و در عین حال نیاز به استفاده از هستههای متعدد پردازنده برای مدیریت خواندن و نوشتن را از میان برمیدارد.
البته نیاز است که بازیها برای استفاده از قابلیت DirectStorage بهینه شوند. با توجه به اینکه این API اکنون هم در کنسول ایکس باکس سری ایکس پیاده سازی شده، بازیهایی که برای این کنسول عرضه شده و به پیسی پورت شوند، احتمالا از این فناوری برخوردار خواهند بود. همچنین پشتیبانی RTX IO باید به صورت مجزا برای هر بازی در درایور گرافیک انویدیا تعبیه شود.
این فناوری روی تمام کارتهای گرافیکی RTX از نسل تورینگ و آمپر کار خواهد کرد و با بروز رسانی API مربوطه در نسخهی سال ۲۰۲۱ ویندوز 10، میتوان انتظار داشت که استفاده از این قابلیت از نیمهی دوم سال آینده عملیاتی شود. در ضمن مایکروسافت میگوید این قابلیت به ملزوماتی نیاز دارد که باعث میشود تمامِ درایوهای M.2 و NVMe برای بهره بردن از آن مناسب نباشند و احتمالا فقط مدلهای پرسرعتتر برای این قابلیت چراغ سبز خواهند گرفت.
NVIDIA DLSS 2.0
فناوری DLSS در نسخهی ابتدایی چیزی بیش از یک تکنیک Image Sharpening معمولی به نظر نمیرسید، اما تحول بینظیر ایجاد شده در DLSS 2.0 و اجرا روی هستههای Tensor تراشههای RTX باعث شد که یکی از بینقصترین تکنیکهای ارتقای تصویری و upscaling را در بازیهای ویدیوئی شاهد باشیم. در واقع DLSS 2.0 بسیار از جزئیاتی را که با اِعمال تکنیک TAA روی صحنه محو میشوند یا از بین میروند را دوباره به تصاویر برمیگرداند و در بسیاری موارد کیفیتی حتی بالاتر از اجرای بازی در رزولوشن Native را ارائه میکند.
بازی Death Stranding یکی از بهترین نمونههای پیادهسازی تکنیک DLSS 2.0 بعد از بازی Control ساختهی رمدی است که میتواند الگوی بیمانندی برای مایکروسافت و سونی برای پیادهسازی قابلیتهای مشابه بر مبنای هوش مصنوعی در کنسولهایشان باشد.
Nvidia Reflex
فناوری دیگری که همزمان با معرفی کارتهای گرافیک جدید معرفی شد، به گیمرهای آنلاین وعدهی بهرهمندی از کاهش تاخیر و افزایش سرعت پاسخگویی سیستم در هنگام بازی را میدهد. به گفتهی انویدیا این قابلیت خود مشتمل بر برخی نوآوریها در تراشهی گرافیکی، تکنیک G-Sync و برخی دیگر قابلیتهای نرمافزاری است که سنجش و کاهش تاخیر سیستم در هنگام اجرای بازیهای رقابتی را ممکن میسازند. کاهش تاخیر سیستم برای گیمرهای آنلاین امری حیاتی است که به پیسی و نمایشگر اجازهی واکنش سریعتر در برابر دستورات ورودیِ کاربر از طریق ماوس و صفحه کلید را میدهد و دقت در عکسالعملها و شلیکها را افزایش میدهد.
شتابدهنده سختافزاری ویدیو
معماری جدید آمپر از نسل پنجم دیکودرِ انویدیا هم برای فرمتهای زیر در پلتفرمهای ویندوز و لینوکس بهرهمند شده است:
● MPEG-2, VC-1, H.264 (AVCHD),H.265 (HEVC), VP8, VP9, and AV1.
کدکها و فرمتهای رنگی که که به صورت سختافزاری پشتیبانی میشوند:
● HEVC 4:2:0 and 4:4:4 color modes with 8/10/12 bit.
● VP9 4:2:0 color mode with 8/10/12 bit.
● H.264 4:2:0 color mode with 8 bit.
مشخصات فنی AORUS RTX 3080 MASTER و ابعاد
پس از تشریح قابلیتهای فنی معماری آمپر و GeForce RTX 3080 نوبت به کارت گرافیکی که در اختیار داریم میرسد تا مشخصات آن را با مدل مرجع (در اینجا Founders Edition) مقایسه کنیم:
نام کارت گرافیکی | NVIDIA GeForce RTX 3090 | AORUS GeForce RTX 3080 MASTER | NVIDIA GeForce RTX 3080 | NVIDIA GeForce RTX 3070 | NVIDIA GeForce RTX 2080 Ti |
معماری تراشه | Ampere | Ampere | Ampere | Ampere | Turing |
مدل تراشه | GA102-300 | GA102-200 | GA102-200 | GA104-300 | TU102 |
پروسهی ساخت | 8nm | 8nm | 8nm | 8nm | 12nm FNN |
تعداد ترانزیستورها | 28Billion | 28Billion | 28Billion | 17.4Billion | 18.6Billion |
هستههای CUDA | 10496 | 8704 | 8704 | 5888 | 4352 |
توان رهگیری پرتو | 69TFLOPs | 58TFLOPs | 58TFLOPs | 40TFLOPs | 10Giga Rays/s |
فرکانس پایه | 1395MHz | 1440MHz | 1440MHz | 1500MHz | 1350MHz |
فرکانس بوست | 1725MHz | 1845MHz | 1710MHz | 1725MHz | 1545MHz |
توان محاسباتی | 35.7TFLOPs | 32.1TFLOPs | 29.7TFLOPs | 20.45TFLOPs | 13.4TFLOPs |
ظرفیت حافظه | 24GB GDDR6X | 10GB GDDR6X | 10GB GDDR6X | 8GB GDDR6 | 11GB GDDR6 |
سرعت حافظه | 19.50Gbps | 19.00Gbps | 19.00Gbps | 16.00Gbps | 14.00Gbps |
رابط حافظه | 384bit | 320bit | 320bit | 256bit | 352bit |
پهنای باندِ حافظه | 936GB/s | 760GB/s | 760GB/s | 512GB/s | 616GB/s |
اتصالات برق | 12Pin | 8+8Pin | 12Pin | 8Pin | 8+8Pin |
توان حرارتی | 350W | 350W | 320W | 220W | 260W |
شروع قیمت | $1499US | $850US~ | $699US | $499US | $999US |
مشاهده میکنید که سرعت ساعت کاری GPU از ۱۷۱۰ مگاهرتز برای مدل مرجع انویدیا، به ۱۸۴۵ مگاهرتز در این مدل افزایش پیدا کرده و اصطلاحا اورکلاک کارخانهایِ قابل توجهی روی تراشهی گرافیکی اعمال شده است. در نتیجهی افزایش راندمان، طبعا توان محاسباتی هم افزایش پیدا میکند که در موردِ این مدل از ۲۹.۷ ترافلاپس در مدل مرجع، به ۳۲.۱ ترافلاپس رسیده است. اما فرکانس کاری حافظهی گرافیکی به مانند تمام کارتهای سفارشیِ دیگر از برندهای مختلف دستنخورده باقی مانده و کماکان ۱۹ گیگاهرتز است. همچنین کانکتورهای تامینِ توان ۱۲ ولتی PCIe هم مانند تمام کارتهای سفارشی ۸ پینی باقی مانده و از مدل ۱۲ پینی استاندارد جدید انویدیا اجتناب شده است. در نظر داشته باشید که طراحی مدار توان و رابطهای برق در ویرایش نسخهی دوم از کارت Aorus RTX 3080 Master تغییر کرده و به ۳ کانکتور ۸ پینی افزایش یافته است.
از جنبهی ابعاد هم طول این کارت ۳۱۹ میلیمتر، عرض آن ۱۴۰ میلیمتر و ارتفاع آن ۷ سانتیمتر است که احتمالا برای بررسی جایگیریِ مناسب آن در داخلِ کیس خود به این اطلاعات نیاز خواهید داشت.
امکانات اختصاصی AORUS RTX 3080 MASTER
Max-Covered Cooling: این ویژگی در سیستم خنککنندهی کارت گرافیک، دو فن ۱۱۵ میلیمتری و یک فن ۱۰۰ میلیمتری از سری فنهای unique blade stack با موتور Ball bearing را در برمیگیرد که جریان هوا را با لبههای مثلثی تیغههای فن به تمام سطح خنک کننده هدایت میکنند و طراحی Wind Claw در زیر فنها هم جریان هوا را تقویت و کانالیزه میکند تا بتواند کاملا سطح خنککننده را پوشش دهد. چرخش معکوس فن میانی هم تلاطم ناشی از چرخش فنهای مجاور را کاهش داده و فشار هوا را افزایش میدهد.
Screen Cooling: این طراحی شامل هیتسینک گسترش یافته در انتهای کارت گرافیک میشود که مشابه با طراحی کارت انویدیا، باعث عبور جریان هوای گرم و دفع بهتر حرارت از بخش انتهای کارت گرافیکی شود.
Vapor Chamber: خنک کننده با دارا بودن صفحهی مسی بزرگ و تماس مستقیم با GPU و تراشههای حافظهی GDDR6X، میتواند به کمک لولههای ناقل حرارتِ کامپوزیتی با فناوری vapor chamber، انتقال حرارت را با سرعت و بهرهوری بالا انجام داده و به هیتسینک منتقل کند.
طراحی زاویهدار: طراحی پرههای زاویهدار و نابرابر برای هیتسینک میتواند جریان هوا را از طریق بالهها هدایت کرده و سطح تماس را بزرگتر کند.
LCD Edge View: یک نمایشگر LCD در لبهی کارت گرافیکی تعبیه شده که نه تنها میتواند اطلاعات کارت گرافیک را نمایش دهد، بلکه قادر است متنهای اختصاصی، عکس و گیف انتخابیِ کاربر را نیز بنا به سلیقه نمایش دهد. حتی افکتهای نورپردازی آن از طریق نرمافزار RGB Fusion 2.0 قابل تغییر است.
Metal Back Plate: صفحهی فلزی نصب شده در پشت کارت گرافیکی نه تنها با طراحی کارت گرافیکی یکدست است، بله ساختار کارت گرافیکی را مستحکمتر کرده و از ایجاد اثرِ خمیدگی در طول زمان به دلیل وزن خنککننده محافظت میکند.
Dual Bios: بایوس در حالت Silent یا ساکت تجربهی کم صداتری را مهیا میکند، در حالی که حالت OC خنککنندگی بیشتر و راندمان بالاتر را نتیجه میدهد.
۶ خروجی گرافیکی: میتوانید از بین سه پورت خروجی HDMI و سه پورت خروجی DP برای نمایشگر یا نمایشگرهای خود ترکیب مناسب را بدون نیاز به آداپتور مبدل انتخاب کنید.
سیستم تست
• پردازنده: Intel Core i7 – 10700K OC to 5.0 GHz
• مادربرد/ حافظه: ASUS Z490-F STRIX/ GSKILL Trident RGB DDR4 3200Mhz 32GB
• سیستمعامل: ویندوز 10 نسخهی November Update با آخرین آپدیتها (19042.685-20H2)
• درایورها: انویدیا GeForce 460.89 WHQL و AMD Radeon Software Adrenalin Edition 20.12.1
کارتهای گرافیک
بنچمارکها
3DMARK 2013
راندمان دایرکت ایکس ۱۱
اولین آزمون کارت گرافیکی ما Fire Strike در 3DMARK با API مبتنی بر دایرکت ایکس 11 کار میکند و الگوی اجرایی مشابه با برخی بازیهای قدیمیتر دارد. امتیاز Graphics Score تا حد زیادی به توان قطعات دیگر بستگی ندارد و میتواند به صورت مستقل مورد قیاس قرار بگیرد. در اینجا RTX 3080 Master توانسته ۲۵ درصد سریعتر از RTX 2080 Ti ظاهر شود و نسبت به پرچمدار دو نسل قبلی یعنی GTX 1080 Ti هم ۴۶ درصد قویتر عمل کرده است. بنابراین اگر قصد ارتقا از پرچمدارِ دو نسل قبلی را داشته باشید، حدود ۵۰ درصد راندمان بیشتری در بازیهای متداول دایرکت ایکس 11 خواهید گرفت.
راندمان دایرکت ایکس ۱۲
برای رابط گرافیکی دایرکت ایکس 12 هم آزمون Time Spy را داریم که استفاده از آن در بازیهای مدرنتر رو به فزونی گذاشته و بنابراین اهمیت آن به تدریج بیشتر از گذشته خواهد شد. در حالی که در نسل تورینگ به امتیاز ۱۳۵۴۱ از کارت RTX 2080 Ti رسیده بودیم، در نسل آمپر راندمان به میزان ۳۲ درصد افزایش پیدا کرده و به ۱۷۹۳۵ در RTX 3080 Master رسیده است. بلافاصله میتوان دید که افزایش راندمان در دایرکت ایکس 12 در RTX 3080، بیشتر از میزان افزایش راندمان در دایرکت ایکس 11 بوده و به بیان دیگر معماری آمپر راندمان بهتری در دایرکت ایکس 12 ارائه میکند.
Cyberpunk 2077
اگر بخواهیم مقایسهای بین راندمان چندین نسل داشته باشیم، باید گزینههای اختصاصی کارتهای گرافیک RTX را از آزمون مستثنی کنیم، بنابراین بالاترین تنظیمات در سطح Ultra را بدون قابلیت RT و همینطور بدون DLSS در بازی تنظیم کردیم. در دقت 1440p با ثبت میانگین ۷۹ فریم توانستیم رکوردی را در راندمان اجرای این بازی در نتایج بدست آمده ثبت کنیم که احتمالا تنها توسط RTX 3090 شکسته شده و البته هنوز نمونهای از آن را در اختیار نداریم. همچنین در اینجا راندمان RTX 3080 نسبت به RTX 2080 Ti به مقدار ۳۱ درصد پیشرفت داشته است که مطابق با الگوی نتیجهی بدست آمدهی قبلی است. RTX 3080 Master به خاطر فرکانس کاری بالاتر، حدود ۳ درصد راندمان بیشتری نسبت به ASUS TUF RTX 3080 کسب کرده است که چندان محسوس نیست، اما قابل تمایز و تغییر جایگاه در نتایج است.
اما ببینیم در رزولوشن 2160p که به اختصار 4K هم میگوییم چه نتایجی ثبت شده است. مشخصا حتی کارت گرافیک RTX 3080 هم نمیتواند در بالاترین تنظیماتِ غیر RT و بدون کمک گرفتن از DLSS به سطحِ ۶۰ فریم در ثانیه برسد و تنها به ۴۱ فریم در ثانیه اکتفا کرده است. از سوی دیگر پرچمدار قدیمی هم فقط توانسته به مرز ۳۰ فریم کنسولی دسترسی پیدا کند که برای اجرای روان و قابل قبول این بازی روی پیسی کفایت نمیکند. در دقت 4K هم تفاوت راندمان بین دو پرچمدار نسل آمپر و تورینگ افزایش یافته و به ۳۶ درصد رسیده است، بنابراین قدرتِ آمپر در رزولوشن 4K بهینهتر از 2K به نظر میرسد.
Godfall
یکی از سنگینترین بازیهای عرضه شده با جلوههای بصری مدرن به عنوان گزینهی بعدی ما برای راستیآزماییِ توان کارت گرافیکی جدید انتخاب شده است. کارت RTX 3080 Master برای بدست آوردن اولین جایگاه در نمودار ما برای رسیدن به میانگینِ ۹۰ فریم در ثانیه در 1440p، کار سختی در پیش نداشته و توانسته با اختلاف ۳۲ درصد GeForce RTX 2080 Ti را شکست دهد. اساسا تنظیمات Epic در این بازی روی کارتهای گرافیکی پایینتر از RTX 2080 قابلیت بازی با نرخ فریمِ مناسبی نخواهد داشت و تنها پرچمداران دو نسل آخر انویدیا هستند که در این رزولوشن میتوانند ایدهآل ۶۰ فریم را پشت سر بگذارند.
در دقت 4K با دشوار شدن پردازش، فقط کارت RTX 3080 هست که میتواند در بالاترین تنظیمات به محدودهی طلایی ۶۰ فریم در ثانیه برسد و راندمان بی نقصی ارائه کند. راندمان ۴۰ فریم در ثانیه از RTX 2080 Ti حدود ۳۰ درصد پایینتر از RTX 3080 است. در رزولوشن 4K بجز RTX 3080، بقیهی مدلها نیاز به کاستن از تنظیمات دارند.
Red Dead Redemption 2
بازی تحسین شده و پرجزئیاتِ راکستار میتواند هم با API دایرکت ایکس 12 و هم با رابط Vulkan روی پیسی اجرا شود که در این میان راندمان رابط ولکان معمولا اندکی بالاتر است. برای بازی RDR2 تصمیم گرفتیم بالاترین تنظیمات گرافیکی ممکن را با استفاده از Vulkan روی کارتهای گرافیکی منتخب آزمایش کنیم. در این حالت کارتهای گرافیک RTX 3080 ما از دو برند ذکر شده توانستند با تنها یک فریم اختلاف در نمودار صدرنشین شوند و کارتهای RTX 2080 Ti و RTX 3060 هم به ترتیب با ۲۹ و ۳۲ درصد راندمان پایینتر در رتبههای بعدی قرار دارند. همانگونه که میبینید افزایش راندمان در Vulkan هم کمابیش هم عرضِ افزایش راندمان در دایرکت ایکس 12 است.
در دقت 4K هم مشخصا تنها کارت RTX 3080 با آخرین تنظیمات قابل بازی است و این مهم تنها به لطف معماری آمپر مهیا شده است.
Assassin's Creed: Odyssey
موتور گرافیکی Assassin's Creed: Odyssey بر اساس دایرکت ایکس 11 ساخته شده بود و بار پردازشی سنگینی هم روی پردازنده میگذاشت. این بازی در دقت 2K بر روی کارت RTX 2080 Ti میتواند به میانگین ۷۲ فریم بر ثانیه برسد، در حالی که RTX 3080 با ۲۶ درصد راندمان بیشتر توانسته به ۹۱ فریم در ثانیه دست پیدا کند. در مقایسهی مستقیم دیگر، راندمان RTX 3080 نسبت به RTX 2080 هم ۴۴ درصد افزایش نشان داده است. همچنین RTX 3080 نسبت به مدل GTX 1080 G1 هم با قدمتی که دارد ۸۹ درصد قویتر عمل کرده است.
در رزولوشن 4K هم مجددا RTX 3080 تنها مدلی است که توانسته میانگین ۶۰ فریم را با آخرین تنظیمات بدست آورد، ولی در کمینهی فریم به ۴۹ فریم در ثانیه سقوط کرده است. مثل بنچمارکهای قبلی RTX 3080 در دقت بالاتر میتواند فاصلهاش را با کارتهای گرافیک نسل قبلی بیشتر کند و قدرتش را بیشتر به رخ بکشد.
راندمان Ray Tracing
Control - RTX
اما عنوان بهترین بازی در استفاده از تکنیکهای مبتنی بر Ray Tracing تا قبل از عرضهی سایبرپانک 2077 متعلق به Control بود و به همین دلیل گزینهی منتخب ما برای آزمایش واحدهای RT در کارتهای گرافیک RTX هم شد. بازی را با بالاترین تنظیمات گرافیکی در حالت Rasterize و افکتهای پردازشی با رهگیری پرتو و همینطور DLSS در بهترین کیفیت یعنی Quality اجرا کردیم تا نرخ فریم خروجی از کارتهای کاندید شده را بدست آوریم. حتی در این تنظیماتِ بالا هم RTX 3080 Master توانست با ۱۰۷ فریم بر ثانیه در دقت 2K به برتری برسد و در 2160p هم نرخ فریم بالاتر از حدِ مورد نیاز برای تجربهی ایدهآل بازی است، در حالی که حتی RTX 2080 Ti هم نمیتواند چنین کیفیتی را در رزولوشن 4K مهیا کند.
اورکلاک
در تلاش برای اورکلاک کارت گرافیکی RTX 3080 Master توانستیم به کمک نرمافزار Afterburner و کمی آزمون و خطا، فرکانس کاری تراشهی گرافیکی در حالت بوست را با ۷۵ مگاهرتز افزایش به ۱۹۲۰ مگاهرتز برسانیم و کماکان اجرای پایداری از بازیها و آزمونهای Stress روی کارت گرافیکی داشته باشیم. توجه داشته باشید که در این حالت فرکانس واقعی GPU به دلیل کارکرد تحت الگوی GPU Boost انویدیا تحت شرایطی به بالای ۲۰۰۰ مگاهرتز هم افزایش مییابد و با افزایشِ میزان مصرف و دما، به صورت پلهای کاهش مییابد. این نتیجه نسبت به عملکرد سایر کارتهای گرافیکی و آنچه که شخصا از معدود مدلهای تست شده دیگر دیده بودیم هم مطلوب بود، هر چند که تاثیر زیادی در افزایش راندمان نخواهد داشت.
شیوهی اورکلاک یا همان افزایش فرکانس کاری تراشههای حافظه هم مثل هیچ یک از نسلهای گذشته نیست، چرا که برای تراشههای GDDR6X از الگوریتم تشخیص خطای ECC استفاده شده که حتی در صورت بروز خطا در ارتباطات با حافظهی گرافیکی، درخواست بازخوانی و تکرارِ مجدد عملیات حافظه اجرا میشود و دیگر شاهد artifact یا ظاهر شدن اشیای تصادفیِ غیر واقعی در صورت افزایش بیش از حد فرکانس کاریِ حافظه نخواهیم بود. در عوض، تنها سرعت اجرای عملیات و در نتیجه سرعت دسترسی به حافظه کاهش خواهد یافت و به جای افزایش فریم، احتمالا با عدم تغییرِ پهنای باند گرافیکی نسبت به افزایشِ فرکانس و یا کاهشِ آن مواجه خواهیم شد. بنابراین تشخیص آستانهی پایداری فرکانسِ خاص در حافظهی کارت گرافیکی، با الگوهای تشخیص بصری خطا در محصولات قبلی متفاوت است.
با شرحی که در بالا رفت، در RTX 3080 Master توانستیم فرکانس موثر حافظه را تا سطح ۲۰ گیگاهرتز افزایش دهیم و مشکلی با پایداری حافظه نداشته باشیم که نتیجهی خوبی محسوب میشود. در نظر داشته باشید که گرافیکهای پرچمدار نسل آمپر در بیشتر سناریوهای اجرا اصطلاحا Power Limit هستند و محدودیت مصرف توان مانع از افزایش فرکانس بیشتر در آنها خواهد شد، بنابراین حتی اگر فرکانس کاری بالاتری را هم برای آنها تعیین کنید، باز هم کارت گرافیک بسته به میزانِ سقف توانی که برای آن در بایوس تعیین شده، فرکانس و در نتیجه ولتاژ کاریِ آن را محدود خواهد کرد و تاثیرِ افزایش فرکانس بی اثر خواهد شد. در معدود سناریوهای فرضی، تنها در صورت نرسیدن به سقفِ توان ممکن است فرکانس کاریِ بالاتر اعمال شود که آن هم معمولا دوامِ زیادی نخواهد داشت و به محدودهی پایینتر نزول خواهد کرد، بنابراین اورکلاک پرچمدارهای آمپر با وجود فناوری افزایش فرکانسِ پویا و محدودیتِ مصرف توان در مجموع تاثیر زیادی در افزایش راندمان نخواهد داشت و به خوبی نسلهای گذشته موثر واقع نخواهد شد.
همچنین افزایش ولتاژ هم در افزایش پایداری سرعت ساعت کاری در این کارتها در اغلب موارد کارساز نیست. حتی در برخی بازههای فرکانسی، تنها با کاهش ولتاژ و کاستن از توان مصرفی میتوان به فرکانس بالاتر دست پیدا کرد و به همین دلیل Undervolting یا کاهش ولتاژ GPU در سری کارتهای آمپر طرفداران زیادی پیدا کرده است و در بسیاری موارد باعث بهینهسازی مصرف توان و کاهش دمای کاری کارت گرافیک میشود، هر چند که برای کاربران عادی و کم تجربه توصیه نخواهد شد.
اما در تستِ دایرکت ایکس 12 با اورکلاک، تنها به میزانِ ۲ درصد به راندمانِ 3DMark Graphics Score با فرکانسِ پیشفرض اضافه شد که نشان میدهد اورکلاکِ دستی ما در راندمانِ کارت گرافیکیِ از پیش اورکلاک شده، تغییر آنچنان ملموسی را ایجاد نخواهد کرد.
دما و نویز
در حالتِ فرکانس پیشفرض، بالاترین دمای ثبت شدهی کارت در داخل کیس MasterCase H500P Mesh ، به عدد ۷۹ درجهی سانتیگراد رسید که بههرحال در بازهی کاری این تراشهی قدرتمندِ گرافیکی محسوب میشود و هنوز تا رسیدن به محدودیت دماییِ ۸۳ درجه فاصلهی محسوسی دارد. البته این کارت در بیشتر بازیها و پس از رسیدن به ثباتِ فرکانسی دمایی بین ۷۶ تا ۷۸ درجه را ثبت میکرد و به ندرت و بسیار کوتاه مدت به ۷۹ درجه میرسید که در این حالت هم فرکانسِ کاری کارت به مقدار ۱۵ یا ۳۰ مگاهرتز پایینتر از حد میانگینِ متعارفش کاهش مییافت. در هر حال مشخص است که خنککنندهی بزرگ این کارت به خوبی میتواند دمای کارت را در سناریوهای سخت نیز کنترل کند و بسته به دمای محیطی و تهویهی کیس، ممکن است دمای پایینتری را هم در هنگام اجرای این کارت گرافیکی تجربه کنید. همچنین بیشترین دما را در بازیهای Red Dead Redemption 2 و Godfall تجربه کردیم.
در مورد نویز صوتی هم عملکرد کارت شباهت بسیاری به GeForce RTX 2080 Ti XTREME از نسل قبلی داشت که مدل مذکور را هم در زومجی بررسی کرده بودیم. فنها در حالت بیکار خاموش هستند و تا رسیدن به دمای مشخصی از حالت لود شروع به چرخیدن نخواهند کرد و نویزی هم تولید نمیکنند. اما در حالت لود بسته به سنگینی پردازشِ بازی و بار کاریِ کارت گرافیک دور چرخش فنها به بیش از ۲۰۰۰ دور در دقیقه هم خواهد رسید که کاملا قابل تشخیص و شنیدن است، اما در هنگام استفاده در داخل کیس و مخصوصا استفاده از هدست آنچنان آزار دهنده نیست.
AORUS GeForce RTX 3080 Master با خنککنندهی عظیم، نورپردازی ARGB و صفحه نمایش LCD روی لبهی کارت، طراحی نوآورانه و کارآمدی را در بین تمام مدلهای موجود از برندهای دیگر عرضه کرده و بهراحتی میتواند نظر بسیاری از گیمرها را در هنگام انتخاب برای خرید به خود جلب کند. ارتفاع ۷ سانتیمتری این کار و این واقعیت که ۴ اسلات مادربرد را در هنگام نصب در کیس اشغال خواهد کرد، ضرورت اطمینان از جایگیری و وجود فضای مناسب در کیس را قبل از خرید دوچندان میکند. حتی در صورت قابلِ نصب بودن هم بهتر است در مورد تهویهی مناسب در هنگام تجمع هوای گرم در داخل کیس و جریان مناسبِ هوا هم مطمئن باشید تا خنککنندهی بزرگ این کارت به بهترین شکل از پس دفع حرارت برآید.
برای بررسی راندمان این کارت گرافیک سعی کردیم عناوین مربوطه را به نحوی گزینش کنیم که تمامِ بازهی مورنظر برای الگوی اجراییِ بازیهای روز پوشش داده شود و به همین خاطر تستهای اختصاصی گرافیک و بازیها را بر اساس دایرکت ایکس 11، دایرکت ایکس 12 و همینطور Vulkan انتخاب کردیم و یک بازی پیشتاز در اجرای تکنیکهای رهگیری پرتو را هم برای آزمودنِ توان شتابدهندههای RT و واحدهای هوش مصنوعی DLSS در مجموعهی بنچمارکها گنجاندیم.
همانگونه که در بررسی بنچمارکها شاهد بودید، کارت AORUS GeForce RTX 3080 Master توانست با اقتدار، صدر تمامِ نمودارها را تسخیر کند و بسته به بازی و رزولوشن پردازش بازی، بین ۲۵ تا ۳۲ درصد سریعتر از RTX 2080 Ti، پرچمدار نسل قبلی عمل کند و GTX 1080 Ti یا RTX 2080 را هم با میزانی در محدودهی ۵۰ درصد پشت سر بگذارد. این راندمان به خاطر فرکانس نسبتا بالاتر کارت RTX 3080 Master نسبت به کارت ASUS TUF RTX 3080 همیشه یک یا دو فریم هم بالاتر بود و طبعا نسبت به کارت Founders Edition هم تا حدود ۵ درصد سریعتر عمل میکند.
با وجود فرکانس کاری بالاتر، از نظر خنککنندگی و دما هم این کارت ثابت کرد که با مجهزشدن به یک خنککنندهی عظیمالجثه و به کمک لولههای ناقل حرارتی متعدد و فنهای توانمند، چیزی برای فدا شدن در ازای رسیدن به راندمان بالاتر وجود ندارد و با وجود ۵ یا ۶ درجه دمای بیشتر نسبت به RTX 3080 از ایسوس، به خوبی میتواند از پس اجرای وظیفهی خنککنندگی خود برآمده و در عین حال راندمان را هم در سطحِ بهینه حفظ کند. هر چند که قبلا هم گفته شد اگر دمای کاری GPU پایینتر باشد، فرکانس آن به صورت خودکار با الگوریتمهای بوستِ انویدیا در میزان بالاتری عملیاتی خواهد شد و تنها خنک نگه داشتن کارت به تنهایی میتواند سبب بهبود نسبی راندمان شود.
مقالهی مرتبط
AORUS GeForce RTX 3080 Master تمام ویژگیهای مورد نیاز برای رسیدن به جایگاهِ برتر در زمینهی طراحی، استقامت و راندمان را برآورده میکند و به عنوان یک محصول قدرتمند از رده کارتهای حرفهای GeForce GTX 3080 در بین مدلهای موجود، ابرازِ وجود و خودنمایی میکند و اگر عدم موجودی و قیمت بسیار بالای این کارتها را در نظر نگیریم، میتواند گزینهای مناسب برای خریداران ایرانی هم باشد که در پردازشهای سنتی کمابیش بالاتر از محصولات رقیب، اما در پردازشهای مدرنِ RT و DLSS یک سر و گردن بالاتر از آنها ظاهر میشوند. برتری در راندمان RT یکی از مزیتهای بالقوه موثر در انتخاب کارت گرافیک آینده برای بسیاری از گیمرها تلقی خواهد شد.
کارت گرافیک AORUS GeForce RTX 3080 MASTER 10G گیگابایت توسط نمایندگی در اختیار زومجی قرار گرفته است.
تهیه شده در بخش سختافزار زومجی