معرفی کارت گرافیک جدید انویدیا، GTX1080 یکی از مهمترین رویدادهای صنعت گیمینگ در روزهای گذشته بوده و تمام کارشناسان و البته خوره‌های بازی منتظر دسترسی به نمونه‌ای از این محصول برای بررسی آن بوده‌اند. برای بررسی قدم به قدم این پرچمدار قدرتمند با زومجی همراه باشید.

پس از انتشار اخبار و گمانه‌زنی‌های فراوان در مورد نسل جدید معماری گرافیکی انویدیا و بالا گرفتن بحث بر سر مشخصات اولین کارت‌های در نظر گرفته شده برای عرضه بر اساس آن، انتظارات به پایان رسید و انویدیا طی مراسمی رسمی اولین محصولات گیمینگ معماری پاسکال (همچون نسل‌های گذشته بر گرفته شده از نام ریاصیدانان مشهوری مانند مَکسول و کپلر) با نام‌های GTX 1080 و GTX 1070 را رونمایی کرد و مشخصات کلی و قیمت آنها را هم اعلام نمود.

در این مقاله سعی می‌کنیم ضمن معرفی مشخصات و قابلیت‌های فنی تراشه‌ی جدید، به تکنیک‌های جدید معرفی شده با این معماری نیز بپردازیم و کارکرد و استفاده‌ی هر یک را بیان کنیم. برخی از این قابلیت‌ها فقط در معماری پاسکال قابل استفاده خواهند بود و برخی نیز ممکن است از طریق بروز رسانی درایور گرافیکی با کارت‌های نسل قبلی جیفورس کار کنند. به خاطر داشته باشید این مشخصات بر اساس مدل مرجع انویدیا یا همان مدلی که Founders Edition نام گرفته بیان می‌شود و برخی مشخصه‌های فنی مانند فرکانس کاری GPU و همین طور فرکانس کاری تراشه‌های حافظه در مدل‌های اختصاصی متفاوت از این ارقام خواهد بود.

GTX1080notes_MG_3864

شاید به خاطر داشته باشید که اولین محصول معماری پاسکالِ انویدیا نه یک کارت گرافیک بازی، بلکه یک کارت محاسباتی قدرتمند با نام  Tesla P100 بود که بر اساس تراشه‌ی پاسکال بزرگ یا همان GP100 ساخته شده است و شامل تمام هسته‌های پردازشی در نظر گرفته شده با قابلیت (single precision (FP32 و (Double precision (FP64 در این تراشه است که در مجموع شامل ۳۸۴۰+۱۹۲۰ واحد CUDA و ۲۴۰ واحد ترسیم بافت یا TU می‌شود. البته Tesla P100 از فناوری حافظه‌ی HBM2 هم پشتیبانی می‌کند که با این تفسیر اگر قرار باشد انویدیا یک محصول گیمینگ را هم بر پایه‌ی تراشه‌ی GP100 عرضه کند قاعدتا باید حافظه‌ی HBM2 داشته باشد و نه حافظه‌های GDDR5 معمولی یا GDDR5X، چرا که به کنترلر حافظه‌ی متفاوتی در خودِ GPU نیاز خواهد داشت.

فناوری ساخت ۱۶ نانومتری

انویدیا با وجود در دست داشتن معماری جدید با واحدهای بیشتر و راندمان بهینه‌تر، یک چالش کاملا جدی و بزرگ را نیز پشت سر گذاشت که اثبات موفقیتش همین عرضه‌ی کارت‌ GTX 1080 بود و این چالش چیزی نبود جز فناوری ساخت جدیدِ ۱۶ نانومتری. اگر مقاله‌ی قبلی ما در مورد معرفی محصولات تجاری پاسکال را خوانده باشید، در آنجا اهمیت این موضوع را به تفضیل شرح دادیم. هم انویدیا و هم ای‌ام‌دی از سال ۲۰۱۱ میلادی از معماری ۲۸ نانومتری در تراشه‌های خود استفاده کرده‌اند و تلاش برای دستیابی به فناوری ۲۰ نانومتری در دو سال گذشته هم ناکام ماند، اما امسال و در میانه‌ی سال ۲۰۱۶ میلادی، ظرفیت و کیفیت تولید کارخانه‌ی TSMC (سازنده‌ی نیمه هادی‌ها و تراشه‌های مبتنی بر آن که ساخت سفارشات Nvidia و AMD را بر عهده دارد) در پروسه‌ی ساخت ۱۶ نانومتری به حدی بالغ شده که می‌توان محصولات تجاری جدید را به صورت انبوه و کیفیت مناسب تولید و عرضه کرد. فناوری جدید ۱۶ نانومتری با نام FinFET نوعی روش بهینه‌ی تولید برای کاهشِمصرف توان، کاهش ولتاژ و همین‌طور کاهش نشتی ترانزیستورها در این ابعاد است. انویدیا پس از مدت‌ها به کمک این فناوری توانسته به طرز چشمگیری فرکانس کاری تراشه‌های پاسکال را نسبت به مکسول و کپلر افزایش و در عین حال ابعاد تراشه و میزان مصرف آنها را کاهش دهد.

NVIDIA 16nm

استفاده از GDDR5X

علاوه بر پروسه‌ی ساخت جدید و افزایش فرکانس کاری، انویدیا برای اولین  بار در این محصول از تراشه‌های حافظه‌ی GDDR5X استفاده کرده است. این تراشه‌های حافظه با استاندارد جدید به تازگی توسط شرکت میکرون (یکی از بزرگ‌ترین سازندگان تراشه‌های حافظه در دنیا) به تولید انبوه رسیده‌اند و بر خلاف حافظه‌های HBM، بدون تغییرات اساسی در نحوه‌ی ارتباط با GPU و تغییر در کنترلر حافظه‌ی آن می‌توانند سرعت و پهنای باند بیشتری را برای کارت گرافیک فرآهم کنند. کارت GTX 1080 با این‌ که مانند GTX 980 از گذرگاه حافظه‌ی ۲۵۶ بیتی استفاده می‌کند، با کمک تراشه‌های GDDR5X توانسته پهنای باند حافظه‌ای نزدیک به کارت ۳۸۴ بیتی GTX 980Ti فرآهم کند و این به تنهایی پیشرفت قابل توجهی محسوب می‌شود. این روزها با افزایش کاربرد نمایشگرهای بزرگتر و یا ترکیب چند گانه‌ی آنها، پهنای باند حافظه‌ی بیشتر اهمیت بالاتری هم پیدا می‌کند. در مقام مقایسه، GTX 1080 با استفاده از  GDDR5X با سرعت انتقال داده‌ای ۱۰ گیگابیت بر ثانیه توانسته ۴۳ درصد پهنای باند بیشتری نسبت به GTX 980 فرآهم کند و با احتساب برخی بهبودهای صورت گرفته در الگوریتم‌های فشرده سازی حافظه، در مجموع شاهد افزایش ۱.۷ برابری نسبت به GTX 980 هستیم.

GDDR5X ZoomG

مشخصات فنی GTX 1080

در تراشه‌ی رده‌ی جیفورسِ معماری پاسکال، انویدیا تصمیم گرفته با حذف واحدهای Double Precision از واحدهای CUDA  که برای بازی‌ها مد نظر نیست و بیشتر در محاسبات علمی پیچیده کاربرد دارد، تعداد آنها را هم از مجموع ۳۸۴۰ واحد FP32 در تراشه‌ی پاسکال بکار رفته در Tesla P100، به ۲۵۶۰ واحد کاهش داده و از پیچیدگی بی دلیل تراشه بکاهد و ضمنا هزینه‌های ساخت را هم کاهش دهد. تراشه‌ی بدست آمده GP104-400-A1 نامیده می‌شود.

کارت مرجع یا اگر دقیق‌تر بگوییم مدل Founders Edition انویدیا از GTX 1080 با سرعت ساعت‌های کاری پیش فرض می‌تواند راندمان ۹ ترافلاپس را برای محاسبات single precision مهیا کند، در حالی که این میزان در مدل مرجع همرده در نسل پیشین یعنی GTX 980 برابر با ۴.۶۱ ترافلاپس بود و حتی از توان ۶.۴ ترافلاپسی کارت رده بالاتر GTX 980Ti هم بسیار بیشتر است. طبیعی است که این کارت با استاندارد PCI-Express 3.0 کار می‌کند و حداکثر توان ۱۸۰ وات را در بدترین سناریو و حداقل بین ۵ تا ۱۰ وات را در حالت بیکار مصرف می‌کند.

GeForceGTX 1080GTX 1070GTX Titan X GTX 980 TiGTX 980
تراشه‌ی گرافیکیGP104-400-A1GP104-200-A1GM200GM200GM204
معماریPascalPascalMaxwellMaxwellMaxwell
تعداد ترانزیستور7.2 Billion7.2 Billion8 Billion8 Billion5.2 Billion
پروسه‌ی ساختTSMC 16 nmTSMC 16 nmTSMC 28 nmTSMC 28 nmTSMC 28 nm
تعدادهسته‌های CUDA25601920307228162048
تعداد واحدهای SMX2015242216
تعداد واحدهای ROPs6464969664
 فرکانس پایه‌ی تراشه1,607 MHz1,506 MHz1,002 MHz1,002 MHz1,127 MHz
فرکانس توربوی تراشه1,733 MHz1,683 MHz1,076 MHz1,076 MHz1,216 MHz
فرکانس حافظه1,250 MHz2,000 MHz1,753 MHz1,753 MHz1,753 MHz
 اندازه‌ی حافظه8 GB8 GB12 GB6 GB4 GB
عرض باند گذرگاه حافظه256-bit256-bit384-bit384-bit256-bit
پهنای باند حافظه 320 GB/s256 GB/s337 GB/s337 GB/s224 GB/s
راندمان محاسبات اعشاری 9.0 TFLOPS6.45 TFLOPS7.0 TFLOPS6.4 TFLOPS4.61 TFLOPS
  سقف حرارتی تراشه94 C94 C91C91C95 C
توان مصرفی180 Watts150 Watts250 Watts250 Watts165 Watts
  قیمت599/699$379/449$999$699$549$

پشتیبانی از نمایشگرهای HDR

انویدیا اکنون به طور کامل از قابلیت High Dynamic Rang یا به اختصار HDR پشتیبانی می‌کند. با این قابلیت می‌توان طیف رنگی گسترده‌تر و رنگ‌های طبیعی‌تر، کنتراست بیشتر، روشنایی بالاتر و محتوای زنده‌تری را در فیلم‌ها و بازی‌ها انتظار داشت. نمایشگرهای دارای این قابلیت از امسال در مرحله‌ی تولید انبوه قرار خواهند گرفت و ابتدا تلویزیون‌ها و سپس مانیتورها با این قابلیت در دسترس خواهند بود. پنل‌های HDR قادر به نمایش رنگ‌های سیاه با عمق رنگ OLEDها و روشنایی‌های درخشان با کیفیت نمایش LCD های رایج خواهند بود و کنتراست به مراتب بالاتری نسبت به نمایشگرهای فعلی و نزدیک به حد تشخیص چشمان انسان خواهند داشت. انویدیا خواسته تا پیشاپیش این امکان را در محصولش آماده‌ی استفاده داشته باشد. در همین راستا هم پاسکال از استاندارد رمزگشایی و رمزگذاری یا Codec جدید 10bit-HEVC برای استریم و پخش محتوای HDR پشتیبانی می‌کند.

HDR ZoomG

فشرده سازی رنگ بهبود یافته

پیش از این از بهبودهای صورت گرفته در الگوریتم‌های فشرده سازی حافظه سخن به میان آمد. اما این تکنیک‌ها چیستند و چه کارکردی دارند؟ در واقع این تکنیک‌ها را می‌توان روش‌هایی برای صرفه جویی بیشتر در پهنای باند حافظه محسوب کرد که فشرده سازی رنگ‌ها یکی از این روش‌ها است. بخش فشرده سازی در تراشه‌ی گرافیکی به صورت پویا بهترین راه را از بین الگوریتم‌های مختلف برای فشرده سازی انتخاب می‌کند. مهمترین الگوریتم Delta Color Compression نام دارد که تفاوت میان پیکسل‌ها را در قالب بلاک‌هایی محاسبه کرده و آنها را به عنوان مجموعه‌های مرجع پیکسلی در نظر می‌گیرد و در مورد پیکسل‌های غیر مرجع، تنها اطلاعات دلتای آنها را با بلاک مرجع ذخیره می‌کند. به این ترتیب دیتای حاصل شده به نصف تقلیل پیدا می‌کند و اصطلاحا 2:1 Compression خوانده می‌شود.

Delta Color Copression

حالا در پاسکال نه تنها الگوریتم فشرده سازی ۲ به ۱ بهبود یافته، بلکه الگوریتم‌های جدیدتر ۴ به ۱ و همین طور ۸ به ۱ هم برای فشرده سازی رنگ‌ها معرفی شده‌اند که تا حد بسیار بیشتر و با تلفیق روش‌های قبلی فضای ذخیره سازی مورد نیاز را کاهش می‌دهند.

Asynchronous Compute

برای بهینه سازی استفاده از توان پردازشی تراشه‌های گرافیکی و توزیع بار کاری پردازش دربازی‌های سنگین امروزی روش  موثری وجود دارد که حالا در دایرکت ایکس 12 به استاندارد تبدیل شده و احتمالا با نام آن هم آشنا هستید. پردازش نامتقارن یا Asynchronous Compute از نسل قبلی مکسول در انویدیا و از خیلی قبل‌تر و با معماری GCN توسط ای‌ام‌دی بکار گرفته شده است. سناریوی محتمل برای استفاده از چنین روشی می‌تواند پردازش همزمان محاسبات فیزیک و بخش گرافیک موتور بازی روی GPU و اعمال برخی افکت‌ها مثل افکت‌های Postprocessing روی تصاویر رندر شده و قبل از نمایش باشد.

pascal-dynamic-load-balancing

در معماری مکسول برای دو نوع متفاوت از بارِ کاری مثل پردازش گرافیکی و پردازش فیزیک امکان تخصیص دو پارتیشن مجزا و ثابت از ابتدای شروع همزمان این دو عملیات وجود داشت و اگر یکی از آنها زودتر به پایان می‌رسید، بخشی از توان GPU بدون استفاده باقی می‌ماند، اما در معماری پاسکال این عملکرد بهبود یافته و پس از اتمام یک پردازش کاری، پردازش دیگر می‌تواند به صورت پویا تمام منابع تراشه را در اختیار خود بگیرد و حداکثر استفاده را از تخصیص منابع ببرد. این مزیت جدید، پردازش نامتقارن و بهبود یافته در نسل پاسکال است و باعث افزایش راندمان در حالت‌های پشتیبانی شده می‌شود. حتما به یاد دارید که این مورد یکی از نقطه ضعف‌های انویدیا در نسل قبلی بود و حواشی زیادی را در مورد بهینه نبودن راندمان آن ایجاد کرده بود. حالا انویدیا وعده‌ی بهبود راندمان در این قسمت را داده است.

امکانات جانبی معرفی شده با پاسکال

Ansel

راه جدیدی برای گرفتن اسکرین شات‌های دلخواه در داخل بازی است که بجای یک تصویر معمولی، یک نمای ۳۶۰ درجه‌ی کامل از محیطی را که در بازی انتخاب کرده‌اید ثبت می‌کند. این نمای ۳ بعدی بعدا از طریق ابزار واقعیت مجازی یا VR مثل Oculus Rift و HTC Vive قابل دیدن خواهد بود و می‌توان از آنها در ابزارهای ویرایش حرفه‌ای هم تصاویری را با تنظیمات اختصاصی و رزولوشن خیلی بالا ایجاد کرد. این امکان نیاز به پشتیبانی در بازی‌ها دارد.

Ansel ZoomG

Nvidia FAST SYNC

یک حالت جدید در بین انواع گوناگون Sync یا همگام سازی در بازی‌ها است. رایج‌ترین حالتی که گیمرهای پی‌سی آن را می‌شناسند V-Sync است که با همگام‌سازی نرخ فریم خروجی کارت گرافیک با نرخ بازسازی مانیتورتان، از ایجاد بریدگی در تصاویر جلوگیری می‌کند. اما ایرادش این است که با گرفتن ترمز موتور گرافیکی بازی تا سقف قابل پشتیبانی در مانیتور شما (مثلا ۶۰ هرتز) ممکن است باعث ایجاد تاخیر در ورودی یا اصطلاحا Input Lag بشود. خاموش کردن V-Sync هم با این که تاخیر در ورودی را از بین می‌برد اما بریدگی در تصاویر را باز می‌گرداند. راه حل جدید انویدیا با نام Fast Sync هیچ کنترلی بر نرخ فریم کارت گرافیک ایجاد نمی‌کند و مانند حالت خاموش بودن V-Sync رفتار می‌کند، اما همزمان فریم‌های خروجی کارت گرافیکی را که باید نمایش داده شوند از بین فریم‌های مختلف انتخاب و به مانیتور ارسال می‌کند و نتیجه هم نمایش تصاویری با کیفیت زمانی است که V-Sync فعال است و کار می‌کند. با این تفاسیر تاخیر در ورودی هم حذف خواهد شد.

Fast Sync ZoomG

VR Audio

فناوری دیگر معرفی شده با کارت‌های گرافیکی GTX 1080/1070 هم مشابه‌ی چیزی است که قبلا ای‌ام‌دی معرفی کرده بود و AMD True Audio نام داشت. این فناوری هم شبیه سازی صدای ۳ بعدی و بیشتر مناسب استفاده در هدست‌های واقعیت مجازی است. با کمک این قابلیت GPU می‌تواند میزان انعکاس و جذب صدا را با توجه به محیط محاسبه و تولید کند. این گزینه هم به امکانات VRworks اضافه شده است.

Simultaneous Multi-Projection

در اینجا با قابلیت جالبی روبرو هستیم. اگر چند نمایشگر را پهلو به پهلو در کنار هم چیده باشید تا تصویری محیطی یا Surround را در بازی‌ها ایجاد کنید، این قابلیت بسیار کمک کننده خواهد بود. در حالت عادی وقتی ۳ مانیتور در کنار هم باشند زاویه‌ی دید تنها یک دوربین در تمام آنها شبیه سازی خواهد شد که اگر مانیتورها در یک خط باشند هیچ مشکلی نیست، اما اگر با زاویه‌ی خاصی در پیرامونِ شما قرار داشته باشند این زاویه باعث کشیده شدن غیر طبیعی تصاویر در نمایشگرهای کناری خواهد شد. قابلیت Simultaneous Multi-Projection یا به اختصار SMP به پاسکال اجازه می‌دهد که تا ۱۶ زاویه‌ی مجزا برای دوربین را به صورت سخت افزاری و تقریبا بدون تاثیر در راندمان شبیه سازی کند و در نتیجه برای مانیتورهای کناری با توجه به زاویه‌ی قرار گرفتنشان تصاویر سه بعدی را تولید کند. این قابلیت برای تولید تصاویر در هدست‌های VR هم نیاز به پردازش دو فریم مجزا برای دو چشم را از بین می‌برد و باعث افزایش کاملا محسوس راندمان می‌شود.

NVIDIA_Pascal_SMP

GPU Boost 3.0

نسخه‌ی جدید این فناوری در تراشه‌های پاسکال تعبیه شده و انعطاف عمل بیشتری را در تعیین فرکانس و ولتاژ متناسب با آن در اختیار قرار می‌دهد. این الگوریتم جدید می‌تواند به فرکانس پایدار بالاتر و راندمان بیشتر منتهی شود اگر محدودیت‌های حرارت و بار کاری تراشه همزمان رعایت شده باشند. در واقع در هر مقدار ولتاژی می‌توان آفست مجزایی را برای فرکانس تعیین کرد. این امکان در مکسول و نسل‌های قبلی روی نموداری ثابت و همسان افزایش پیدا می‌کرد. نرم افزارهای اختصاصی اورکلاک باید برای بهره گیری از این حالت بروز رسانی شوند.

GPU Boost 3.0

بروز رسانی حالت SLI

در این نسل پس از مدت‌ها قابلیت ارتباط کارت‌های گرافیکی در حالت SLI یا چند گانه تغییر کرده و تنها دو کارت برای این نسل به طور رسمی پشتیبانی می‌شود (استفاده از سه یا چهار کارت گرافیکی دیگر توصیه نمی‌شود) و همزمان از دو لینک برای ارتباط کارت‌‌ها استفاده خواهد شد. به این طریق پهنای باند ارتباطی کارت‌ها دو برابر خواهد شد.

بررسی راندمان...

در این مقاله سعی کردیم به معماری پاسکال و مشخصات آن تحت تراشه‌ی GP104-400 بپرداریم و امکانات و قابلیت‌های جدید معرفی شده با آن را شرح دهیم. روشن است که تمام اینها بدون داشتن تصوری در مورد راندمان این محصول خیلی امیدوار کننده و مثمر ثمر نخواهد بود. در اینجا این وعده را می‌دهیم که در بخش دوم مقاله بررسی اختصاصی و ویژه از راندمان GTX 1080 در زومجی داشته باشیم و این کارت را درعمل و در بنچمارک‌ها و بازی‌های واقعی محک بزنیم. پس منتظر بخش دوم مقاله‌ی ما باشید، چون محصول ویژه‌ی ما در راه است!

ZoomG GeForce GTX1080 NVIDIA

 

تهیه شده در زومجی

تهیه شده در زومجی

مقاله های مرتبط

کاراکتر باقی مانده