نویسنده: فرشید معتمد
// جمعه, ۳۱ مرداد ۱۳۹۹ ساعت ۱۷:۰۱

موشکافی معماری AMD در ایکس باکس سری ایکس مایکروسافت

APU-های کنسولی نسل بعدی AMD به تدریج از خفا خارج می‌شوند. با هم به بررسی اجمالی اطلاعات جدید از کنسول نسل بعدی مایکروسافت می‌پردازیم.

در رویداد سالانه‌ی Hot Chips 2020، مایکروسافت جزئیات بیشتری از قسمت‌های داخلی معماری سیستم ایکس‌باکس سری ایکس را ارائه کرد. بخش زیادی از اطلاعات مطرح شده در ارائه‌ی منتشر شده پیش از این رخداد، در برگیرنده‌ی جزئیاتی بود که قبلا هم از آن باخبر بودیم، اما با در دست داشتن اسلایدهای جدید به برخی موارد جالب توجه نیز دسترسی پیدا کردیم که شامل دیاگرامی از هسته‌ی پردازنده نیز هست. اجازه دهید به‌صورت مفید و مختصر به برخی از عناوین برجسته‌ی آن بپردازیم.

دیاگرام هسته در تراشه مرکزی ایکس باکس سری ایکس به همراه مشخصات کلیدی

درحالی‌که می‌دانستیم ایکس‌باکس سری ایکس ۸ هسته/۱۶ رشته‌ی پردازشی براساس پردازنده‌ی Zen 2 و واحد گرافیکی با ۵۲ واحد پردازشی خواهد داشت، این اولین باری است که تصویر کاملی از هسته را مشاهده می‌کنیم. جای تعجبی نیست که قسمت مربوط‌به GPU بسیار بزرگ باشد. تراشه‌ی کامل ابعادی با ۳۶۰.۴ میلی‌متر مربع مساحت دارد که ۱۵.۳ میلیارد ترانزیستور را در خود جای داده است. یک تحلیل سریع روی تصویر مشخص می‌کند که GPU حدود نیمی از هسته (به‌صورت دقیق‌تر ۴۷.۵ درصد) را در برگرفته است.

بلاک دیاگرام سیستم روی چیپ یا همان SOC در ایکس باکس سری ایکس

باتوجه‌به تمام بخش‌های تعبیه شده در این سیلیکون، اندازه‌ی هسته درواقع کاملا مدیریت شده است. در نظر بگیرید که پردازنده‌های مرکزیِ Ryzen بر مبنای Zen 2 با طراحی دو کلاستری Chiplet، بالغ بر ۷۴ میلی‌متر مربع مساحت دارند (با ۴ برابر حافظه‌ی کش سطح سوم یا L3 بیشتر در مقایسه با APU-ی بکار رفته در ایکس‌باکس سری ایکس) و بعد GPU که امکانات و هسته‌های سایه‌زن بیشتری نسبت به Navi 10 (تراشه‌ی گرافیکی RX 5700XT) دارد که آن هم ۲۵۱ میلی‌متر مربع را شامل می‌شود. این یعنی مجموعا ۳۲۵ میلی‌متر مربع بدون درنظرگرفتن هسته‌های بهبود یافته‌ی معماری Navi 2x و ۱۲ واحد پردازشیِ اضافه‌ی دیگر (نسبت به RX 5700XT). از سوی دیگر ابعاد این تراشه بیش از دو برابر بزرگتر از APU-ی دیگر AMD با اسم رمز Renior است که ۱۵۶ میلی‌متر مربع مساحت دارد.

با نگاه نزدیکتر به تصویر هسته، به نظر می‌آید که تراشه‌ی کامل حداکثر دارای ۵۶ واحد پردازشی (Compute Unit) در قسمت مربوط‌به GPU باشد. این به خاطر این است که با وجود این هسته‌ی نسبتا بزرگ، بازده تولید تراشه‌های سالم را می‌توان با درنظرگرفتن واحدهای اضافه بسیار افزایش داد (به بیان دیگر یعنی تراشه‌هایی که تا سقفِ ۴ واحد از ۵۶ واحد پردازشی گرافیکی آن‌ها هم بعد از پروسه‌ی لیتوگرافی معیوب تشخیص داده شده و قابل استفاده نباشند، باز هم به‌عنوان تراشه‌ی سری ایکس قابل استفاده خواهند بود). اگر شمارشِ ما از روی تصویر درست باشد، برآورد می‌شود که AMD و مایکروسافت فقط ۴ واحد از کلاسترهای پردازشیِ دوگانه را غیرفعال کرده‌اند و البته تمام ۸ هسته‌ی کلاسترهای پردازنده باید برای به‌دست آوردن یک تراشه‌ی قابل استفاده سالم باشند.

توضیحاتی در رابطه با قانون مور و چگونگی حل مشکلات در رابطه با آن در سری ایکس

همچنین این ارائه زمانی را به معرفی کاهشِ سختی در مقیاس‌پذیری تراشه نسبت به قانون‌ مور اختصاص می‌دهد. درحالی‌که اندازه‌ی تراشه‌ی XBOX Series X در رده‌ی سخت‌افزار کنسول قبلی است (۳۷۵ میلی‌متر مربع برای ایکس‌باکس وان در سال ۲۰۱۳ و ۳۶۷ میلی‌متر مربع برای ایکس‌باکس وان ایکس در سال ۲۰۱۷)، و تعداد ترانزیستورها بیش از دو برابر نسبت به XBOX One X افزایش داشته (۶.۶ میلیارد دربرابر ۱۵.۴ میلیارد)، اما در عین حال هزینه‌ی تولید هسته هم بیشتر شده است. مایکروسافت مشخص نکرده که چقدر بیشتر، اما نماد $ را برای هزینه‌ی ایکس‌باکس وان، نماد +$ را برای ایکس‌باکس وان ایکس و ++$ را برای ایکس‌باکس وان سری ایکس فهرست کرده است. همان‌گونه که در جای دیگری هم اشاره کردیم، درحالی‌که لیتوگرافی ۷ نانومتری شرکت TSMC قدرتش را به رخ می‌کشد، هزینه‌ی تمام شده برای هر ویفر به میزانِ قابل ملاحظه‌ای بالاتر از پروسه‌ی ۱۲ نانومتری است.

توضیحاتی در رابطه با معماری velocity در ذخیره ساز کنسول سری ایکس

به‌علاوه، مایکروسافت جزئیات بیشتری در مورد معماری Velocity و اهدافش ارائه کرده است. معماری Velocity به‌جای افزایش حافظه‌ی سیستم، از حافظه‌ی ارزان‌قیمت‌ترِ SSD استفاده می‌کند. در گذشته قیمت حافظه‌های DRAM هر سال ۳۰ درصد کاسته شده، اما برای هشت و نیم سال گذشته هر سال فقط ۵ درصد کاهش داشته است. در مقابل قیمت حافظه‌های Flash در مدت مشابه ۲۳ درصد در هر سال افت کرده است.

از آن‌جا که SSD-ها بسیار سریع‌تر از پلاترهای چرخانِ استفاده شده در هارددیسک‌ها در کنسول‌های قبلی هستند، مزیت بزرگی در زمان‌های بارگذاری بازی‌ها دارند. در ترکیب با تکنیک sampler feedback streaming، سخت‌افزار قادر به بکارگیری حافظه‌ی فلش برای افزایش‌ راندمان‌ کلی خواهد بود، بدون اینکه نیاز به افزایش تصاعدی در میزانِ حافظه‌ی رم باشد.

مقایسه دو تصویر با استفاده از ری تریسینگ و بدون آن در بازی ماینکرافت

یکی از جنبه‌های جدید جالب توجه‌ در کنسول‌های نسل بعدی پشتیبانی از ray tracing (تکنیک رهگیری پرتو) است. تاکنون می‌دانستیم که هر دو کنسول ایکس‌باکس سری ایکس و پلی‌استیشن 5 از رهگیری پرتوی سخت‌افزاری پشتیبانی خواهند کرد، اما تا قبل از این هیچ نشانه‌ی روشنی در اختیار نداشتیم از اینکه چه سطحی از راندمان را باید انتظار داشته باشیم. به نظر می‌رسد که مایکروسافت اهمیت استفاده از رهگیری پرتو در بازی‌ها را کمرنگ جلوه می‌دهد، یا حداقل برداشت ما این‌گونه است. درست مانند آنچه که کارت‌های سری RTX انویدیا انجام داده‌اند، مایکروسافت نیز در اینجا روی رویکرد رندرِ ترکیبی تاکید می‌کند و گوشزد می‌کند که جایگزین کاملی برای روش‌های رندر سنی نیست.

تا آن‌جا که در مبحث راندمان رهگیری پرتو اشاره می‌شود، مایکروسافت فقط به سقف راندمان محاسبه‌ی ۳۸۰ گیگا یا میلیارد پرتو-جعبه در ثانیه و ۹۵ میلیارد پرتو-مثلث در ثانیه اکتفا می‌کند (مفهوم جعبه و مثلث را در الگوریتم BVH و RT در مقاله‌ی بررسی معماری تورینگ در کارت‌های گرافیک RTX 2080 ،RTX 2070 و RTX 2080 Ti انویدیا قبلا شرح داده بودیم). این محاسبات چگونه با سخت‌افزار سری RTX 20 انویدیا قابل مقایسه خواهد بود، درحالی‌که ادعا شده RTX 2080 Ti قادر به پردازش ۱۱ میلیارد پرتو در ثانیه است؟ واقعا نمی‌دانیم، چرا که انویدیا سقفِ راندمان را عنوان نکرده و مایکروسافت هم از راندمانِ معمول حرفی نزده است.

اسلاید متذکر می‌شود که جزء کوچکی از ابعاد تراشه برای شتابِ ۳ تا ۱۰ برابری در تکنیک رهگیری پرتو اختصاص داده شده است که به نظر می‌رسد که تقریباً مشابه‌ی آنچه باشد که در سخت‌افزار انویدیا دیده‌ایم. در بازی‌هایی که رهگیری پرتور را با رندرِ سنتی ترکیب می‌کنند، اجرای بازی با قابلیت ray tracing فعال شده روی RTX 2060 انویدیا، اغلب دو یا سه برابر سریع‌تر از نسل قبلی GTX 1080 Ti خواهد بود.

هنوز جزئیات قطعی از اینکه ایکس‌باکس سری ایکس از هیچ‌گونه سخت‌افزار اضافی مرتبط به یادگیری ماشینی برخوردار باشد، مثل آنچه که از هسته‌های Tensor انویدیا برای DLSS 2.0 استفاده می‌شود در اختیار نداریم. البته اسلایدها صریحا به شتاب‌دهی یادگیری ماشینی اشاره می‌کنند و به عبارت " ML inference acceleration" (مترادف با شتاب‌دهی استنباط یادگیری ماشینی) برای ۳ تا ۱۰ برابر سرعت بیشتر و بخش کوچکی از هسته هم اشاره شده است، اما این مورد می‌تواند با اجرای محاسبات FP16 یا INT8 روی کلاسترهای معمولیِ CU نیز انجام شود.

اسلاید مربوط به فرمت‌های تصویری، خروجی کنسول و مشخصات ذخیره‌ساز

به‌عنوان جمع‌بندی، ایکس‌باکس سری ایکس از خروجی HDMI 2.1 پشتیبانی خواهد کرد که امکان خروجی با دقت 4K و ۱۲۰ هرتز یا حتی 8K و ۶۰ هرتز را فرآهم می‌کند. آنچه که انتظار نداشتیم، این است که خروجی DisplayPort در اینجا وجود ندارد، اما اگر قصد داشتید که کنسول را به یک نمایشگر مخصوص بازی برای پی‌سی وصل کنید، این مورد می‌تواند قابلیت‌ها را محدود کند.

همچنین رمزگذار/ رمزگشای ویدیو دارای پشتیبانی از رمزگشایی 4K و 8K AVC و HEVC/ VP9 با پشتیبانی از رمزگذاری AVC (فرمت H.264) و HEVC (فرمت H.265) است. این کار باعث بهبود قابلیت‌های استریم برای هر کاربری خواهد شد که می‌خواهد آخرین دستاوردهای خود در بازی را پخش کند.

در پایان برای یادآوری، اسلاید مشخصات پردازنده مرکزی، واحد گرافیکی و حافظه در کنسول ایکس‌باکس سری ایکس را مشاهده می‌کنید:

مشخصات پردازنده یا CPU، واحد گرافیکی و حافظه یا DRAM در سری ایکس

قابلیت‌ها و اطلاعات جدید معرفی شده از کنسول نسل بعدی مایکروسافت را چگونه ارزیابی می‌کنید؟ نظرات خود را با ما در میان بگذارید.


منبع Tomshardware
اسپویل
برای نوشتن متن دارای اسپویل، دکمه را بفشارید و متن مورد نظر را بین (* و *) بنویسید
کاراکتر باقی مانده