موشکافی معماری AMD در ایکس باکس سری ایکس مایکروسافت
در رویداد سالانهی Hot Chips 2020، مایکروسافت جزئیات بیشتری از قسمتهای داخلی معماری سیستم ایکسباکس سری ایکس را ارائه کرد. بخش زیادی از اطلاعات مطرح شده در ارائهی منتشر شده پیش از این رخداد، در برگیرندهی جزئیاتی بود که قبلا هم از آن باخبر بودیم، اما با در دست داشتن اسلایدهای جدید به برخی موارد جالب توجه نیز دسترسی پیدا کردیم که شامل دیاگرامی از هستهی پردازنده نیز هست. اجازه دهید بهصورت مفید و مختصر به برخی از عناوین برجستهی آن بپردازیم.
درحالیکه میدانستیم ایکسباکس سری ایکس ۸ هسته/۱۶ رشتهی پردازشی براساس پردازندهی Zen 2 و واحد گرافیکی با ۵۲ واحد پردازشی خواهد داشت، این اولین باری است که تصویر کاملی از هسته را مشاهده میکنیم. جای تعجبی نیست که قسمت مربوطبه GPU بسیار بزرگ باشد. تراشهی کامل ابعادی با ۳۶۰.۴ میلیمتر مربع مساحت دارد که ۱۵.۳ میلیارد ترانزیستور را در خود جای داده است. یک تحلیل سریع روی تصویر مشخص میکند که GPU حدود نیمی از هسته (بهصورت دقیقتر ۴۷.۵ درصد) را در برگرفته است.
باتوجهبه تمام بخشهای تعبیه شده در این سیلیکون، اندازهی هسته درواقع کاملا مدیریت شده است. در نظر بگیرید که پردازندههای مرکزیِ Ryzen بر مبنای Zen 2 با طراحی دو کلاستری Chiplet، بالغ بر ۷۴ میلیمتر مربع مساحت دارند (با ۴ برابر حافظهی کش سطح سوم یا L3 بیشتر در مقایسه با APU-ی بکار رفته در ایکسباکس سری ایکس) و بعد GPU که امکانات و هستههای سایهزن بیشتری نسبت به Navi 10 (تراشهی گرافیکی RX 5700XT) دارد که آن هم ۲۵۱ میلیمتر مربع را شامل میشود. این یعنی مجموعا ۳۲۵ میلیمتر مربع بدون درنظرگرفتن هستههای بهبود یافتهی معماری Navi 2x و ۱۲ واحد پردازشیِ اضافهی دیگر (نسبت به RX 5700XT). از سوی دیگر ابعاد این تراشه بیش از دو برابر بزرگتر از APU-ی دیگر AMD با اسم رمز Renior است که ۱۵۶ میلیمتر مربع مساحت دارد.
با نگاه نزدیکتر به تصویر هسته، به نظر میآید که تراشهی کامل حداکثر دارای ۵۶ واحد پردازشی (Compute Unit) در قسمت مربوطبه GPU باشد. این به خاطر این است که با وجود این هستهی نسبتا بزرگ، بازده تولید تراشههای سالم را میتوان با درنظرگرفتن واحدهای اضافه بسیار افزایش داد (به بیان دیگر یعنی تراشههایی که تا سقفِ ۴ واحد از ۵۶ واحد پردازشی گرافیکی آنها هم بعد از پروسهی لیتوگرافی معیوب تشخیص داده شده و قابل استفاده نباشند، باز هم بهعنوان تراشهی سری ایکس قابل استفاده خواهند بود). اگر شمارشِ ما از روی تصویر درست باشد، برآورد میشود که AMD و مایکروسافت فقط ۴ واحد از کلاسترهای پردازشیِ دوگانه را غیرفعال کردهاند و البته تمام ۸ هستهی کلاسترهای پردازنده باید برای بهدست آوردن یک تراشهی قابل استفاده سالم باشند.
همچنین این ارائه زمانی را به معرفی کاهشِ سختی در مقیاسپذیری تراشه نسبت به قانون مور اختصاص میدهد. درحالیکه اندازهی تراشهی XBOX Series X در ردهی سختافزار کنسول قبلی است (۳۷۵ میلیمتر مربع برای ایکسباکس وان در سال ۲۰۱۳ و ۳۶۷ میلیمتر مربع برای ایکسباکس وان ایکس در سال ۲۰۱۷)، و تعداد ترانزیستورها بیش از دو برابر نسبت به XBOX One X افزایش داشته (۶.۶ میلیارد دربرابر ۱۵.۴ میلیارد)، اما در عین حال هزینهی تولید هسته هم بیشتر شده است. مایکروسافت مشخص نکرده که چقدر بیشتر، اما نماد $ را برای هزینهی ایکسباکس وان، نماد +$ را برای ایکسباکس وان ایکس و ++$ را برای ایکسباکس وان سری ایکس فهرست کرده است. همانگونه که در جای دیگری هم اشاره کردیم، درحالیکه لیتوگرافی ۷ نانومتری شرکت TSMC قدرتش را به رخ میکشد، هزینهی تمام شده برای هر ویفر به میزانِ قابل ملاحظهای بالاتر از پروسهی ۱۲ نانومتری است.
بهعلاوه، مایکروسافت جزئیات بیشتری در مورد معماری Velocity و اهدافش ارائه کرده است. معماری Velocity بهجای افزایش حافظهی سیستم، از حافظهی ارزانقیمتترِ SSD استفاده میکند. در گذشته قیمت حافظههای DRAM هر سال ۳۰ درصد کاسته شده، اما برای هشت و نیم سال گذشته هر سال فقط ۵ درصد کاهش داشته است. در مقابل قیمت حافظههای Flash در مدت مشابه ۲۳ درصد در هر سال افت کرده است.
از آنجا که SSD-ها بسیار سریعتر از پلاترهای چرخانِ استفاده شده در هارددیسکها در کنسولهای قبلی هستند، مزیت بزرگی در زمانهای بارگذاری بازیها دارند. در ترکیب با تکنیک sampler feedback streaming، سختافزار قادر به بکارگیری حافظهی فلش برای افزایش راندمان کلی خواهد بود، بدون اینکه نیاز به افزایش تصاعدی در میزانِ حافظهی رم باشد.
یکی از جنبههای جدید جالب توجه در کنسولهای نسل بعدی پشتیبانی از ray tracing (تکنیک رهگیری پرتو) است. تاکنون میدانستیم که هر دو کنسول ایکسباکس سری ایکس و پلیاستیشن 5 از رهگیری پرتوی سختافزاری پشتیبانی خواهند کرد، اما تا قبل از این هیچ نشانهی روشنی در اختیار نداشتیم از اینکه چه سطحی از راندمان را باید انتظار داشته باشیم. به نظر میرسد که مایکروسافت اهمیت استفاده از رهگیری پرتو در بازیها را کمرنگ جلوه میدهد، یا حداقل برداشت ما اینگونه است. درست مانند آنچه که کارتهای سری RTX انویدیا انجام دادهاند، مایکروسافت نیز در اینجا روی رویکرد رندرِ ترکیبی تاکید میکند و گوشزد میکند که جایگزین کاملی برای روشهای رندر سنی نیست.
تا آنجا که در مبحث راندمان رهگیری پرتو اشاره میشود، مایکروسافت فقط به سقف راندمان محاسبهی ۳۸۰ گیگا یا میلیارد پرتو-جعبه در ثانیه و ۹۵ میلیارد پرتو-مثلث در ثانیه اکتفا میکند (مفهوم جعبه و مثلث را در الگوریتم BVH و RT در مقالهی بررسی معماری تورینگ در کارتهای گرافیک RTX 2080 ،RTX 2070 و RTX 2080 Ti انویدیا قبلا شرح داده بودیم). این محاسبات چگونه با سختافزار سری RTX 20 انویدیا قابل مقایسه خواهد بود، درحالیکه ادعا شده RTX 2080 Ti قادر به پردازش ۱۱ میلیارد پرتو در ثانیه است؟ واقعا نمیدانیم، چرا که انویدیا سقفِ راندمان را عنوان نکرده و مایکروسافت هم از راندمانِ معمول حرفی نزده است.
اسلاید متذکر میشود که جزء کوچکی از ابعاد تراشه برای شتابِ ۳ تا ۱۰ برابری در تکنیک رهگیری پرتو اختصاص داده شده است که به نظر میرسد که تقریباً مشابهی آنچه باشد که در سختافزار انویدیا دیدهایم. در بازیهایی که رهگیری پرتور را با رندرِ سنتی ترکیب میکنند، اجرای بازی با قابلیت ray tracing فعال شده روی RTX 2060 انویدیا، اغلب دو یا سه برابر سریعتر از نسل قبلی GTX 1080 Ti خواهد بود.
هنوز جزئیات قطعی از اینکه ایکسباکس سری ایکس از هیچگونه سختافزار اضافی مرتبط به یادگیری ماشینی برخوردار باشد، مثل آنچه که از هستههای Tensor انویدیا برای DLSS 2.0 استفاده میشود در اختیار نداریم. البته اسلایدها صریحا به شتابدهی یادگیری ماشینی اشاره میکنند و به عبارت " ML inference acceleration" (مترادف با شتابدهی استنباط یادگیری ماشینی) برای ۳ تا ۱۰ برابر سرعت بیشتر و بخش کوچکی از هسته هم اشاره شده است، اما این مورد میتواند با اجرای محاسبات FP16 یا INT8 روی کلاسترهای معمولیِ CU نیز انجام شود.
بهعنوان جمعبندی، ایکسباکس سری ایکس از خروجی HDMI 2.1 پشتیبانی خواهد کرد که امکان خروجی با دقت 4K و ۱۲۰ هرتز یا حتی 8K و ۶۰ هرتز را فرآهم میکند. آنچه که انتظار نداشتیم، این است که خروجی DisplayPortدر اینجا وجود ندارد، اما اگر قصد داشتید که کنسول را به یک نمایشگر مخصوص بازی برای پیسی وصل کنید، این مورد میتواند قابلیتها را محدود کند.
همچنین رمزگذار/ رمزگشای ویدیو دارای پشتیبانی از رمزگشایی 4K و 8K AVC و HEVC/ VP9 با پشتیبانی از رمزگذاری AVC (فرمت H.264) و HEVC (فرمت H.265) است. این کار باعث بهبود قابلیتهای استریم برای هر کاربری خواهد شد که میخواهد آخرین دستاوردهای خود در بازی را پخش کند.
در پایان برای یادآوری، اسلاید مشخصات پردازنده مرکزی، واحد گرافیکی و حافظه در کنسول ایکسباکس سری ایکس را مشاهده میکنید:
قابلیتها و اطلاعات جدید معرفی شده از کنسول نسل بعدی مایکروسافت را چگونه ارزیابی میکنید؟ نظرات خود را با ما در میان بگذارید.