微软公开Xbox Series X系统架构细节,近距离探秘最强性能主机

作者 Liffy_Island   编辑 Liffy_Island   2020-08-19 18:58:05

光追加速模块得到确认。

      一年一度的 Hot Chip 硬件峰会是科技行业相互交流前沿芯片技术的大会。在今年的 Hot Chip 峰会上,微软带来了 Xbox Series X 系统架构详情。除去之前已经公布的诸多特性外,很多相关设计和实现细节为首次对外公布。



CPU部分

      首先最令人兴奋的就是 Xbox Series X 主芯片物理视图。从图上可以看出 GPU 部分占据了绝大部分面积;中间两侧为 Fabric Coherency G6 MCs;上端两侧为包含了 L3 缓存的两个 Zen 2 CPU 簇;上端中间为多媒体硬件加速芯片;四周由 GDDR6 内存控制器和 IO 控制器包围。


      主芯片基于台积电 7nm Enhanced 工艺打造,该工艺较为特殊,并不是此前台积电的其他 7nm 工艺,是 AMD 和台积电联合研发以满足微软需求的新 7nm 工艺。芯片面积为 360.4 mm²,内含 153 亿个晶体管,保持了与 Xbox One X 核心差不多大小的同时,将晶体管数量翻了一倍不止,这就是新设计和制程工艺带来的结果。L1 缓存 512KB、L2缓存 4MB,L3 缓存 8MB。


     CPU 通过一条可扩展数据总线与其他模块连接,有 GPU、内存控制器、显示控制模块、视频解码模块、安全模块、音频单元、I/O控制模块等等。值得一提的是,CPU 本身拥有 Xbox SPLEAP 安全技术,硬件层面上防止 Privilege Escalation 类型攻击。

     整体结构类似与笔记本平台的 Ryzen 4000 系列 APU,相较于桌面端的 Zen 2 系列,L3 缓存小了不少。从此前移动端和桌面端 Zen 2 CPU 对比情况看,这颗 CPU 单纯拿出来与桌面级 Zen 2 比较的话,游戏性能可能会略弱一些。

     此外微软提到这枚 CPU 属于“服务器”级,估计是将 AMD 霄龙(EPYC)系列的 CPU 部分特性进行了融合。考虑到微软云游戏的服务器都是直接采用 Xbox Series X 的这枚 SoC,因此倒也合情合理。


内存和GPU

     Xbox Series X 内存相对比较特殊。其使用了交错内存设计,可增大并行性,减少访问时间。由 10GB 高交错内存搭配 6GB 低交错内存,总带宽高达 560GB/s,并加入了安全加密的设计。


      GPU 详细参数也是本次峰会上首次公开,也是 AMD RDNA 2 架构 GPU 的首次详细展示,被 AMD 证实为“完整的 RDNA 2 架构 GPU”。整体上,我们可以看到 GPU 主要由 28 组双 CU 模块组成,其中屏蔽了两组,也就是 52 个 CU 单元,3328 个流处理器。支持此前 RDNA 2 公布过的所有功能和特性。


      非常值得注意的是,RDNA 2 架构的硬件加速光线追踪支持在这枚 SoC 得到证实,其有专属的光追加速硬件单元 Ray Accel。但与英伟达 RTX 显卡 GPU 的不同之处在于,光追加速单元分布在每一个 CU 单元中,不是单独拿出来放在一起。预计未来 RDNA 2 架构的 AMD GPU 也同样是该类型设计。


      其中每个 CU 中可最多开启 4 个光追加速单元,52 个 CU 代表光追加速最高为 379.4 G/sec ray-box,以及 95 G/sec ray-tri 性能。微软定义的光追性能单位和英伟达的 GRay/s 不同,因此目前还无法与 RTX 显卡直接对比。



音频处理单元

      另一个本次公开细节的重头是 Xbox Series X 的专属音频模块,其单精度算力比 Xbox One X 的 8 核 CPU 还要强。之所以要如此之高的算力负责音频是因为,空间中如果有三四百个不同位置的音源同时发声并互相影响,那随之所需的算力要求就相当高了。可以想象一下在一个山洞里 20 个人群殴产生的各种声音反射的感觉。


      其包含两个 4 路浮点 SIMD 数字信号处理器(DSP)和 4 个浮点引擎,可提供可编程、高性能、高吞吐量的音频处理需求。该模块还包含了可提供 300 条实时信道的 Opus 实时解码器和采样率转换器,以及 4 个 DSP 核心、音频特效、XMA 解码等硬件。


VRS和SFS

      微软在这篇系统架构 PPT 里还重点介绍了可变速率着色(Variable Rate Shading, VRS)技术以及取样反馈流(Sampler Feedback Streaming, SFS)工作原理,二者皆为 RDNA 2 架构特性。


      可变速率着色就是将画面分割成各种区域块,让 GPU 专注于那些能被人眼明显感知的区域块渲染,降低不明显的区域块计算量。换句话说,“把好钢用在刀刃上”。依照区域划分方式可分为内容适应着色(Content Adaptive Shading)和动作适应着色(Motion Adaptive Shading),前者可对表现突出区域增加渲染速度,其余部分放慢;后者可对动态物体增加渲染速度,静态物体放慢。 

      可变速率着色提供完整的边缘细节,没有空洞、抖动或者人为的棋盘渲染效果,同时与 TAA 抗锯齿技术兼容。它可以极小的代价换取 10% 到 30% 的帧数提升。



      取样反馈流是微软一直在强调的技术。简单来说,它能持续追踪游戏画面中哪些材质一直存在,哪些不是。然后根据利用率进行分级,把利用率低的材质数据踢出内存。由此换来内存利用率最高 2.5 倍的提升和 60% I/O 资源释放。可以看到上图左下部分记录了地球仪活动的材质部分。


其他部分

      Xbox Series X 还有一枚专门负责安全的 HSP,内含了一系列的安全技术。MSP 则是针对 NVMe SSD 的硬件加密和解压模块,节省了超过两个 Zen 2 核心的算力。


      视频解码和编码部分,Xbox Series X 支持传统的 480p/1080p 解码,以及 4K/8k AVC 和 HEVC/VP9 HDR 解码,支持 AVE 和 HEVC HDR 编码。这一点很关键,玩家录制出来的视频是支持 HDR 显示的视频,这对于推广 HDR 技术的益处不必多言。


      微软还提到了针对游戏的机器学习推理加速特性,可运用在角色行为、画面分辨率拉伸等方面。其中分辨率拉伸类似于英伟达在 RTX 系列显卡中采用的 DLSS(深度学习超采样)技术。但机器学习部分并未很具体展开,只提到了非常小的消耗可带来 3 到 10 倍的表现提升,不确定是有专门的硬件加速还是通过既成硬件实现,但其动力就是微软此前所提及的 97 TOPS(整数运算性能)提供。

      Xbox Series X 还支持两个独立的虚拟化命令流,32bit HDR 格式等技术。 至于微软是如何把这种级别性能的机器功耗控制在了 300W 级别,答案就在于微软没有明说的“专利技术”了。

| (124) 赞(82)
Liffy_Island 小吃货

关注

评论(124

跟帖规范
您还未,不能参与发言哦~
按热度 按时间