用来形容主机性能的teraflops究竟是个什么东西?

作者 Iniestyle   编辑 Iniestyle   2016-07-06 08:30:00

从“万亿次浮点运算每秒”是什么说起,我们来聊聊索尼和微软的下一台主机究竟会有哪些改善。

  “万亿次浮点运算每秒”(teraflops,以下简称 TF)是业界目前用来描述计算机图形性能的常用单位,那么其含义究竟是什么,对主机游戏表现又有怎样的影响?本文将带您走近真实的 TFBOYS  teraflops。

  自从 PS4 和 Xbox One 两者的规格首次泄露之后,它们在图形性能上的差距就一直是坊间热议的焦点。在这里我们来看一个直观的比较:Xbox One 的显卡性能在规格调整之前是 1.23TF,而索尼的 PS4 则是 1.84TF,相比之下高出了不少。

  从纸面上看这个差距是很大的,这意味着 PS4 在图形性能上有着大约 50% 的优势。而图形性能正是众多对次世代游戏画面表现翘首以盼的玩家们最为看重的。看起来主机还没开卖,微软就遇到了麻烦。

  现在,两家公司的后续机型已经揭开了面纱,而硬件规格霸主的宝座似乎要易主了。PS4 Neo(以下简称 Neo)的性能目前据传为 4.2TF,而微软“天蝎计划”(以下简称天蝎)的性能约为 6TF,有 43% 的优势。当然两台主机看起来都很棒,但这不是重点。

teraflops到底是个啥?

  我们今天想谈论的是 TF 究竟是什么?这看似巨大的规格差别对实际的性能指标和游戏体验会有怎样的影响?

  首先,我们从基本的名词解释说起。teraflops 中的 tera 代表一万亿,flo 则是指一次浮点运算(floating point operation),这是描述计算性能的基本单位,而 ps 自然是每秒(per second)的意思。

  就微软和索尼主机使用的 AMD 图形技术而言,TF 的计算方法非常简单:将图形处理器(GPU)中流处理器(shader,常见译名还有着色器、渲染器等)的数量与其时钟频率相乘即可。AMD GPU 的每个计算单元有 64 个流处理器,Xbox One 有 12 个计算单元,PS4 则有 18 个,因此二者分别拥有 768 和 1152 个流处理器。而两台主机的流处理器时钟频率分别为 853MHz 和 800MHz。

  此外,将流处理器数量与频率相乘得到的结果还要再乘二,这是因为在一个时钟周期内可以同步执行乘法和累加两种指令,如此这般我们就能得到一个巨大无比的天文数字。为了便于读写,我们把计算电脑硬盘容量那一套搬过来,用这个数字除以一百万,便能得到 megaflops,即百万次浮点运算每秒,若除以一万亿,就可得到 teraflops。

  以下是 Xbox One、PS4 和 Neo 图形性能的计算过程:

  • Xbox One:768 shaders x 853MHz x 2 = 1,310,208 megaflops/1.31TF
  • PS4:1280 shaders x 800MHz x 2 = 1,843,200 megaflops/1.84TF
  • Neo:2304 shaders x 911MHz x 2 = 4,197,888 megaflops/4.2TF

  微软声称天蝎的图形核心计算性能约为 6TF,但 GPU 的其他规格并没有公布。也就是说,我们知道了计算结果,却对流处理器数量和频率一无所知。在近期对天蝎规格的分析中,我们综合考量主机设计惯例,以及代号 Vega 的 AMD 下一代 GPU 的泄漏情报等信息,得出了对其硬件规格最合理的两种推测:

  • 天蝎规格1:3584 shaders x 840MHz x 2 = 6,021,120 megaflops/6.02TF
  • 天蝎规格2:3840 shaders x 800MHz x 2 = 6,144,000 megaflops/6.13TF

  此推测基于两个假定的前提:一是天蝎的时钟频率较低,因为其处理器面积很可能远远超过 Neo,而处理器越大发热量也越大,通常工作频率就会较低;二是微软使用了 AMD 的下一代 Vega 核心,据泄漏信息确认其拥有 64 个计算单元 4096 个流处理器。因为如果要使用与 Neo 同样的 Polaris 核心实现 6TF 的性能,就要求 GPU 运行在极高的频率下。

  • 天蝎规格3:2304 shaders x 1302MHz x 2 = 5,999,616 megaflops/6TF

  如此一来,其频率将比 Neo GPU 的未删减版 —— Radeon RX 480 电脑显卡核心还要高,而这显然是不可能的。简而言之,除非微软采用的是未出现在 AMD 蓝图上的下一代 GPU,我们几乎可以肯定天蝎采用的就是 Vega 的删减版。

teraflops对系统性能的影响有多大?

  TF 是用来衡量计算性能的基本参数,独立于与 GPU 设计的其他方面。举例来说,相对于英伟达,AMD 的 GCN 图形处理架构在纯粹的计算性能上是很强的,因此在前些年数字货币挖矿风潮盛行的时候 Radeon GPU 很吃香。然而需要强调的是,计算性能并不能与游戏性能划等号。

  关于这一点有一个绝佳的对比实例:9TF 的英伟达 GTX 1080 和 8.6TF 的 AMD Radeon R9 Fury X。如果单看计算性能,你可能会认为二者的游戏性能也相差无几。但请看下面的 4K 分辨率测试结果,GTX 1080 可不是快了一点,而是几乎在所有游戏中都遥遥领先,就连只有 6.5TF 的 GTX 1070 在多个游戏中的表现都优于 Fury X。

  事实上,若单看 TF 数据,GTX 1070甚至比不上英伟达自家上代产品 Titan X(7TF),但实际表现却并不占劣势。

  因此,显卡的实际游戏性能是由多方面决定的。显示驱动程序非常重要,图形架构本身的效率更是举足轻重,更不用说还有显存带宽和内置缓存容量等一系列因素。

  然而单就游戏主机而言,计算性能的比较还是很有意义的。

  首先,GPU 的其他指标通常会随着计算性能的增长而同步提高;其次,PS4 和 Xbox One 的 GPU 源自同一家族,其核心设计非常相近。

  但若要对 Xbox One/天蝎 和 PS4/Neo 进行跨代对比,意义就显得不那么大了。虽然 AMD 的新图形核心与上一代完全兼容,但在架构上仍然作了改进,简而言之就是更高效。对此我们可以对 AMD 即将发售的 RX 460 显卡进行测试。

  RX 460 拥有与 Radeon HD 7850 相同的 16 个计算单元,但采用了新的 Polaris 核心。届时对二者在相同的频率和显存带宽下进行测试,理论上就可得出 AMD 第四代 GCN 架构在效率上的提升,而这就是关键所在。

  就数据上说,天蝎的计算能力是 Xbox One 的 4.6 倍,而 Neo 是 PS4 的 2.3 倍。而这仅仅是 TF 的对比,AMD 的新架构对最终性能的提升也许会比预想的还大。但再次强调,计算能力提高 40% 并不意味着实际性能表现也会提高 40%。

| (112) 赞(81)
Iniestyle 点赞狂魔

关注

评论(112

跟帖规范
您还未,不能参与发言哦~
按热度 按时间