是什么导致了Steam评测的乱象丛生

作者 Esther   编辑 Lost   2017-08-09 17:18:45

对于玩家评测的争议,最早始于 Steam 采用的二元制评分系统,以好评差评比来计算游戏的最终好评率作为显现在外的“分数”。

  *欢迎关注作者微博九号游戏姬Esther


  这篇文章的契机,是因为最近 VGtime 的雷电老师聊到有意做一期以 Steam 玩家评测为主题的电台节目,想了解一下我对“Steam 评测”的想法。

  我把本篇内容大致整理为 Steam 评测机制用户体验开发者影响三大块,希望能帮助大家更直观、更多维度地解读 Steam 评测生态,解读中文神教、抖机灵等乱象诞生的前因后果。

  以及,我想强调一下,这篇文章并非批判中文差评现象,而是想重点讨论 Steam 本身评测体系漏洞导致的种种问题。

Steam的评测机制

评分二元制——非好即差

  这一切起源于 Steam 采用的二元制评分系统,以好评差评比来计算游戏的最终好评率作为显现在外的“分数”。

  2016年2月,有人提出了“One Finger Death Punch 为什么能有高达98%的好评率?”一问,我曾基于当时的评测环境写过一篇回答,以下为节选:


  ​当时我认为 Steam 的二元制评分利远大于弊,玩家们更倾向于看具体评测(而且玩家还可以在评测里给出自己的数字评分)、商店页面能关联评测网站评分,最重要的是给了许多独立游戏出头的机会。

  现在呢?独立游戏早已不是上架一批新的就带来一批新玩法的那个时期,玩家评测里的好评和差评也不再那么纯粹的基于游戏本身好玩与否,二元制评测的弊端日渐明显。虽然 Steam 不太可能改成自由数字评分或者五星评星之类的机制,但加个中评至少也能把底部这个大漏洞堵上,平衡一下虚高虚低,被无中文差评也不会显得那么难看。


玩家反馈三元制——赞、踩还是欢乐

  最开始“欢乐”可以跟“赞”或者“踩”兼容,也就是玩家可以同时给一篇评测点“赞”点“踩”然后再点一个“欢乐”,而在今年的评测改版以后变得只能三选其一。

  一个槽点略大的细节是改版时 Steam 追溯调整旧评测,把所有和“赞”、“踩”同时点了的“欢乐”都归为“欢乐”,扣除原评测中相应“赞”、“踩”数——早在2015年 Steam 加入“欢乐”选项时就有过争议,不少玩家认为 Steam 该改进的是二元评分(而不是新增一个“欢乐”),并且“欢乐”的加入可能让更多玩家为了获得“欢乐”而写一些哗众取宠可是没有实际参考意义的内容(导演,给他们多加几个鸡腿!)。

  对此 Steam 在2017年的回答是我不仅要保留“欢乐”,还要让你们的评测都“欢乐+1,赞数-1”。


  从 Steam 对推行“欢乐”选项的决心就可以看出,Steam 目前对评测系统“玩家参与度”的需求远大于“参与质量”。或者说,结合 Steam 决心打造无人工干扰的商店系统(算法推荐、算法投放、算法排行)来看就能明白 G 胖对自家算法的绝对自信:系统的参与者只有玩家,先尽量让所有用户都参与到几大社区功能中再考虑参与质量的问题;把大的算法框架架起来,哪些细节出问题了再改进算法,大家都是小白鼠,现在评测系统中存在的问题都是 Steam 已经预见并决定承受的牺牲。


排行算法——神秘但基本与评测热度挂钩

  现在我们知道为什么抖机灵评测那么有市场了。有一些原本不跟评测互动的玩家可能“会心一笑”后点个“欢乐”,但更重要的是一些在原本只有“赞”、“踩”来表示“是否有价值”的评测不再“没有价值”,进入了名为“欢乐”的避风港。

《绝地求生》最热的两篇评测

  2017年上半年这段期间 Steam 算法和筛选机制经历了几次改变,主要为:

  1.只有在 Steam 商店玩家买给自己的游戏,玩家写评测才会计入游戏评分并且默认露出。接受礼物、激活 Key 都会让你的评测默认“消失”,如果想要看到这些评测则需要玩家手动改变筛选条件,而这是大多数玩家都不会去做甚至都不会去想的事情。

  只有在筛选框手动改为默认“全部”,才能露出其他评测;“自定义”中可以加入多种默认语言  


  2.根据 Steam 的新算法,露出的评测默认为“仅30天内评测”或“仅7天内评测”,需要查看全部评测(热评)的话需要手动拉到最底下点击那个按钮下边的超链接“这里”,这也是很多玩家懒得去调整的事情。

  就算把显示筛选条件改为“最有价值”,也只是“30天内最有价值”,区别在于省略了这句提示  
  点击“加载更多评测”也不过是加载“30天内”的评测(除非这个游戏近期真的没有用户所选语言的评测),“浏览全部”在下面  
  这里才是所有时间内的总评测排序,只能手动进入  


  3.只有计入评分的评测数超过10篇以后计分才会被显示出来,否则就会变成这样:

  看到这句话后,还有多少玩家愿意手动向下拉?
没有显示“总评”的话,又有多少人会有兴趣点进去查看详情?

  ​激活 Key 的评测不计入总评这点可以理解,Steam 也可以借此补上一些开发者送Key刷好评的漏洞。但赠送礼物也不算数?也许是想堵开发者自充礼物送玩家刷好评的漏洞、也许是为(当时)不久后的Steam禁止囤积礼物铺垫打击二次交易……吧。

  但不管怎么说,这条规则还是挺伤感情的,让 Steam 以前精心设计的送礼合卡系统变成了个笑话:我这到底是给朋友送温暖还是害他的评测无法被玩家直接看到?

  而评测超过30天就过期的机制也非常粗暴,至今我们也不太能解读到 Steam 到底是在补哪个漏洞,只知道它是让“抖机灵”和“无中文差评”神教进一步发展的有力帮凶——再经典的评测超过一个月都得躺进荣誉室,而成本较低的“抖机灵”和“中文神教”随时都有人能顶上。而最后那个不满10条不显示的负面影响可以理解成:“这游戏没什么人在玩,你也别看了吧”。

  其实原本 Steam 的评测机制还足以应付多数玩家的“作为”,但在2015年的国区开启、2016年的蓬勃发展后,今日的 Steam 已经有大量中国新玩家涌入并参与评测,又恰逢2017年3月的评测机制改版,Steam 评测的“生态平衡”一下被打破。只依赖算法框架的评测机制显出诸多弊端,矛盾逐渐激化,乱象丛生。近半年时间就让热门游戏的中文评测区变为一滩“浑水”,只有“过气游戏”和相对冷门的独立游戏能躲过一劫。

  (温馨提示:咱们中国玩家好像还不太习惯使用举报功能,G 胖既然赋予了我们这个权利,该用赶紧用起来的!Steam 在社区管理上效率还可以的,量大肯定处理)

  不仅评测,对于游戏、创意工坊等等也都有相应的举报功能  


当前评测环境对用户体验的影响

短评露出

  上边提到的几项评测机制改版,其优点在于大幅降低了评测门槛,许多短小的评测都得到了露出的机会。很显然 Steam 对评测的定义并不“严格”,它更支持玩家们自由地分享自己的游戏体验。

当前《欧洲卡车模拟2》评测区的“默认景象”

  截图里第一条评测虽然比第二条短得多,但它同样描绘出了欧卡2能给玩家带来的精神体验,而短评的阅读门槛又远比长评低的多,目测这条评测的安利效率应该远大于第二条。


让人又爱又恨的“抖机灵”

用“西方哪个国家我没去过”来描述《欧卡2》明显相当机智与风趣

  关于 Steam 评测“抖机灵”,我想最合适的一句评价就​是“凡事皆有度”吧。相比“中文神教”,“抖机灵”大多不含恶意,并且也确实有不少玩家以精妙的方式写出了游戏的特点。要说缺点的话,大概就是看多了会审美疲劳并且会把人家用心写的中长评顶掉。

  而这种评测乱象的人为因素在于 “喜欢看 - 点赞 - 更多人写-喜欢看” 的循环,目前这种状况看似不好,但实际上对大多数玩家来说是一种合理的、可以接受的现象,否则那些评测就不会还存活于商店评测的“首页”里。

  如果“抖激灵、写段子”的评测真的过量了,必然会出现一部分有意识的玩家去发表客观仔细的评测、也必然会有一部分读者开始倾向于给有更多内容的中长评测点赞,评测区生态也理所当然的会有所“反弹”(当然,这个“反弹”无法完全变回一两年前的样子,肯定会结合那时的新生态趋势);出现特别极端的情况也会产生像《尼尔 机械军团》一样,自发地去呼吁、制止这类“刷评价”行为

  而对“‘抖机灵’认真写中长评的人不公平”的问题来说,“太长不看”确实是现在中国互联网中的一种普遍风气。因此在清楚自己评测水平没有精彩到成为忽视环境的现象级案例的情况下,我建议玩家的中长评还是在形式上多下功夫,考虑如何吸引到观众的注意力。对此我一年半前做出过相关回答,仅作参考:


  当然,讲故事类的评测就不必参考了。只要写得好,再长大家都爱看。


评测生态接下来究竟会变好还是进一步劣化?

  排除Steam主动改善评测机制的情况的话,我觉得目前 Steam 的评测生态还没触底。虽然现在已经有部分玩家开始觉得这样不太好,但这“部分玩家”规模尚且不足,能做的实在太少。

  Steam 目前的评测机制仍然处于无人为干涉状态,短期内不会存在一步到位、直接引导评测环境的方法,以“无中文差评”为例,这种权力滥用的集体暴力行为,比官方规则的强制约束、意见领袖的呼吁、玩家的自我约束效果都大的多。或者说,后者最后只会玩成一堆小圈子,却很难影响大局面。

  2017年7月,依然有人因为没中文给《奇异人生》打差评  

  不过长期来说,一方面 Steam 很有可能积极完善评测机制,另一方面玩家审美的提升、动态平衡(前文提到过量时玩家自发的矫正)、Steam 鉴赏家评测的引领等等,都会逐渐推进、改善评测生态,尤其是简体中文的评测生态​。

  (题外话,Steam 对评测生态的不干涉已经到了什么地步呢?许多活跃评测玩家都曾有过被个别人针对的经历:活跃玩家的上百篇评测全部被有预谋的点了踩,然而 Steam 至今没有对这些玩家的反馈和举报有过哪怕一次的回应)


当前评测环境对开发者的影响

马太效应——进一步的两极分化

  对玩家来说,“不满10篇不显示”可能只是个让人不怎么舒服的改变,但对许多没有发行能力的独立游戏开发者来说,这已经可以称得上是毁灭性的打击了。

  有时候大半页的游戏都凑不到10篇评测  

  ​诚然,Steam 的开放和自由造就了如今独立游戏的繁盛。但在诸如大量低劣游戏上架 Steam 等的问题上,Valve 采取的解决方法却极其粗暴,一刀切地剥夺了“弱推广”游戏的权利,把曝光量聚焦在原本就会有很多人关注的游戏上。(似乎想靠算法和时间来淘汰掉“不受欢迎的游戏和开发者”)

  对于有办法自行推广的游戏来说10篇评测也许不算什么,但对于那些在狭义上更加“独立”的独立游戏人来说,他们没有推广资源与手段,他们甚至可能只是第一次开始自己做游戏,这种情况下造成的结果就是“没人知道他们的游戏→没人买→没人评价→评价数量不够更没人看到”,变为恶性循环。

  平心而论,没有评价展示的这类游戏只有在封面或者其他元素足够吸引我们注意力时,我们才有可能点进去看看,而对于其他不擅长“包装”的游戏来说,玩家们可能连把鼠标滑过去看看简介的兴趣都没有。

  因此在当前时期,这个机制在多数时候起到的是“以画面来筛选游戏”的作用,这对往往没钱优化美术的独立游戏来说,既不合理,也不公平。


复合式评测——多元推荐

  除了鉴赏家专属推荐栏以外,首页大图轮播也多了“由鉴赏家推荐”的来源  

  ​令人欣慰的是,尽管 Steam 暂时还没有人为管理评测社区的行动,但 Valve 一直在努力推进 Steam 鉴赏家的发展。

  Steam 鉴赏家以玩家群组形式存在,当该组鉴赏家文章(收录游戏)达到10后即可公开给所有玩家关注。鉴赏家本身就像书单、歌单一样,由该鉴赏家组织整理发布,在“鉴赏类型”上不但可以选择“推荐、情报型(中立)、不推荐”,还可以露出一段自定义简评,如果有需要的话还可以在专属醒目位置附上长篇评测的传送门。

  与普通的玩家评测不同,Steam 鉴赏家的评测是复合式的,最高存在一人长评+另一人短评+综合上是否推荐三个层面。从这个角度来说,评测机制改革缓慢的原因可能是 Steam 最终想搭建多层面的复合评测系统。

  Steam 似乎想要借助评测意见领袖(以及进驻 Steam 的主播、游戏媒体等)的魅力打造介于开发者与野生评测之间的二级过渡组织,来辐射、引导底部生态环境,最近 Steam 甚至宣布了未来将实际支持开发者提前给鉴赏家发放能够提前评测游戏的专属激活码,以此用来反哺游戏开发者。

  商店页面下会自动显示已关注鉴赏家的评价

  不过发展到现在,Steam 鉴赏家对游戏的实际访问量、销量影响依然比较小,而针对鉴赏家的一些“合作体系”已经在形成。在 Steam 做出更多推进动作之前,我们也无法断言鉴赏家究竟会走向何方。


“精准投放”——杯水车薪的算法补偿

  算法改革后,首页大图轮播也加入了“由您的好友 XXX 推荐”一项  

  这一推荐机制对略有知名度的独立游戏来说是好事。搭载于 Steam 玩家关系网基础上的这层推荐机制可以将他们的玩家直接作为二次曝光的节点,以此辐射给他们那些不太关注独立游戏的朋友。从商店首页推荐机制的改革来说这么做相当聪明。但是……这个改革依然无法对马太效应做出有效的约束,对于那些没机会得到超过10篇评测的独立游戏来说,这个机制真是毫无卵用……


结语

  Steam 评测生态什么时候会变得更好呢?我不知道。

  但我猜多年后我们回顾 Steam 大事记,还会记得这不太光彩、一叶障目、乱象丛生的时代。

(0)
| (429) (2) (77)
Esther 注册用户

关注
打赏过后,喝酒吃肉~

评论(429

跟帖规范
有些什么看法,加入我们一起讨论吧…


总贡献榜