一款游戏的民间汉化过程是怎样的?

作者 小卖   编辑 小卖   2020-03-20 18:00:00

珍惜生命,远离汉化……

  本文来自“真庭正宗”在知乎问题“游戏的汉化过程是怎样的?”下的回答,已获作者授权转发。你可以点击前面标题链接查看原文,或者点击这里前往他的微博,关注他发布的更多内容。


  我前几年的时候曾经发出过这样的感叹:

  也许这个年代,留给汉化组的灰色地带已经越来越少了,各位的热忱和对文化产品的喜爱已经无法承担违反法律带来的风险,汉化组也许已经完成了自己的历史使命,在版权普及的浪潮中,是时候再一次审视自己所处的环境以及掂量可能面临的后果了。

  目前大部分的海外文化产品,在我们强大的消费能力和广阔市场的诱惑下,都是削尖了脑袋想往里进来。大部分游戏产品,虽然面临严格的审查和政策约束,也总有各种曲线救国的方式到达中国消费者的手里。

  所以现在的海外游戏产品自带中文已经是非常司空见惯的事情,早期的游戏汉化者们要么正规化加入了真正的官方汉化组织,要么就因为年龄工作的关系淡出这个圈子,在需求极度缩小又面临越来越严厉的法律风险的今天,游戏汉化组已经是非常稀有的存在了。

  (注:本文谈论的都是民间汉化过程,官方汉化个人也有参与过,过程要简单很多,主要靠的是翻译人员和管理人员,没有民间汉化那么多有意思的过程)


  本人有幸在游戏汉化需求旺盛、民间组织兴盛的年代,见证过这一令人痛苦而又感动的时期。

  痛苦是因为大部分的优秀游戏都天然有着语言的壁垒,无法领略其 100% 的魅力;感动的是你能看见前赴后继的民间汉化者们,凭着无以伦比的热情持续地对游戏进行汉化,至少在我所知的范围内,99.9% 的民间汉化人员是完全靠着一腔热血在坚持。

  我也参与过一些大小型的项目,既有担任单纯翻译的作品,也有参与从策划到测试整个流程的经历。所以我觉得对这个问题,算是有一定心得吧,抛砖引玉,希望能看到更多在汉化组中扮演过不同角色的人来分享他们的经历。我相信对保留这个绝无仅有年代的记忆是个很有裨益的事情。

  游戏汉化组与字幕组的工作存在非常大的不同,后面我会详细讲述,游戏汉化的难度与体量要远远大于影视剧的翻译。


先回答题主列的几个问题:

  汉化组应该有一个特别牛叉的软件,能够提取出游戏里的所有文本,之后通过机翻和人工校对后又可以直接套入游戏里去,这样一款游戏就汉化成功了。(纯属意淫…ಥ_ಥ)

  提取游戏文本是一项非常有技术含量的事情,涉及很多方面。我后面会详解,但是难以实现你的这个假设的最主要原因就是,游戏的加密方式是不同的,你无法使用一套解密方式去对应所有的游戏。而且游戏文本放置的结构每个游戏也会不同。然后导出的文本用机翻是一个办法,但是效果一般都很差,先不谈机翻本身应对复杂句子和暧昧表达的能力,民间汉化导出的文本中会存在大量的指向代码、着色代码、排版代码,会把整个句子切分得七零八落,所以机翻没办法正确识别,翻译效果很差。

  导入就更是有难度的,因为还会涉及到一个很多人不了解的因素:字库容量。总之就是没那么简单。

  那么题主的几个疑问:

1、是否存在类似的软件?

  存在。破解人员会针对游戏编写解包工具、导出工具。翻译、润色人员会有文本对照软件。除这些专用的工具以外,还有美工会使用大家熟知的图像处理软件,测试人员会使用模拟器。

2、游戏里的文本是怎样提取出来的?

  游戏里的文本通常是加密存放在游戏解包出的文件里,只要破解人员破攻破了游戏的加密方式,找到了文本位置,就可以自行编写一个导出工具导出文本。

3、为什么会有乱码现象?

  因为字库对应和文字编码问题。

4、为什么不把汉化做成 png 图片直接贴进游戏里?

  因为效率很低,不易修改,还会面临内存溢出等等运行上的问题。

  总之,汉化是一个挺烦人、挺复杂的过程,不过还挺有意思的,我接下来详细介绍一下我从各种项目中总结出来的流程,具体到每个环节。(当然我并没有实际参与过的一些流程比如破解、导入、美工,我只能按照我的理解来说明,不一定准确,也不够详尽,期待各位专业人士的答案)


  一款游戏的汉化从开始到结束,主要会分为 3 个大的时期,若干个工作程序。我做了一张简易的表格,大致能够展现主要的基干和各部分主要的工作内容。

  玩家印象中,汉化工作最主要的部分应该就是图中“主流程”的这个部分。实际上,对于一款游戏的汉化来说,我认为最为关键的是前期的工作,而如果能够走到主流程这个阶段的,一般来说完成只是时间问题(当然还有用爱发电的人们的精力、坚持)。

  不是所有的游戏汉化都完整全部走完这个流程。根据游戏类型、组织形式的不同,会有所出入。我参与的大部分是 RPG 游戏的汉化,这是汉化需求最迫切的游戏类型。RPG 的汉化,大致上都是按照这个流程来的。

  好,接下来让我们来详细介绍一下每个环节。

前期


  这是决定一款游戏是否真的能够汉化的关键时期。


意向/立项

  一款游戏要让人产生意向走向汉化,一定是具备一定人气、游戏素质过硬的作品。如果没有人气,就无法产生立志汉化它的爱好者,而参与汉化的爱好者的热情与坚持是汉化能否成功完成的重要因素;素质不高受众不多,汉化者的动力也会不足,我可以很负责任的说,除去想向广大玩家安利自己喜爱的作品以外,虚荣心也是一个很大的 motivation(笃定),不逐利,也就逐个名儿嘛。

  当满足了这些条件,热情高涨、又有一定能力的组织者就会活动起来了。


可行性/初步破解

  首先,发起者会找到一名核心的技术人员。来确认一下这款游戏汉化的可行性。

  这名技术人员将是贯穿整个项目最最重要的人员之一,所有后续的工作,都会建立在这个人的工作成果上。我先表明我的一个观点:一款游戏汉化的实现与否,起关键决定性作用的是破解人员。而这位核心的破解人员,将确定整个游戏汉化的基调,可以说他控制了整个项目进展的顺利程度。

  在当时的业内,一位技术过硬的破解中坚是极度稀缺的资源。他需要很强的反编译能力(找到解密的方法)、洞察能力(发现汉化文本、图片的储存位置)、编程能力(写各种工具)、沟通能力(制定、交代各种汉化中需要遵守的规则,比如文本长度限制、代码内容等)。

  这些技术大神们,在汉化届里,可谓是明星级的存在。我有很多崇拜的破解大神,他们都是中国游戏汉化届的、也是电子游戏文化普及的功臣。

  这位破解人员与组织发起者一起,对目标游戏进行分析:

  1. 破解难度如何 2. 文本量多少 3. 所需的组织规模

  首先核心破解人员会对游戏进行解密。早期的主机游戏,厂商之间都没有共通的加密标准,各自有各自的编程语言、编程习惯和加密方式。破解要寻找破解目标游戏的方式,将各种介质中的文件结构按照他想要的方式解压出来,才能找到需要汉化的内容。

  成功解包之后,就能够寻找文本大致的所在位置了。通常来说,大部分游戏的主要内容文本都是存放在一起的,找到其中一个之后基本能够确定大部分文本的位置,这样就能看到整个游戏需要汉化的文本规模,供发起者判断接下来的工作量。

  接下来破解人员还要寻找一个东西,它就是汉化中非常关键的因素:字库

  很多人对这个东西没有什么认识,而这个东西将影响整个项目的质量。

———— 字库解释 ————

  首先我来解释一下什么是字库:

  字库的形式通常是一张图片和一个映射表(码表)。

  众所周知,计算机软件是代码写成的。所以你在屏幕上看见的文本,计算机处理时,并不像人类一样是用语言能力组织出来的。而是通过一套映射方式,从一张排满了字符的图片里挑选要显示的字符,再按编程者制定的顺序排列,形成文本。

  拿一段汉字文本打个比方。

  “我恢复正常了”这段文字,“我”对应的代码是 #00,“恢”对应的代码是 #01,以此类推。那么,游戏中需要显示这句对白是,计算机实际首先读取到的需要显示的内容是“#00#01#02#03#04#05”。接着计算机将去一张码表里读取这个代码,比如 #01 代码映射的是图片中的第一行第一列(1-1):


码表


字库图片

  字库图片计算机就会对这张图片里的 1-1 部分寻址,然后将得到的“部分图片”也就是“我”这个汉字图像,显示到屏幕上。同理其他的字符也是这么显示的。

  游戏开发人员会根据游戏使用的文本,编排一个字库图,这张图里会包含这个游戏里用到的所有文字,接着设定码表,哪个代码字符代表显示这张图里的哪个部分,就可以正常显示游戏中的文本了。

  那对于汉化者来说,字库带来的问题是什么呢?首先他们一般得到的字库图片是需要解码的,如下图:


未经排列的字库

  乍一看根本不知道这是什么,需要解析这些像素的排列之后,重新排列,才能得到正确的字库如:


实际的字库图

  得到字库图之后,就完了吗?对于海外英化游戏的组织来说,可能就 OK 了,但是汉化不行。

  如果原文是英文的游戏,你会发现,字库里只会有 A-Z 的大小写字母,以及一些常用的标点符号;如果原文是日文的游戏,早期一点的比如 FC 游戏 GBA 游戏,只会有五十音图和标点,后期一点的 PS、SS 游戏,会有大概 100 个 ~ 300 个的汉字加上五十音图和标点。

  问题在哪?问题在于这些语言可以用有限的字符来排列出他们所需的句子,而汉语除非使用拼音(早期日本游戏的文本显示就全是假名,类似使用拼音),不然所需的字符将是非常庞大的。

  所以汉化人员需要对字库进行扩容,把众多的汉字加进去。这个工作具体是在主流程的导入步骤进行的。我们后面再说扩容面临的问题。

———— 字库解释完毕 ————

  解包出来的东西,在重新打包成可运行的游戏文件当中也可能出现各种问题。为了测试汉化成果放入游戏后的运行情况,破解导出一小段文本,初步翻译(也可能用“测试这是测试测试这是!!&……¥%”这种文本去,总之就是替换掉原文就行)之后,制作一个暂定的扩容字库,然后重新打包到游戏里,运行一下看看实际结果。

  除此之外,破解还得解析游戏用的图片格式,压缩方法等等……这个我不太了解就不详述了。

  一切顺利的话,组织者们就可以确定这款游戏的汉化是可行的。


组织编成

  确定完可行性和工作量,组织者们就要开始去拉人入伙啦!如果是万众期待的超大作,那跃跃欲试的人会非常之多,如何判断这些人的素质水平和思想觉悟,是组织者很重要的工作。

  总之就会有各种进组的测试,如果有过汉化经验会加分很多。毕竟这是一个没有回报的工作,对其中的艰辛没有充分认识的话,能不能坚持下来是很难说的。

  人员差不多到了组织者需要的程度之后,就会按照需求编排人员,按照职能、流程等等把团队组织起来。这基本就跟企业里的管理人员做的事情差不多,但是难度更高,因为企业里大家天天会来上班,有钱赚,为了晋升也会努力,而汉化组可不这样,你经常会面临找不到人,迟迟不交稿。会面临我失去兴趣了、家庭变故了、摔断腿了等等奇奇怪怪的弃坑缘由……

  管理人员和进度,也是组织者在后续流程中最重要的工作之一。如果组织者还要实际担任后面流程中的某个步骤的话,那简直是地狱般的强度。所以,大部分汉化组会专门设立一些管理进度的催稿、联络、协调的人员。

  人员编排完了,接下来就是分配工作了。破解组分别负责哪些部分的技术问题,翻译组和润色组谁负责哪部份的文本,校对组如何确保这些文本表意的正确性,同时哪些美工处理哪些图片,测试安排几轮又分别在什么时期,谁去对应外界的催更和伸手党,怎么处理可能存在的撞车 (就是别的汉化组也来汉化这款作品了)…………简直就是一个小企业了。


天幻FF9汉化组编成


下一页:主流程

| (96) 赞(254)
小卖 VG老兵

关注

评论(96

跟帖规范
您还未,不能参与发言哦~
按热度 按时间