赣南师范大学,赣州
以ChatGPT为代表的生成式人工智能近期备受各界关注。这些大语言模型能够通过数据训练和引导不断更新自身,初步呈现出类似人类的创造性。其强大的理解、分析和综合能力显示出当代人工智能技术的巨大进步,必然给人类社会带来一定的冲击。不同于此前分析式、决策式的人工智能,生成式人工智能采用深度学习算法,基于大规模样本进行预训练,然后通过指令微调(Instruction Fine-Tuning)等技术,构造出性能强大的通用语言模型[1]。随着OpenAI开发的大型语言模型(Large Language Model)ChatGPT的问世,其辅助翻译功能立即得到广泛关注。ChatGPT在执行机器翻译任务时,需要用户提供输入提示,然后生成相应的答案(即译文)。不过,相对于专门机器翻译引擎,ChatGPT的功能更为全面丰富。
术语处理是翻译实践中的重要内容,涉及准确性和一致性。专业文本中的术语翻译对译员提出了更大的挑战。在处理专有名词翻译时,译者的知识和对相关领域的了解至关重要。但正如王元院士在《数学大辞典》前言中指出: “文献浩如烟海……即便是专业数学家,对他专业以外的数学领域,往往也了解有限。”[2]译者不可避免会遇到他们不熟悉、不了解,甚至从未见过的专业术语,由于领域知识所限,难以准确翻译,需要进行术语查证。运用搜索引擎查询固然便捷,但往往结果数量众多,质量却良莠不齐,可靠性较差。通过查找专业图书和学术论文进行术语查证相对可靠,但专业阅读门槛较高,查证效率较低,也难以避免少量误译现象。此外,即使是权威资料或可靠信源,不同作者或发布者也会因其思考角度和立场不同而导致同一术语存在多种译法。本文以某科技类文本专著的英语翻译为例,探讨生成式人工智能ChatGPT在术语查证方面具有怎样的优势。
术语翻译查证是翻译能力的重要组成部分[3]。科技类文本专业性强,充斥大量术语,翻译查证工作更加繁重。
科技类文体翻译的主要难点在于准确高效翻译大量高度专业化术语。术语翻译的准确性和一致性至关重要,任何错讹都可能误导读者,甚至造成不可估量的经济损失。冯志伟老师的著作中指出了术语的定名原则:专业性、约定俗成性、单义性、科学性、理据性、简明性、能产性、稳定性、系统性、确切性、国际性这11个原则。[4]在《中国术语学概论》一书中,基于术语的内容,该书将术语具有的特性总结为单义性、科学性、具有定义、系统性等;基于术语的形式,术语具有简短性、修辞中立性、派生性(或能产性)、符合本民族习惯、稳定性等特性。[5]科技类文本术语既具有普通英语术语的特征,也具有自身特征。第一,科技类文本术语有其严谨性。在相关领域的科技成果或进行英语表达的过程中,需要严格按照科技领域的基本表达要求进行准确表达。第二,科技类文本术语具有专业性。科技类文本术语在专业词汇层面和语言表达层面具有专业性,不同专业领域在相同的表达上也有不同表述,领域之间存在着明确界限。第三,科技类文本术语具有一致性。在科技类文本术语的翻译中要保持专业领域和相同名称一致。
本文第四章会结合笔者在翻译《基于项目的翻译技术方法》项目中的经验展示术语翻译过程中术语查证的解决方案,帮助译者在译中快速选择术语查证工具,积累相关术语知识、完成术语工作。本文的研究成果将为缺乏科技术语查证翻译经验的译者提供一套行之有效的查证方法,从而减少译者时间和精力的浪费,并降低术语翻译的错误率,促进术语翻译在规范性和统一性上的改善与进步。
搜索已成为译者翻译中的重要组成部分。已有研究表明,搜索在翻译过程中的时间占比从23%到50%以上不等,而在逆向翻译过程中,搜索时间占比普遍超过50%[6]。在翻译实践中,译者经常会因为某个术语的翻译反复推敲,很多词汇和表达在字典中都是查不到的,这时候译者就需要求助一些工具,本文旨在探究比较ChatGPT和传统的查证方式相比,有何优势。笔者选取了传统查证方式中的以术语在线为代表的大型术语库检索方式和以谷歌为代表的搜索引擎检索方式,笔者在下文中将通过对该项目中的术语进行查证,来比较上述的两种传统术语查证方法和用生成式人工智能ChatGPT进行术语查证的优劣。
关于大型术语库检索方式,笔者选择了术语在线这一平台,术语在线(termoline.cn)由全国科学技术名词审定委员会主办,旨在提供术语知识服务。它的目标是建立规范术语的“数据中心”“应用中心”和“服务中心”,以支持科技发展并维护语言的健康使用。这个平台集合了全国名词委会权威发布的审定公布名词数据库、海峡两岸名词数据库和审定预公布数据库,其中包含了超过45万条规范术语。覆盖领域广泛,包括基础科学、工程与技术科学、农业科学、医学、人文社会科学、军事科学等100多个学科,但是术语在线平台中收录的词条有限,有很多词条在术语在线中不能找到对应的标准翻译。
笔者还选取了谷歌代表搜索引擎的检索方式,搜索引擎在翻译的各个阶段都是有帮助的。在翻译之前,译者可以通过几个关键词获取足够的背景信息。在翻译过程中,它还可以用于搜索单词或短语,以验证原文本(ST)和目的语文本(TT)的真实性。在翻译项目中出现译员不熟悉的专业术语时,可以使用翻译引擎来检索所需要的。此外,建议译者能够区分不同类型来源的特点和用途。使用不同的方法、技巧和工具来确保高质量的检索。在本文中,笔者使用到了谷歌搜索引擎来进行术语查证,但是互联网上信息浩如烟海,纷繁复杂,想要找到译者需要的信息并不容易,往往需要多次尝试搜索表达,多加浏览才可以得到想要的结果,这样会使译者付出更多的时间和精力。
本文选取的翻译原文本是《基于项目的翻译技术应用》(A Project-Based Approach to Translation Technology),作者是Rosemary Mitchell-Schuitevoerder博士,出版于2020年。该书属于科技类文本,全书共约31万字,介绍了计算机辅助翻译(Computer Aided Translation)的基本流程,基于机辅工具SDL Trados 向读者展示了计算机辅助工具工作的整个流程,是初学者不可多得的一本工具书。
ChatGPT是“一个巨大的现象”(A Huge Phenomenon),也是技术加速发展进程中的重大范式转变。它是一个大语言模型,属于人工智能的范畴,称为生成式人工智能,它可以生成新内容,而不是简单地分析现有数据。[7]ChatGPT技术相对于传统的人工智能技术具有更高的通用性、自适应性和可扩展性。它不仅可以深入理解和分析文本,还能结合上下文和背景,对相关问题进行综合和归纳,并以多种方式进行回答和反馈,引入ChatGPT技术来规范科技名词具有多方面的优势。ChatGPT 技术通过调节模型的设定和参数,该技术能够适应不同的对话场景、用户需求和领域应用, 并给出满足特定要求的答复[8]。对于科技名词规范化这样的任务,ChatGPT技术可以借助大量语料库,自动学习各个领域的专业术语和使用规范,因此能够理解和生成更加准确和专业的内容。通过定制化的训练,ChatGPT技术还能掌握科技名词审定的原则和方法,自动提取、生成和呈现语料中的科技名词以及相关信息。或者根据专家需求生成一个包含相关科技名词及其关系、属性、分类等信息的知识图谱,从而降低人工参与的成本和难度。
此翻译项目依托于计算机辅助翻译工具SDL Trados完成,译者先在Trados中创建新项目,进而把待翻译文本拖进Trados中,译者的Trados软件中安装的是免费的翻译插件——小牛翻译,即译者会得到由小牛翻译软件翻译过的机器翻译译文,并且Trados会把原文切分成一个个句段,这样更方便译者翻译,同时,也为笔者的研究提供了便利,便于笔者提取想要研究的术语对象。笔者将在下文中进行机构组织名称专业术语的翻译查证,分别用ChatGPT和传统的查证方法来查证并审校。
表1 实验结果
Table 1 Results of the experiment
待查证术语 |
术语在线 |
谷歌 |
ChatGPT |
TAUS |
无 |
第5个链接 |
直接返回正确结果 |
GALA |
错误结果 |
多次尝试搜索后得到结果 |
直接返回正确结果 |
ribbon |
错误结果 |
多次尝试搜索后得到结果 |
直接返回正确结果 |
filter |
错误结果 |
多次尝试搜索后得到结果 |
经过两次查证得到结果 |
例1.
原文:TAUS
机器翻译:TAUS
查证过程:
原文本中,“TAUS”第一次出现时,其全称“the Translation Automation User Society”紧跟其后,这为翻译查证提供了便利条件。笔者先用传统的方法来查证此术语,将“TAUS”输入到“术语在线”中,其搜索结果如图1所示。
图1 术语在线搜索TAUS截图
Figure 1 Screenshot of TAUS termonline search
这并没有得出笔者想要的结果,于是笔者又将其全称“the Translation Automation User Society”输入“术语在线”中,其搜索结果如图2所示,其搜索结果与笔者想要的结果无直接关联。
图2 术语在线检索the Translation Automation User Society截图
Figure 2 Term online search screenshot of the Translation Automation User Society
笔者遂于谷歌引擎中搜索“TAUS是什么意思”,搜索结果如下图3所示,搜索结果中,第五个结果中出现了“翻译自动化用户协会”及其全称“Translation Automation User Society”,如图4所示,且此文章是由中国翻译协会官网发出,具有一定权威性,那么笔者就完成了用传统的术语查证方法查证“TAUS”的过程。
图3 谷歌检索TAUS术语截图
Figure 3 The screenshot of TAUS search on Google
图4 中国翻译协会官网中TAUS解释截图
Figure 4 Screenshot of the explanation of TAUS on the official website of translators association of China
笔者用ChatGPT进行查证,ChatGPT 技术具备快速且准确地处理庞大文本信息的能力。在ChatGPT的聊天对话框中输入“TAUS”,结果如图5所示,结果不仅给出了“TAUS”的全称及其翻译版本,还对此机构进行了解释,在为笔者补充了背景知识的同时,也让笔者根据其内容确定了这个翻译是正确的。通过比较,可以看出在查证“TAUS”这个术语时,用ChatGPT查证比用传统方法查证更省时,省力,同时也更高效。
图5 ChatGPT搜索TAUS截图
Figure 5 Screenshot of TAUS search on ChatGPT
例2:
原文:ribbon
机器翻译:丝带
查证过程:笔者先采用传统的查证方式对术语“ribbon”进行查证,笔者先把“ribbon”输入到“术语在线”中,其搜索结果如下图6所示,没有得到笔者想要的结果。笔者又将“ribbon什么意思”输入到谷歌搜索引擎中,搜索结果如图7所示,笔者浏览搜索结果,没有得到笔者想要的结果,于是又改变提示词,输入“ribbon在计算机领域什么意思”,结果如图8所示,搜索结果中的第一条正是正确结果。接着笔者又用ChatGPT进行术语查证,对话结果如图9所示,笔者得到了想要的结果。韦孟芬通过科技文本发现“科技英语中相当数量的术语都来源于非科技术语的转化,其中包含常用词汇的专业化以及同一词语词义的多专业化。”[9]对比用传统方法进行术语查证和用ChatGPT进行术语查证术语“ribbon”的过程可以证明,用ChatGPT进行术语查证比用传统的术语查证方法更加节约译员的时间,提高译员的工作效率。
例3:
原文:This process is called setting up filters.
机器翻译:这一过程称为设置过滤器。
查证过程:笔者看到机器翻译将“filter”翻译为“过滤器”时,笔者第一时间就想要去查证该术语,因为对于包括笔者在内的不熟悉计算机领域的读者来说,“过滤器”放在这种语境中并不合适,笔者第一次看到这个单词时,有两个翻译版本,一个是“过滤器”,即是一种工具,可以过滤掉不想要的残渣(见下图4),另一个是“滤镜”,即当下的人们,无论是年轻人,中年人抑或是老年人,拍照时候会选择一些滤镜来让自己的照片看起来更美观,或者是起到搞怪的效果。黄昭厚认为,推荐的“正名”使用久了,“异名”可能逐渐消亡,这就能逐步引导术语的统一。[10]笔者先用传统的术语查证方式查证“filter”,笔者先将“filter”输入到“术语在线”中,得到的结果如图所示,没有得到笔者想要的结果,笔者又将“filter什么意思”输入到Google中,得出的结果如下图所示,笔者浏览翻阅所有的结果,没有得到笔者想要的结果,于是笔者又将提示词换成“filter在计算机领域是什么意思”,得出的结果如下图所示,搜索结果中的第一项就是笔者想要的结果,点开第一项的结果图如下图所示,页面显示是“稀土掘金”,笔者想要确定此译文是否具有权威性,于是笔者又将“稀土掘金”四个字输入到Google中,搜索结果如图所示,“稀土掘金”是一个技术开发者分享内容,交流信息的平台,正好是计算机领域的平台,所以其译文具有权威性,至此,笔者完成了用传统方法查询术语“filter”的过程。笔者接着采用ChatGPT进行“filter”术语查证,在ChatGPT对话框中输入“filter什么意思”,得到的结果如图所示,对话结果中只有第一项“数据筛选”符合此语境,对于术语工作者来说,语境是理解概念的关键。[11]但是“数据筛选”是动词,而原文中的“filter”前面有动词“set up”,此处不能转译为动词,所以此翻译不正确,笔者将提示词改为“filter在计算机领域什么意思”,对话结果如图所示,笔者得到了正确的译文。
综上所述,ChatGPT技术在查询机构组织缩写词领域拥有巨大潜力。在对话机器人方面,ChatGPT 可以让用户自然提问,实现了从理解到生成,模拟人类进行对话,在客服、辅导、调研等方面提高了服务质量和效率[12]。Chatgpt有些反馈结果经不起考验,需要进一步证明,即使基于ChatGPT结果进一步查证,也还是会更高效。应用这一技术可以显著提高机构组织名称审定的效率和准确性,推动多语种科技名词的翻译和对照工作,增强科技名词审定成果的规范性和一致性,并促进科技名词的广泛应用和普及。因此,ChatGPT技术有望成为名词规范化领域的重要支持工具。
[1]袁毓林.超越聊天机器人,走向通用人工智能——ChatGPT的成功之道及其对语言学的启示[J].当代语言学,2023(5):633-652.
[2]王元.数学大辞典(第2版)[M].北京:科学出版社,2017.
[3]赵秋荣,葛晓华.翻译能力研究[M].北京:外语教学与研究出版社,2023.
[4]冯志伟.现代术语学引论[M].北京:商务印书馆,2011.
[5]刘青.中国术语学概论[M].北京:商务印书馆,2015.
[6]王静,柴明颎.数字化时代翻译搜索的特征与搜索教学构想——基于一个实验的阐发[J].外语与翻译,2023(1):76.
[7]Baker,Pam.ChatGPT for Dummies[M].New Jersey:Hoboken,2023.
[8] Mattas P S.ChatGPT:A Study of AI Language Processing and its Implications[J].International Journal of Research Publication and Reviews,2023,4 ( 2 ):435-440.
[9]韦孟芬.英语科技术语的词汇特征及翻译[J].中国科技翻译,2014,27(1):5-7.
[10]黄昭厚.科技术语的翻译与定名[J].中国科技翻译,1993(3):47-50.
[11]王华树,冷冰冰.术语管理概论[M].北京:外文出版社,2017.
[12]Thorp H H.ChatGPT is fun,but not an author [ J].Science,2023,379(6630):313.