1. 同声翻译器的原理有哪些
同声传译,简称同传(simultaneous interpretation),亦称同声翻译、同步口译。是译员在不打断讲话者演讲的情况下,不间断地将演讲者的讲话内容传译给听众的一种口译方式。会场或剧场中配备专门用来进行翻译的电声系统。译员们将演讲词或台词同步译成不同语种,通过电声系统传送,席位上听众可自由选择语种进行收听。同声传译的最大优点在于效率高,可以保证讲话者作连贯发言,不影响或中断讲话者的思路,有利于听众对发言全文的通篇理解。同声传译是当今世界上在举办各类大型会议、论坛、峰会时经常采用的一种翻译方式。目前,世界上 95% 的国际会议采用的都是同声传译的方式。特点是讲者连续不断地发言,而译者是边听边译,原文与译文翻译的平均间隔时间是三至四秒,最多达到十多秒。译者仅利用讲者两句之间稍歇的空隙完成翻译工作,因此对译员素质要求非常高。同声传译是一种受时间严格限制难度极高的语际转换活动,它要求译员在听辨源语讲话的同时,借助已有的主题知识迅速完成对源语信息的预测、理解、记忆、转换和目的语的计划、组织、表达、监听与修正,同步说出目的语译文,因此同声传译又叫同步口译。在各种国际会议上,同声传译译员以“闪电般的思维”和令人叹服的口译技巧,成功克服上述多重任务( multi-tasking )间的交织、重叠和干扰给大脑造成的能量短缺和注意力分配困难,使听和说并行不悖,成为与源语发言人一样令人瞩目的明星。 根据 AIIC (国际会议口译员协会)的规定,同声传译译员只要翻译出演讲者内容的 80 %就已经算是合格了(同声传译译员翻译出演讲内容的 90 %、 100 %当然也有可能),因为很多人平时说话非常快,演讲时又只顾及自己的演讲内容或带各地的口音,同声传译译员只好调动自己的一切知识储备和经验来全力以赴。那些有意放慢速度照顾同声传译译员的演讲者毕竟不是太多,这就对从业者的素质提出了极高的要求。
2. google翻译网站的原理是什么
很简单,自己开发一项技术就可以了,这对于谷歌来说,不是什么难事
3. 谁能解释一下在线翻译器的工作原理
就是把你输入的内容通过脚本翻译过来
4. 英语翻译软件的原理
机器翻译基本工作原理和基本分类
机器翻译(Machine Translation,MT)是建立在多学科基础上的综合学科,现代理论语言学的发展,计算机科学的进步,信息学和概率统计学的应用,对机器翻译的发展和演变产生了重要影响。机器翻译的基本思想是利用计算机对自然语言进行翻译,而各种机器翻译系统采用的技术和理念不尽相同;面对各种各样的机器翻译系统,文献上有各种分类方式。本文根据所应用的基本工作原理对机器翻译系统分类作一综述。
1. 基本类型的机器翻译系统:现有的机器翻译系统按照其基本工作原理,可以分为基于规则的(Rule-Based)机器翻译,基于实例的(Example-Based)机器翻译和统计型的(Statistical)机器翻译这三种基本类型。
1.1. 基于规则的机器翻译系统(Rule-Based Machine Translation, RBMT):其基本工作原理基于一个假设,即语言无限的句子可以由有限的规则推导出来。基于这个假设的机器翻译方法又可以分为三类:直接翻译法(Direct Translation),中间语言法(Interlingual Approach),和转换法(Transfer Approach)。它们都需要用到大规模的双语词典,需要用到源语言推导规则,语言转换规则和目标语言生成规则;其不同点在于对语言进行的分析深度不同。如直译法几乎不需要进行语言分析,中间语言法和转换法需要对源语言和目标语言进行某种程度的语言分析。
1.1.1直接翻译法(Direct Translation):这种翻译方法直接对源文字中的字词进行逐个翻译,译后文字顺序按照原文顺序进行排列。这是基于规则的机器翻译的最早的工作方法。这种译法简单、直观,其弊端也是明显的:由这种方法得到的翻译结果质量很不令人满意。人们已经逐渐不再使用这种直接翻译法。
1.1.2中间语言法(Interlingual Approach):这种翻译方法对源语言文字进行透彻的语言分析,将其转化为一种中间语言表达形式,进而由这种中间语言(Interlingua)进一步生成和输出符合目标语言语法规则的文字。这种中间语言是一种非自然语言,即不是任何国家地区人们使用的语言;而且它是一种没有歧义的表达方式。此外,中间语言不是唯一的,不同的系统采用不同的中间语言。任意一种语言经由中间语言译为其它任意一种语言,理论上这种中间语言法是最有效率的一种翻译方式。假定世界上总共有n种自然语言,使用中间语言法,只需2n个模块就可以解决所有自然语言之间的互译问题。不使用中间语言,这些语言间的互译则需要n(n-1)个模块。当n大于3时,2n小于n(n-1)。我们知道,世界上的自然语言种类远大于3,因此2n个模块的数量远小于n(n-1)个模块的数量。
1.1.3 转换法(Transfer Approach):这种翻译方法先对源语言文字进行一定程度的语言分析,去除语法的因素,生成源语言的中间表达方式,然后经由转换,生成目标语言的中间表达方式,再由目标语言的中间表达方式生成和输出符合目标语言语法规则的文字。目前来说,转换法的语言分析和实现方法在三种方法中最为复杂,得到的翻译质量在三种方法中也是最好的,是目前商业上最常使用的翻译方法,在商业上最为成功。
在许多基于规则的机器翻译系统中,由语言学家辅助编写一系列关于源语言和目标语言的语法规则,以及将源语言数据转换为目标语言数据的转换规则。然而使用全人工来制作这些规则非常昂贵、费时,而且易于出错。一个解决方法便是将以往的历史翻译结果作为资源库,其中的源语言文字和它对应的目标语言译文作为例子,从中尝试提取出恰当的规则。方法之一是对源文字和目标语言译文作人工标记以示关联。Sato言和Nagao[1]研发出一个系统,用“平面依赖关系树”来表示源语言文字和目标语言文字。这种关系树型数据结构是计算机高效识别的一种形式。通常用两个层次代表源语言和目标语言之间的关联:第一层次依赖于文字的表面形式(如字、词顺序),用于源语言的分析和目标语言的生成;第二层次依赖于字词间的语义关联,用于从源语言向目标语言的转换。这种机器翻译系统在基于规则的机器翻译基础上,利用了实例库的优势。
随着大量历史翻译结果的积累,出现了基于实例的机器翻译系统,人们将这些已经完成的翻译结果作为资源库,利用到机器翻译中来。
1.2. 基于实例的机器翻译(Example-Based Machine Translation,EBMT):其基本工作原理是基于类比(Analogy)的原则,从实例库中匹配出与源文字片段最相似的文字片段,取出实例文字片段对应的目标语言翻译结果,进行适当的改造,最终得出完整的翻译结果。基于实例的机器翻译其核心思想最早由MakonNagao 提出,他提出:人们在翻译简单句子时并不作深层语言分析,而是翻译。首先把源句子分解成若干片段,然后将这些片段译为目标语言,每个片段的翻译都是通过与例句做匹配以类比的原则得到的,最后将这些译后句子组合成一个长句子。
1.2.1. 实例库的构成:实例库也称为语料库(Corpus),由已经完成的翻译结果构成。这些现成的翻译结果也称为语料,包括人工翻译的结果和经过人工编辑的机器翻译结果。语料库由双语对构成,包括源语言文字片段和目标语言译文文字片段两部分。这些翻译结果要先经过拆分和对齐处理,才可以成为语料库中的可用语料。因此语料库也称为平行双语语料库(Parallel的 Corpus)。拆分和对齐目前有多种形式,如句子水平的对齐和短语水平的对齐。对齐的文字片段大小的选择,会直接影响匹配的效率和翻译结果。
1.2.2. 语料拆分的碎片化问题:Nirenburg等(1993)指出,在基于实例的机器翻译系统(EBMT) 中,实例语料存在一个文字片段长度和相似度之间的一个矛盾。文字片段越长,越不易得到一个相似度高的匹配;文字片段越短,越可能得到一个大致匹配,但是得到低质量翻译结果的风险也越大。比如由段落划分边界产生的重叠问题以及不恰当的划分导致的翻译质量下降。直观上似乎是选择以句子为单位划分得到的语料对比较好,有诸多优势如:句子的边界划分清楚,一些简单句子的结构清晰。然而在实际应用中,以句子为单位并不是最恰当的方式。实践证明匹配和重组过程需要使用更加短小的片段。(当然,这些研究结果是以欧美语系语言之间的翻译研究结果为基础的。)
1.2.3. 实例库定制:实例语料的的范围和质量影响着基于实例的机器翻译系统(EBMT)的翻译质量水平。在某特定领域获取高质量语料可以大大提高机器翻译在此领域的翻译质量,称为语料(实例)库的定制。
1.3. 统计型机器翻译系统(Statistical MT):IBM公司的Brown在1990年首先将统计模型用于法-英机器翻译。其基本思想是:把机器翻译问题看成是一个噪声信道问题,然后用信道模型来进行解码。翻译过程被看作是一个解码的过程,进而变成寻求最优翻译结果的过程。基于这种思想的机器翻译重点是定义最合适的语言概率模型和翻译概率模型,然后对语言模型和翻译模型的概率参数进行估计。语言模型的参数估计需要大量的单语语料,翻译模型的参数估计需要大量平行双语语料。统计机器翻译的质量很大程度上取决于语言模型和翻译模型的性能,此外,要找到最优的译文,还需要有好的搜索算法。简单说,统计机器翻译首先建立统计模型,然后使用实例库中的实例对统计模型进行训练,得到需要的语言模型和翻译模型用于翻译。
统计型机器翻译,除了基于噪声信道理论的系统以外,还有基于最大熵方法的系统。博格(A.L.Berger)在1996年 提出自然语言处理中“最大熵方法”(Maximum Entropy Approach)。德国人奥赫 (Franz Joseph Och)等发现, 把IBM公司的统计机器翻译基本方程式中的翻译模型转变为反向翻译模型,总体的翻译正确率并没有降低,由此,他们提出基于最大熵方法的机器翻译模型。
统计型机器翻译取得了一定的成绩,然而纯统计设计却不能解决所有困难。统计型的方法不考虑语言的语义、语法因素,单纯用数学的方法来处理语言问题,有着巨大的局限性。于是人们开始探索基于统计方法和其它翻译方法的联合应用。如统计的和基于实例的机器翻译系统,统计的和基于规则的机器翻译系统,等等。
2. 综合类型的机器翻译系统:
以上三个基本机器翻译系统各有优势和长处,同时又不可避免的具有某种缺陷和局限性。如基于规则的机器翻译系统(RBMT)可以准确的描述语言学特征和规律,然而制定适用和完备的语言规则却不是一件容易的事;基于实例的机器翻译系统(EBMT)可以充分利用已有的翻译结果,但是实例库的维护需要大量的人工和费用;统计型的机器翻译(Statistical以MT)可以缓解知识获取的瓶颈问题,但是纯数学的方法难于完全解决语言中的复杂问题。为进一步提高机器翻译系统的翻译水平,人们综合以上几个基本类型的优势,又发明了混合型机器翻译系统(Hybrid器MT),多引擎机器翻译系统(Multi-Engine MT)和提出了基于知识的机器翻译系统(Knowledge-Based MT)的理论。
2.1 混合型机器翻译系统(Hybrid MT):翻译过程使用两种或以上机器翻译原理。比如:基于规则的机器翻译方法的核心是构造完备的、适应性较强的规则系统。如何得到完备和适应性强的规则系统成为研究焦点。使用传统的方法,语法规则库的建立需要大量的人力、物力,大量的语言语法规则之间往往存在着不可避免的冲突,规则的完备性和适应性不能得到保证。随着人们翻译工作的进行,生成大量已完成的翻译结果,形成大量语料。人们想到了使用统计方法从现有语料中自动提取我们需要的语言语法信息。从实例中抽取语言转换规则,将基于实例的机器翻译作为研究技术来建立语言规则基础,而不是单纯用来进行类比翻译。通过一个归纳的过程,从大量例句中提出抽象的规则 。这样传统的基于规则的机器翻译方法发展成为以规则为基础,语料库为辅助的机器翻译方法。这种翻译模型可以称之为混合型机器翻译系统(Hybrid MT)。
2.2 多引擎机器翻译系统(Multi-Engine MT):这种机器翻译系统的基本思想是几架机器翻译引擎同时进行并行翻译,并行翻译的这几架翻译引擎分别基于不同的工作原理,给出多个翻译结果,然后通过某种机制或算法筛选并生成最优翻译结果进行输出。多引擎机器翻译系统的一种工作方式如:接收到源文字后,先将文字转化为若干文字片段,由多个机器翻译引擎进行并行翻译,型各个文字片段均得到多个翻译结果, 通过某种机制选择最优的翻译片段组成最优组合,最后输出最优的翻译结果。或者是接收到源文字后,由多个机器翻译引擎进行并行翻译,得到多个翻译结果,然后对各个翻译结果进行字词的比较,通过某种假设检验和算法,选择适当的字词翻译组成最优翻译结果输出。
2.3. 基于知识的机器翻译系统(Knowledge-Based MT):在机器翻译研究中,人们越来越发现在翻译过程中正确的理解、领会源语言的重要性。语言有着其复杂性。其中语言的模糊性是各种机器翻译系统所面对的最顽固的难题。语言的模糊性指语言文字同一表层结构对应着两种或两种以上的深层结构,简单说就是一种形式对应着两种或两种以上的解释,必须通过上下文内容的提示和综合知识背景、常识才可能做出正确的诠释。受人工智能,知识工程的发展影响,人们开始强调对源语言更为彻底的理解,提出不仅需要进行深层语言分析,还需要进行世界知识的积累和处理,建立知识库,以助于理解语言。通过对世界知识的了解,解决机器翻译中遇到的语言模糊问题。为了从根本上彻底的解决机器翻译所面对的语言的模糊性问题,人们提出了基于知识的机器翻译系统。
2.3.1 基于语义网的机器翻译(Semantic Web based Machine Translation, SWMT):是基于知识的机器翻译系统的一种实现方式。语义网(Semantic Web),指通过某种技术,将现有网络上的知识内容转化为机器可以辨识的内容,成为机器翻译的“世界知识库”。这些理论基于Tim Berners-Lee提出的观点“知识一旦经定义和形式化后,便可以通过任意方式访问”。万维网最初的设计是希望它简单,去中心化并且尽可能的易于互动。网络的发展证明它是一个巨大的成功。然而,网络上面的信息都是面向人类大脑的。为了让计算机也能够接受和利用这些信息资源,在新的世纪一种扩展和补充性质的技术出现了,分称为W3C,Semantic Web3 (三维语义网)。三维语义网络的基础技术是数据格式的“资源描述构架”( ‘Resource Description Framework’,RDF), 它定义了一种结构,用一种自然的方式来描述计算机处理的巨大量的数据[8]。目前人们已经 在尝试将现有的机器翻译系统整合入语义网,以充分利用世界知识/专家知识, 提高机器翻译质量。
3.语音翻译(Speech Translation):语音翻译是与文字翻译相对应的一种机器翻译分类,与前面的分类有着不同。但是有着广泛的应用,如日常交谈、电话通话、会议讲话等对语音交流内容的自动翻译,在实际应用中非常重要。语音翻译在翻译之前增加了一个语言识别(SpeechB Recognition)过程,形成正确的文字内容输入,并且在翻译过程完成后增加了一个语音合成(Speech Synthesis)过程,
形成一个正确的语音内容输出。其中语音识别技术和语音合成技术都有着专门研究,这里不再赘述。
作者姓名:洪洁
工作单位:传神语联网网络科技股份有限公司 多语工程中心
作者姓名:洪雷
工作单位:中国科学院大学 外语系
5. 百度翻译的原理是什么
网络翻译是一项免费的在线翻译服务,支持中英文之间的文本和网页翻译功能,输入想要翻译的文本或者网页地址,即可获得翻译结果。这项服务的基本原理是机器自动从>大量语料中学习并自动生成翻译结果,即翻译结果是没有经过任何人工整理与编辑的。
6. 机器软件进行中英文翻译的原理是什么
向词典一样 输入海量的词跟意思 所以输中文的时候 就有对应的翻译了 但因为都是词典 所以才会出现语句语病 要交作文 或者别的文书 还要自己修改
7. 同声翻译器的原理是什么
同声翻译器的原理是一个翻译在后台实时翻译,通过电声系统同步传播,听众根据自身需求,选择相应的频道,所看到大会人员带的翻译器真的只是一个耳机,重要的是后台的翻译人员。
会场或剧场中配备专门用来进行翻译的电声系统。译员们将演讲词或台词同步译成不同语种,通过电声系统传送,席位上听众可自由选择语种进行收听。
(7)自动翻译软件原理是什么扩展阅读:
1、同声传译的最大优点在于效率高,可以保证讲话者作连贯发言,不影响或中断讲话者的思路,有利于听众对发言全文的通篇理解。
2、同声传译是当今世界上在举办各类大型会议、论坛、峰会时经常采用的一种翻译方式。目前,世界上 95% 的国际会议采用的都是同声传译的方式。
3、特点是讲者连续不断地发言,而译者是边听边译,原文与译文翻译的平均间隔时间是三至四秒,最多达到十多秒。译者仅利用讲者两句之间稍歇的空隙完成翻译工作,因此对译员素质要求非常高。
8. 翻译机都是什么原理
翻译机现在基本有2种模式,人工智能和真人服务。人工智能是大多数翻译机在用的模式,如讯飞、准儿,他们通过在线翻译、在线查询海量的信息,提供准确的翻译。
真人服务模式,是很少见的,传神翻译机是这一种,翻译机通话模式采用电信方式,不因网络受损,能享受同传交传的极致服务。
9. 翻译软件原理和翻译机原理,是一样的吗
语音翻译机的工作原理
内置麦克风辨识使用者说话的语言及内容,并将语音转换为文字,然后通过机器翻译引擎进行文字对文字的翻译,将原始语言转化为目标语言。最后,将翻译的内容进行语音合成并播放出来。
语音翻译机对比翻译软件的优势
1、硬件上能做到更优秀的拾音
语音翻译机硬件方面采用四麦拾音降噪技术,帮助更好地识别人声,音频设计上则讲究立体的环境拾音效果,也就是更逼近真实的人耳效果。相对手机APP拾音更优秀,这就解决了听得清,听得明白的问题。
相比较手机的音频设计上,因为要照顾到通话特性,所以一般要讲究抑制远场而增益近场,所以绝大多数安装在手机里的翻译软件之所以在实际使用中表现欠佳,一般来说都是折在了第一步----听得清听得明白上。
2、翻译更精准
通过神经网络学习及AI算法,完成更准确的语意翻译,再加上完备的语言数据库,使翻译更加准确。
语音翻译机采用的是科大讯飞的神经网络算法,神经网络算法的最大的优势在于越用越准,还有学习功能。而手机APP则用的是统算法。不断完备的云端语言库,加上阿里云和谷歌云的语言库不断优化加持,让翻译更准确,沟通更高效。
3、无需联网也能翻译
使用手机翻译软件大多需要联网,而国内的手机卡在国外使用会造成十分高昂的流量和漫游费用。使用语音翻译机没有网络也能轻松翻译,帮你省钱而且使用更便捷。
基于规则的翻译,翻译知识来自人类专家。找人类语言学家来写规则,这一个词翻译成另外一个词。这个成分翻译成另外一个成分,在句子中的出现在什么位置,都用规则表示出来。这种方法的优点是直接用语言学专家知识,准确率非常高。缺点是什么呢?它的成本很高,比如说要开发中文和英文的翻译系统,需要找同时会中文和英文的语言学家。要开发另外一种语言的翻译系统,就要再找懂另外一种语言的语言学家。因此,基于规则的系统开发周期很长,成本很高。
此外,还面临规则冲突的问题。随着规则数量的增多,规则之间互相制约和影响。有时为了解决一个问题而写的一个规则,可能会引起其他句子的翻译,带来一系列问题。而为了解决这一系列问题,不得不引入更多的规则,形成恶性循环。
10. 中英文翻译机器软件的原理
机器翻译是一门新兴的学科。五十年代起,美国、苏联等国家的一些科学家才对机器翻译开始进行初步的研究和探索,直到七十年代起,机器翻译的研究工作刁‘开始有新的进展。目前,世界_L已有十多个国家的七十多个机器翻译的研究单位发表过机器翻译的正式报告。