一、机器翻译的基于人工神经网络
2013年来,随着深度学习的研究取得较大进展,基于人工神经网络的机器翻译( Neural Machine Translation )逐渐兴起。其技术核心是一个拥有海量结点(神经元)的深度神经网络,可以自动的从语料库中学习翻译知识。一种语言的句子被向量化之后,在网络中层层传递,转化为计算机可以“理解”的表示形式,再经过多层复杂的传导运算,生成另一种语言的译文。实现了 “理解语言,生成译文”的翻译方式。这种翻译方法最大的优势在于译文流畅,更加符合语法规范,容易理解。相比之前的翻译技术,质量有“跃进式”的提升。
目前,广泛应用于机器翻译的是长短时记忆(LSTM,Long Short-TermMemory)循环神经网络(RNN,Recurrent Neural Network)。该模型擅长对自然语言建模,把任意长度的句子转化为特定维度的浮点数向量,同时“记住”句子中比较重要的单词,让“记忆”保存比较长的时间。该模型很好地解决了自然语言句子向量化的难题,对利用计算机来处理自然语言来说具有非常重要的意义,使得计算机对语言的处理不再停留在简单的字面匹配层面,而是进一步深入到语义理解的层面。
代表性的研究机构和公司包括,加拿大蒙特利尔大学的机器学习实验室,发布了开源的基于神经网络的机器翻译系统GroundHog。2015年,百度发布了融合统计和深度学习方法的在线翻译系统,Google也在此方面开展了深入研究。
二、同声传译是否能完全被“机器翻译”取代
不可能,人类几千年解决不了的问题,人工智能是不可能完成的;首先机器翻译对于一些突发状况是无法及时处理的;另外,语言永远都会有不断新生的词汇和用法,机器能不能及时跟上;还有一些用语的委婉用和灵活使用,都是机器无法立刻代替的。就像机器翻译无法准确翻译名著诗词,同声传译更加能够体会具体语境和当时情况。
三、谁知道翻译软件什么翻译最准
我做翻译的,本科读计算机的,明确告诉楼主:目前和未来50年内不可能出现可以替代人工翻译的机器翻译(MT);机器翻译的介绍:,看完这个相信您会对MT有个较为全面的认识!!机器翻译涉及人工智能、模糊识别、语法、语义、知识学习、数据库等多种知识领域,目前计算机这些方面的发展还完全无法做到结合语境来翻译,所以就出现了你说的“逐字翻译”,因此很多重要文件、公司手册和网站等翻译工作都是交给专业的、有丰富翻译经验的翻译公司和翻译人员做的;如果语料库足够大,将全人类各行各业用过的所有语言句对都放进一台告诉反应的计算机中,那样的精度就会有很大提高的,但这样做搜索和匹配的时间就得很久!
目前做的比较好的在线翻译工具就是GOOGLE 翻译了;机器翻译跟人工目前距离太大,没有可比性的,只有在处理部分单词、固定词组等时,机器翻译才是有效的,设计逻辑性的问题时机器无法处理好。
真正专业软件的介绍:
四、大家对于自然语言的理解有什么好的新的见解吗?
走向实用的自然语言理解技术
用自然语言与计算机进行交流,获取合适的信息,得到满意的服务,是人们长期以来所追求的。自然语言理解是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。NLU是自然语言理解(Natural Language Understanding)的缩写。
随着计算机技术和人工智能总体技术的发展,自然语言理解不断取得进展。机器翻译是自然语言理解最早的研究领域。由于早期研究中理论和技术的局限,所开发的机译系统的技术水平较低,不能满足实际应用的要求。到了1970年代初期,对语言理解对话系统的研究取得进展。进入1980年代之后,自然语言理解的应用研究广泛开展,机器学习研究又十分活跃,并出现了许多具有较高水平的实用化系统。这些系统是自然语言理解研究的重要成果,表明自然语言理解在理论上和应用上取得了突破性进展。
在中国,语音和语言处理技术的研发略晚于国外。清华大学智能技术与系统国家重点实验室属下的语音技术中心1979年创立(原名语音实验室),至今已有25年的历史。在以清华大学语音技术中心为代表的顶尖的学术机构的带动下,中国的语音和语言处理技术得到很大发展。
相对于规范语言,对自然语言的理解具有更大的难度。这是因为自然语言包含大量的口语语言现象,诸如:省略、指代、更正、重复、强调、倒序等等。涉及到语音的口语对话系统将还包括噪音、含混不清、口头语、吃音、音变等等口语语音现象。
而相对于基于关键词的技术,自然语言理解技术的优势是:(1)直接:在信息查询时,用户可以不必进行多级菜单的选取而直奔主题。(2)灵活:用户查询不必严格按照某些关键词进行询问,只要用户的叙述在语义上与要查询的一致。
一个技术优越而适用性好的自然语言理解系统,应该具备支持上下文相关分析(包括省略分析)、话题自由变换、人机混合主导以及口语对话等技术特点。
上下文相关分析是指系统在理解当前语句时可以联想用户以前所说的话,进行综合分析,因此即使有时用户所说的话有一定的省略,系统照样可以理解。
话题自由变换是指系统允许用户在多个话题之间不断转换,系统照样可以记住以前的谈话内容,比如用户在问航班起飞时间时,突然问目的地与本地的时差,然后再确认要先前询问的航班,系统都能满意回答。而目前的一些系统,对话往往只能局限于某一个话题,一旦用户变换话题,系统将无所适从。
人机混合主导则是完全的自然对话,用户可以转换话题后在回到原来的话题(像人一样);用户可以答非机问(多回答或少回答);……而系统都可以根据实际情况提取语义信息,如果用户询问的信息足够,那么系统直接回答问题;而如果用户询问的信息不全或者用户迟疑太久,那么系统则主动询问来获取足够的信息。而不具备人机混合主导性能的系统只能等用户发问,如果用户根本不知道问什么,那么系统将一直待机等待。
口语对话是自然语言理解技术实现的难点,但是也是应用系统适用性的关键点。口语中,人们的语言很随意,可以省略、更正、倒叙等等,这些口语现象是传统的单单基于词法分析的理解系统所难以解决的,而引入基于关键语义的技术却可以很好地解决。
从目前的理论和技术现状看,通用的、高质量的自然语言处理系统,仍然是较长期的努力目标,但是针对一定应用,具有相当自然语言处理能力的实用系统已经出现。