跳转到主要内容

首创机器辅助翻译

100

即使在千兆赫级处理器和千兆字节级内存出现以后,机器在翻译语言方面仍然表现平平。例如,最新的程序提供了智能结果—但仅在普通电子邮件和商业网页的舒适使用范围内。

部分原因是不仅每种语言的许多词汇有不止一个意思,而且短语可能有字面意思和约定俗成的意思,这使得非母语讲话人的翻译需要巧妙地避免出现尴尬以及更坏的情况—混淆。个人风格和上下文产生的大量问题使情况更加复杂—更不必说人类为任何一个词加入的多种意义,包括喜爱、讽刺以及幽默—而且您会经常看到,即使最先进的机器也难以达到一名经验丰富的翻译人员的技能。


早期的翻译系统

1931年,IBM-Filene-Finlay 翻译机被永久安装到位于日内瓦的国际联盟。在那里,有些语言已经提前翻译好并同步读出,而有些语言首先以母语说出,而译员做记录。然后,一名译员以自己的语言说出,而其他人同时以自己的语言读出。在 1946年的纽伦堡战争犯审判期间,该系统经过修改,实现了真正的同声传译—讲话人的说话速度必须放缓,让译员能够同步说出。


Print-Braille 翻译

1946年,IBM 开始制造 Banks Pocket Braille Writer——一种袖珍型 Braille 打印机,这种设备用于捐赠给老兵,同时向公众销售。1964年,公司在美国盲人印刷厂 (APH) 推出了第一个自动化的 Braille 翻译系统,将文本翻译成布莱叶盲文。1968年,IBM Braille D 型电子打字机允许非布莱叶盲文作者制作布莱叶盲文文档,从而成为可供个人使用的第一款电动布莱叶盲文打字机。产品提供了六种不同语言的键盘供打字员使用。


俄语至英语翻译

1952年,IBM 与乔治敦大学语言学者合作,开发了一种在计算机上使用的翻译软件。1954年 1月 7日,他们演示了一种试验性质的软件程序,在 IBM 701 计算机上将俄语翻译成英语。1959年,为美国空军开发的 Mark 1 翻译设备进行了第一次从俄语到英语的自动翻译。在 1964年的纽约世博会上,Mark 1 在 IBM 展厅向公众展示。


同声传译

今天,IBM MASTOR(多语种自动语音到语音翻译机)软件提供了多种不同语言的双向翻译。该软件的工作方式就如同真人译员—您在讲话时,语音就会被即时翻译。2007年,IBM向美国政府捐赠了 1000台翻译设备和 10,000份 MASTOR 软件。据美国参谋长联席会议副主席 Admiral Edmund Giambastiani 指出:“这种技术可帮助改善美国和联盟国的人员与伊拉克人民及伊拉克的救助机构之间的沟通。”

01/04
IBM 在机器辅助翻译设备领域的悠久历史可追溯到 20世纪 20年代,而且公司目前正在努力研制具有突破性的下一代翻译系统解决方案。
IBM 创始人 Thomas Watson Sr. 早期在国际商会工作期间就亲身感受到了语言障碍的问题。1927年,在他的指引下,公司开发出了第一个基于 Filene-Finlay 同步翻译机的翻译系统。本质上讲,该系统是耳机和拨号盘的语音装置,允许用户收听专业译员的实时语音翻译。
1931年,系统最早在国际联盟(联合国的前身)安装并使用,允许收听者拨号说出母语,并同步收听为活动预先翻译好的语音。IBM® Filene-Finlay 翻译机后来经过修改,用于二战后的纽伦堡战争犯审判时同步翻译,并用在联合国中。
到 20世纪 50年代初,IBM 开发出了采用 IBM 701 电子数据处理机(公司的第一款商用科学计算机)的英语至俄语的翻译机。该程序结合了逻辑算法,模拟讲双语的人的工作而做出语法和语义“决定”。20世纪 60年代,IBM 开发出了翻译中文的机器和程序,这项工作取得了更大的进步。IBM 研究人员使用短语结构分析方法将表意的中文字符与其它语言匹配。
大约在同时,IBM 研制出了自动语言翻译机,这是一种为军事机构定制的计算机,采用容纳 170,000个单字和短语的高速光学磁盘将俄语文档翻译成英语。
IBM 还开发了第一款布莱叶盲文翻译机。通过与位于肯塔基州路易斯维尔的美国盲人印刷厂合作,公司在 20世纪 60年代初推出了布莱叶盲文翻译系统。该系统基于公司第一款量产的大型机——IBM 704,并且在美国盲人印刷厂作为 APH-IBM 系统投入运行。

“在全世界范围内,对于不讲通用语言的人来说,语音到语音翻译系统有可能会使他们互相交流的方式发生革命性变化。语言的种类有几千种;设想一下能够通过一种通用翻译机的帮助而即时地与任何人交流。打破这种交流障碍将大大增强人们对文化的了解。允许人们接受并适应每个人的差异对于未来将会非常有益。”
Yuqing Gao
IBM 研究员

“通过语言的印刷,人们不断地努力与同时代的人进行更广泛的交流,并与子孙后代进行更全面的交流。部分来讲,多语言(原文如此)阻碍了这一诉求。电子语言翻译是人们与邻居交流的另一个巨大进步… 具体地说,如果电子语言翻译将来可能实现翻译成世界欠发达地区的语言、西方语言中存在的基本参考和科学文献,这本身就具有重大意义。将当前科学领域中的文献随时以多种方言使用而为研究提供价值是另一个实用的目标。”
Leon Dostert
乔治敦大学语言与语言学学院教授、创始人和主任

“701翻译机”,IBM 新闻稿

1954年 1月 8日
“IBM 在语音到语音翻译系统研发方面的进步有可能使全球各地的人互相交流的方式发生革命性变化。MASTOR 系统在军事领域的使用就是这种能力的一个绝好例子—我们看到了它能够提高美国军人的安全,并挽救生命。”
Anne Altman
总经理,IBM 美国联邦

“在 IBM 实验室制造:语音翻译技术帮助伊拉克美军突破语言障碍”,IBM 新闻稿

2006年 10月 12日
01/03
最近,Thomas J. Watson 研究中心—与华盛顿特区的美国国防部合作—研制了 MASTOR,即多语种自动语音到语音翻译机。该系统由软件和双向自动翻译设备组成,可以识别并翻译50,000英文和 100,000伊拉克语词汇。在 2007年秋,IBM 将系统捐赠给美国军事部门,帮助联合作战部队与伊拉克人交流。IBM 研究院还研制出了将阿拉伯电视广播内容翻译成英文文本的技术。该系统叫跨语言自动语言开发系统 (TALES),可识别阿拉伯语音,并将其翻译成英文文本,产生了机器生成的闭合字幕,使讲英语的收听者能够了解阿拉伯语的内容。
2006年,IBM 在全体员工中间举行了“创新大讨论”,以发现有希望的想法。浮现的一个关键问题是 170个国家中的公司员工固有的语言障碍带来的挑战。IBM 出资启动了一个覆盖全公司的项目,涉及研究实验室、软件开发与咨询服务部门,旨在开发一种“实时翻译服务”,作为安全的企业级语言翻译系统,用于为 IBM 员工构建智慧的工作场所,并且最终被全球各地的 IBM 客户、IBM 业务伙伴和合作伙伴使用。
IBM 多语种自然语言处理小组在翻译研究首席技术官 Salim Roukos 领导下开发出了公司所称的 n.Fluent 系统。
n.Fluent 的发音是 “en-flü-nt”,它根据多语种 IBM 员工提交的使用模式而不断学习。该系统目前主要仅在内部使用,在这个众包形式的 IBM 项目中,志愿者已经帮助 n.Fluent 发展到了能够在英语和其它 11种语言之间即时翻译的阶段。目前,员工可以将其用作安全的实时翻译电子文档、网页、甚至实时的即时消息的方式。 截止到目前,2008年在 IBM 内部最先推出的 n.Fluent 可用于翻译英语和中文(简体和繁体中文)、韩国语、日语、法语、意大利语、俄语、德语、西班牙语、葡萄牙语和阿拉伯语。除了供 IBM 员工在内部使用外,n.Fluent 还用于向 IBM 客户提供网络支持,并且正在向外部授予许可,用于提供基于云的翻译服务。
n.Fluent 团队利用从大量相关语言对比句中开发的算法,例如英语和西班牙语以及法语和英语。但是,由于 n.Fluent 中的大部分内容是英语,团队采用 IBM 员工众包的方式获取并持续改进软件的翻译准确性和质量。
负责该项目的 IBM 研究员 David Lubensky 说:“n.Fluent 是哈佛商学院的一个案例,指出了公司内的人如何帮您开发更好的产品。我们的目标是将这个经验用到多个领域中。”

Content navigation