大公司争相布局AI翻译,文化差异与数据安全成瓶颈
自ChatGPT面世以来,许多机构预测AI将最先替代的职业之一是“翻译”。如今这一寓言正在成为现实,知名语言学习平台多邻国(Duolingo)今年裁掉了近数千名人工翻译,转而依靠GPT-4来完成翻译工作和内容制作。
《2024中国翻译行业发展报告》显示,经营范围中含有“机器翻译与人工智能翻译”业务的国内企业数量迅速增长,由2022年底的588家,增长至2023年底的839家,其中超过80%的翻译企业已布局生成式AI技术。调查公司Global Market Insights的数据显示,2020年AI翻译市场规模还只是6.5亿美元,预计2027年将达到30亿美元,增长近4倍。
AI给翻译行业带来的变革是显而易见的,最典型的是文学翻译的应用。阅文集团去年透露,AI翻译是网文发展的新浪潮,通过AI翻译,网文出海的成本能够降低九成以上,降本增效的优势明显。
不过,北信源海外Linkdood CEO裔云天指出,目前绝大多数市面流行的翻译软件专注于文字沟通,语音沟通的细分场景是被忽视的。
行研公司Mordor Intelligence的报告显示,全球语音翻译市场规模到2024年年底预计刚触及5.6亿美元,且市场高度分散,仅有微软、Meta、谷歌等少数大公司争夺市场份额。2022年,微软宣布为Skype提供即时语音翻译;同年,Meta开发了首个由人工智能驱动的闽南语口语翻译系统,作为通用语音翻译器(UST)计划的一部分。
“大家现在看到的都是文字的实时翻译,但是在现实情况中,更多人需要的是语音实时沟通。” 裔云天解释,在翻译这一应用场景下,大部分用户希望对方能直接理解自己在说什么,而不是先经过文字翻译软件复制、粘贴的复杂程序。他进一步指出,即使现在的即时语音沟通,例如在GPT-4o的产品发布会上,双方仍需在面对面的距离上交流,远距离沟通仍有不小挑战。
5月26日,在第十四届中国对外投资合作洽谈会的北信源产品发布会上,北信源(深交所:300352)推出了“信源密信”的海外版LINKDOOD,增加了AI即时同译功能。裔云天介绍了他们的两种解决思路:一个是利用深度学习的能力,让LINKDOOD可以自动识别100多种语言的语音;
另一个是改善了延迟效果,语音翻译基本上不会超过1秒的网络延迟时间,可以在通讯软件里实现同传翻译。英伟达高级科学家Jim Fan曾分析,延迟反应是AI语音的硬伤,“如果必须等待 5 秒才能听到回复,那么用户体验就会急剧下降。即使AI音频本身听起来很真实,它也会破坏沉浸感并让人感觉毫无生气。”
尽管如此,在语音形式下,AI翻译面临的挑战还很多。香港中文大学(深圳)翻译专业教授张舒音教授曾在此前的采访中指出,实时翻译模型相对成熟的当下,在一些重要的商业洽谈或外交场合,人工智能翻译设备并不被允许使用。这一方面是因为不够信任数据安全,另一方面则在于AI对文化差异的拿捏还不够精确。
裔云天表示,信息安全是北信源的老牌优势区,LINKDOOD采用私有服务器部署,并实现端到端加密技术确保所有通信内容的安全。不过他也坦言,比如成语、俚语、玩笑话,类似的跨文化问题在全球都没有很好的技术解决方案,目前能做的就是,尽量用简洁的语言去进行出海业务沟通。