相干Coherent任命CTO女掌门,曾在多家光电通信企业任职
近日,Meta宣布推出口语翻译系统,Meta CEO扎克伯格在facebook上发布demo影片,首次在线上通过该翻译系统和员工对话。
在demo影片中,扎克伯克说英文,来自台湾的Meta工程师用闽南语,通过该口语翻译系统,两人无障碍交流,且翻译都非常地道。
Meta称,将闽南语翻译成英语的这套系统,是第一个由AI驱动的“为非文字语言开发的语音翻译系统”。
在全球范围内,有许多语言和闽南语一样,有人使用,但没有标准化的书写方式,而AI翻译系统需依靠大量的可标签范例,像是口语标签或字符,才能把资料“喂”给机器学习。
Meta的研究团队称:“我们利用普通话作为中间语言来建立伪标签,我们首先将英语(或闽南语)语音翻译成普通话文本,然后我们再翻译成闽南语(或英语),并将其加入训练数据。”
目前,该系统允许讲闽南语的人与讲英语的人交谈,尽管很生硬。该模型一次只能翻译一个完整的句子,但扎克伯格相信,这项技术最终可以应用于更多语言,并将改进到提供实时翻译的程度。
Meta宣布,他们将开放大型语料库,让研究人员可以为更多“无法书写的语音”建立翻译系统。业内人士认为,良好的翻译工具对于元宇宙的开发不可或缺。
【开源AI模型,精准翻译超200种语言】
今年7月,Meta公司宣布将免费开源旗下AI系统NLLB-200 ,该系统是全球第一个能翻译200种不同语言的单一AI模型,将为超过10亿人提供高品质翻译内容。
Meta公司称,将会把NLLB-200对外开源,同时向非营利机构提供20万美元的资助,以开发该技术应用于更多应用程式上。
德国慕尼黑大学计算机语言学家Alexander Fraser认为,该模型的主要贡献在于数据,包含了100种全新语言。
目前,市面上很多翻译工具并不支持冷门的语言,也就是少于百万人口使用的语言,而NLLB-200解决了这个问题。
【"不遗漏任何语言"】
全球有数十亿人,但一直以来却没有可以翻译上百种语言的高品质翻译工具,他们无法通过自己惯用的语言或母语浏览网络上的内容,或在网络社群上参与讨论,尤其是对于非洲、亚洲等地区有高达数亿人使用不同种类的语言。
为了突破网络上的语言障碍,并促进元宇宙发展,Meta的AI研究人员早年已成立NLLB专案,开发AI模型为全世界提供高品质的翻译功能。
据悉,NLLB是“No Language Left Behind(不遗漏任何语言)”的缩写,该AI系统可以高质量翻译世界上多达200种语言,除了主流语言外,其中还包含多达55种非洲系语言及其他少数语言。
在多项指标中,相较现有的其他翻译工具,NLLB-200的翻译品质平均高出44%。在部分非洲和印度语言中,提升幅度相较最新的翻译系统更提升了70%。
此外,Meta也与维基基金会合作,希望NLLB-200之后可以提供维基百科翻译的服务,改善维基百科的翻译系统。通过双方的合作,NLLB-200持续学习其他翻译器中无法翻译的语言,AI模型可以自己学习语言中的文字系统,得到更准确的翻译结果。
可以想象的是,“通用语音翻译系统”一旦在元宇宙中实现,可以让全世界不同语种的用户,在元宇宙虚拟空间里沟通、开会、玩游戏,将会比在现实中更加方便,也将更进一步实现Meta对发展元宇宙的野心。
-
叠片工艺获突破!激光技术解决正极极片模切难题
2022-09-14 -
许之咏:风光配储成为必然,四大方法解决储能发展难题
2022-09-05 -
宁夏求解减碳降耗难题
2022-08-15 -
中国半导体研发费用难题何解?
2022-07-25 -
破解SiC、GaN栅极动态测试难题的魔法棒—光隔离探头
2022-07-01 -
润阳股份负债率高企现金流承压,IPO能否解低毛利难题?
2022-06-23 -
容汇锂业冲刺创业板IPO,“家中无矿”难题何解?
2022-06-15 -
TCL电子:一道价值重估的难题
2022-04-25 -
自然语言处理序列模型——HMM隐马尔可夫模型
2022-04-13 -
加利福尼亚的可再生能源难题
2022-04-06 -
钒是否掌握储能难题的关键?
2022-04-03 -
燃料成本占比高达85%,气电难题该咋解?
2022-03-28 -
两会上的新能源汽车:补能模式有争议,芯片难题待攻克
2022-03-08 -
破解“汽车缺芯”难题 亟须完善产业布局
2022-03-07 -
充电桩的运营难题,不只是特斯拉知道
2022-02-21