世界上已知的语言大约有7000种,占40%
没有标准的书写系统。这些没有文字的语言给现代机器学习翻译系统带来了一个独特的问题,因为翻译通常需要先将口头语言转换成书面文字,然后再将文字翻译成语音。但是
Meta在10月19日宣布,已经通过其最新的开源语言人工智能(AI)解决了这个问题。
Meta公布了“首个由人工智能驱动的无书面语语音翻译系统”,成功翻译了台湾省主要使用的口语——闽南语。
这个系统是Meta的人工智能项目的一部分,该项目被称为“通用语音翻译器(UST)”。Meta在一份声明中说:“翻译系统是Meta。
人工通用语音翻译器项目的第一个里程碑,该项目专注于人工智能系统的开发,提供所有语言的实时语音到语音翻译,甚至无字语言。“该项目致力于开发更多实时语音到语音的翻译,以便元宇宙的居民能够更方便地互动。
Meta表示,在过去,人工智能驱动的大多数语言翻译工作都专注于书面语言,但其目标之一是翻译更多缺乏正式书写系统的语言。据Meta称,目前有7000家
多种语言,但“40%以上的语言以口语为主,没有标准或知名的书写体系。”
Meta的首席执行官马克·扎克伯格(MarkZuckerberg)在脸书上发布的视频中演示了使用该系统翻译闽南语,并表示
该公司将开源该工具,以便人们可以使用新的人工智能系统来翻译更多的语言。