您的位置:首页软件教程 → Google发表新语言语音模型Translatotron呈现更即时、更正确更贴近原音的口语翻译效果

Google新语言语音模型Translatotron,主要是藉由Seq2seq模型系统直接针对口语内容进行分析、翻译,并且将翻译结果转换为另一种语言,透过相近口音呈现翻译结果,而非传统先转成文字再进行翻译,可加快即时翻译效率。

清欢网

Google稍早宣布将推出可透过单一流程即可完成两种语言互译,无需像过往翻译必须透过语音识别成文字,再透过机器学习方式完成文字翻译,最后将翻译结果文字以语音方式播放,造成翻译结果可能变得不通顺,甚至可去除口语中无谓赘词,让口语翻译效果更好,同时也能提升翻译效率。

根据Google公布的全新语言语音模型Translatotron,主要是藉由Seq2seq模型系统直接针对口语内容进行分析、翻译,并且将翻译结果转换为另一种语言,透过相近口音呈现翻译结果。

由于传统翻译透过语音转文字、以文字内容进行翻译,再将翻译结果转换为语音内容呈现,必须经过几个处理步骤,因此可能会在各个步骤产生翻译错误、增加无谓赘词,或是翻译结果不通顺的情况,在Translatotron的设计仅透过单一流程,让系统能直接针对口语内容进行翻译,去除无谓的口语赘词,或是省略无需翻译的专有名词、外来用语等细节,借此提高口语翻译的正确率与执行效率,并且可藉由人工智慧技术辅助,让翻译结果能以自然、贴近原音形式呈现,宛如原本说话者以不同语言阐述内容。

Translatotron模型系统从2016年开始建造,主要想法便是希望能让口语翻译更加即时,并且能让更多人可打破语言隔阂彼此交谈。而在Seq2seq模型系统设计里,主要是以多任务目标学习方式,分别预测来源与目标内容,借此加快语言即时翻译效率。

关于我们|免责申明|商务合作|友情链接|网站地图

@2019- QHmanhua.com 清欢网 All Rights Reserved