您好,欢迎访问开云网站!
您好,欢迎访问开云网站!
集团动态
联系开云
发布日期:2024-07-14 作者:开云
科技日报北京6月5日电(记者张梦然)《天然》5日颁发的一篇论文报导了一个Meta人工智能(AI)模子的底层手艺。该模子能翻译200种分歧说话,增添了机械翻译的说话数目。
神经机械翻译模子操纵人工神经收集翻译各类说话。这些模子凡是需要年夜量可在线获得的数据加以练习,但并不是所有说话数据都是公然、低本钱或是遍及可和的,这类说话被称为低资本说话。一味地增添模子翻译说话数目,可能会影响模子的翻译质量。
此次,Meta的法国研究团队和“不落下任何说话”(NLLB)团队开辟了一种跨说话手艺,能让神经机械翻译模子进修若何操纵翻译高资本说话的预存能力,实现对低资本说话的翻译开云体育app。研究团队开辟了一个在线多说话翻译东西,名为“NLLB-200”。该东西能容纳200种说话,其低资本说话数目是高资本说话数目的3倍,翻译表示则比现今已有系统高44%。
因为团队在很多低资本说话上只能获得1000—2000例样本,为了扩年夜“NLLB-200”的练习数据量,他们用一个说话辨认系统发现了这些特定说话的更多实例。团队还从互联网存档中发掘双语文本数据,帮忙晋升其翻译质量。
研究团队指出,这个东西可以帮忙很少被翻译的那些说话的利用者,让他们也能用上互联网和其他手艺。另外,教育是一个很是主要的利用,由于这个模子可以帮忙低资本说话利用者获得更多图书和研究文章。但团队也暗示,今朝误译的环境仍有可能呈现。