新型人工智能工具可翻译200种语言

新华社北京6月7日电 人类有超过7000种语言,其中包括使用人数不多、相关资料稀少的“小众语言”。美国“元”公司新研发的一个人工智能模型,能翻译200种不同语言,实现了对较多“小众语言”在线翻译。

人工智能翻译目前多利用基于人工神经网络的模型翻译各种语言。这些模型通常需要大量可在线获取的训练数据。不过,有些特定语言的数据尚不能公开和低成本获取或普遍可及,这类语言又被称为“低资源语言”。

“元”公司团队新研发的一种跨语言技术,能让基于人工神经网络的翻译模型学习如何利用已有的翻译高资源语言的能力来翻译低资源语言。团队应用该技术开发了一个名为NLLB-200的在线多语言翻译工具,可容纳200种语言,其能翻译的低资源语言的数量是高资源语言数量的3倍。这一研究成果近期发表在英国《自然》杂志上。

由于研究团队在许多低资源语言上只能获取1000至2000例样本,为扩大NLLB-200的训练数据量,他们利用一个语言识别系统发现了这些特定语言的更多实例。团队还从互联网存档中挖掘这些语言与英语的双语文本数据,帮助提升模型的翻译质量。

研究者称,该翻译工具可帮助低资源语言使用者使用互联网等技术,且这一模型还可用于教育,帮助这类人群获取更多图书和论文资料。不过研究者也表示,这一工具的误译情况仍有可能出现。

来源: 新华社

【来源:经济界】凡本网注明“来源:经济界” 的所有作品,版权均属于经济界。如转载,须注明“来源:经济界”。违反上述声明者,本网将追究其相关法律责任。
上一篇 2024-06-09 下午4:04
下一篇 2024-06-09 下午4:55

相关推荐

  • 首次夏尔西里全面系统科学考察完成

    “以科学之名,深入无人区,探净土之秘,寻珍禽草木现世间” 中秋未至,中国科考事业的硕果却已收获颇丰。由中国科学探险协会与中国科学院新疆分院联合组织的新疆阿拉套山综合科学考察暨新疆第三次科学考察之北疆山地考察野外工作任务已经圆满收官。此次科考以“走进夏尔西里无人区”为主题,旨在深入探索以夏尔西里自然保护区为核心的阿拉套山及其周边地区的自然资源、生态环境及地质地…

    3天前
    0
  • IFA2024看点:看COLMO如何定义未来AI中场

    “单纯堆砌大模型并非长久之计”这是中国科学院院士、北京大学国际机器学习研究中心主任鄂维南,在近期接受媒体采访时曾提到的观点。 Chat GPT加速了AI 进入大模型时代,但从计算量和参数规模的角度看,我国算力与美国相比仍有差距,存在巨大算力浪费的GPT并非我国AI 发展优选。 当AI走出实验室,真正应用于市场的落点在哪里?在AI技术及相关产业进入中场阶段的2…

    3天前
    0
  • 《魔兽世界》国服:阿里云技术引领的冒险新征程

    当《魔兽世界》国服再次敞开艾泽拉斯的大门,是阿里云的先进技术铺就了这条回归之路。这不仅是对经典游戏的一次深情致敬,更是技术革新在提升玩家体验上的卓越展现。 云端的澎湃动力: 阿里云ECS云服务器g8a机型,以其AMD第四代处理器Genoa的强大性能,为《魔兽世界》提供了澎湃的计算动力。这股力量,让游戏世界的每一处细节都栩栩如生,每一次战斗都流畅自如。 自如应…

    2024-08-28
    0
  • 智慧科技 绽放未来 TCL实业即将亮相IFA2024

    9月6日-10日,2024年德国柏林国际电子消费品展览会(IFA2024)将在柏林会展中心举行。作为全球规模最大、最具影响力的国际视听及消费类电子产品展览会之一,恰逢IFA开展第100周年,IFA2024将汇聚更多来自世界各地的顶尖品牌、科技巨头、行业专家和消费者共同探索未来科技趋势,展示尖端科技产品和创新解决方案。 作为全球领先的智能终端企业,TCL实业始…

    2024-08-27
    0
  • 号外号外 | 美的以旧换新狂撒羊毛中 薅到即赚到

    如果说时下消费市场的热词,恐怕非“补贴80亿,换新选美的”莫属。在全民以旧换新的浪潮中,美的持续升级换新模式、不断降低换新门槛、提高换新补贴力度,让这句标语火遍全网,你是不是也被成功“洗脑”?如今,在国家政策的持续推动下,美的针对以旧换新的福利仍在疯狂输出。 日前,美的以旧换新的风就吹到了美丽的阿勒泰,在这里,美的开展了一场场极具趣味性的“薅羊毛”钜惠活动,…

    2024-08-26
    0