设为首页收藏本站

大数据论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 199|回复: 2

Facebook投入自然语言研究,推动机器翻译研究进步

[复制链接]
发表于 2019-9-17 17:32:18 | 显示全部楼层 |阅读模式

Facebook此前宣布将投入自然语言领域的三个子领域进行研究。通过研究自然语言处理的深层学习方法,推送现在的机器翻译研究的进步。
file:///C:\Users\ADMINI~1\AppData\Local\Temp\ksohtml12028\wps1.png
Facebook成立人工智能语言研究联盟
8月28日发布的一篇博客文章中,Facebook公布了来自35个国家的115份获奖提案中的11份,并宣布成立人工智能语言研究联盟(AI Language Research Consortium),这是一个由合作伙伴组成的社区,Facebook表示将“共同努力,推进NLP”。
具体细节在发稿时很难得到,但Facebook表示,新成立的小组将促进协作,解决具有挑战性的难题,如表征学习、内容理解、对话系统、信息抽取分析、情感分析、总结、数据收集和清理以及语音翻译。
除了与Facebook的研究人员就多年项目和出版物进行合作外,人工智能语言研究联盟的成员还有机会获得研究经费,参加年度研究讲习班,参加重要的NLP会议。
Facebook翻译研究的突破
  对于神经机器翻译(NMT)模型,有监督式训练通常需要大量附有参考翻译的句子。然而,大量高质量的双语数据并不是普遍可用的,这就要求研究人员使用没有参考翻译的单语数据。反向翻译(Back translation,一种半监督学习技术)允许 Facebook 在一定程度上克服这个问题。Facebook 最近提交给 WMT 的报告是基于 Facebook 之前在大规模反向翻译方面的工作,这也帮助 Facebook 在去年的同一比赛中赢得了第一名。
  而今年,Facebook 引入了一种新的方法,通过生成多个候选译文,并选择最能平衡正向、反向、流畅性三种不同模型分数的译文,来进一步改进 Facebook 的反向翻译系统。
正向模型的分数主要由候选翻译在多大程度上捕捉了原句的意思来衡量;相反,反向模型的分数是通过查看模型能从候选译文中重建出的句子准确性来评判;流畅性模型的分数根据候选翻译流畅性来衡量,最后系统通过观察大量的单语数据以自我监督的方式进行训练;经过对这三个分数的平衡,系统就能够产生显著优化后的翻译结果。
Facebook在研究自然语言处理方面,还设立了新的研究对象,使用问答数据集,利用机器为用户提供问题答案,这也是一项新的技术挑战。

点评

海!外直播 t.cn/RxmJTrC 禁闻视频 t.cn/RJvO78S 把地表的资源用光,把地下的矿藏挖空,把子女财产转移到外国去,现在又把全球的垃圾运进来……他们和中国人民有血海深仇吗?到底是谁亡我之心不死?  发表于 2019-9-24 17:38
回复

使用道具 举报

发表于 2019-9-17 17:32:21 | 显示全部楼层
灵玖软件,大数据搜索与挖掘技术服务商 灵玖软件专注于大数据搜索与挖掘的技术创新与服务,提供大数据搜索、大数据挖掘与大数据应用解决方案,以应对大数据的管理、处理、分析并从大数据中获知识与智慧。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|大数据论坛 ( 京ICP备10002193号-4 京公海网安备110108001289号  

GMT+8, 2019-10-15 19:29 , Processed in 0.288360 second(s), 27 queries , Gzip On.

Powered by Discuz! X3.1

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表