商城资讯网
社会新闻
当前位置: 首页 >> 社会新闻 >> 正文

中国AI军团争霸机器阅读理解大赛,搜狗创下全球新纪录


文章作者:www.lysbela.com 发布时间:2020-01-09 点击:1919



全球人工智能领域现已成为中国企业实力的全面展示。

这不是真的。2018年反复发起的CoQA机器阅读理解竞赛,最终形成了中国人工智能力量相互竞争后争夺霸权的趋势。

更有甚者,就在最近,搜狗的人工智能团队脱颖而出,不仅以高分夺冠,还彻底刷新了CoQA的所有评价指标。

不得不说:浩浩荡荡~

搜狗赢了CoQA

这次搜狗团队赢来的是搜狗搜索人工智能研究团队,模型是伯特答案验证(单一模型)。

自9月份发布以来,CoQA竞赛吸引了许多国内外知名的研究机构和大学,包括微软、迅飞、清华、复旦、斯坦福等。竞争极其激烈。

在不到一个月的时间里,CoQA挑战赛的冠军已经易手三次。

1月3日,搜狗以82.8%的成绩稳坐榜首,刷新了所有CoQA评价指标。

此外,搜狗算法是第一个在CoQA域外数据集上代表80%以上的模型。“CoQA难度”CoQA竞赛有什么特别之处?

如果你不是自然语言处理从业者,你可能对CoQA有点不熟悉。你可能想知道为什么在不到半年的时间里,所有的大公司和大学都在努力攻克CoQA。

这始于去年自然语言处理的快速发展。

2018年是民盟取得巨大进步的一年。BERT出现了,扫描了所有主要的NLP测试,刷新了SQuAD结果。

除了算法,质量保证,自然语言处理中的一个重要应用,今年也悄然发生了变化。

SQuAD测试已经逐渐跟不上智能问答系统的发展,行业迫切需要一个更具挑战性和智能的质量保证挑战。这被今年8月上线的CoQA所取代。

如果SQuAD就像是做英语阅读理解,CoQA更像是模拟真实的人类对话。

CoQA包含从8000多次对话中收集的多个问题和答案。每一段对话都是通过两个人配对并通过问答对话进行聊天来收集的。

CoQA的唯一性在于:

1。这个问题不是SQuAD的问题和答案,而是一个多轮对话。2.答案可以是自由格式的文本;3.每个答案都附有段落中的证据序列;4.测试集包含来自七个不同字段的数据。

问答多轮对话更像人类,应用前景广阔。例如,谷歌去年发布的人工智能电话,甚至图灵测试,都是问答环节的登陆场景。

此外,竞赛官员提供的培训数据来自五个领域的文章,测试集包含了另外两个领域(红迪论坛和科学网站)的更多文章,这进一步测试了NLP“从一个例子到另一个例子”的能力。

竞赛名单由两部分组成。域内是指测试集“试题”和训练集来自同一个领域。域外是指测试集“测试问题”来自于训练集之外的两个领域,测试模型推理能力。

搜狗在两次测试中分别得了83.8分和80.2分,排名第一,两部分之间的差异在所有参赛队伍中最小,反映了搜狗模式在阅读理解中的普遍泛化能力。

你如何评价搜狗模式?

不是偶然的成功。

自从伯特模型去年诞生以来,搜狗开始考虑将它与自己的研究成果结合起来。

本次CoQA竞赛的模式是BERT和答案验证的结合。搜狗创新地在BERT的输出层增加了推理和判断网络,解决了原文无法直接找到答案的情况。

这个推理和判断网络是由搜狗采用的证据支持的“答案验证”。它可以运用注意和自我注意的机制将对话问题和材料编码为一个整体,并推导出答案。

搜狗认为,在阅读和理解的过程中,找到支持答案的文本和选择准确答案的过程是交织在一起的,所以“答案抽取网络”也模仿了人类的思维方式,使得答案抽取具有更强的语境支持。

为了让人工智能更好地理解本轮对话,搜狗模式将历史对话的问答与本轮问题一起输入网络,从而提高其在多轮对话中的表现。

At t

该算法可以综合考虑答案抽取和证据对答案的支持作用,同时整合对话历史的问答信息,从而大大提高对当前问题的理解和答案的准确性。有两个亮点:

1)证据支持的答案选择:

阅读理解是寻找回答问题的句子和提炼准确答案的同时过程。搜狗算法创新地模拟了这一过程,实现了证据文本支持的答案选择。

2)推理答案的理由:在

CoQA竞赛中,相当多的问题在原文中没有直接答案,只能通过推理获得。搜狗算法将推理转化为分类问题,通过问题材料的整体编码找到推理答案。

尖端技术已经登陆。

当然,也许你也很好奇,搜狗赢得这样一个“冠军”有什么用?

搜狗回答说,从去年9月决定参加争夺榜首的比赛开始,搜狗投入了大量的时间、人力和物力参加CoQA比赛,不仅重视“跑点”。

因为搜狗一直坚持探索以语言为核心的人工智能策略,人工智能问答对搜狗的意义不言而喻。

而以技术和产品闻名的搜狗,已经将尖端技术成果在产品中付诸实践。

智能扬声器

例如,去年的热门智能扬声器是问答服务的自然应用场景。英美烟草和其他公司正在规划布局。华为去年也在搜狗问答技术的支持下进入战场。

然而,世界上许多智能扬声器产品只能用于简单问答的鸡肋场景。

华为人工智能扬声器,经过各种方案PK,选择了配备搜狗的智能问答服务。用户只需要用自然语言提问,系统就可以“理解”用户的话语,直接“回复”用户想要的信息。让智能音箱真正高效便捷,而不是让人们沉迷于产品。

这是对尖端技术和快速产品着陆能力的一次小规模试验。

专业搜索

此外,更重要的是进一步加强搜狗的核心业务。

搜索是搜狗的起点,王小川认为搜索的未来是问答,机器阅读理解是问答技术发展的核心之一。

人工智能问答会给专业搜索带来什么样的火花?

目前,搜狗已经在法律和医学领域进行了尝试。

在法律领域,搜狗律师问答机器人具有逻辑分析和推理能力。它可以为用户提供丰富的咨询结果,如可能的判断结果、法律建议或基于事实和法律要求的类似案件,并作为人类的小型法律顾问。

在医疗领域,搜狗搜索的智能分诊功能是第一个引入基于人工智能技术的智能诊断助手,它模拟医患对话的模式,与用户的病情进行沟通,并提供可能的疾病范围供用户参考。

从全球视角展望未来

如上所述,除了搜狗,著名的顶尖公司和机构如微软、艾伦研究所(AI2)、斯坦福大学、清华大学COAI实验室、北京大学、复旦大学、北京邮电大学、中国科技大学等也参加了CoQA。

全球科技公司正在开发尖端的问答技术。去年,谷歌的人工智能要求订购食物,并在全世界引起轰动,这标志着人工智能已经开始征服图灵测试。

刷清单赢得CoQA竞赛对搜狗来说只是证明其技术实力的一个小测试。这也是搜狗搜索团队在前沿技术研究、应用和产品着陆方面的答案。

未来智能问答领域的雁群竞争将更加激烈。

CoQA竞赛是起点,但也是目前世界上该领域最权威的参考之一。

搜狗赢得了冠军,不仅展示了人工智能领域头号选手的潜力和能力,也是对中国人工智能实力的又一次介绍。

这是全球科技进程中的一个历史性时刻

youtube.com

下一条: 为打造产业金融中心建言献策 中国产业金融论坛在济南成功举办