商业 要闻 产经 房产 金融 银行 基金 保险 数码 智能 汽车 娱乐 时尚 生活 健康

多语种语言理解领域继续进阶 科大讯飞成为SemEval 2022三冠王

2022-04-22 09:07:42 来源:南早网
分享: 微信 微博

日,第十六届国际语义评测大赛(The 16th International Workshop on Semantic Evaluation, SemEval 2022)落下帷幕。国内人工智能巨头科大讯飞,从达特茅斯学院、谢菲尔德大学、华为等一众参赛选手中脱颖而出,成功夺得三项重量级冠军,充分彰显了其在多语种语言理解领域的技术硬实力。

图片1.jpg

据悉,SemEval 2022评测由国际计算语言学协会(Association for Computational Linguistics, ACL)旗下SIGLEX主办,迄今已举办16届,代表着最前沿国际技术和水。而科大讯飞分别在“多语种新闻相似度评测任务”(Task 8)、“多语种惯用语识别任务” 子赛道(Task 2: Subtask A one-shot)、“多语种复杂命名实体识别任务”(Task 11)三个子赛道中拿下冠军,表明其在多语种语言理解方面已经再走了行业的前端。

其中,多语种新闻相似度评测任务(Task 8),要求参赛队伍需要在每组新闻中判断是否描述了同一个事件,并以1-4分为两篇新闻的相似度打分。在此过程中,参赛队伍必须将文中相似的主要元素剥离出来并逐一分析,比如地理信息、叙事技巧、实体、语气、时间及风格,最终得出两篇文章的相似度与差异化。值得一提的是,这项任务涉及阿拉伯语、德语、英语、西班牙语等多达10种语言。能够在这项任务中夺得魁首,充分展示了科大讯飞在跨语言理解能力上的技术优势。

科大讯飞夺得的第二项冠军,即语种惯用语识别任务(Task 2),则要求参赛队伍根据给定的目标语句,包括其上下文和多字短语,判断该语句中的多字短语用法究竟是惯用语还是字面意思。该任务为多语言任务,包含英语、葡萄牙语、加利西亚语三种语言,需要参赛队伍在不同语言之间进行迁移。能够成功夺冠,说明科大讯飞有着强大的分析及跨语言理解能力。而有了该项技术,在日常写作和翻译工作中,即可有效鉴别惯用语的表达用意,极大提高内容准确率。

相比于前两项冠军,第三冠——多语种复杂命名实体识别任务(MutiCoNER),在复杂程度方面更上了一层阶。该任务是一个多语言赛道数据集,包含11项单独语言命名实体评测任务,以及2项多语言统一建模的评测任务,要求参赛团队在单个语言以及多个语言混合的文本数据中,精准预测不同语言实体的类别标签。而科大讯飞在多语言混合、中文、孟加拉语赛道上,分别以92.9%、81.6%、84.2%的F1成绩登顶,再度证明了其源头创新能力。

从OpenASR连夺22冠,到成为北京冬奥会和冬残奥会“官方自动语音转换与翻译独家供应商”,再到此番成为SemEval 2022三冠王,科大讯飞已经在智能语音领域形成了独树一帜的技术优势。未来,科大讯飞将继续深耕人工智能源头技术创新,用人工智能技术服务社会,并推动中国在人工智能浪潮中占得先机。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

相关文章

热门文章

热点排行

猜你喜欢