多语种语言理解领域继续进阶科大讯飞成为SemEval 2022三冠王

2022-04-22 09:07:42 来源：南早网

近日，第十六届国际语义评测大赛（The 16th International Workshop on Semantic Evaluation, SemEval 2022）落下帷幕。国内人工智能巨头科大讯飞，从达特茅斯学院、谢菲尔德大学、华为等一众参赛选手中脱颖而出，成功夺得三项重量级冠军，充分彰显了其在多语种语言理解领域的技术硬实力。

图片1.jpg

据悉，SemEval 2022评测由国际计算语言学协会（Association for Computational Linguistics, ACL）旗下SIGLEX主办，迄今已举办16届，代表着最前沿国际技术和水平。而科大讯飞分别在“多语种新闻相似度评测任务”（Task 8）、“多语种惯用语识别任务” 子赛道（Task 2: Subtask A one-shot）、“多语种复杂命名实体识别任务”（Task 11）三个子赛道中拿下冠军，表明其在多语种语言理解方面已经再走了行业的前端。

其中，多语种新闻相似度评测任务（Task 8），要求参赛队伍需要在每组新闻中判断是否描述了同一个事件，并以1-4分为两篇新闻的相似度打分。在此过程中，参赛队伍必须将文中相似的主要元素剥离出来并逐一分析，比如地理信息、叙事技巧、实体、语气、时间及风格，最终得出两篇文章的相似度与差异化。值得一提的是，这项任务涉及阿拉伯语、德语、英语、西班牙语等多达10种语言。能够在这项任务中夺得魁首，充分展示了科大讯飞在跨语言理解能力上的技术优势。

科大讯飞夺得的第二项冠军，即语种惯用语识别任务（Task 2），则要求参赛队伍根据给定的目标语句，包括其上下文和多字短语，判断该语句中的多字短语用法究竟是惯用语还是字面意思。该任务为多语言任务，包含英语、葡萄牙语、加利西亚语三种语言，需要参赛队伍在不同语言之间进行迁移学习。能够成功夺冠，说明科大讯飞有着强大的分析及跨语言理解能力。而有了该项技术，在日常写作和翻译工作中，即可有效鉴别惯用语的表达用意，极大提高内容准确率。

相比于前两项冠军，第三冠——多语种复杂命名实体识别任务（MutiCoNER），在复杂程度方面更上了一层台阶。该任务是一个多语言赛道数据集，包含11项单独语言命名实体评测任务，以及2项多语言统一建模的评测任务，要求参赛团队在单个语言以及多个语言混合的文本数据中，精准预测不同语言实体的类别标签。而科大讯飞在多语言混合、中文、孟加拉语赛道上，分别以92.9%、81.6%、84.2%的F1成绩登顶，再度证明了其源头创新能力。

从OpenASR连夺22冠，到成为北京冬奥会和冬残奥会“官方自动语音转换与翻译独家供应商”，再到此番成为SemEval 2022三冠王，科大讯飞已经在智能语音领域形成了独树一帜的技术优势。未来，科大讯飞将继续深耕人工智能源头技术创新，用人工智能技术服务社会，并推动中国在人工智能浪潮中占得先机。

免责声明：市场有风险，选择需谨慎！此文仅供参考，不作买卖依据。

多语种语言理解领域继续进阶科大讯飞成为SemEval 2022三冠王

相关文章

热门文章

热点排行

猜你喜欢

多语种语言理解领域继续进阶 科大讯飞成为SemEval 2022三冠王

相关文章

热门文章

热点排行

猜你喜欢

多语种语言理解领域继续进阶科大讯飞成为SemEval 2022三冠王