机器阅读理解是自然语言处理领域最受关注、进步最快的技术方向之一。日前,阿里安全在由中央网信办、工信部、公安部指导,厦门市政府主办,多方携手打造的中国人工智能大赛上,战胜120多家参赛队伍,获得该技术领域团体赛冠军。
阿里安全新一代安全架构核心AI技术,也成为唯一一支在阅读理解中,答题准确率高于80%的参赛队伍,高于人工75%的准确率。
阿里安全团队获得全国人工智能大赛冠军
阿里安全高级算法专家开阳介绍,机器阅读理解技术给用户和企业带来很大价值:“这项技术能够帮助用户从长篇文本内容中,快速理解核心观点,返回问题答案,可以直接用在一些问答场景中。”开阳表示,作为一项通用能力,这项技术也可以提升机器对自然语言的语义理解能力,帮助完成其他自然语言理解的任务。
比赛前,阿里安全团队针对竞赛任务做了细致的分析,针对本次竞赛任务特点设计了从“数据预处理—单模型优化—特征选择—多模型融合—主动学习”的处理流程,成员间分工明确,默契配合,在有限的参赛时间内,最大化输出效率,为最终夺冠奠定了基础。
在技术方面,阿里依托于最新的预训练语言模型,通过对不同预训练模型(包括RoBerta、Albert、Electra等)融合,提取不同语义特征的优势,实现优势互补,最终提升对复杂语境的理解能力。
开阳介绍,自然语言本身存在非常大歧义,特别是在安全场景下存在激烈的对抗,黑灰产会利用一些歧义的语义来绕过检测传播有害内容。只有不断提升自然语言的理解能力,增加对复杂语义的理解,才能更有效对抗黑灰产,守卫用户安全。
因为社会进程需要,再叠加疫情因素,如今政府和各行各业都在进行数字化转型,新基建建设如火如荼,为了增加新基建的安全性,阿里安全综合20年的经验和技术能力,提出新一代安全架构,并在不断升级该架构核心技术层的AI技术能力,解决新基建场景下的安全问题。
“阿里的安全架构理念将人工智能作为基建的一部分,提供基础能力支撑。我们将继续开发人工智能技术,保障数字经济的健康有序发展。”开阳表示。