阿里巴巴|北大95后“AI萝莉”回来了:现在达摩院开源7大NLP模型( 二 )


从基础模型扩展出能力多样的模型,再把它们在实际业务中结合使用,让AliceMind成了业界能力最全面的深度语言模型体系 。
那么AliceMind都用到了哪些地方?
落地是个系统化的工程
AliceMind已经上线到阿里内部的NLP平台,可以提供给不同部门的业务使用 。
在官方网站上也提供了Demo,比如这个基于PLUG模型的语言生成模块 。
输入红楼梦选段:
阿里巴巴|北大95后“AI萝莉”回来了:现在达摩院开源7大NLP模型
文章图片
就能生成一段续写:
阿里巴巴|北大95后“AI萝莉”回来了:现在达摩院开源7大NLP模型
文章图片
而像这样可供大家试玩的Demo还有几十个 。
不过这些官网上的服务并非都是由AliceMind提供技术支持,很多都只是这一体系启发下的小模型 。
那么这次开源的几大核心目前都在哪里打工呢?
应用最广泛的,就是电商 。
尤其是阿里巴巴国际事业部(ICBU)或像速卖通(AliExpress)这样拥有跨境电商业务的部门,就是多语言模型VECO的直接受益者 。
VECO是AliceMind体系中的8大模型之一,用于多语言理解和跨语种的文本嵌入、分类,掌握了100多种语言 。
阿里内部基于AliceMind的翻译平台日调用量约10亿次,创造了数亿美元的国际跨境贸易和其他国际业务商业价值 。
就像达摩院深度语言模型团队负责人黄松芳所说“语言模型落地是个系统化的工程”:
语言模型从训练、微调到蒸馏、压缩,到整个部署上线都在平台上面完成,上线之后跟业务方的系统连在一起,能够直接嵌到他们的业务逻辑、业务系统里面去 。
我们更熟悉的淘宝拍照识图、天猫精灵智能音箱中也有AliceMind的贡献 。
目前,AliceMind已经在阿里内部数十个核心业务落地,日均调用50亿次,活跃场景超过200个 。
在阿里之外,医疗领域尤其是癌症治疗上,AliceMind同样出力不少 。
【阿里巴巴|北大95后“AI萝莉”回来了:现在达摩院开源7大NLP模型】作为一个具有自主学习能力的深度学习语言模型体系,AliceMind应用在搜索引擎上时会有一个重排机制 。
以具体某一类医学文献为目标,AliceMind在粗排先捞了一批相关文本后,还会再次结合文章类型、引用图谱等信息,进行不断地重排 。
同时将抽取获得的信息与已知的结构化知识做融合,构建知识体系,最终得到最高质量的临床文献 。
在最近16支世界知名团队参加的精准医学国际评测中,凭借这一精准医学搜索引擎,阿里团队在两项临床证据质量评估上均取得第一:
这样高精度的专业医学搜索引擎能够在疾病治疗时,为临床医生做提供高质量的临床决策辅助 。
法律领域也有AliceMind的出没 。
浙江省高级人民法院就与达摩院合作,实现了从立案到裁判文书生成的全流程智能化审判系统 。
而在这一试点单位中,AI对法官工作量的分担使当庭宣判率提升至90%,结案时间也从平均40天缩短到50分钟 。
现在,基于AliceMind的AliNLP平台日均累计调用量超过数万亿次,每天有超过每天有超过1000个业务方使用 。
电商、教育、医疗、能源,通信、法律、内容搜索、城市大脑……越来越多的领域在AliceMind的加入下变得更加便利,更加智能 。
开源之后要做什么?
现在,预训练语言模型目前在NLP领域以及整个学习界都非常热门,超大规模参数的模型已成为一种趋势 。
对此,达摩院深度语言模型团队的负责人,也是AliceMind的总负责人黄松芳表示:
我们这边其实不会一味地追求大,而是非常强调它的落地 。
一个语言模型从研究开发到投入实际应用,不是一家企业就能做到的 。
还需要整个社区的开发者都参与,才有可能将学术论文中的公式算法用到大家的生活便利上 。
达摩院希望通过开源,能降低业界研究和创新应用的门槛,使语言AI进入大工业时代 。
下一步,AliceMind打算与语言学、神经科学等跨学科的单位加强合作,将语言AI扩展到更大的应用中 。


推荐阅读