阿里云CTO周靖人:“模型即服务”要解决什么问题?

MaaS即“模型即服务”,指以模型为核心提供服务。

阿里云“通义千问”大模型研发负责人周靖人。

“MaaS最底层的含义是要把模型作为重要的生产元素,围绕模型的生命周期设计产品和技术,从模型的开发入手,包括数据处理、特征工程、模型的训练和调优、模型的服务等,提供各种各样的产品和技术。”

阿里云“通义千问”大模型研发负责人周靖人。

MaaS是“Model as a Service”的缩写,即“模型即服务”,指以模型为核心提供服务。2022年11月,任阿里云“通义千问”大模型研发负责人的周靖人在云栖大会上最早提出这个词。此后,在国内伴随着ChatGPT热潮出现的“百模大战”中,这种商业模式广被提及,亚马逊云科技、字节跳动都选择了这条发展路径。

MaaS即“模型即服务”,指以模型为核心提供服务。

在这一场AI大模型热潮中,阿里云非常明显是以云计算服务商的自我认知参与其中。“阿里云的平台非常欢迎第三方模型。”近日,阿里云CTO周靖人在接受澎湃科技(www.thepaper.cn)采访时表示。

在阿里云发起的AI模型社区魔搭中,集聚了180多万AI开发者和900多个AI模型。模型贡献者基本覆盖国内大模型赛道核心玩家,如百川智能、哔哩哔哩、粤港澳大湾区数字经济研究院(IDEA研究院)、澜舟科技、清华大学人工智能研究院、深势科技、浙江大学、智谱AI等。

7月25日晚,阿里云又在其微信公众号上发布声明称,阿里云成为国内首家支持Meta公司的Llama 2全系列训练和部署方案的公司。Llama 2是Meta最新开源的类ChatGPT大语言模型,包括70亿、130亿及700亿参数版本。

“有算力、无模型,不够。有模型,无生态,也不够。发展大模型,算力、模型、生态,缺一不可。”周靖人说。

“让模型的使用更简洁”

“大模型浪潮还处在早期阶段,人人都能感受到技术变革的来临,但对于如何降低大模型的研发门槛、如何实现大模型的落地应用,大家都还没有答案。”周靖人认为,动辄超千亿参数的大模型研发,不是单一的算法问题,也不是靠简单堆积GPU就能实现。“大模型的研发,是囊括了底层算力、网络、存储、大数据、AI框架、AI模型等复杂技术的系统性工程,需要AI和云计算的全栈技术能力。大模型的应用落地更是需要丰厚的生态土壤。”

实际上,多位知情人士对澎湃科技表示,在2021年,任达摩院副院长的周靖人就在内部提及MaaS的概念。

周靖人对澎湃科技解释道,MaaS最底层的含义是要把模型作为重要的生产元素,围绕模型的生命周期设计产品和技术,从模型的开发入手,包括数据处理、特征工程、模型的训练和调优、模型的服务等,提供各种各样的产品和技术。

更简单来说,MaaS最核心的就是让模型的使用更简洁,简单几行代码就可以调用模型。

这就涉及AI模型落地应用的现状,即一个AI模型难以覆盖各行各业的AI应用需求,面对新场景往往需要进行二次开发或优化,否则许多模型难以适配到特定环境应用中。而AI模型定制化门槛较高,同时目前缺乏AI模型开发和使用交流分享的平台。也就是说当开发者遇到相关问题后,无法找到对应的模型服务,也比较难找到人来解答相关问题。

周靖人曾在采访中表示,“最终的目标是,甚至小学生也可以调用模型,能做业务系统的开发。”

“大模型自由市场”

要实现这个目标,就要做一个“大模型自由市场”。

在魔搭(ModelScope)平台上,所有模型生产者都可上传模型,验证模型的技术能力,探索模型的应用场景和商业化模式。从这个意义上说,魔搭社区是个充分开放的大模型自由市场。

魔搭是阿里达摩院与中国计算机学会(CCF)开源发展委员会在2022年联合推出的国内首个AI模型开源社区,把300多个模型开放给中国的AI研究者与团队,涵盖了自然语言处理,视觉、语音、多模态等模型。阿里巴巴在大型语言模型领域的研究主要由达摩院负责,由周靖人主导。

“一个模型的应用,不仅是接入模型,还会涉及到模型的微调、模型的一系列测试等。”7月,周靖人在2023世界人工智能大会上推出新的模型工具ModelScopeGPT(魔搭GPT),目的是有效帮助使用者在海量模型里面找到最合适的模型,“复杂的系统需要多个模型完成联合的任务,今天可以通过这样的一个流程自动化把各种模型融合在一起。”

魔搭GPT(ModelScopeGPT)是一款大模型调用工具,经常被称为agent(智能代理),它能接收用户以自然语言发出的指令,通过“中枢模型”通义千问调用魔搭社区其他的AI模型,大小模型协同完成人类布置的复杂任务。

比如,用户在魔搭GPT的对话框输入任务:“用20字描述一款新的VR(虚拟现实)眼镜,并用女声朗读,随后转成视频。”魔搭GPT会展示整个任务规划过程,先由中枢模型生成一段描述VR眼镜的文案,接着调用语音生成模型,生成语音并用女声念出,最后调用视频生成模型,输出最终的视频内容。过程中,魔搭GPT先后调用了一大二小3个模型。

目前从全球来看,MaaS的订阅制收费早已经开始。根据海通证券研报总结:OpenAI在2月1日正式官宣ChatGPT Plus试点订阅计划。此外,嵌入其他产品获得引流式收入也是模式之一,例如微软推出高级付费版Microsoft Teams Premium,订阅者可享用“智能回顾”功能,用以提供自动生成的会议记录、推荐任务和个性化标亮。其它收费模式包括不同模型对不同客户需求和客户定价,客户要求越高,模型越好,收费也将越高。

周靖人认为,大模型的研发不应该是一场少数机构的竞赛,而应该通过大小模型的协同进化走向更高级的应用,尤其是适应中国本土需求的应用。

首个大模型标准化专题组组长公布,科大讯飞、华为、阿里等入选

国家标准委指导的国家人工智能标准化总体组宣布我国首个大模型标准化专题组组长。

科大讯飞研究院院长刘聪被聘为国家人工智能标准化总体组大模型专题组联合组长的聘书。图片来源:科大讯飞

·上海人工智能实验室与科大讯飞、华为、阿里、百度等企业联合担任我国首个大模型标准化专题组组长。在2023世界人工智能大会上,国家人工智能标准化总体组宣布正式启动大模型测试国家标准制订。

7月7日,在2023世界人工智能大会“共话标准,驱动产业——生成式人工智能标准化分论坛”上,国家标准委指导的国家人工智能标准化总体组宣布我国首个大模型标准化专题组组长,由上海人工智能实验室与科大讯飞、华为、阿里、百度等企业联合担任,现场进行了证书颁发并正式启动大模型测试国家标准制订。

国家标准委指导的国家人工智能标准化总体组宣布我国首个大模型标准化专题组组长。

公开资料显示,今年5月,国家人工智能标准化总体组正式启动大模型专题组相关工作,以推动大模型国家标准化工作的开展。大模型专题组将承担大模型标准化制订工作,目的是推动大模型技术和标准化的实践结合,促进人工智能产业健康发展。

国家人工智能标准化总体组官方微信公众号显示,大模型专题组组长、副组长申报条件为:

1、由总体组成员单位推荐单位内部大模领域专家进行申报,申报人需具有中华人民共和国国籍,政治思想素质较高,遵纪守法,具有良好的科学道德、诚信记录、职业操守和较强的责任心。

2、在大模型理论研究和产业应用等方面具有较高专业水平,熟悉该领域国际前沿科技发展态势、法规制度与标准规范等。牵头起草过国际、国家或行业标准,具有在主要国际组织或标委会中有大模型标准化相关工作经验的优先。

3、原则上不超过65周岁,具有能够适应和完成相关工作的身体条件。

澎湃科技(www.thepaper.cn)从科大讯飞了解到,科大讯飞研究院院长刘聪被聘为国家人工智能标准化总体组大模型专题组联合组长,组长聘期为三年。

360集团方面告诉中国证券报,身为大模型专题组组长单位,公司将积极参与工作组工作,发挥自身实践和经验优势,参与大模型测试国家标准制订。

科大讯飞研究院院长刘聪被聘为国家人工智能标准化总体组大模型专题组联合组长的聘书。图片来源:科大讯飞

根据国家人工智能标准化总体组官方微信公众号,对有关大模型标准化研究选题建议要求为:

1. 研究选题应注重结合国际态式、我国国情和实际工作需求,重点围绕大模型软硬件底座、关键技术、产业应用等重点领域的突出问题,具备孵化标准或指导性技术文件的可能性。

2. 研究选题应具有明确的研究目标、研究任务和较强的创新价值或应用价值,文字表述科学、清晰、简洁。