人工智能(AI)再掀热潮,近期国产AI大模型竞相发布。
继百度、三六零、商汤等科技巨头发布各自大模型后,阿里巴巴“通义千问”大模型4月11日亮相云峰会。阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇表示,未来阿里巴巴所有产品都将接入“通义千问”大模型,进行全面改造。
据介绍,阿里云已经累积了从飞天云操作系统、芯片到智算平台的“AI+云计算”的全栈技术实力,阿里云将把这些AI基础设施和大模型能力向所有企业开放,共同推动AI产业的发展。
目前钉钉、天猫精灵率先接入大模型测试,将在评估认证后正式发布新功能。
“未来所有软件都值得接入大模型升级改造,我们将开放通义千问的能力,为每一家企业打造自己的专属GPT(一种预训练的语言模型)。”阿里云智能CTO周靖人表示,阿里云将提供完备的算力和大模型基础设施,让包括创业公司在内的所有企业和机构更好地实现创新,让中国整体的AI能力有全方位的提升。
在发布会当天,阿里云宣布将与OPPO安第斯智能云联合打造OPPO大模型基础设施,基于通义千问完成大模型的持续学习、精调及前端提示工程,未来建设服务于其海量终端用户的AI服务。同时,吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登、掌阅科技等多家企业表示,将与阿里云在大模型相关场景展开技术合作的探索和共创。
张勇说,大模型是一场“AI+云计算”的全方位竞争,超万亿参数的大模型研发,并不仅仅是算法问题,而是囊括了底层庞大算力、网络、大数据、机器学习等诸多领域的复杂系统性工程,需要有超大规模AI基础设施的支撑。
对于大模型领域阿里与引领者OpenAI的差距,阿里方面表示,OpenAI是目前全球大模型研究领域的引领者,
ChatGPT是非常优秀的模式,通义千问目前还在不断学习和成长中。尤其GPT-4在推理、数学等方面有了非常不错的表现,通义千问尚不能及。当然,通义千问也有自己较为擅长的领域,比如在文本对话、阅读理解等方面。
总体来说,阿里处于全球领先的大模型研发梯队,具备语言大模型、多模态大模型、大模型底层训练平台的完整布局。
随着AI模型数据量变大,AI产业正从“手工作坊”组成的轻工业走向集约化生产,需要高性能、低成本的体系化基础设施才能完成工业化生产。国内绝大部分中小公司没有能力自建动辄需千卡甚至万卡以上的大模型基础设施,即便对于很多头部企业,从0到1不断训练、优化大模型也并不经济,各行各业都需要成本足够低的AI基础设施。
阿里云从2019年开始投入大模型研发,是国内大模型领域最早的先行者,其曾训练完成全球首个10万亿参数AI大模型,近期推出实测效果接近ChatGPT的大模型“通义千问”,成为国内唯一支撑过万亿参数以上大模型的“飞天智算基础设施”。
周靖人介绍,“飞天智算基础设施”可提供从IaaS(基础设施即服务)、PaaS(平台即服务)到MaaS(物联网即服务)的三层系统服务能力。
其中,智算IaaS服务包括可支持最大十万卡GPU单集群规模、可承载多个万亿参数大模型同时在线训练的智算集群,可为万卡规模AI集群提供无拥塞通讯的自研RDMA网络架构等;智算PaaS服务以机器学习平台PAI为核心,可支持万卡的单任务分布式训练规模,AI训练效率提升可达10倍,推理效率提升可达6倍,覆盖全链路AI开发工具与大数据服务,深度支持了通义大模型的研发。
另外,智算MaaS服务包括通义大模型系列和以之为基础的企业定制大模型,以及国内首个“模型即服务”开放平台魔搭社区,魔搭现已汇聚超800个优质开源模型,总用户量超100万,模型累计下载次数超1600万,成为国内规模最大的模型社区。