占位大模型生态,阿里云胜算几何?
“1 6 N”组织结构调整后,阿里云来到一个关键时点。
按照计划,2024年5月之前,阿里云智能集团将从阿里集团分拆并完成上市。
从财务数据来看,阿里云经历过上一季度的收入下滑之后重回增长,截至2023年6月30日止的季度(2024财年第一季度)收入增长4%至251.23亿元,经调整EBITA利润增长106%至3.87亿元;
从组织结构来看,钉钉将从阿里云独立,阿里云不再承担钉钉的带宽成本,同时还将获得钉钉作为客户的云服务收入;
从战略方向来看,阿里云提出以促进中国大模型生态繁荣为首要目标,搭建了以AI模型为核心的云计算技术和服务架构,并开源了两款大模型。
云服务分三层结构,IaaS、PaaS和SaaS,阿里云则将其置换为IaaS、PaaS和MaaS。IaaS竞争激烈,运营商云、华为云正在用更快的速度拿下政企大客户,而MaaS空间初启,阿里云发力AI模型服务,连续开源多款大模型,并搭建“大模型自由市场”,某种程度上,也呼应了阿里集团“回归淘宝”的策略,即“生态繁荣”。
张勇说,历经移动互联网和产业互联网时代,当前我们正处于智能化的起点。下一步,AI将成为各行各业的新型生产力,带来一个全新的万亿AI大市场。云计算是AI时代最重要的算力基础设施,这将成为云计算向传统IT进一步渗透的重要拐点。
如果说阿里云面临的挑战在于,业绩的增长、估值的提升以及市场份额的扩大,那么一个新的局面似乎正在打开。
01
大模型分野,开源意在何处?
自从openAI点燃大模型之火以后,大模型分野为两条路径:其一是以ChatGTP为代表的闭源大模型,另一是以Llama为代表的开源大模型。
Llama来自Facebook⺟公司Meta,其免费可商用版本Llama2被认为是目前最成功的开源大模型,在包括推理、编码、精通性和知识测试等许多外部基准测试中都优于其他开源语言模型,与闭源模型相比,接近GPT-3.5,与谷歌 PaLM持平或表现更好。
百川智能创始人王小川认为,未来开源和闭源会是并行状态,像现在既有苹果系统,也有安卓系统。“在更多公司要参与进来的时候,光用闭源的API调用是不够的,也存在数据安全的问题。闭源大模型因为体量大,部署和推理成本高只能服务一部分需求。剩下要靠更灵活更定制化的开源模型来提供。”
Meta选择开源大模型,无疑将有利于其技术迭代以及品牌形象提升,一位硅谷AI从业者评价称:“Meta became the cool kid again.”
阿里云也站在了开源大模型的道路上,背后则多了一层云计算服务的考量。
2022年11月,阿里云提出“Model as a Service”理念,阿里达摩院与中国计算机学会(CCF)开源发展委员会联合推出的国内首个AI模型开源社区魔搭(ModelScope),开发者可以在社区上下载开源AI模型,并直接调用阿里云的算力和一站式的AI大模型训练及推理平台。
关于魔搭社区建立的原因,阿里云CTO周靖人解释,AI 产业化应用面临几重挑战:一是 AI 模型开发门槛高,需要大量数据和算力的配合,只有大公司和研究机构才能对 AI 大模型进行研发和创新;二是简单的 AI 模型难以覆盖各行各业的 AI 应用需求,面对新场景时,往往需要进行二次开发或优化,AI 模型定制化门槛较高;三是模型训练、推理、安装部署等较为复杂,使用门槛较高;四是缺乏 AI 模型开发和使用交流分享的平台。
魔搭社区提供模型仓库,收集模型,提供优质数据,还可针对业务场景调优,并提供快速体验模型,再者,提供抽象接口或 API 接口,以便开发者针对模型进行二次开发。魔搭社区无缝对接阿里云机器学习平台 PAI 和弹性计算 ECS,为开发者提供一定的免费资源,帮助开发者体验AI模型开发。
显然,在开源策略中,越多的用户使用模型和资源,对阿里云算力的需求量也就越大。
截至7月底,魔搭已成为国内规模最大、生态最活跃的的AI开发者社区。集聚了200多万AI开发者、1000多个优质AI模型,模型累计下载总量超过4500万。
魔搭社区有Meta开源的Llama2模型,阿里云开源的通义千问大模型——QWen-7B、QWen-7b-Chat、Qwen-VL,以及来自百川智能、哔哩哔哩、IDEA研究院、兰丁股份、澜舟科技、openBMB社区、启智社区、清华TSAIL、RWKV、深势科技、WeNet社区、元语智能、浙江大学、智谱AI等公司和机构贡献的模型。
比如,浙江大学联合高等教育出版社、阿里云等发布的智海-三乐教育垂直大模型,以阿里云通义千问7B通用模型为基座,基于核心教材、领域论文和学位论文等语料和专业指令数据集继续预训练和微调,集成了搜索引擎、计算引擎和本地知识库等功能,将于9月在全国12所高校应用,可提供智能问答、试题生成、学习导航、教学评估等能力。
该模型已通过阿里云灵积平台(DashScope)对外提供API服务,可获取云上高效推理能力,方便被开发者集成。未来该模型还将基于灵积平台提供的高效微调训练能力、插件框架等配套设施,系统化的拓展模型覆盖面和效果。
02
开源社区,价值几何?
实际上,开源社区本身,也是一种商业模式。
当下最活跃的AI开源社区当属Hugging Face,这家创立于2016年的公司,早期业务是聊天机器人。后来整合NLP领域的预训练模型,发布了Transformers库,吸引了大批的开发者。
Hugging Face在2022年5月完成1亿美元的C轮融资,该轮融资仍由Lux Capital领投,红杉资本和Coatue首次参与跟投,其他跟投的投资方包括 Addition、Betaworks、AIX Ventures、Cygni Capital、Kevin Durant和Olivier Pomel这些Hugging Face原有的投资方。融资之后Hugging Face估值达到20亿美元。
截至2023年6月1日,Hugging Face 共享了215,693个训练模型,38,085个数据集,涵盖 NLP、语音、生物学、时间序列、计算机视觉、强化学习等几乎所有领域,搭建了全球范围最完整的 AI 开发者生态。而且,Facebook、微软、Google都是Hugging Face上活跃的模型贡献者。
国内开发者如何看待大模型开源社区?亿邦动力进行了一些调研。
范特科技董秘陈放说:“开源其实是一个很好的商业模式,即可以通过开源方式来降低打磨产品的成本,又可以广泛收集市场反馈。开源模式大部分是基础功能免费,特殊功能另行收费,且采用续费模式的居多。在大模型的兴起之后,开源社区其实又迸发出了新的生机,也有新的故事,之前github之类的传统社区一统天下,现在Hugging Face等全新的开源大模型社区,对于支撑技术和运营能力又提出了更高的要求。”
陈放认为,要运营好开源社区,还是需要积极吸引优秀的项目,注重校企合作。最重要的是能够让用户在使用中得到价值,这点具体在新的开源社区中会是什么,还是一个值得探索的问题。
边无际EdgenesisCEO陈永立也运营着一个开源社区,他说:“开源我觉得是未来的基础软件发展必然趋势,就是大家维护好一套通用的基础软件,然后在上边儿去开发自己的业务。开源社区的核心点是开源产品要真正解决别人的问题,再有一点就是开源社区的运营是一个比较花时间精力的事,而且是一件很专业的事,需要专门负责开源运营的负责人,有相应的开源运营团队。”
数拾科技CTO熊荣康使用了魔搭社区,他说:“在魔塔社区用了些模型,之前用过录音转文字的开源模型,教程很详细,还能直接在阿里云上运行。有很多人在上面发布修改的模型,魔塔上基本都是中文版本的更符合国内环境好情况。不过交互逻辑还有很大改进,有些模型都在线运行不了demo。”
与Hugging Face相比,魔搭的特点是更关注本土需求,提供大量中文模型,比如阿里通义大模型系列、澜舟科技的孟子系列模型、智谱AI的多语言预训练大模型等。
不过对于阿里云来说,魔搭社区并不急于商业变现,更多地承担生态繁荣的责任。
7月7日召开的世界人工智能大会(WAIC2023)上,周靖人表示,阿里云将以促进中国大模型生态的繁荣作为阿里云的首要目标,向大模型创业公司提供全方位的服务,包括智能算力和开发工具,并在资金和商业化探索方面提供充分支持。
周靖人提到,模型成为重要的生产要素,“模型即服务”不简简单单指大模型本身或者各种各样丰富的模型,更重要的是如何让模型能够集成,并在各行各业管理下真正进行一系列优化,让模型释放本身的能力,结合行业具体业务场景完成业务系统智能化。
阿里云正在开启多个行业的大模型合作,目前已经公布的通义千问合作伙伴包括昆仑数智、朗新科技、千方科技、中金财富、石基集团、用友网络、亚信科技、易点天下、中国石油大学(北京)、国泰君安、巨人网络、西门子等,覆盖油气、电力、交通、金融、酒旅、企服、通信等行业。
03
AI能拉动云服务增长吗?
行业研究机构IDC日前发布的2022年全球云计算追踪数据显示,全球云计算IaaS市场规模增长至1154.96亿美元,同比去年上涨26.2%。
全球前三名云厂商依次为亚马逊、微软、阿里云,所占份额分别为48.9%、14.4%、6.2%,谷歌和IBM紧随其后,所占份额分别为5.6%和2.9%。华为云、中国电信、腾讯云、中国移动和百度云位列六至十名。
与2021年相比,阿里云市场份额在减少,而亚马逊和谷歌所占市场份额在增加。
移动互联网发展见顶之后,全球云服务商收入增长都在放缓,AWS增速从40%下降到12%,微软Azure增速从31%下降到15%,但显然阿里云面临的挑战更大一些,增速已降至不足10%,上个季度首次出现负增长。
反观紧随其后的谷歌云仍保持近30%的增长,极有可能取代阿里云占据全球云厂商第三的位置。
2023年第二季度,阿里云的收入同比增长了4%。财报显示,阿里云本季度收入增长主要受到存储、网络和AI计算相关产品驱动,部分被CDN需求正常化抵消增幅。从客户分布维度,收入增长主要受到金融服务、教育、电力和汽车行业驱动,部分被主动缩减项目式收入的举措所抵消。
AI热潮带来的算力和模型服务需求,正在推动阿里云重回增长,那么这种增长能否长期持续?
IDC统计了全球主要云计算厂商的收入拆分,阿里云、AWS的收入结构基本接近, 均主要以IaaS业务为主,辅以一部分PaaS业务,而微软Azure的PaaS和SaaS的收入占比超过60%。
实际上,云计算产业链中,从底层的IaaS,到中间层的PaaS,再到上层的SaaS,越往上产品差异化越大,毛利率越高。微软Azure正是将自身的Windows、Office、SQL Server等软件与云服务打通,获得了更高的毛利率。
IDC在7月6日发布的《全球公共云服务半年度跟踪报告》显示:2022年全球公共云服务市场收入总计为5458亿美元,其中,SaaS(软件即服务)是公共云服务收入的最主要来源,占2022年总收入的45%以上。
2022年全球公共云服务收入及同比增长(单位:十亿美元)|数据来源:IDC
面对全球市场以及国内市场激烈的IaaS竞争,阿里云发力PaaS和MaaS,微软Aure是可以参考比较的对象。
作为openAI的投资方,微软显然更受益于生成式AI的发展。今年初,微软宣布Azure OpenAI服务在全球Azure平台发布,该服务旨在为开发人员提供对大型语言模型的便捷访问,这些模型可以跨其他Azure产品无缝集成,以协助企业开发和部署对话式AI服务和解决方案。此外,微软在其全球合作伙伴大会上宣布了Microsoft365Copilot定价、推出Bing Chat Enterprise AI聊天机器人、和Meta联合宣布将Llama2开源大模型引入Azure云和Windows。
微软2023年第四财季电话会议上,微软首席财务官Amy Hood则表示,尽管目前对Azure AI服务的需求强劲,但目前AI服务对Azure的收入贡献仅有约1个百分点,随着微软加速投资云基础设施,AI对微软收入带来的影响将集中在2024财年的下半年。
张勇在财报会议上也说:“人工智能AI革命是一个增量机会,各行各业,所有公司他们都会希望利用人工智能来提升他们的服务。但是这个是离不开要利用大量高性能的算力,不仅是用于现阶段模型的训练,还要用于支撑以后他们提供各种的服务。因此我们认为这是非常重要的、长期的一个带动增长的引擎。”
也就是说,向上市冲刺的阿里云,增长是确定的,但时间可能是长期的。
- 0000
- 0000
- 0000
- 0000
- 0000