首页站长资讯Databricks 以 13 亿美元收购 OpenAI 竞争对手 MosaicML:打造企业定制化生成式 AI 模型的未来
3772

Databricks 以 13 亿美元收购 OpenAI 竞争对手 MosaicML:打造企业定制化生成式 AI 模型的未来

站长网2023-06-28 15:35:230

Databricks 同意以约 13 亿美元的估值收购生成式人工智能初创公司 MosaicML,此举旨在满足企业构建类似 ChatGPT 的工具的快速增长需求。

总部位于旧金山的数据存储和管理初创公司 Databricks 表示,此次交易将其支持人工智能的数据管理技术与 MosaicML 的语言模型平台相结合,使企业能够利用专有数据自行构建低成本的语言模型。目前,大多数企业依赖于在网络上公开数据中训练的第三方语言模型。

同样总部位于旧金山的 MosaicML 成立于 2021 年,将成为 Databricks 的一个独立服务。据 MosaicML 的联合创始人兼首席执行官 Naveen Rao 称,该公司专注于将使用生成式人工智能的成本从数千万美元降低到每个模型数十万美元。MosaicML 目前拥有 62 名员工,并已筹集了 6400 万美元的资金。

预计该交易将在 Databricks 截至于 7 月 31 日的第二季度结束时完成。

生成式人工智能应用程序旨在根据用户的自然语言提示生成原创文本、图像和计算机代码。自从 AI 初创公司 OpenAI 在去年 11 月推出 ChatGPT 在线生成式 AI 聊天机器人以来,企业对该技术的兴趣大幅增长。

像 Anthropic 和 OpenAI 这样的公司会向企业授权现成的语言模型,然后企业在其基础上构建生成式 AI 应用程序。由于这些模型的强劲商业需求,生成式 AI 市场迅速扩大,为像 MosaicML 这样的初创公司创造了机会,他们声称可以以更低的成本提供类似的 AI 模型,并根据公司的数据进行定制。

Databricks 首席执行官 Ali Ghodsi 表示:「如果你从零开始构建一个模型,就知道要为其提供什么内容。」Ghodsi 说,现成的模型因已在互联网数据上进行了训练,其中充斥着可能会扭曲结果的无关信息。他说,许多公司也担心与外部供应商共享其数据所涉及的隐私和安全问题。

一些机器学习专家和 AI 供应商表示,像 ChatGPT 这样的大型语言模型的计算和综合能力超过了小型模型,但后者在特定领域具有有限但强大的功能。毕马威美国人工智能负责人 Sreekar Krishna 表示,数据管理和确定哪些模型最适合特定的用途仍然面临持续的挑战。

「数据一直是成功的关键因素,」Krishna 说,随着大型语言模型的出现,对数据的需求只会增加。

企业技术领导者正面临着准备他们的数据,以用于 AI 模型的压力。数据是所有算法的基础,因为它们用于教授算法从中提取模式并做出预测。像 Replit 这样的公司,提供编程工具,已经在使用 Databricks 作为数据管道,并将这些信息传输到 MosaicML 来训练代码生成模型。

Databricks 技术被称为 Lakehouse,旨在为 AI 应用准备和管理企业数据,统一数据、分析和 AI 编程工具到一个系统中。Databricks 通过出租分析、AI 及其他基于云的软件,以利用 AI-ready 数据为构建企业技术系统提供「镐和铲子」,从中赚取收入。去年,Databricks 报告了超过 10 亿美元的年收入。

据 PitchBook 数据这家市场分析公司称,全球生成性 AI 市场的支出预计将在今年年底达到 426 亿美元,并以每年 32% 的复合年增长率增长到 2026 年的 981 亿美元。它表示,生成式 AI 初创企业获得的风险投资从 2022 年总额 48 亿美元增长到了 2023 年前 5 个月的 127 亿美元。

Databricks 成立于十年前,由加州伯克利的一组数据科学家创建,经过 2021 年 8 月的 16 亿美元筹资轮后,私募市场估值为 380 亿美元。它的投资者包括摩根士丹利的 Counterpoint Global、安德烈森·霍洛维茨、贝莱·吉福德、UC 投资以及 ClearBridge 投资。

生物制药服务公司 Syneos HeAlth 的首席信息和数字官 Larry Pickett 表示,专门的医疗数据训练模型的当前成本估计为 100 万至 200 万美元。分析人士说,那些「特定领域」的模型对公司来说比 ChatGPT 更有用,因为它们拥有更多行业术语和专业知识。

但 Pickett 期望 Syneos HeAlth 可以通过使用较小的预训练模型,而不是基于 OpenAI 完整数据语料库来构建的模型,花费显著的较少资金。「并非每个人、每个应用都需要 GPT-4,」Krishna 说,他指的是 OpenAI 的大型语言模型。大型语言模型正在变得精细,用于非常特定的应用,他说,「到了那个时候,它非常小,可以嵌入任何手机中」。

0000
评论列表
共(0)条