IBM和NASA宣布在Hugging Face上线watsonx.ai地理空间基础模型
文章概要:
1. IBM 和 NASA 联合宣布将 watsonx.ai 地理空间基础模型添加到 Hugging Face 平台上,该模型旨在利用卫星图像数据来推进气候科学和改善地球生活。
2. 该基础模型在 NASA 的 Harmonized Landsat Sentinel-2卫星数据的基础上进行了训练,并使用了标记数据对多个特定用例进行了微调。
3. 基础模型的开发和使用有助于科学和商业领域,解决了 AI 训练中大规模数据标注的难题,并能够提供更快的训练速度和更高的准确性。
IBM 和 NASA 今天共同宣布,在 Hugging Face 平台上推出了 watsonx.ai 地理空间基础模型。这个模型的开发旨在利用大量的卫星图像数据来推进气候科学的发展,并改善地球上的生活。该模型是使用 NASA 的 Harmonized Landsat Sentinel-2卫星数据(HLS)进行训练的,并通过使用标记数据进行细化调整,以适用于烧伤疤痕和洪水预测等多个具体用例。
该地理空间基础模型借鉴了 IBM watsonx.ai 项目中的企业技术,公司希望这种新模型的创新能够同时对科学和商业领域产生积极影响。“通过基础模型,我们有机会进行大量的预训练,然后轻松地适应和加快生产和部署的速度。”IBM 研究人工智能副总裁 Sriram Raghavan 告诉 VentureBeat。
官网地址:https://www.ibm.com/jp-ja/products/watsonx-ai
数据标注是一个难题,基础模型解决了这个问题。过去,IBM 的企业用户在使用 AI 进行训练时面临的一个主要挑战是需要大量标记数据。而基础模型改变了这种模式。
基础模型通过预先训练在大规模未标记数据集上,然后使用一些标记数据进行特定用例的微调,从而得到一个非常定制的模型。不仅模型是定制的,IBM 和 NASA 还发现,使用基础模型的方法比完全使用标记数据构建的模型能够更快地进行训练,并且具有更高的准确性。
例如,Raghavan 表示,在洪水预测这个用例中,新的基础模型能够比最先进的模型提高15% 的预测准确性,而所需的标记数据量只有一半。
“现在你只需要做一半的工作,”Raghavan 说道。“你使用了以非监督方式训练的基础模型,然后一个专业人士说,‘我会教你如何进行洪水预测’,他们只需要使用一半的标记数据来进行训练,而不是之前那样。”
对于烧伤疤痕这个用例,IBM 发现了更大的益处。Raghavan 表示,与当前最先进的模型相比,IBM 的模型能够使用少75% 的标记数据进行训练,提供了性能上的 “两位数” 改进。
至于为什么 IBM 和 NASA 选择在 Hugging Face 上提供地理空间基础模型,Raghavan 表示有多个原因。首先,他说 Hugging Face 已经成为开放 AI 模型领域的领先社区。这是 IBM 今年早些时候宣布 watsonx.ai 项目时做出的认可。作为最初的合作伙伴,IBM 与 Hugging Face 合作,为 IBM 的企业用户提供开放 AI 模型的访问权限。
通过在 Hugging Face 上提供地理空间基础模型,IBM 和 NASA 希望这个模型能够得到广泛的使用,并希望在实际使用过程中能够学到一些经验教训,以不断改进模型的性能。
Raghavan 表示,通过使模型与 Hugging Face 的 API 兼容,开发人员可以利用各种现有的工具来使用和受益于这个模型。“我们的目标是降低用户的使用难度,而目标用户主要是科学家,他们将在卫星数据上开展研究工作,” 他说。“目前,Hugging Face 的 API 在用户中非常熟悉,它们在生态系统中占据主导地位。”
虽然地理空间基础模型的核心受众是科学家,Raghavan 认为,这将有助于企业对 AI 的使用案例有所启发。在直接影响方面,IBM 目前使用各种模型帮助组织进行可持续发展。Raghavan 表示,新模型将来会与该平台集成。此外,这些经验教训还有可能对 IBM 的其他 AI 开发工作产生影响。“我们认为我们正在探索基础模型开发过程中开发者体验的道路,” 他说。“通过现在让科学家对这些模型进行微调,我们将开始了解如何改进这个过程,我相信我们将从中获得一些宝贵的经验教训。”
- 0001
- 0000
- 0000
- 0000
- 0000