OpenAssistant发布其开源ChatGPT竞争对手
站长网2023-04-17 09:58:221阅
在 OpenAI 发布之后 ChatGPT,去年12月份开源项目 OpenAssistant 也发布了其第一个模型、训练数据和代码,功能类似于 OpenAI 的 ChatGPT。
为什么重要:
人工智能研究的民主化,特别是在大规模语言模型及其对齐领域,仅限于少数具有训练和收集数据资源的研究实验室。OpenAssistant 发布模型和数据旨在使这项研究民主化,并提供包容性和多样化的研究工作。
根据一项与志愿者的比较研究,OpenAssistant 的模型接近 ChatGPT 的 gpt-3.5-turbo 模型生成的结果。
该项目试图反对 OpenAI 使自己的语言模型和数据来源的开发变得越来越不透明,并与一小群选定的专家研究的方法。
评析:
OpenAssistant 旨在创建一个开源 AI 助手,其功能与 OpenAI 的 ChatGPT 相同。在13,500多名志愿者的帮助下,花了数月时间收集了“人工生成、人工注释的助理式对话语料库”。收集到的数据用于改进多种语言模型,包括 Meta 的 LLaMA 模型和 EleutherAI 的 Pyhtia 模型的变体。
最大的变体基于具有300亿个参数的 LLaMA 模型。Pythia 模型已经可用,LLaMA 模型将很快发布。
该团队还采取措施检测并删除数据集中的有害消息,但并非万无一失。
OpenAssistant 的模型表现出“幻觉”等大型语言模型普遍存在的问题,并且收集的训练数据主要由男性贡献,年龄中位数为26岁。
0001
评论列表
共(0)条相关推荐
- 0000
- 0000
- 0000
- 0000
- 0002