百度正式推出大语言模型文心一言:3月16日起开放预约
今天下午,百度在北京总部召开新闻发布会,主题围绕文心一言。百度创始人、董事长兼首席执行官李彦宏正式发布预训练生成式大语言模型「文心一言」。
据介绍,「文心一言」目前包含以下五类落地场景:文学创作、商业文案创作、数理逻辑推送、中文理解、多模态生成。文心一言是百度基于文心大模型技术推出的生成式对话产品。百度在人工智能领域深耕十余年,拥有产业级知识增强文心大模型ERNIE ,具备跨模态、跨语言的深度语义理解与生成能力,在搜索问答、云计算、内容创作生成、智能办公等众多领域都有更广阔的想象空间。
在现场文心一言准确回答了《三体》作者、电视剧角色扮演者等事实性问题。生成式AI在回答事实性问题时常常“胡编乱造”,而文心一言延续了百度知识增强的大模型理念,大幅度提升了事实性问题的准确率。
面对“于和伟和张鲁一有哪些共同点”、“于和伟和张鲁一谁更高”这类问题,文心一言也基于推理能力得出了正确答案。
在商业文案创作场景中,文心一言顺利完成了给公司起名、写Slogan、写新闻稿的创作任务。
连续三次内容创作生成中,文心一言既能准确理解人类意图,又能清晰地表达,这是基于庞大数据规模而发生的“智能涌现”。文心一言大模型的训练数据包括万亿级网页数据、数十亿的搜索数据和图片数据、百亿级的语音日均调用数据,以及5500亿事实的知识图谱等,这让百度在中文语言的处理上,能够处于独一无二的位置。
文心一言还具备了一定的思维能力,能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,文心一言能理解题意,并有正确的解题思路,进而像学生做题一样,按正确的步骤,一步步算出正确答案。
文学创作、商业文案创作、数理推算是大语言模型常见的优势和能力,在此基础上,文心一言还表现出更优秀的中文理解及多模态生成能力。
此外,在现场展示中,文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”四个字创作了一首藏头诗。
多模态生成方面,李彦宏现场展示了文心一言生成文本、图片、音频和视频的能力。有趣的是,文心一言甚至能够生成四川话等方言语音;文心一言的视频生成能力则因成本较高,现阶段还未对所有用户开放,未来会逐步接入。
“多模态是生成式AI一个明确的发展趋势。”李彦宏表示,“未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。”
在展示过程中,谈到文心一言能不能处理英文的问题,他表示:答案是,可以处理。不过李彦宏也强调,不过确实要承认文心一言对英文的理解和处理能力现在还没有中文这么好。部分原因是因为在训练数据样本还不够大。百度李彦宏介绍称,内测中「文心一言」并不完美,但市场有需求必须要推出来。
3月16日起,首批用户即可通过邀请测试码在文心一言官网体验产品,后续将陆续开放给更多用户。 此外,百度智能云即将面向企业客户开放文心一言API接口调用服务。3月16日起正式开放预约,搜索「百度智能云」进入官网,可申请加入文心一言云服务测试。
文心一言邀请码申请入口:https://cloud.baidu.com/survey_summit/wenxin.html
- 0000
- 0002
- 0000
- 0000
- 0001