首页站长资讯智源研究院推出FlagEval“天秤”大模型评测体系

3212

智源研究院推出FlagEval“天秤”大模型评测体系

站长网2023-06-09 20:57:130阅

在今日的2023北京智源大会上，智源研究院宣布推出FlagEval（天秤）大语言模型评测体系。该体系从“能力、任务、指标”三维评测角度出发，结合超过600个维度对大模型进行全面测评。

据悉，天秤大模型的任务维度目前包含22个主观和客观评测数据集，共计超过84433道评测题目。

智源研究院院长黄铁军指出，大模型至少需要具备三个特点。第一，规模要大，需要达到百亿参数级别;第二，涌现性，能够产生预料之外的新能力;第三，通用性，不限于专门问题或者领域。

智源研究院推出FlagEval天秤 大模型评测体系

0000

评论列表

共(0)条

相关推荐

ChatGPT 正在为一种新型 Snapchat 滤镜提供支持
站长资讯站长网2023-11-10 09:56:07
0000
报告：到今年底全球将有13亿部iPhone活跃设备超50%为二手设备
站长资讯站长网2023-10-11 20:33:34
0001
董宇辉称俞敏洪是自己的“王多鱼” 负责帮自己实现梦想
站长资讯站长网2023-05-23 10:26:23
0001
上海出台11条举措推动人工智能大模型创新发展
站长资讯站长网2023-11-09 10:27:07
0000
网站引入ChatGPT被群起而攻之，AI写作还难堪大用
站长资讯站长网2023-06-23 23:42:49
0001