Echo

Echo 关注TA

大家好,我是Echo!

Echo

Echo

关注TA

大家好,我是Echo!

  •  普罗旺斯
  • 自由职业
  • 写了309,377,204字

该文章投稿至Nemo社区   资讯  板块 复制链接


开源 AI 大模型“洗牌”:阿里通义千问 Qwen2-72B 成“王者”,傲视 Meta Llama-3、微软 Phi-3 等群雄

发布于 2024/06/28 07:51 140浏览 0回复 1,048

感谢IT之家网友 風見暉一 的线索投递!

IT之家 6 月 28 日消息,Hugging Face 联合创始人兼首席执行 Clem Delangue 于 6 月 26 日在 X 平台发布推文,表示阿里云开源的通义千问(Qwen)指令微调模型 Qwen2-72B 在开源模型排行榜上荣登榜首。

Hugging Face 公布了全新的开源大语言模型排行榜,通过 300 片英伟达 H100 GPU,重新运行 MMLU-pro 等标准评估目前主流的大语言模型,并在其要点介绍中称 Qwen2-72B 为“王者”,并表示中国的诸多开源模型在榜单上有一席之位。

他表示,为了提供全新的开源大模型排行榜,使用了 300 块 H100 对目前全球 100 多个主流开源大模型,例如,Qwen2、Llama-3、mixtral、Phi-3 等,在 BBH、MUSR、MMLU-PRO、GPQA 等基准测试集上进行了全新评估。

阿里巴巴开源的 Qwen-2 72B 模型在激烈竞争中脱颖而出,不仅超越了科技巨头 Meta 的 Llama-3,还超越了法国知名大模型平台 Mistralai 的 Mixtral,成为了新的行业领军者。IT之家援引官方博文附上榜单排行如下:

排名 新的榜单排名
Qwen/Qwen2-72B-Instruct
2 meta-llama/Meta-Llama-3-70B-Instruct
3 microsoft/Phi-3-medium-4k-instruct
4 01-ai/Yi-1.5-34B-Chat
5 CohereForAI/c4ai-command-r-plus
6 abacusai/Smaug-72B-v0.1
7 Qwen/Qwen1.5-110B
8 Qwen/Qwen1.5-110B-Chat
9 microsoft/Phi-3-small-128k-instruct
10 01-ai/Yi-1.5-9B-Chat

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。


本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/778/218.htm]

本文标签
 {{tag}}
点了个评