Echo

关注TA

大家好，我是Echo！

该文章投稿至Nemo社区资讯板块复制链接

小米 AI 大模型 MiLM-6B 首次曝光：64 亿参数，C-Eval 总榜排名第 10

发布于 2023/08/11 16:37 240浏览 0回复 706字

IT之家 8 月 11 日消息，小米公司此前并未“官宣”直接加入 AI 大模型赛道中，不过小米的 AI 大模型 MiLM-6B 目前已经悄然现身 C-Eval、CMMLU 大模型评测榜单，截至当前，小米大模型在 C-Eval 总榜单排名第 10、同参数量级排名第 1。

IT之家根据 GitHub 项目页给出的信息得知，MiLM-6B 是由小米公司开发的一个大规模预训练语言模型，参数规模达 64 亿。

小米 AI 大模型 MiLM-6B 首次曝光：64 亿参数，C-Eval 总榜排名第 10

▲ 图源 MiLM-6B 的 GitHub 页面

而根据 C-Eval 给出的信息，MiLM-6B 模型在具体各科目成绩上，在 STEM（科学、技术、工程和数学教育）全部 20 个科目中，计量师、物理、化学、生物等多个项目获得了较高的准确率。

小米 AI 大模型 MiLM-6B 首次曝光：64 亿参数，C-Eval 总榜排名第 10

▲ 图源 C-Eval

据悉，MiLM-6B 模型目前已经在大多数文科科目中表现出了相对良好的准确度，不过在“法学、数学、编程、概率论、离散数学”等涉及“抽象思维”的科目中，还有一定进步空间。

在 10 个“社会科学”测试科目中，除“教育学和地理”外，该模型在其他 8 个科目中都获得了较为理想的准确率。在人文科学的 11 个科目中，MiLM-6B 则在“历史与法律”基础上有着不错的准确率表现。

AI 大模型 MiLM-6B 当下才首次曝光，不过完成度已经较高，在未来该模型可能会被用于小米旗下“小爱同学”等虚拟助理服务中。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

点了个评