Echo

Echo 关注TA

大家好,我是Echo!

Echo

Echo

关注TA

大家好,我是Echo!

  •  普罗旺斯
  • 自由职业
  • 写了309,598,123字

该文章投稿至Nemo社区   资讯  板块 复制链接


Qwen2-Math 开源 AI 模型发布:阿里通义千问家族新成员,数学能力超 GPT-4o

发布于 2024/08/09 10:06 103浏览 0回复 639

感谢IT之家网友 软媒用户1392612我抢了台乌蝇哥的左手 的线索投递!

IT之家 8 月 9 日消息,阿里通义千问 Qwen2 开源家族迎来新成员 Qwen2-Math共有 15 亿参数、70 亿参数和 720 亿参数三个版本,是基于 Qwen2 LLM 构建、专门用于数学解题的语言模型。

简介

Qwen2-Math 是一系列基于 Qwen2 LLM 构建的专门用于数学解题的语言模型,其数学能力显著超越了开源模型,甚至超过了闭源模型(如 GPT-4o),官方希望为科学界解决需要复杂多步逻辑推理的高级数学问题做出贡献。

性能

团队在一系列数学基准评测上评估了我们的数学专用模型 Qwen2-Math。在 Math 上的评测结果表明,其最大的数学专用模型 Qwen2-Math-72B-Instruct 超越了最先进的模型,包括 GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro 和 Llama-3.1-405B。

Qwen2-Math 基础模型

Qwen2-Math 指令微调模型

正开发多语言模型

IT之家从报道中获悉,新模型系列 Qwen2-Math 专注于数学能力,目前仅支持英文,团队计划推出支持英文和中文的双语模型,并且开发多语言模型。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。


本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/787/293.htm]

本文标签
 {{tag}}
点了个评