IT之家 10 月 30 日消息,昆仑万维今日宣布开源百亿级大语言模型「天工」Skywork-13B 系列,并配套开源了 600GB、150B Tokens 开源中文数据集。
昆仑万维「天工」Skywork-13B 系列目前包括 130 亿参数的两大模型:Skywork-13B-Base 模型、Skywork-13B-Math 模型,IT之家附开源地址如下:
Skywork-13B 下载地址(Model Scope):https://modelscope.cn/organization/skywork
Skywork-13B 下载地址(Github):https://github.com/SkyworkAI/Skywork
除模型开源外,Skywork-13B 系列大模型还将开源 600GB、150B Tokens 的中文语料数据集 Skypile/Chinese-Web-Text-150B,号称是目前最大的开源中文数据集之一。
同时,昆仑万维「天工」Skywork-13B 系列大模型即将全面开放商用 —— 开发者无需申请,即可商用。
据介绍,本次开源的 Skywork-13B 系列模型在 CEVAL、CMMLU、MMLU、GSM8K 等几大评估基准中超越 LLaMA2-13B 等开源大模型(截至 10 月 25 日数据)。
在中文文本创作领域的评测中,Skywork-13B 系列大模型的成绩如下,在科技、金融、政务、企业服务、文创、游戏等领域表现不错。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/728/536.htm]