昆仑万维宣布开源百亿级大语言模型“天工”:0门槛商用
开心家园10月30日消息,今天,昆仑万维官方宣布,开源百亿级大语言模型“天工”Skywork-13B系列,并罕见地配套开源了600GB、150B Tokens的超大高质量开源中文数据集。
根据官方介绍,昆仑万维“天工”Skywork-13B系列包括Skywork-13B-Base、Skywork-13B-Math两大模型及150B Tokens高质量中文数据集。
其中Skywork-13B-Base模型是Skywork-13B的基础模型,其经由3.2万亿个多语言高质量数据训练,在CEVAL, CMMLU, MMLU, G*8K等评测与基准测试上都展现了同等规模模型的最佳效果。
Skywork-13B-Math模型经过专门的数学能力强化训练,在G*8K等数据集上取得了同等规模模型的最佳效果。
本次开源的数据集大小约为600GB,总token数量约为150B,是目前开源最大的高质量中文数据集之一。
此外,昆仑万维还公开了模型中使用的评估方法、数据配比研究和训练基础设施调优方案等,助力对于大型模型预训练的认知,推动人工智能通用智能的实现。
目前开源社区中的中文大模型多数并非是完全可商用,通常需要进行复杂的商用授权申请流程,甚至设定**不给予商业授权。
此次Skywork-13B系列大模型将全面**商用许可,无需再次申请授权即可将大模型进行商业用途,帮助更多对中文大模型感兴趣的用户和企业在行业中不断探索和进步。
附Skywork-13B下载地址:
https://modelscope.cn/organization/skywork
https://github.com/SkyworkAI/Skywork
随便看看
- 2022-05-24水晶虾饺怎么做才透亮又Q弹?掌握好配方比例和水温,个个晶莹剔透,口感鲜香爽滑!
- 2022-06-06汤鲜味美的正宗扬州狮子头,拌饭吃也太香!
- 2021-07-12Win10和Win11的游戏性能比较如何?网友:11日大获全胜
- 2021-07-12win11系统防火墙如何关闭window11防火墙
- 0照烧鸡腿,手把手教你,待客露一手也是个硬菜!
- 2021-07-02创意无限:用食材拼出的漂亮又有趣的图案(一)
- 2022-07-14原创 饮食规律,食材简单,夏天也没有那么难熬了呢
- 2021-09-13微软:最满足Win11升级的要求将于2022年初完成
- 2021-07-12微软Win11不需要升级操作TPM2.0
- 2022-10-11榜样力量催人奋进英模事迹激励前行