百川智能发布70亿参数中英文大模型！清北抢先可用，现已开源

发布时间：2023-06-16 21:08:51 文章来源：量子位

允中发自凹非寺

量子位 | 公众号 QbitAI

王小川的新创业公司百川智能，刚刚推出了70 亿参数量的中英文预训练大模型——baichuan-7B。

(资料图片)

baichuan-7B不仅在C-Eval、AGIEval和Gaokao中文权威评测榜单上，以显著优势全面超过了ChatGLM-6B等其他大模型，并且在MMLU英文权威评测榜单上，大幅领先LLaMA-7B。

目前baichuan-7B大模型已在Hugging Face、Github以及Model Scope平台发布。

开源地址：Hugging Face：https://huggingface.co/baichuan-inc/baichuan-7BGithub：https://github.com/baichuan-inc/baichuan-7BModel Scope：https://modelscope.cn/models/baichuan-inc/baichuan-7B/summary

多个最具影响力中文评估基准7B最佳

为了验证模型的各项能力，baichuan-7B在C-Eval、AGIEval和Gaokao三个最具影响力的中文评估基准进行了综合评估，并且均获得了优异成绩，它已经成为同等参数规模下中文表现最优秀的原生预训练模型。

在中文C-EVAL的评测中，baichuan-7B的综合评分达到了42.8分，超过了ChatGLM-6B的38.9分，甚至比某些参数规模更大的模型还要出色。

https://cevalbenchmark.com/static/leaderboard_zh.html (时间为2023-06-15)

C-Eval评测基准由上海交通大学、清华大学以及爱丁堡大学联合创建，是面向中文语言模型的综合考试评测集，覆盖了52个来自不同行业领域的学科。

在AGIEval的评测里，baichuan-7B综合评分达到34.4分，远超LLaMa-7B、Falcon-7B、Bloom-7B以及ChatGLM-6B等其他开源模型。

AGIEval评测基准由微软研究院发起，旨在全面评估基础模型在人类认知和问题解决相关任务上的能力，包含了中国的高考、司法考试，以及美国的SAT、LSAT、GRE和GMAT等20个公开且严谨的官方入学和职业资格考试。

在GAOKAO评测中，baichuan-7B的综合评分达到了36.2分，显著领先于同参数规模的各种其他预训练模型。

GAOKAO评测基准是复旦大学研究团队创建的评测框架，以中国高考题目作为数据集，用于测试大模型在中文语言理解和逻辑推理能力方面的表现。

MMLU英文评估基准表现大幅领先LLaMA-7B

baichuan-7B不仅在中文方面表现优异，在英文上表现同样亮眼。在MMLU的评测中baichuan-7B综合评分高达42.5分，大幅领先英文开源预训练模型LLaMA-7B的34.2分以及中文开源模型ChatGLM-6B的36.9分。

MMLU由加州大学伯克利分校等知名高校共同打造，集合了科学、工程、数学、人文、社会科学等领域的57个科目，主要目标是对模型的英文跨学科专业能力进行深入测试。其内容广泛，从初级水平一直涵盖到高级专业水平。

万亿优质数据、4K上下文窗口、高效稳定训练造就领先7B预训练模型

训练语料对大模型的训练结果至关重要。在构建预训练语料库方面，百川智能以高质量中文语料为基础，同时融合了优质的英文数据。在数据质量方面，通过质量模型对数据进行打分，对原始数据集进行篇章级和句子级的精确筛选；在内容多样性方面，利用自研超大规模局部敏感哈希聚类系统和语义聚类系统，对数据进行了多层次多粒度的聚类，最终构建了包含1.2万亿token的兼顾质量和多样性的预训练数据。相较于其他同参数规模的开源中文预训练模型，数据量提高了超过50%。

在万亿优质中英文数据的基础上，为了更好地提升训练效率，baichuan-7B深度整合了模型算子来加快计算流程，并针对任务负载和集群配置，自适应优化了模型并行策略以及重计算策略。通过高效的训练过程调度通信，baichuan-7B成功地实现了计算与通信的高效重叠，进而达到了超线性的训练加速，在千卡集群上训练吞吐达到180+Tflops的业界领先水平。

同时，已有的开源模型窗口长度在2K以内，对于一些长文本建模任务，如需要引入外部知识做搜索增强的场景，更长的处理长度有助于模型在训练与推理阶段捕获越多的上下文信息，2K的处理长度存在比较大的制约。baichuan-7B基于高效的attention算子优化实现了万级别超长动态窗口的扩张能力，本次开源的预训练模型开放了4K上下文窗口，使模型应用场景更加广泛。

此外，baichuan-7B还对模型训练流程进行了深度优化，采用了更科学且稳定的训练流程和超参数选择，使得 baichuan-7B模型的收敛速度大大提升。与同等参数规模的模型相比，baichuan-7B在困惑度（PPL）和训练损失（training loss）等关键性能指标上表现更加优秀。

免费可商用，清华北大率先使用助力研究

秉持开源精神，baichuan-7B代码采用Apache-2.0协议，模型权重采用了免费商用协议，只需进行简单登记即可免费商用。

baichuan-7B此次开源的内容十分丰富，包含了推理代码、INT4量化实现、微调代码，以及预训练模型的权重。

其中，微调代码方便用户对模型进行调整和优化；推理代码与INT4量化实现则有助于开发者低成本地进行模型的部署和应用；预训练模型权重开源后，用户则可以直接使用预训练模型进行各种实验研究。

据了解，北京大学和清华大学两所顶尖大学已率先使用baichuan-7B模型推进相关研究工作，并计划在未来与百川智能深入合作，共同推动baichuan-7B模型的应用和发展。

清华大学互联网司法研究院院长、计算机系教授刘奕群认为， baichuan-7B模型在中文上的效果表现十分出色，它免费商用的开源方式展现出开放的态度，不仅贡献社区，也推动技术发展。团队计划基于baichuan-7B模型开展司法人工智能领域的相关研究。

北京大学人工智能研究院助理教授杨耀东认为，baichuan-7B模型的开源将对于中文基础语言模型的生态建设及学术研究产生重要推动作用，同时他也表示将持续关注相关领域探索，并且在中文大语言模型的安全和对齐上进行进一步深入研究。

百川智能CEO王小川表示：“本次开源模型的发布是百川智能成立2个月后的第一个里程碑，对百川智能而言是一个良好的开局。baichuan-7B模型，不仅能为中国的AGI事业添砖加瓦，也为世界大模型开源社区贡献了新的力量。”

— 完 —

量子位 QbitAI · 头条号签

关键词：

2023-06-16 21:08:51·百川智能发布70亿参数中英文大模型！清北抢先可用，现已开源
2023-06-16 21:07:03·中消协发文！碰到这些盲盒，请记得说“不”！环球即时
2023-06-16 21:03:43·世界热推荐：市场监管总局出台信用修复新规鼓励支持相关经营主体重塑信用
2023-06-16 20:58:46·首创证券“首富杯”第二届私募实盘大赛年度颁奖典礼暨非凡IR+启动仪式成功举办天天视讯
2023-06-16 20:50:21·国网泉州供电公司：为变压器“防暑降温” 全力保障迎峰度夏电力供应
2023-06-16 20:53:01·每日信息：永吉股份股东邓代兴质押1408.89万股用于补充流动资金
2023-06-16 21:01:32·2023澳广展：穗澳开启“商贸配对”合作新模式
2023-06-16 20:49:25·世界最资讯丨极挑杀青，岳云鹏说我跟白敬亭最像P上去的，如何才能拍摄犹如P图般的照片？
2023-06-16 20:38:16·鲍佳漪_关于鲍佳漪简述_世界即时
2023-06-16 20:38:55·湖北启动河湖安全保护专项执法行动天天观焦点
2023-06-16 20:37:38·纽威股份控股股东王保庆质押1610万股用于为控制的公司融资提供质押担保-全球播资讯
2023-06-16 20:38:44·环球今热点：【东西问·中外对话】意大利学者：应摒弃“脱钩”论调
2023-06-16 20:54:50·天天信息:用友承建！雪天盐业主数据管理平台正式上线
2023-06-16 20:13:18·全球快播：天天315丨海南省公布8批次不合格食品涉及市民常吃的油条、豆芽等
2023-06-16 20:05:41·每日焦点！如何理解ERP？
2023-06-16 20:20:57·不以物喜不以己悲什么意思（不以物喜不以己悲意思是什么）
2023-06-16 20:09:35·港警拘6名比亚迪刑毁案疑犯无证据显示针对内地品牌
2023-06-16 20:10:53·月光启蒙课文原文阅读答案月光启蒙课文-天天热议
2023-06-16 20:16:18·学韩语的软件带中文翻译学韩语的软件重点聚焦
2023-06-16 20:02:38·世界微头条丨昆明鸿云景悦花园组织开展消防应急演练
2023-06-16 20:09:29·焦点信息:酸甜多汁、个头饱满！金山引进种植慈溪杨梅正式上市
2023-06-16 20:13:56·[路演]天富能源：将进一步发挥“源网荷储”一体化优势打造兵团一流智慧电网_世界播报
2023-06-16 20:06:14·中金公司(601995.SH)股东海尔金盈累计减持公司1.08%股份持股降至5%以下
2023-06-16 19:48:10·海希通讯：拟与辰隆数字签订战略合作框架协议_焦点
2023-06-16 20:02:35·环球视点！人必买的三种保险大部分的人都不知道赶紧收藏
2023-06-16 19:46:09·世界焦点！英语中vi和vt是什么意思_英语vi vt是什么意思
2023-06-16 19:45:57·济南疾控重要提醒：高温袭来，请做好防暑降温措施-世界今亮点
2023-06-16 19:52:32·环球焦点！警方通报球迷冲进球场抱梅西：已满18岁，行拘！
2023-06-16 19:44:41·全球观天下！ORIGIN的drink_up面膜好用吗
2023-06-16 19:47:53·金马游乐闪耀IAAPA新加坡展Show出国际范
2023-06-16 19:56:19·全球微头条丨福田汽车加速商用车自动化进程，强势引领行业变革
2023-06-16 19:42:58·平安健康重磅成立数智新体检研究院跑出企业健康发展加速度|全球热消息
2023-06-16 19:49:18·三项重大成果同日上《自然》，都是湖北的！
2023-06-16 19:32:44·博时招商蛇口产业园REIT6月16日扩募上市开启中国公募REITs发展新篇章|环球信息
2023-06-16 19:31:24·球迷冲场拥抱梅西，北京警方：邸某某已行拘，一年内不得进体育场馆看同类比赛
2023-06-16 19:10:50·你是不是也记得多久没有说爱我什么歌（你是不是也记得多久没有说爱我）-天天热文
2023-06-16 19:19:52·环球最资讯丨广交朋友，苏宁还不想认命
2023-06-16 19:25:05·【天天热闻】北京今天最高气温将冲击39℃ 紫外线强烈需防暑防晒
2023-06-16 19:07:13·视点！2023年南宁端午节景区活动汇总
2023-06-16 19:25:18·世界新资讯：国家中商母婴产业研究院周年大会将于7月9日在南宁召开
2023-06-16 19:02:43·特朗普应诉后发表讲话：这是政治迫害，我只是碰巧挡了他们的路
2023-06-16 18:58:54·【全球新要闻】五部门关于开展2023年新能源汽车下乡活动的通知
2023-06-16 19:11:01·当前简讯:福晶科技：截至目前公司未与中际旭创建立合作关系
2023-06-16 18:56:55·小鹏广州工厂年产量12万辆或投产X9纯电MPV
2023-06-16 19:03:27·解码下半年TMT投资机会如何看待半导体国产化趋势？
2023-06-16 19:01:56·华嵘控股：拟通过发行股份及支付现金的方式购买开拓光电100%股权
2023-06-16 19:03:05·世界最新：抖音终止千亿外卖目标，却暗中抢夺美团与58到家的“蛋糕”
2023-06-16 19:07:07·女子烈日下举牌求前夫复婚，称想给孩子完整的家：举了6个多小时
2023-06-16 19:04:51·原来她早就不是“中国人”，为爱嫁洋老公，最红时被封杀_世界实时
2023-06-16 18:39:19·世界今亮点！近期进口煤市场稳中偏弱运行，后期不确定性仍存金十期货6月16日讯，1.本周，中国进口动力煤市场稳中偏弱运行，市场上报还盘稀少，市场成交以补空单为主

热门推荐HOT

百川智能发布70亿参数中英文大模
允中发自凹非寺量子位|公众号QbitAI王小川的新创业公司百川智能，刚刚
中消协发文！碰到这些盲盒，请记
中国商务新闻网是商务部国际商报社主办，国家互联网信息办公室批准的国
世界热推荐：市场监管总局出台信
中国商务新闻网是商务部国际商报社主办，国家互联网信息办公室批准的国
国网泉州供电公司：为变压器“防
近段时间，气温升高导致用电量增加，变压器一直处于高负荷运行状态。为
每日信息：永吉股份股东邓代兴质
永吉股份股东邓代兴质押1408 89万股用于补充流动资金2023 6 1620:35:00
2023澳广展：穗澳开启“商贸配对
2023澳门·广州缤纷产品展将于6月22日-24日在广州保利世贸博览馆正式开
世界最资讯丨极挑杀青，岳云鹏
尽量选择非常乱的背景，再搭配上不符合当下环境的穿搭风格，普通人也可
鲍佳漪_关于鲍佳漪简述_世界即时
小伙伴们，你们好，今天小夏来聊聊一篇关于鲍佳漪，关于鲍佳漪简述的文
湖北启动河湖安全保护专项执法行
湖北省水利厅16日联合省高级人民法院、省人民检察院、省公安厅、省司法
纽威股份控股股东王保庆质押1610
纽威股份控股股东王保庆质押1610万股用于为控制的公司融资提供质押担保

最近更新

全球热讯:奔腾B70 “超A的感觉
0T发动机功率165千瓦，峰值扭矩340牛·米，匹配爱信6AT变速箱，不仅换
日本强行排污入海，后果有多可怕
国内起义，国外抗议，不管这里里外外的的反对声有多大，终究还是没拦住
芯海科技通过ISO 26262功能安全
6月16日，国际独立第三方检测、检验和认证机构德国莱茵TV集团（以下简
焦点要闻：中国船舶大连造船重大
为全力冲刺“双过半”目标，纪念建厂125周年，中国船舶集团旗下大连造
粮企敞开收购展现企业担当
本报记者樊欣欣眼下，伴随着全市麦收工作的结束，我市夏粮进入集中上市
焦点讯息：加拿大将冻结与亚投行
6月15日，外交部发言人汪文斌主持例行记者会。有记者提问，加拿大称将
2023年印尼羽毛球公开赛1/4决赛
6月16日，据BWF世界羽联：2023年印尼羽毛球公开赛1 4决赛赛况：安洗莹2
美光将投资43亿元加码西安工厂
美光追加在中国的投资。6月16日，存储巨头美光科技（NASDAQ：MU）发布
每日速看!金谷子:周三完美5美
金谷子:周三完美5美就从现在的黄金反弹来看，我认为主力洗盘的行为还没
我市举行“满疆红”群防群治队伍
6月15日，“满疆红”群防群治队伍誓师大会暨信息平台启用仪式在市体育
世界微资讯！香港一季度末市面流
6月16日，香港金管局公布2023年第1季在香港发行的支付卡的统计资料。根
万讯自控(300112.SZ)主要股东傅
智通财经APP讯，万讯自控(300112)(300112 SZ)发布公告，持公司股份比例
五部门：截至4月末涉农贷款余额5
五部门：截至4月末涉农贷款余额53．16万亿元同比增长16．4％,央行,金融
全球快看：山东师范大学研究生应
6月15日，“百名博硕走进黄河口”暨黄河流域博硕创新发展联盟成立大会
滦南县气象台更新高温橙色预警【
滦南县气象台2023年06月16日16时48分继续发布高温橙色预警信号：预计明

猜你喜欢LOVE

Copyright @ 2001-2023 www.u74.cn All Rights Reserved 商业时报网版权所有关于我们

网站信息内容, 均为相关单位具有著作权,未经书面授权,转载注明出处
未经商业时报网书面授权，请勿建立镜像，转载请注明来源，违者依法必究

皖ICP备2022009963号-4
联系邮箱：39 60 29 14 2@qq.com

关于我们 | 联系方式 | 供稿服务 | 版权声明 | 友情链接 | 合作伙伴 |