大语言模型中的涌现现象是不是伪科学？_商业时报网

大语言模型中的涌现现象是不是伪科学？

发布时间：2023-06-09 07:45:57 文章来源：程序员客栈

Datawhale干货

作者：平凡@知乎，诺桑比亚大学，在读博士

(资料图)

今天晚上，花了一点儿时间看了两篇文章：

《Emergent Abilities of Large Language Models》[1]

《PROGRESS MEASURES FOR GROKKING VIA MECHANISTIC INTERPRETABILITY》[2]

这两篇讲的都是emergent behavior，即涌现现象。

大规模神经网络下的涌现现象

在机器学习中使用大规模神经网络时，由于增加了参数数量、训练数据或训练步骤等因素，出现了定性上的新能力和性质，这些能力和性质在小规模神经网络中往往是不存在的。

第一篇文章举了这个例子，每个图都可以理解为一个任务，横轴是神经网络的规模，而纵轴是准确率，可以理解为模型的性能。

我们拿图一来看，在10的22次方前，这些模型基本上的性能基本上都很稳定在0附近，而在10的22以后，突然在10的24次方上获得了很大的性能提升，在其他的几个任务上都表现出类似的特征。

意想不到的效果

第二篇文章更是有趣，我直接把推特一位博主的评论引用在这里：

作者发现，当我们训练用网络计算同余加法 a+b = ? (mod c) 时，网络在某个时间突然获得了 100% 准确率。分析发现，神经网络实际上“顿悟”了使用傅立叶变换来计算同余加法！这个算法可以证明是正确的，反人类直觉的。

从这俩例子里面我的感受是，只要数据量足够且真实，且模型没有硬错误的前提下，不断的训练说不定真的能够产生一些意想不到的效果。

还有就是我觉得人类现在积累的知识并不少，但是系统的少，零星的多，如果类似ChatGPT这样的大模型可以拿所有的人类已有知识进行不断学习的话，我觉得有很大概率会让它涌现出意想不到的能力。

甚至可能把人类的生产力解放提前很多。

参考

1.https://arxiv.org/pdf/2206.07682.pdf

2.https://arxiv.org/pdf/2301.05217.pdf

关键词：

2023-06-09 07:45:57·大语言模型中的涌现现象是不是伪科学？
2023-06-09 08:01:00·高龄能不能转行做程序员？
2023-06-09 07:59:00·快看点丨ChatGPT 标注指南来了！数据是关键
2023-06-09 08:06:46·csgo开箱多少钱一个钥匙？ CSGO开一个箱子价格是多少？
2023-06-09 07:38:58·中国电信广东客服：受影响的移动用户接听语音业务已全面恢复
2023-06-09 08:01:03·重庆市公民具备科学素质比例5年保持中国西部地区第一_全球快报
2023-06-09 07:45:57·聚焦民营经济，江汉区致力优化营商环境
2023-06-09 07:43:54·【新要闻】湖北枣阳：爱心助考圆梦起航
2023-06-09 07:45:45·最新消息：定了！本周六！
2023-06-09 07:48:39·防患于未“燃”！武昌民警进社区演练消防救援-资讯
2023-06-09 07:53:48·上班族诉讼有“时差”，法官夜间调解解难题
2023-06-09 07:51:53·安信尊享添益债基个人投资者限购|简讯
2023-06-09 08:03:15·csgo开箱多少钱出刀？靠谱的开箱网站有哪些？
2023-06-09 07:35:20·中国投资价值正在减弱？橡树资本首席投资官：大错特错！坚定不移长期投资中国
2023-06-09 07:34:50·5月上海二手房成交回落：挂牌活跃置换打新成重要消费目的
2023-06-09 07:55:33·金十期货整理|6月9日大类资产隔夜行情汇总1.美国劳动力市场开始出现降温的信号，周四公布的数据显示，上周美国初请失业金人数超预期加速回升，创2021年10月30日当周以来新高，受此影响，美元指数一度下逼103整数关口，收跌0.66%，报103.34
2023-06-09 07:53:50·CSGO新人免费开箱网站有哪些? csgo开箱暗影双匕为什么便宜？
2023-06-09 07:47:11·世界视点！新天绿能：6月8日融券卖出金额16.33万元，占当日流出金额的1.14%
2023-06-09 07:48:58·焦点速递！中国建筑：6月8日获融资买入7288.08万元，占当日流入资金比例8.87%
2023-06-09 07:43:45·亚信安全：6月8日融券卖出金额2.89万元，占当日流出金额的0.22% 精彩看点
2023-06-09 07:57:08·视焦点讯！诺泰生物：6月8日融券卖出金额43.74万元，占当日流出金额的0.2%
2023-06-09 07:34:04·最新快讯!大中型客货车安全驾驶知识测试题（大中型客货车在线学习）
2023-06-09 07:25:16·安徽歙县旅游景点卖鱼村（安徽歙县旅游景点）
2023-06-09 07:33:23·穿越喜羊我是懒羊羊（穿越喜羊羊之懒神逆袭）_当前热门
2023-06-09 07:28:55·养蚕的方法和注意事项视频（养蚕的方法）
2023-06-09 07:26:02·师说的原文和翻译及注释及注音（师说的原文和翻译）_热消息
2023-06-09 07:35:10·白昌洙权相佑（白昌洙）|环球播资讯
2023-06-09 07:29:43·起亚福瑞迪变速箱油尺怎么看（起亚福瑞迪变速箱油多久换一次？）环球百事通
2023-06-09 07:35:04·天天速读：汽车轮胎一次换4个还是2个（福特汽车轮胎多久换一次？）
2023-06-09 07:33:35·哈弗h3原装车壳（哈弗h3哪些配件容易损坏？）环球热资讯
2023-06-09 07:25:24·天天看点：社区列清单，居民、共建单位抢签约
2023-06-09 07:05:36·今日播报!上海两男子往车窗塞露骨小卡片被刑事拘留，警方：他们与诈骗分子勾结
2023-06-09 07:24:12·抖音开放平台正式推出交易类小程序解决方案|全球观察
2023-06-09 07:07:10·寻文化根脉叙一家亲情两岸少数民族文化交流活动落幕_天天视点
2023-06-09 07:22:50·世界消息！险险险！浏阳消防从火场救出一家8口
2023-06-09 07:09:48·世界消息！一汽奔腾NAT续航达成率97.85%，青岛网约车司机都在夸
2023-06-09 07:17:25·天天快看：一汽奔腾NAT续航达成率97.85%，青岛网约车司机都在夸
2023-06-09 07:13:45·驾乘质感与智能体验并重，高性能电动SUV长这样！
2023-06-09 07:08:29·北京市通信管理局就网络安全问题约谈有关企业
2023-06-09 07:08:13·香港设计师黄竞的“文博”之旅：从天马行空到落地有声_焦点资讯
2023-06-09 07:23:13·专家初步判断：天津津南区八里台镇局部地面沉降属于突发地质灾害
2023-06-09 07:09:20·航班增加机票价格回落国内民航市场加快复苏进程|世界快报
2023-06-09 07:07:50·热消息：京津冀“3+N”联盟关节骨水泥类医用耗材集中带量采购开标平均降价83.13%
2023-06-09 07:03:48·A股半导体公司减持进行时，中微公司董事长已减持套现逾1亿|全球要闻
2023-06-09 07:10:16·自然科学基金报告：博士毕业人数持续增长，青年基金占比要提高短讯
2023-06-09 07:08:35·深化“解剖式、代入式”调研为民服务小切口撬动主题教育大成效
2023-06-09 07:19:23·天天新消息丨柳铁单招考什么科目怎报名的试
2023-06-09 07:11:49·即时看！辽宁单招考什么科目时候开始
2023-06-09 07:11:24·军校高中是什么招生条件学
2023-06-09 07:16:02·要闻：空中乘务专业是什么类型男生要求

热门推荐HOT

大语言模型中的涌现现象是不是伪
Datawhale干货作者：平凡@知乎，诺桑比亚大学，在读博士今天晚上，花了
高龄能不能转行做程序员？
大家好，我是良许。在我的直播间，每天晚上都有人在问，我今年30多岁了
快看点丨ChatGPT 标注指南来了
Datawhale干货作者：太子长琴，算法工程师，Datawhale成员前言ChatGPT
csgo开箱多少钱一个钥匙？ CSGO
CSGO的皮肤交易平台有很多，但很多皮肤交易平台的手续都非常高，买个皮肤还不如直接开一个，小编为大家整理了十个好用的csgo皮肤交易平台给
中国电信广东客服：受影响的移动
【中国电信广东客服：受影响的移动用户接听语音业务已全面恢复】财联社
重庆市公民具备科学素质比例5年
6月8日，重庆市科学技术协会第六次代表大会召开。上游新闻记者从会上获
聚焦民营经济，江汉区致力优化营
聚焦民营经济，江汉区致力优化营商环境极目新闻记者张理晶通讯员肖文竹
【新要闻】湖北枣阳：爱心助考
湖北枣阳：爱心助考圆梦起航枣阳市北城派出所民警彭小龙乘驾铁骑将证件
最新消息：定了！本周六！
最新消息：定了！本周六！极目新闻记者邹浩湖北省2023年普通高考已结束
防患于未“燃”！武昌民警进社区
防患于未“燃”！武昌民警进社区演练消防救援极目新闻记者吴昌华通讯员

最近更新

每日消息!兰石化招生考什么意思
1、兰石化招生考什么意思1、兰州职业技术学院兰州职业技术学院是2001年
兰石化单招考什么内容录取准备些
1、兰石化单招考什么2020兰石化单招分数线300分。2、兰石化单招考什么
中专和职高有什么区别区别有哪
中专和职高的区别：性质不同；户别不同，户别也就是户籍的类别，一般是
今日快看!地铁查询时间多久到_地
1、可以打开拿着自己的公共交通卡，去任何一个地铁站通过电脑分析查询
环球资讯：上海迪士尼啥时候开的
1、上海迪士尼乐园于2016年6月16日正式建成开园。2、它是中国内地首座
每日精选：全国养老保险查询_沈
1、你好，具体步骤:打开辽事通点击右下角的我，点击城市服务找到页面中
吃醋的答案
1、吃醋和约的意思是不一样的。吃醋，一般多指的是男女关系中的嫉妒情
你们的爱歌词_你们的爱周笔畅
1、关不上的窗（周传雄），失眠（许慧欣），如果我变成回忆（tank），
kfc优惠券打印_kfcyouhui
1、每天都有2、星期一半价：新奥尔良烤鸡腿堡5元份；培根燕麦堡5元份
冷轧钢管生产工艺流程_冷轧钢管
1、熔点是固体将其物态由固态转变（熔化）为液态的温度。2、20号钢的20
环球看热讯：本人择业意愿继续升
1、择业意愿就是你在毕业之后选择就业方面比较偏向于哪个工作，这个时
农行信用卡透支额度没有了_农行
1、农行的借记卡是不能透支或欠费的,没有这个功能。2、如果您持有农行
最新快讯!拆机棒还可以用什么别
1、先把SIM从手机一侧拆下来，有的手机卡槽位置在手机底部，记得先拿出
淘宝双十一 2021_淘宝双十一
1、数据显示，2021年双十一全网交易额为9652亿元，同比增长122%，未突
环球观热点：三元生物（301206）
6月8日北向资金增持2 07万股三元生物。近5个交易日中，获北向资金增持

猜你喜欢LOVE

Copyright @ 2001-2023 www.u74.cn All Rights Reserved 商业时报网版权所有关于我们

网站信息内容, 均为相关单位具有著作权,未经书面授权,转载注明出处
未经商业时报网书面授权，请勿建立镜像，转载请注明来源，违者依法必究

皖ICP备2022009963号-4
联系邮箱：39 60 29 14 2@qq.com

关于我们 | 联系方式 | 供稿服务 | 版权声明 | 友情链接 | 合作伙伴 |