9月11日,2025 Inclusion·外滩大会消息显示,“支付宝碰一下”用户规模已突破2亿,半数来自最近4个月,拿下1亿新用户的速度快了一倍,刷新...
2025-09-11 3
英国《经济学人》9月8日文章,原题:对被“神化”的大语言模型的信仰正在崩塌 当科技圈谈及大型语言模型进展乏善可陈时,常用智能手机作类比:早期OpenAI公司推出ChatGPT带来的革命性影响力堪比2007年iPhone问世,但如今大语言模型的迭代更像普通手机的小幅升级。ChatGPT-5最新发布后,热度甚至不及最新亮相的iPhone 17。
更值得关注的是小型语言模型在企业中的崛起。许多公司更倾向于量身定制的AI模型,以满足自身特定需求。一些企业在人力管理等方面无需大语言模型“全知全能”的能力,小语言模型成本低、易部署,反而更经济高效。万国商业机器公司研究负责人大卫·考克斯表示:“你的‘人力资源’聊天机器人并不需要掌握高深物理知识。”
小语言模型不仅能在公司内部IT系统运行,也适合嵌入智能手机、自动驾驶汽车、机器人等对能耗与速度敏感的设备。小语言模型可靠性逐步提高,可能表明苹果等厂商未大举投资云端大语言模型是明智决策。
何谓“小语言模型”?业内并无明确界定。两者区别主要在于训练参数数量:大语言模型可达数千亿,小语言模型通常在40亿甚至低于1亿。训练方式的改进,使小语言模型逐渐缩小与大语言模型的差距。例如,英伟达最新推出的9亿参数新款AI模型,在多项测试中超过“元”公司今年4月发布的40倍参数的模型。市场研究公司的阿格拉瓦尔表示:“今天的小模型,比去年的大模型更强大。”
企业需求推动了小语言模型发展。信息技术研究和咨询公司高德纳表示,大语言模型的“AI幻觉”等问题导致用户疲劳,企业更青睐在行业数据上微调的专业模型。今年企业对小语言模型的需求增速预计是大语言模型的两倍。
成本考量也促使小语言模型受欢迎:重复、可标准化的任务可用小语言模型完成,而无需调用资源消耗巨大的大语言模型。万国商业机器公司的Docling产品便是例子:仅用约2.5亿参数的小语言模型即可执行转化数据的任务,用大语言模型反而不划算。小语言模型也可以在更便宜的芯片上运行,能降低硬件成本。
小语言模型在AI代理中也具优势。英伟达公司的研究认为,小模型有潜力成为“代理型AI”的核心,能以更低成本完成任务,并支持“乐高式”组合——用多个专业小模型替代单一大语言模型。这一点凸显了小语言模型在经济与灵活性上的吸引力。未来,大语言模型仍将主导如ChatGPT等消费者应用,但企业与设备端AI可能更多采用小语言模型。OpenAI自身也在内部使用不同规模模型,以任务复杂度分配资源。(蒋礼译)
相关文章
9月11日,2025 Inclusion·外滩大会消息显示,“支付宝碰一下”用户规模已突破2亿,半数来自最近4个月,拿下1亿新用户的速度快了一倍,刷新...
2025-09-11 3
英国《经济学人》9月8日文章,原题:对被“神化”的大语言模型的信仰正在崩塌 当科技圈谈及大型语言模型进展乏善可陈时,常用智能手机作类比:早期OpenA...
2025-09-11 4
文 | 小娱侃圈编辑 | 芒果粉序2014年,于上班族而言,公交站台或许是他们最为熟悉的“战场”。毕竟在那个年份,排队上车的人能从站牌直接排到路口,而...
2025-09-11 6
美国知名保守派活动人士、总统特朗普的政治盟友查理·柯克10日在犹他州奥勒姆市的犹他山谷大学演讲时遭枪击身亡,终年31岁。枪击事件发生在当天中午12时1...
2025-09-11 6
在第四十一个教师节到来之际,习近平总书记给全国特岗教师代表回信,提出殷切希望,并向全国广大教师和教育工作者致以节日祝贺和诚挚问候。教育大计,教师为本。...
2025-09-11 4
“跑两步就喘成狗,是不是呼吸方法错了? ”——先别急着背4-4、3-2节奏,喘得凶,可能只是因为你在跟身体抢方向盘。 真事儿:上周北京奥森,一位穿...
2025-09-11 4
国务院新闻办公室11日举行“高质量完成‘十四五’规划”新闻发布会。国家卫生健康委主任雷海潮说,“十四五”时期卫生健康工作度过了极不平凡的五年。卫生健康...
2025-09-11 6
9月10日,海口市公安局龙华分局针对网传女子和外卖员因剐蹭打架一事发布警情通报,全文如下:9月9日12时许,林某(女,36岁 驾驶小汽车行驶至海口市金...
2025-09-11 7
发表评论