首页 抖音推荐文章正文

“小而美”语言模型正崛起

抖音推荐 2025年09月11日 19:00 4 admin

“小而美”语言模型正崛起

英国《经济学人》9月8日文章,原题:对被“神化”的大语言模型的信仰正在崩塌 当科技圈谈及大型语言模型进展乏善可陈时,常用智能手机作类比:早期OpenAI公司推出ChatGPT带来的革命性影响力堪比2007年iPhone问世,但如今大语言模型的迭代更像普通手机的小幅升级。ChatGPT-5最新发布后,热度甚至不及最新亮相的iPhone 17。
更值得关注的是小型语言模型在企业中的崛起。许多公司更倾向于量身定制的AI模型,以满足自身特定需求。一些企业在人力管理等方面无需大语言模型“全知全能”的能力,小语言模型成本低、易部署,反而更经济高效。万国商业机器公司研究负责人大卫·考克斯表示:“你的‘人力资源’聊天机器人并不需要掌握高深物理知识。”
小语言模型不仅能在公司内部IT系统运行,也适合嵌入智能手机、自动驾驶汽车、机器人等对能耗与速度敏感的设备。小语言模型可靠性逐步提高,可能表明苹果等厂商未大举投资云端大语言模型是明智决策。
何谓“小语言模型”?业内并无明确界定。两者区别主要在于训练参数数量:大语言模型可达数千亿,小语言模型通常在40亿甚至低于1亿。训练方式的改进,使小语言模型逐渐缩小与大语言模型的差距。例如,英伟达最新推出的9亿参数新款AI模型,在多项测试中超过“元”公司今年4月发布的40倍参数的模型。市场研究公司的阿格拉瓦尔表示:“今天的小模型,比去年的大模型更强大。”
企业需求推动了小语言模型发展。信息技术研究和咨询公司高德纳表示,大语言模型的“AI幻觉”等问题导致用户疲劳,企业更青睐在行业数据上微调的专业模型。今年企业对小语言模型的需求增速预计是大语言模型的两倍。
成本考量也促使小语言模型受欢迎:重复、可标准化的任务可用小语言模型完成,而无需调用资源消耗巨大的大语言模型。万国商业机器公司的Docling产品便是例子:仅用约2.5亿参数的小语言模型即可执行转化数据的任务,用大语言模型反而不划算。小语言模型也可以在更便宜的芯片上运行,能降低硬件成本。
小语言模型在AI代理中也具优势。英伟达公司的研究认为,小模型有潜力成为“代理型AI”的核心,能以更低成本完成任务,并支持“乐高式”组合——用多个专业小模型替代单一大语言模型。这一点凸显了小语言模型在经济与灵活性上的吸引力。未来,大语言模型仍将主导如ChatGPT等消费者应用,但企业与设备端AI可能更多采用小语言模型。OpenAI自身也在内部使用不同规模模型,以任务复杂度分配资源。(蒋礼译)

发表评论

而然网 网站地图 Copyright © 2013-2024 而然网. All Rights Reserved.