Workflow
Docling
icon
搜索文档
“小而美”语言模型正崛起
环球网资讯· 2025-09-11 02:10
行业趋势变化 - 大型语言模型进展乏善可陈 热度不及最新iPhone 17 [1] - 小型语言模型在企业中崛起 需求增速预计是大型语言模型的两倍 [1][2] - 企业更青睐行业数据微调的专业模型 因大型语言模型存在AI幻觉等问题导致用户疲劳 [2] 技术性能比较 - 小型语言模型参数通常在40亿甚至低于1亿 大型语言模型参数达数千亿 [2] - 训练方式改进使小型语言模型缩小与大型语言模型差距 例如英伟达9亿参数模型超过元公司40倍参数模型(40倍参数约360亿参数) [2] - 当前小型语言模型比去年大型模型更强大 [2] 应用场景优势 - 小型模型适合企业内部IT系统运行 以及智能手机、自动驾驶汽车等对能耗与速度敏感的设备 [1] - 人力资源聊天机器人等特定任务无需大型模型全知全能能力 [1] - 小型模型在AI代理中具优势 能以更低成本完成任务并支持多个专业模型组合替代单一大型模型 [3] 成本效益分析 - 小型语言模型成本低、易部署更经济高效 [1] - 重复可标准化任务可用小型模型完成 无需调用资源消耗巨大的大型模型 [2] - 小型模型可在更便宜芯片上运行 降低硬件成本 如万国商业机器公司Docling产品仅用2.5亿参数执行数据转化任务 [2] 市场策略调整 - 苹果等厂商未大举投资云端大型语言模型被视为明智决策 [1] - 大型语言模型仍主导ChatGPT等消费者应用 但企业与设备端AI可能更多采用小型语言模型 [3] - OpenAI内部使用不同规模模型 根据任务复杂度分配资源 [3]