推理引擎
搜索文档
开源破局AI落地:中小企业的技术平权与巨头的生态暗战
21世纪经济报道· 2025-11-11 14:20
开源AI采用现状 - 超过50%的受访企业在AI技术栈的数据、模型与工具层面使用开源技术[1] - 科技、媒体与通信行业的开源AI使用率最高,达到70%[1] - 开源技术通过公开源代码与全球协作,让企业能够根据自身需求快速定制解决方案[1] 企业AI落地挑战与策略 - 企业需要迅速接入大模型,但也要合理应用以规避风险,避免在单一模型厂商上绑死[2] - 企业面临高效利用异构资源的挑战,包括GPU、CPU等多样化算力以及公有云、边缘计算和私有数据中心等多种部署环境[2] - 不同部门或业务场景可能使用不同的大模型或定制小模型,使资源管理更加复杂[2] - 开源生态可以兼容多样化环境,支持企业的不同业务[3] AI操作系统与推理引擎 - 企业需要有弹性、可扩容的AI应用平台,同时兼顾成本与信息安全,AI操作系统是核心中枢[4] - AI操作系统应通过标准化接口和模块化设计,对应不同硬件和不同模型,其核心是推理引擎[4] - 在超过350个企业中,仍有超过51%的企业尚未部署任何推理引擎[5] - 推理引擎类似于传统操作系统在CPU上的作用,通过标准化和模块化设计实现GPU和其他算力的高效利用[4] 开源推理引擎发展 - vLLM是一个高性能、开源LLM推理和服务引擎,旨在提升LLM的推理速度和GPU资源利用率[6] - 红帽发布了开源项目llm-d,进一步增强vLLM推理能力,为AI推理的规模化落地提供方案[6] - Meta的Llama系列推理框架主要针对自家服务,在跨模型与硬件适配能力方面有限[6] - vLLM和SG Lang等开源推理引擎由于支持多种模型和硬件,更适合企业场景[6] 行业趋势转变 - AI落地叙事从造模型转向跑模型,从比拼算法转向构建生态[4] - 开源社区为全球开发者打下良好基础,企业只需在社区中找到技术并企业化[4] - 企业应充分利用开源社区的集群效应,结合企业级AI平台,实现任意云环境、任意模型和加速器的AI部署[6]
奥特曼:假如给我一千倍算力,我会这样做
量子位· 2025-06-04 07:04
AGI定义与发展趋势 - AGI的核心特征是具备超人推理能力、1万亿个上下文标记处理能力及多工具调用能力[1][27] - 理想AGI不需要包含知识本身,而是具备思考、搜索、模拟和解决任何问题的能力[3] - 关键目标包括自主发现新科学或加速全球科学发现速度数倍[4][16] 技术演进方向 - 下一代模型将在1-2年内实现突破,完成GPT-3到GPT-4级别的跨越[21][22] - 模型将深度理解企业背景信息,连接工具系统并进行超人类推理[24][27] - 重点发展小型化模型,具备极快运行速度与万亿级上下文处理能力[27] 算力应用策略 - 千倍算力假设下优先用于AI研究,由模型自主决定资源分配[30][31] - 增加推理阶段计算资源投入可显著提升答案质量[32][33] - 企业可针对高价值问题集中投入算力资源[35] 行业应用前景 - 芯片设计领域可实现更优芯片架构生成[23] - 生物科技领域可定向攻克特定疾病[23] - 模型将作为推理引擎整合企业信息与物理模拟工具[28] 发展理念 - 实现时间节点不如持续指数级进步重要[18][20] - 人类会动态调整对AGI的预期标准[12][14] - 当前LLMs可能成为未来AGI的底层工具之一[14]