deepseek r1

搜索文档
V3.1适配了国产FP8 精度芯片
小熊跑的快· 2025-08-22 01:12
技术突破 - DeepSeek R1成功源于采用FP8数据格式的细粒度混合精度框架 大部分计算密集型操作在FP8精度下进行 少数关键操作保持原始数据格式 [1] - 国产芯片适配FP8后 效率损失从37%显著改善 降本优势惠及国产卡 [1] 行业趋势 - 国内下一代多家芯片厂商支持原生FP8 大模型基于FP8精度进行工程优化降本 [2] - 国产软硬件协同进步 推动低成本解决方案走向全球市场 [2][3] 竞争格局 - 英伟达GPU此前因CUDA优化及FP16适配占据优势 国产卡需升级至FP16导致效率损失37% [1] - 英伟达计划下放精度至FP4 国内厂商则聚焦FP8原生支持 形成差异化技术路径 [2]
市场对ai应用还是有很大误解
小熊跑的快· 2025-04-01 04:51
AI Agent与Chatbot的区别 - AI Agent与Chatbot本质不同 Chatbot是对话窗口 用户输入提示词后反馈回答 而AI Agent将提示词环节内化 直接提供解决方案 [1] - AI Agent的工作流程示例 用户提出量化实施idea后 Agent自动完成策略生成 数据获取 代码编写 回归测试等全流程 大模型在其中负责任务分解与执行指导 [1] - AI Agent的核心价值 通过预置高质量提示词 解决用户专业度不足和交互惰性问题 实现复杂任务的自动化封装 [1] AI Agent的核心特征 - 高度定制化 需封装行业特定知识 导致腾讯等互联网巨头难以直接切入B端市场 [2] - 强垂直属性 单一Agent无法覆盖全行业 受限于数据与知识储备的局限性 [3] - 人力替代效应 当前基于Claude 3底座的Manus Agent处理单问题成本20元 月工作成本4400元 可替代2.5万元月薪人力 [3] AI Agent的技术演进 - 成本下降曲线 通过工程优化与硬件升级 每16个月处理成本降低80% 伴随大模型精度持续提升 [3] - 任务复杂度进化 早期Agent仅能处理5步思考 未来将扩展至50步以上复杂问题 [3] - 机器人领域突破 2024年前依赖人工编程分解任务 现通过Agent实现问题识别-分解-处理的自动化闭环 [3]