Workflow
模型上下文协议(MCP)
icon
搜索文档
浪人早报 | 英伟达拟向OpenAI投资1000亿美元、小米17定档9月25日、转转逐步关停自由市场…
新浪科技· 2025-09-23 05:02
人工智能与芯片行业 - 英伟达宣布向OpenAI投资1000亿美元约合7115亿元人民币 这是公司史上最大规模投资承诺 双方将合作建设庞大数据中心[2] - 受此消息影响 英伟达股价大涨近4% 总市值逼近4.5万亿美元[2] - DeepSeek宣布线上模型升级至DeepSeek-V3.1-Terminus版本 支持128k上下文长度 包含思考模式和非思考模式[5] - 苹果在最新开发者测试版系统中引入Anthropic提出的模型上下文协议MCP支持 实现AI跨平台交互[10] 消费电子与智能手机 - 小米宣布小米17系列将于9月25日发布 包含三款机型 全系搭载澎湃OS3系统并实现产品力跨代升级[3] - 真我GT8系列官宣10月发布 包含GT8和GT8 Pro两款旗舰机型 公司副总裁强调Pro版本具备Ultra级产品力[8] - 部分iPhone 17系列及iPhone Air用户反馈存在WiFi间歇性断连问题 影响包括CarPlay在内的功能使用[9] 新能源汽车与自动驾驶 - 哪吒汽车关联公司合众新能源及两家子公司被三名自然人申请破产审查 案件由桐乡市人民法院受理[7] - 理想汽车对自动驾驶部门进行组织架构调整 将原有三个二级部门拆分为八个细分部门 保留规划管理和AI评测运营部门[8] 产品质量与认证 - 深圳罗马仕科技多个快充移动电源3C认证证书被撤销 原因为认证证书暂停期限届满后未提出恢复申请且整改不合格[6] 二手交易平台业务调整 - 转转集团宣布逐步关停自由市场业务 未来将聚焦二手官方验业务模式 强调其他业务线正常运转[4] 金融行业技术现状 - 英国银行业仍大量使用上世纪60-70年代代码系统 Baringa调查显示16%银行依赖60年代软件 40%维护70年代代码[12] - 半数银行仅有一两名员工能理解这些遗留系统 且多数接近退休 另有31.5%银行依赖一两名未退休员工维持系统运转[12]
AI 基础设施缺失的一层:聚合代理流量
AI前线· 2025-09-01 06:56
AI代理流量爆发与基础设施缺口 - 自主AI代理自行调用API和服务的新型流量正在爆发 这种代理驱动的出站流量是当前AI基础设施中缺失的一层[2] - 大型语言模型代理能够规划任务、链接工具使用、获取数据并启动子任务 所有操作均通过传统基础设施未监控的出站请求实现[2] - 软件架构师已观察到AI API成本突然飙升、权限过宽的机器人访问敏感数据以及缺乏可见性控制等告警信号[2] 传统基础设施的局限性 - 传统API网关仅管理入站流量 而代理调用完全绕过网关表现为正常出站HTTP请求 形成关键盲点[3] - 大多数现有基础设施并非为代理AI的出站调用而构建 留下治理缺口[3] - Gartner在2024年API炒作周期中将"AI网关"列为创新触发阶段的新兴解决方案[2][6] 代理AI带来的具体风险 - 成本不可预测:代理可能陷入失控循环 行为不当的代理通过反复调用外部服务导致预算超支[4] - 安全风险:宽泛凭证权限导致安全隐患 例如连接到GitHub的AI助手因提示注入泄露私有仓库数据[4] - 缺乏可见性与控制:团队无法监控代理行为 难以调试或干预执行过程[5] AI网关的核心功能与架构 - AI网关作为中间件组件 拦截并实时管理AI代理发起的出站流量 提供集中控制[15] - 关键功能包括流量拦截、策略引擎、路由成本管理、可观察性审计层、安全凭据处理、速率限制和多提供商路由[19][20] - 架构包含请求调解增强、输出防护、数据隐私执行以及缓存性能优化等模块[20] 行业标准与协议发展 - 模型上下文协议(MCP)成为AI代理连接工具和数据的新兴标准 类似"AI代理的USB-C"[21] - 谷歌Agent2Agent(A2A)协议专注于代理协作 支持复杂工作流但增加级联故障风险[21] - 多个标准并行发展包括OpenAI工具、LangChain协议和思科ACP 可能引入不一致性和漏洞[22] 实施建议与基础设施准备 - 工程领导者应开始构建轻量级框架 通过审计代理运行位置和添加基础日志建立可见性[23] - 建议通过网关调解凭证 注入短期有限权限令牌 严格执行最小权限原则[25] - 设置超时、最大重试次数和API预算等硬性限制 终止无谓消耗令牌或资金的循环[31] 企业治理与合规要求 - 网关可过滤或标记敏感数据 确保代理遵守数据隐私规则 提供清晰可审计的AI使用记录[25] - 需要定义组织范围内的AI政策 限制对敏感数据的访问 要求受监管输出进行人工审查[31] - 通过网关聚合代理流量实现丰富日志记录 输入到可观察性和SIEM工具中追踪异常行为[25]
量子位智库2025上半年AI核心成果及趋势报告
2025-08-05 03:19
**行业与公司关键要点总结** --- **1. 行业概述** - **AI行业核心逻辑**:技术范式推动模型能力增强,解锁更大应用空间,加速价值创造 [7] - **四大趋势方向**:应用趋势、模型趋势、技术趋势、行业趋势 [4] --- **2. 应用趋势** - **通用类Agent**: - 深度整合工具使用,完成复杂研究任务(如生成图文报告、视频素材)[9] - 交付内容深度提升(从简单文字到多文件编辑)[9] - **Computer Use Agent (CUA)**: - 基于视觉操作GUI,打破数据孤岛,但成本高、异步化难 [12] - **垂类Agent涌现**: - **旅行**:飞猪“问一问”支持多Agent协同(路线规划、票务查询)[13] - **设计/创作**:自然语言生成生产级海报/视频(如GPT-4o图像生成)[13][26] - **时尚**:自然语言生成穿搭方案 [13] - **AI编程**: - Cursor ARR突破5亿美元,演化阶段:代码补全→端到端交付 [15] - 验证成本高(人类反馈占90%工作量),需拆解为小问题解决 [48] - **模型上下文协议(MCP)**: - 标准化接口调用外部工具,但生态未成熟(仅支持20-30个调用)[16] --- **3. 模型趋势** - **推理能力提升**: - 思维链技术推动数学/代码能力进步(如AIME 25准确率+23%)[19] - 工具使用端到端训练(如o3模型,任务准确率+81%)[21] - **多模态融合**: - 视觉推理(如o3模型解决量子力学题目)[24] - 图像生成控制力增强(支持16个细节指令、多轮编辑)[26] - 视频生成整合原生配音(如Veo 3唇动同步)[27][28] - **小模型普及**: - 极致性价比(如Qwen3-0.6B、Gemma 3n仅需2GB RAM)[33] - **评估演化**: - 传统静态榜单饱和,转向实用性任务(如HealthBench医疗评估)[35] --- **4. 技术趋势** - **训练阶段重心**: - 预训练(基础能力)与后训练(激发能力)并重,强化学习算力需求超预训练 [39][41] - **强化学习**: - 算力消耗未来占比最高(如xAI集群扩展至100万卡规模)[56] - **多智能体系统(Multi-Agent)**: - 分布式处理提升效率(如Grok 4采用此架构)[43] - **在线学习**: - 从交互经验中学习,突破人类数据依赖(如Google Deepmind“经验时代”)[44] - **Transformer架构迭代**: - 优化注意力机制(如MiniMax-01支持400万token上下文)[45] - 混合架构涌现(如腾讯混元T1融合Mamba-Transformer)[46] --- **5. 行业趋势** - **头部玩家竞争**: - OpenAI领先优势缩小,谷歌Gemini 2.5 Pro、xAI Grok 4(科学/工程类SOTA)达第一梯队 [58] - 中美差距缩小:中国多模态(如Seedance视频生成)和代码能力(Qwen3-Coder)达SOTA [60][61] - **AI编程争夺战**: - 海外:OpenAI Codex、Anthropic Claude Code、谷歌Gemini Code [62] - 国内:通义灵码、字节Trae(对标Cursor)[63] - **创业公司分化**: - 技术驱动(如DeepSeek开源R1模型)vs. 商业化落地(如零一万物聚焦B端)[64] - **算力竞赛**: - xAI算力集群快速扩张(2025年达100万卡),强化学习算力需求+567% [56] --- **6. 其他关键数据** - **视频生成商业化**:字节可灵月收入1400万美元 [31] - **系统提示词**:Claude模型1.7万字提示词决定用户体验 [51] - **验证瓶颈**:AI编程中90%工作量来自代码验证 [48] --- **注**:所有数据与观点均引自原文标注的文档ID,未进行主观推断。
进门领跑AI投研:“AI进宝”覆盖场景更进一步,上线业绩点评Agent
智能投研产品升级 - 公司推出业绩点评Agent并上线三大MCP Server(图表MCP、投研信息搜索MCP、网络信息搜索MCP),这是AI进宝的第四大关键模式 [1] - MCP Server基于模型上下文协议,标准化AI大模型与外部工具交互规范,降低开发成本并提升交互效率 [2] - 投研信息搜索MCP整合券商分析师点评、内外资金融研报、路演纪要等数据源,网络信息搜索MCP集成网络数据使内容更实时专业 [2] - 业绩点评Agent可实时解析财报并自动提炼关键指标,生成符合研报标准的点评,效率较人工提升超10倍 [4] 市场覆盖与行业地位 - 公司服务超280万专业投资者,机构AI投研解决方案市占率居前 [4] - 平台实现公募基金全覆盖,银行、信托等大型机构覆盖率达91.36%,私募覆盖量达83.64% [5] - 累计投研路演会议量超50万场,公开路演日均新增约400场 [5] - 路演会议系统服务74家券商研究所和3000多家上市公司,疫情期间年复合营收增长超150% [6] 技术布局与生态拓展 - 百度、阿里等科技巨头已布局MCP Server领域,百度于4月发布全球首个电商交易MCP [3] - 公司计划下半年推出事件点评、行业速览等Agent,扩展投研全链路智能决策生态 [4] - 平台支持APP、桌面客户端和网页版三种访问方式,桌面端与网页版功能更强大 [7] 发展历程与战略转型 - 公司创立于2013年,2015年上线路演直播APP,2019-2023年整合腾讯会议等技术强化路演系统 [6] - 2020年疫情推动线上办公,公司抓住风口培育用户线上习惯,实现金融路演领域领先 [6] - 从路演服务升级为机构AI投研平台,通过内容力、智能力等提升解决方案价值 [6]
Claude网页版接入MCP!10款应用一键调用,开发者30分钟可创建新集成
量子位· 2025-05-02 04:36
核心观点 - Anthropic推出的MCP协议正逐渐成为行业标准,实现大模型与外部数据源和工具的无缝集成 [1][4][5] - Claude针对MCP进行两项重大更新:网页版接入MCP和Research功能升级,已向Max/Team/Enterprise用户开放 [1][3][6] - 行业认为MCP可能开启"万物皆应用"时代,大模型SaaS化趋势加速 [2] MCP协议特性 - MCP被类比为AI应用的Type-C接口,支持大模型获取上下文数据提升回答质量 [4][5] - 已集成GitLab、PayPal、Cloudflare等10个应用,开发者可30分钟内创建自定义集成 [9] - 展示案例包括Confluence/Jira任务管理、Intercom故障排查、Zapier日程读取 [11][12][13][15] Claude功能更新 网页版MCP接入 - 从需配置文件的桌面端扩展到网页版,降低技术门槛 [7][9] - 支持直接调用Atlassian等企业工具完成文档处理、任务派发等闭环操作 [11][12] Research功能升级 - 数据源扩展至数百个内外渠道,支持MCP应用接入 [16][17][18] - 新增复杂研究模式:自动分解请求、多源交叉验证、生成带引用标注的综合报告 [17][18][19] - 演示案例显示可半小时处理500+参考资料完成调研 [20] 行业影响 - 用户可通过自定义网站+MCP组合替代传统SaaS付费功能,开源生态或迎来变革 [2] - 协议标准化推动AI应用开发效率,30分钟快速集成凸显平台扩展性 [9]
Docker 推出 MCP Catalog 和工具包,供应商不顾安全问题争相支持
AI前线· 2025-04-28 23:57
Docker推出MCP目录和工具包 - Docker推出MCP目录和MCP Toolkit用于管理MCP工具 [2] - MCP Catalog是Docker Hub的一部分,初始包含100多台服务器,支持Elastic、Salesforce Heroku等第三方供应商工具 [3] - 未来计划允许企业发布自定义MCP服务器,Docker承诺提供全面的企业控制 [3] MCP协议背景与行业应用 - MCP协议由Anthropic于2024年11月推出,旨在为AI代理提供标准化API以控制服务器服务 [4][5] - 协议被OpenAI、微软、谷歌等公司迅速采用,供应商争相提供MCP服务器以接入AI工作流 [5] - 安全机构Wiz推出MCP服务器用于检测代码漏洞,并指出当前存在的安全问题 [6] MCP协议的安全挑战 - 当前缺乏官方MCP服务器注册中心,存在恶意服务器域名抢注和代码植入风险 [6] - Trail of Bits发现工具投毒攻击,恶意服务器可通过描述操纵AI代理执行恶意命令 [9] - Anthropic最初设计需人工验证命令,但AI自动化执行需求与安全性存在矛盾 [10] 行业应对措施与发展趋势 - Docker提供验证过的MCP服务器注册中心,支持注册中心访问管理和镜像访问管理功能 [12] - Anthropic将官方MCP注册中心纳入路线图,但当前社区服务器仍标注"未经测试、风险自负" [11] - 行业处于快速采用阶段,安全边界尚不明确,企业级解决方案需求显著 [11][12]
Manus爆火的秘密武器Browser Use融资1700万美元,让AI「读懂」网页
36氪· 2025-03-24 07:36
融资情况 - 公司完成1700万美元种子轮融资 由Felicis的Astasia Myers领投 Paul Graham、A Capital和Nexus Venture Partners跟投 [1] 技术特点 - 将网站按钮和元素转化为智能体可理解的文本格式 帮助AI自主决策 [5] - 通过提取交互元素(如按钮、表单)实现浏览器操作自动化 包括填写表单、搜索信息和导航网页 [9] - 相比依赖视觉截图的方案 能更低成本地重复执行相同任务 [5] 应用场景 - 支持购物车添加商品并完成结账 [10] - 可读取简历并协助求职 过程中支持人工干预 [12] - 在Hugging Face平台实现模型检索 按点赞数排序并保存前5名结果 [14] 市场反响 - GitHub开源项目获得超过47k个Star [8] - Y Combinator 2025冬季班中20余家公司采用该技术 [6] - 因被Manus智能体集成而知名度大幅提升 [3][21] 行业背景 - AI智能体领域快速发展 Anthropic推出模型上下文协议(MCP)实现AI与工作流深度集成 [16] - OpenAI推出Operator智能体 通过视觉界面控制浏览器执行网络任务 [18][19] - 公司技术被定位为连接静态AI模型与动态数字世界的底层基础设施 [7]