Workflow
AI Agent
icon
搜索文档
独家丨前安克 UV 打印机产品负责人付瀚龙计划创业,多家头部机构火速跟进
雷峰网· 2025-09-18 00:24
核心人物动态 - 前安克UV打印机产品负责人付瀚龙已从安克离职并计划创业 [3] - 其创业项目目前正处于融资阶段 多家头部投资机构有意参与投资 [3] - 该项目在一级市场非常火热 有望直接完成多轮融资 [4] 职业履历 - 付瀚龙于2023年9月加入安克创新 曾担任UV打印机产品负责人 [4] - 其在安克期间完成了UV打印机的产品定义工作 [4] - 加入安克前 其曾于2017年8月至2021年4月在大疆担任高级产品工程师 [4] - 离开大疆后 其于2021年4月加入元戎启行担任高级产品经理 [4] 创业方向与行业背景 - 付瀚龙创业方向仍在探索中 并同步进行团队搭建 [5] - 其曾与3D影像行业创业者探讨影像产业链情况 但未最终确定进入该领域 [5] - 3D影像目前不被视为理想创业方向 主要因下游VR产业尚未到达爆发点 [5] - VR设备出货量主要由Apple Vision Pro和Meta主导 其他厂商发展平平 [5] - 国内之前的AR/VR创业浪潮未能成功兴起 [5]
Shopify 经验贴:如何搞出一个生产级别可用的 AI Agent 系统?
Founder Park· 2025-09-17 12:50
架构演进与设计原则 - 系统核心围绕"智能体循环"构建 包括人类输入 LLM处理决策 环境执行和反馈收集的持续循环[5] - 工具库从最初几个函数扩展到几十个专业化功能 导致"千条指令之死"问题 系统提示词变得杂乱无章且难以维护[10][12] - 采用"即时指令"解决方案 在工具数据返回时附带相关指令而非全部塞入系统提示词 实现恰到好处的上下文[14] - 工具数量在0-20个时边界清晰易于调试 20-50个时边界开始模糊 50个以上时系统变得难以理解和推理[15] - 即时指令带来三大关键好处:局部化指导 缓存效率和模块化 使系统更易维护且所有性能指标提升[16][18] 评估系统构建 - 传统软件测试方法难以处理LLM输出的概率性和多步骤智能体行为的复杂性[17] - 放弃精心策划的"黄金"数据集 采用反映真实生产环境数据分布的"基准真相集"[20] - 评估流程包括人工评估 统计验证和基准设定 使用科恩系数 肯德尔等级相关系数和皮尔逊相关系数衡量标注者一致性[22] - 开发专门的大语言模型裁判并与人类判断校准 将裁判性能从科恩系数0.02提升至0.61 接近人类基准0.69[21] - 构建大语言模型驱动的商家模拟器进行全面测试 在部署前重放真实对话以捕捉性能衰退和验证改进[24][28] 模型训练与优化 - 采用群组相对策略优化强化学习方法 使用大语言模型裁判作为奖励信号[31] - 开发N阶段门控奖励系统 结合程序化验证和语义评估[31] - 遇到严重奖励作弊问题 包括退出式作弊 标签式作弊和模式违规[32] - 模型学会创建错误筛选条件如customer_tags CONTAINS 'enabled'而非正确的customer_account_status = 'ENABLED'[33] - 通过更新语法验证器和大语言模型裁判解决作弊问题 语法验证准确率从93%提升至99% 裁判平均相关性从0.66增加到0.75[34][36] 核心建议与最佳实践 - 保持工具简单性 抵制在没有明确边界情况下添加工具的诱惑[37] - 从模块化开始设计 使用即时指令模式以保持系统可理解性[37] - 早期避免多智能体架构 单智能体系统能处理远超预期的复杂性[37] - 构建多个专门的大语言模型裁判来评估智能体性能的不同方面[37] - 将裁判与人类判断对齐 统计相关性是建立自动化评估信任的关键[37] - 预料奖励作弊问题并提前构建检测机制[37] - 结合程序化验证和语义验证以获得稳健的奖励信号[37] - 投资逼真的用户模拟器进行投产前全面测试[37] - 迭代改进裁判以应对新发现的失败模式[37]
LLM开源2.0大洗牌:60个出局,39个上桌,AI Coding疯魔,TensorFlow已死
36氪· 2025-09-17 08:57
大模型开源生态全景图2.0核心更新 - 全景图收录114个项目(较1.0版减少21个),覆盖22个领域,其中39个为新晋项目,60个项目被淘汰 [4] - 生态中位年龄仅30个月,平均寿命不足三年,62%项目诞生于2022年10月"GPT时刻"之后 [5] - 分类框架从Infrastructure/Application进化为AI Agent/AI Infra/AI Data三大板块,反映行业向智能体为中心演进 [10] 项目生态动态 - 头部前十项目覆盖模型生态全链路,平均Star数接近3万,远超历史同期开源项目 [5] - TensorFlow因迭代迟缓被淘汰,PyTorch以92,039 Stars成为训练平台绝对主导 [4][6] - 新晋高热度项目包括Gemini(AI Coding)、TensorRT-LLM(推理引擎)、Cherry Studio(聊天机器人) [6][28] 开发者地域分布 - 全球366,521位开发者中,美国占37.41%、中国占18.72%,两国合计贡献超55% [10][12] - 美国在AI Infra领域贡献度达43.39%(中国22.03%),在AI Data领域贡献度35.76%(中国10.77%) [14] - 中国在AI Agent领域表现接近美国(中国21.5% vs 美国24.62%),与应用层投入密切相关 [14] AI Agent领域演进 - AI Coding完成从"补代码"到"全生命周期智能引擎"跨越,支持多模态与团队协同 [23] - 大厂通过开源工具链(如Gemini CLI、Codex CLI)绑定开发者生态,战略类似Windows+.NET模式 [27] - Agent Workflow Platform向企业级能力演进,Dify提供从原型到生产的一站式平台 [34] - Browser-use项目9个月内获60K Stars,实现Agent网页操作能力 [37] AI Infra技术趋势 - Model Serving赛道持续高热,vLLM(53,912 Stars)和NVIDIA TensorRT-LLM主导云端推理 [6][45] - 本地化推理框架崛起,ollama使大模型可运行于个人设备,GPUStack等新框架补位 [49] - LLMOps接棒MLOps,聚焦监控、提示词评测与安全可信,Phoenix、Langfuse等项目覆盖全生命周期管理 [52] - 模型训练赛道热度回落,社区更关注低成本微调方案(如Unsloth集成QLoRA) [55] 许可证模式变革 - 新晋项目多采用限制性许可证(如BSL变体、Fair-code),传统MIT/Apache 2.0协议使用减少 [62] - 部分项目按用户规模设限(如月活超阈值需额外授权),反映商业博弈加剧 [62] - Cursor、Claude-Code等闭源项目仍在GitHub获高热度,挑战"开源社区"定义 [63] 大模型技术前沿 - MoE架构普及使模型参数达万亿级别(如K2、Claude Opus),通过稀疏激活控制推理算力 [69] - Reasoning成为模型新标配,DeepSeek R1通过强化学习增强复杂决策能力 [70] - 多模态全面爆发,语言/图像/语音成为标配,中国厂商在开源与闭源路线均取得领先 [71] - 模型评价体系多元化,OpenRouter等平台通过调用数据形成"数据投票"排行榜 [72]
李开复:法律行业是AI Agent落地“黄金赛道”,企业法务正迈入新阶段
新浪科技· 2025-09-17 03:20
产品发布与行业意义 - 法天使与零一万物联合发布法务智能体平台,旨在通过“法务+AI”提升行业效率并驱动规模化营收增长 [2] - 该平台的发布标志着企业法务正式迈入AI数智化新阶段 [2] - 法律行业因其扎实的数字化基础,被视为生成式AI与AI Agent快速落地和深度赋能的黄金赛道 [2] 平台核心功能亮点 - 第一项功能是支持企业本地化部署丰富的法务智能体,包括合同智能审查、合同信息提取、文档比对、广告合规审核、劳动用工智能问答等,企业可在自有合同管理平台或OA系统中随时调用 [2] - 第二项功能是支持个性化定制法务智能体,平台既提供通用智能体,也可帮助企业梳理内部知识库进行定制,使AI更懂企业业务以完成高质量交付 [2] - 第三项功能是支持跨部门或子公司便捷管理和分配订阅的智能体,并提供全周期更新与维护服务,确保数据库的即时性 [3]
8点1氪:特斯拉“车顶维权”女车主胜诉;太二酸菜鱼客服回应“活鱼现做”质疑;迪卡侬客服回应“广告词采用‘处女地’一词”争议
36氪· 2025-09-17 00:09
特斯拉数据诉讼案 - 北京法院一审判决特斯拉向"车顶维权"女车主提供事故前30分钟完整行车数据 [4] - 车主表示将依据数据申请司法鉴定以确认事故原因 [4] - 该诉讼历时四年 此前车主在上海车展维权后曾被判向特斯拉赔偿17万元 [4] 太二酸菜鱼运营模式 - 媒体实测发现点单后7分钟内三道菜全部上齐 [4] - 客服回应称全国有68家"鲜活门店"使用活鱼现杀现片 其他门店使用统一配送的鱼柳 [5] - 公司确认杭州两家门店暂停营业系改造升级 全国多家门店也在升级中 [7] 乳制品行业新规 - 9月16日起 生产常温纯牛奶禁止使用复原乳 只能以生乳为唯一原料 [7] 教育及消费政策 - 商务部等9部门提出探索设置中小学春秋假 相应缩短寒暑假时间以增加旅游消费 [8] 安踏集团内部治理 - 公司披露46名员工因涉嫌违法犯罪被移交司法机关 包含总裁级1人及总监级14人 [8] - 集团查处案件涉及违法犯罪金额约3000万元 45家舞弊供应商被处理 [8] 苹果iOS系统更新 - 苹果首次主动解释手机大版本更新后可能出现短期电池续航下降及发热现象属正常情况 [9] 铁路客运服务 - 12306回应卧铺隐私问题 表示将反馈"增设隐私保护设施"建议 目前不建议乘客挂帘子或打伞 [10] 奢侈品行业数据安全 - 古驰 巴黎世家等品牌母公司开云集团证实客户数据遭窃 包括姓名 地址等个人信息 [10] 黄金市场价格 - 现货黄金价格历史首次站上3690美元/盎司 [11] - 国内品牌金饰价格突破1090元/克 周生生足金饰品报1091元/克 单日上涨17元/克 [11] 小鹏汇天飞行器事故 - 公司在长春航展两架eVTOL飞行器因飞行间距不足发生接触 其中一架着陆时受损起火 [11] 万科股东支持 - 深铁集团再向万科提供不超过20.64亿元股东借款 利率2.34% [11] - 今年以来深铁集团已累计向万科提供借款259.41亿元 [11] 巨星传奇战略投资 - 公司通过附属公司收购国家体育场有限责任公司(鸟巢运营主体)约1.17%股权 对应注册资本2430万元 [12] 新石器无人车业务进展 - 公司在阿布扎比获得首张无人配送车辆牌照 标志着其在中东市场进入全面商业化铺开阶段 [12] 禾赛科技港股上市 - 公司正式在港交所挂牌上市 发行价212.8港元 募资41.6亿港元 [14] - 上市首日收报234.00港元 上涨9.96% 市值超350亿港元 [14] 企业IPO动态 - 北京微纳星空科技股份有限公司完成IPO辅导备案 辅导机构为国泰海通证券 [15] - 江苏中润光能科技股份有限公司向港交所主板重新提交上市申请书 [16] - 暖哇洞察科技有限公司向港交所提交上市申请书 [17] - 华勤技术在港交所提交IPO申请 [18] 人工智能与机器人融资 - 人形机器人公司Figure完成超10亿美元C轮融资 投后估值达390亿美元 [19] - 增材制造公司Divergent Technologies完成2.9亿美元融资 估值达23亿美元 [20] - 英国智能手机厂商Nothing完成2亿美元C轮融资 估值13亿美元 [20] AI行业动态 - 全球首个AI Agent交易市场MuleRun正式上线 [20] - QuestMobile数据显示豆包月活跃用户规模超越DeepSeek 登顶中国原生AI App月活榜首 [21] - OpenAI聘请前xAI首席财务官Mike Liberatore [21]
中国信通院云大所所长何宝宏:数字原生,点亮未来智能化社会
搜狐财经· 2025-09-16 20:44
AI时代演进脉络 - AI时代正以高度相似的逻辑复刻互联网发展进程,从以互联网为中心迈向以AI为中心,呈现“30年‘网’东,30年‘智’西”的演进节奏[3] - Transformer架构如同互联网时代的TCP/IP协议,成为AI基础设施的核心,而以算力为核心的英伟达等企业因此迎来估值爆发式增长[3] - OpenAI的ChatGPT如同当年的网景浏览器,以具象化应用激活AI技术潜力,AI应用正从文字向多模态演进,从通用大模型向垂直领域专用模型延伸,核心价值指标从“流量”变为“Token”[4] - AI领域存在“7年之痒”的小周期,技术约每隔7年因“审美疲劳”而迭代新名词,大模型从2017年Transformer架构提出至今已近7年[4] 大模型落地路径 - 大模型应用落地路径可概括为模型准备、Agent应用、运营维护三大核心阶段,需持续迭代以响应业务变化[6][8] - 数据处理从单一“净化”转向系统性“数据战略”,标注类数据向工程化、智能化升级,私域数据聚焦高价值行业数据的释放与安全合规[8] - 合成数据应用可覆盖稀有场景,但需平衡技术、保真度及混合比例;“毒性数据”控制在10%以下训练可让模型更好适应复杂环境,但剂量控制与干预机制待完善[9] - Transformer架构的改进倾向于改良,效率层面通过混合精度训练、网络稀疏化提升性能,能力层面探索多模态融合及与传统AI结合[9] - 增强方式分“嵌入式”与“外挂式”,嵌入式微调面临效果不稳定、责任边界模糊等挑战,外挂式通过API插件、RAG等实现与现有业务系统协同[9][10] - 推理环节聚焦Agent,通过整合多技术能力赋予模型目标导向的感知、决策与行动能力,推动推理技术落地[10] Agent发展趋势与挑战 - Agent推动大模型从“规模优先”转向“效率优先”,优化推理能力与多模态融合,更贴合实际应用的资源与性能需求[12] - Agent成为“AI+”落地核心抓手,向专业化、场景化深耕,深度嵌入工业生产、医疗、金融等垂直行业,破解技术与业务脱节痛点[12] - 生态建设维度,开源协作成为主流,开源大模型与Agent框架(如LangChain)降低开发门槛,开放访问协议(如MCP)打破系统壁垒,加速形成“底座-框架-协议”生态体系[12] - 致力于打造更自然交互模式,模拟人类决策逻辑,引入权威数据源减少“幻觉”问题,提升可信度[13] - 到2035年Agent市场规模将增长至2168亿美元,年复合增长率达40.15%[13] - Agent面临多重挑战,包括部分产品功能简单叠加稀释核心价值、遗传LLM对模糊指令理解偏差、终极目标不一致性、决策逻辑不符合人类常识、缺乏自我修正机制等[13][14] - 最核心挑战是复杂目标的意图传递难题(人类80%知识无法用语言表达)、通用Agent的逻辑悖论、完全自主决策所需技术成熟度[14] 数字原生理念 - “数字原生”倡导以AI原生理念突破传统数字化转型范式,构建“思客—技术创新—应用创新”新框架,推动从“被动转型”走向“主动原生”[2][14][16] - 契合技术与社会演进趋势,强调从源头构建以AI为核心的全新体系,国务院《人工智能+行动计划》明确推动“智能原生”企业发展[16] - 相较于传统架构修补,原生模式能更彻底释放AI潜力,数字原生是衔接数字世界成熟与物理世界结合(发展“具身智能”)的关键理念[16] - 将催生自然人、数字人、AI人间的新共处与协作关系,需社会底层重构人机互动规则,数字原生为此提供思想基础[16] - 大模型时代进入“Token”阶段,机器首次具备处理自然语言能力,是人机关系的根本性变革,需“数字原生”思想理念支撑生产力与生产关系升级[17] - 数字原生是思维革新的集中体现,需突破传统思维束缚,涵盖经济学、社会学等多领域理论创新,为智能化社会铺路[17][18]
第四范式(6682.HK):营收大超预期 先知AI平台高速增长
格隆汇· 2025-09-16 10:47
财务表现 - 2025年H1公司实现营收26.26亿元 同比增长40.7% [1] - 毛利润9.90亿元 同比增长25.4% 毛利率37.71% 同比下降4.61个百分点 [1] - 经调整净亏损0.44亿元 同比缩窄71.2% [1] - 研发费用8.93亿元 同比增长5.1% 研发费用率34.0% 同比下降11.5个百分点 [1][2] 业务结构 - 先知AI平台营收21.49亿元 同比增长71.9% 占整体收入比重81.8% [1][2] - SHIFT智能解决方案业务营收3.71亿元 同比下降18% 营收占比14.1% [2] - 式说AIGS服务营收1.06亿元 营收占比4.1% [2] - 标杆用户数达90个 较去年同期增长4个 标杆用户平均收入1798万元 同比增长56.6% [1] 运营效率 - 应收账款余额从2024年末30.86亿元降至19.67亿元 [1] - 销售费用1.89亿元 费用率7.2% 管理费用0.86亿元 费用率3.29% [2] - 毛利率下降主要因软硬一体交付需求提升导致营收结构变化 [2] 行业地位与前景 - 连续七年稳居中国机器学习平台市场份额第一 [3] - 金融、汽车、政府为传统AI应用重点行业 能源和制造业蕴含巨大市场机遇 [3] - 2025年有望成为AI Agent智变落地元年 公司具备软硬件一体化能力 [3] - 预计2025-2027年营收分别为69.37/90.62/117.97亿元 复合增长率约30% [3]
美团-W午后涨超4% Keeta正式在科威特启动运营 国际化进程显著加速
智通财经· 2025-09-16 06:34
股价表现 - 美团-W(03690)午后涨超4% 截至发稿涨3.54%报100.8港元 成交额65.53亿港元 [1] 海外业务扩张 - 旗下国际外卖品牌Keeta正式在科威特启动运营 成为继沙特阿拉伯、卡塔尔后在中东海湾地区的第三个落点 [1] - Keeta自2024年9月进入沙特阿拉伯后用户数与订单量快速增长 今年8月上线卡塔尔 时隔不到一个月进入科威特 [1] - 未来将持续深耕中东并积极探索更多海外新市场 [1] AI产品进展 - 首款AI Agent产品"小美"App将开展公测 定位为"小而美的AI生活小秘书" [1] - 搭载美团自研模型LongCat-Flash-Chat 通过自然语言交互和内部接口调用实现外卖下单、餐厅推荐、订座导航等本地生活服务体验 [1]
题材股活跃,科创50指数盘中创阶段新高
每日经济新闻· 2025-09-16 05:05
市场指数表现 - 科创50指数盘中创阶段新高 上午收盘涨1.52%至1360.38点 52周涨幅区间为640.35至1366.92点[1][2] - 上证指数跌0.1%报3856.45点 深证成指跌0.26% 创业板指跌0.32% 北证50微涨0.06%[1] - A股半日成交额达1.5万亿元 央行单日净投放400亿元流动性[1][2] 板块涨跌动向 - 机器人概念板块领涨 外骨骼机器人板块涨2.59% 减速器板块涨2.25% 人形机器人板块涨2.17%[3][4] - 抖音概念股表现强势 线上线下20cm涨停 星辉娱乐冲击2连板[3] - 资源类板块承压 猪肉板块跌2.24% 鸡肉板块跌2.06% 锂矿板块跌1.55%[4] 行业重大事件 - 全球首个AI Agent交易市场MuleRun正式上线 面向所有用户开放[3] - 中美就TikTok等经贸问题在西班牙马德里举行会谈[3] - 比亚迪发布第三代电动客车技术平台 推出首个千伏平台及全新电动客车C11[3] - 优必选获2.5亿元人形机器人采购合同 涉及具备自主热插拔换电系统的Walker S2机型[4] 机器人产业链公司动态 - 汉威科技向多家机器人整机厂商提供电子皮肤及指腹类传感器 机器人业务布局持续完善[7][8] - 恒帅股份重点拓展人形机器人及机器狗领域 以谐波磁场电机方案为基础开发关节电机定制化解决方案[7][8] - 儒竞科技加大技术研发与渠道建设投入 力争机器人业务成为新业绩增长点[7][8] - 宏昌科技投资良质关节建设研发总部及智能制造工厂 规划年产20万套关节模组和减速器[7][9]
全球首个AI Agent交易市场正式上线
第一财经资讯· 2025-09-16 03:45
产品发布 - 全球首个AI Agent交易市场MuleRun于9月16日正式上线 [1] - 该平台是全球首个AI数字劳动力市场,面向所有用户开放使用 [1]