AI Agent

搜索文档
独家丨前安克 UV 打印机产品负责人付瀚龙计划创业,多家头部机构火速跟进
雷峰网· 2025-09-18 00:24
付瀚龙于2023年9月加入安克,曾短暂担任UV打印机负责人。据了解,安克UV打印机的产品定义由付瀚龙完 成,他也算得上是立下了汗马功劳。 以下文章来自雷峰网子账号【鲸犀】, 想了解更多独家或干货可点击关注: " 付瀚龙先后在大疆、元戎启行、安克待过。 " 作者丨姚单 编辑丨余快 据 雷峰网·鲸犀 近日报道,前安克UV打印机产品负责人付瀚龙从安克离职后,计划创业。该项目正在如火如 荼地融资中,多家头部机构有意参与投资。 据知情人士透露,付瀚龙的项目在一级市场非常火热,有望直接完成多轮融资。 // 近期热门文章 独家丨前钉钉CEO叶军计划创业,投身于AI Agent赛道 原大疆 Mavic 3 产品经理李进吉创业,瞄准影像眼镜赛道 发力UV打印机,创想三维IPO前景如何? 加入安克前,付瀚龙先后在大疆、元戎启行待过。付瀚龙在2017年8月加入大疆担任高级产品工程师,并于 2021年4月离职后加入元戎启行担任高级产品经理。 付瀚龙此番创业,仍在寻找方向当中,并同步搭建团队。 多方消息人士透露,付瀚龙曾向3D影像创业者探讨影像产业链情况,但最终未确定是否投身于3D影像行业创 业。 不过,3D影像被视为不是一个很好的创 ...
Shopify 经验贴:如何搞出一个生产级别可用的 AI Agent 系统?
Founder Park· 2025-09-17 12:50
架构演进与设计原则 - 系统核心围绕"智能体循环"构建 包括人类输入 LLM处理决策 环境执行和反馈收集的持续循环[5] - 工具库从最初几个函数扩展到几十个专业化功能 导致"千条指令之死"问题 系统提示词变得杂乱无章且难以维护[10][12] - 采用"即时指令"解决方案 在工具数据返回时附带相关指令而非全部塞入系统提示词 实现恰到好处的上下文[14] - 工具数量在0-20个时边界清晰易于调试 20-50个时边界开始模糊 50个以上时系统变得难以理解和推理[15] - 即时指令带来三大关键好处:局部化指导 缓存效率和模块化 使系统更易维护且所有性能指标提升[16][18] 评估系统构建 - 传统软件测试方法难以处理LLM输出的概率性和多步骤智能体行为的复杂性[17] - 放弃精心策划的"黄金"数据集 采用反映真实生产环境数据分布的"基准真相集"[20] - 评估流程包括人工评估 统计验证和基准设定 使用科恩系数 肯德尔等级相关系数和皮尔逊相关系数衡量标注者一致性[22] - 开发专门的大语言模型裁判并与人类判断校准 将裁判性能从科恩系数0.02提升至0.61 接近人类基准0.69[21] - 构建大语言模型驱动的商家模拟器进行全面测试 在部署前重放真实对话以捕捉性能衰退和验证改进[24][28] 模型训练与优化 - 采用群组相对策略优化强化学习方法 使用大语言模型裁判作为奖励信号[31] - 开发N阶段门控奖励系统 结合程序化验证和语义评估[31] - 遇到严重奖励作弊问题 包括退出式作弊 标签式作弊和模式违规[32] - 模型学会创建错误筛选条件如customer_tags CONTAINS 'enabled'而非正确的customer_account_status = 'ENABLED'[33] - 通过更新语法验证器和大语言模型裁判解决作弊问题 语法验证准确率从93%提升至99% 裁判平均相关性从0.66增加到0.75[34][36] 核心建议与最佳实践 - 保持工具简单性 抵制在没有明确边界情况下添加工具的诱惑[37] - 从模块化开始设计 使用即时指令模式以保持系统可理解性[37] - 早期避免多智能体架构 单智能体系统能处理远超预期的复杂性[37] - 构建多个专门的大语言模型裁判来评估智能体性能的不同方面[37] - 将裁判与人类判断对齐 统计相关性是建立自动化评估信任的关键[37] - 预料奖励作弊问题并提前构建检测机制[37] - 结合程序化验证和语义验证以获得稳健的奖励信号[37] - 投资逼真的用户模拟器进行投产前全面测试[37] - 迭代改进裁判以应对新发现的失败模式[37]
LLM开源2.0大洗牌:60个出局,39个上桌,AI Coding疯魔,TensorFlow已死
36氪· 2025-09-17 08:57
大模型开源生态全景图2.0核心更新 - 全景图收录114个项目(较1.0版减少21个),覆盖22个领域,其中39个为新晋项目,60个项目被淘汰 [4] - 生态中位年龄仅30个月,平均寿命不足三年,62%项目诞生于2022年10月"GPT时刻"之后 [5] - 分类框架从Infrastructure/Application进化为AI Agent/AI Infra/AI Data三大板块,反映行业向智能体为中心演进 [10] 项目生态动态 - 头部前十项目覆盖模型生态全链路,平均Star数接近3万,远超历史同期开源项目 [5] - TensorFlow因迭代迟缓被淘汰,PyTorch以92,039 Stars成为训练平台绝对主导 [4][6] - 新晋高热度项目包括Gemini(AI Coding)、TensorRT-LLM(推理引擎)、Cherry Studio(聊天机器人) [6][28] 开发者地域分布 - 全球366,521位开发者中,美国占37.41%、中国占18.72%,两国合计贡献超55% [10][12] - 美国在AI Infra领域贡献度达43.39%(中国22.03%),在AI Data领域贡献度35.76%(中国10.77%) [14] - 中国在AI Agent领域表现接近美国(中国21.5% vs 美国24.62%),与应用层投入密切相关 [14] AI Agent领域演进 - AI Coding完成从"补代码"到"全生命周期智能引擎"跨越,支持多模态与团队协同 [23] - 大厂通过开源工具链(如Gemini CLI、Codex CLI)绑定开发者生态,战略类似Windows+.NET模式 [27] - Agent Workflow Platform向企业级能力演进,Dify提供从原型到生产的一站式平台 [34] - Browser-use项目9个月内获60K Stars,实现Agent网页操作能力 [37] AI Infra技术趋势 - Model Serving赛道持续高热,vLLM(53,912 Stars)和NVIDIA TensorRT-LLM主导云端推理 [6][45] - 本地化推理框架崛起,ollama使大模型可运行于个人设备,GPUStack等新框架补位 [49] - LLMOps接棒MLOps,聚焦监控、提示词评测与安全可信,Phoenix、Langfuse等项目覆盖全生命周期管理 [52] - 模型训练赛道热度回落,社区更关注低成本微调方案(如Unsloth集成QLoRA) [55] 许可证模式变革 - 新晋项目多采用限制性许可证(如BSL变体、Fair-code),传统MIT/Apache 2.0协议使用减少 [62] - 部分项目按用户规模设限(如月活超阈值需额外授权),反映商业博弈加剧 [62] - Cursor、Claude-Code等闭源项目仍在GitHub获高热度,挑战"开源社区"定义 [63] 大模型技术前沿 - MoE架构普及使模型参数达万亿级别(如K2、Claude Opus),通过稀疏激活控制推理算力 [69] - Reasoning成为模型新标配,DeepSeek R1通过强化学习增强复杂决策能力 [70] - 多模态全面爆发,语言/图像/语音成为标配,中国厂商在开源与闭源路线均取得领先 [71] - 模型评价体系多元化,OpenRouter等平台通过调用数据形成"数据投票"排行榜 [72]
李开复:法律行业是AI Agent落地“黄金赛道”,企业法务正迈入新阶段
新浪科技· 2025-09-17 03:20
第二,支持个性化定制法务智能体,让AI更懂企业业务,完成更高质量交付。既提供通用的法务智能 体,也可以帮助企业梳理内部知识库,进行智能体的个性化定制,在企业的语境中更快执行具体任务。 第三,支持跨部门/子公司便捷管理和分配订阅的智能体,提供全周期智能体更新与维护服务。通过法 务智能体平台,企业可自由分配和订阅所需智能体,享受智能体的后期更新与维护服务,确保数据库的 即时性。(文猛) 新浪科技讯 9月17日上午消息,近日,法天使联合零一万物发布法务智能体平台,宣布将以"法务 +AI"更快地帮行业提高效率,带来效率和营收的规模化增长。零一万物创始人兼CEO李开复为发布会 致辞称:"AI Agent已从'可用'进化为'好用'的智能决策Agent,真正成为企业生产力,法律行业凭借扎实 的数字化基础,成为生成式AI与AI Agent快速落地、深度赋能的'黄金赛道'。" 责任编辑:江钰涵 "此次零一万物与法天使联合发布'法务智能体平台',不仅实现了AI Agent与法律实务的深度融合,更标 志着企业法务正式迈入AI数智化新阶段。"李开复表示。据悉,此次发布的"法务智能体平台"主要有三 项功能亮点: 第一,支持企业本地化部 ...
8点1氪:特斯拉“车顶维权”女车主胜诉;太二酸菜鱼客服回应“活鱼现做”质疑;迪卡侬客服回应“广告词采用‘处女地’一词”争议
36氪· 2025-09-17 00:09
"车顶维权"女车主:终于赢了特斯拉一次。 整理 |Purple 点击上方【36氪随声听】,一键收听大公司热门新闻。听完音频记得添加进入 【我的小程序】 中哟! 特斯拉"车顶维权"女车主胜诉,北京法院判令特斯拉提供事故前30分钟完整行车数据 9月16日,北京市大兴区人民法院一审判决,责令特斯拉向女车主张亚周提供其车辆2021年2月21日交通事故前三十分钟的完整行车数据。2021年,张父 驾驶特斯拉发生追尾事故,交警认定其全责,但家属认为事故原因是刹车失灵,持续要求特斯拉提供完整数据未果。同年,张女士曾 在上海车展车顶维 权,被行政拘留,后在特斯拉侵权诉讼案中被判赔偿17万元。 "四年了,真的是太难了"。9月16日晚间,张亚周接受记者专访时感叹,"这四年来,我与特斯拉打官司,一直在输、一直在输,今天终于赢了特斯拉一 次"。 张女士表示至二审判决后,将依据数据申请司法鉴定,进一步确认事故原因。 (每日经济新闻) "点单7分钟后,三道菜全部上齐",太二酸菜鱼客服回应"活鱼现做"质疑 9月14日,有媒体记者在太二酸菜鱼杭州一门店实测发现,点单7分钟后,三道菜全部上齐。店员表示,酸菜鱼所用的鱼是统一配送的,在门店内现场切 ...
中国信通院云大所所长何宝宏:数字原生,点亮未来智能化社会
搜狐财经· 2025-09-16 20:44
"数字原生推动企业数字化从被动转型走向主动原生,彻底地释放AI潜力。 在AI大模型规模持续扩大、应用场景日益丰富的当下,行业却普遍面临一大关键难题:如何跳出同质化竞争与低水平复制的困局,让AI技术真正转化为 业务与社会价值,推动产业数智化转型迈向更深层次? 9月8日,由数智猿与数据猿联合主办、中关村科学城公司协办,并获新华社中国经济信息社等多家机构支持的"2025第五届数智化转型升级发展论坛—— 暨AI大模型&AI Agent趋势论坛"针对这些问题,展开了深入而广泛的讨论。 何宝宏博士说,如今的AI时代,正以高度相似的逻辑复刻这一进程。Transformer架构如同当年的TCP/IP,一统人工智能技术江湖,成为AI基础设施的核 心;以算力为核心的英伟达等企业,也正因这一基础设施的需求爆发,迎来估值的爆发式增长。 生态层的突破同样清晰。OpenAI的ChatGPT,恰似当年的网景浏览器,以具象化的应用场景激活了AI的技术潜力,点燃了人工智能革命的火种。 应用层面,AI也在重复从文字到多模态的演进,从通用大模型向私域部署、垂直领域专用模型延伸。只不过,互联网时代的"流量",如今被AI时代 的"Token"所替代, ...
第四范式(6682.HK):营收大超预期 先知AI平台高速增长
格隆汇· 2025-09-16 10:47
财务表现 - 2025年H1公司实现营收26.26亿元 同比增长40.7% [1] - 毛利润9.90亿元 同比增长25.4% 毛利率37.71% 同比下降4.61个百分点 [1] - 经调整净亏损0.44亿元 同比缩窄71.2% [1] - 研发费用8.93亿元 同比增长5.1% 研发费用率34.0% 同比下降11.5个百分点 [1][2] 业务结构 - 先知AI平台营收21.49亿元 同比增长71.9% 占整体收入比重81.8% [1][2] - SHIFT智能解决方案业务营收3.71亿元 同比下降18% 营收占比14.1% [2] - 式说AIGS服务营收1.06亿元 营收占比4.1% [2] - 标杆用户数达90个 较去年同期增长4个 标杆用户平均收入1798万元 同比增长56.6% [1] 运营效率 - 应收账款余额从2024年末30.86亿元降至19.67亿元 [1] - 销售费用1.89亿元 费用率7.2% 管理费用0.86亿元 费用率3.29% [2] - 毛利率下降主要因软硬一体交付需求提升导致营收结构变化 [2] 行业地位与前景 - 连续七年稳居中国机器学习平台市场份额第一 [3] - 金融、汽车、政府为传统AI应用重点行业 能源和制造业蕴含巨大市场机遇 [3] - 2025年有望成为AI Agent智变落地元年 公司具备软硬件一体化能力 [3] - 预计2025-2027年营收分别为69.37/90.62/117.97亿元 复合增长率约30% [3]
美团-W午后涨超4% Keeta正式在科威特启动运营 国际化进程显著加速
智通财经· 2025-09-16 06:34
股价表现 - 美团-W(03690)午后涨超4% 截至发稿涨3.54%报100.8港元 成交额65.53亿港元 [1] 海外业务扩张 - 旗下国际外卖品牌Keeta正式在科威特启动运营 成为继沙特阿拉伯、卡塔尔后在中东海湾地区的第三个落点 [1] - Keeta自2024年9月进入沙特阿拉伯后用户数与订单量快速增长 今年8月上线卡塔尔 时隔不到一个月进入科威特 [1] - 未来将持续深耕中东并积极探索更多海外新市场 [1] AI产品进展 - 首款AI Agent产品"小美"App将开展公测 定位为"小而美的AI生活小秘书" [1] - 搭载美团自研模型LongCat-Flash-Chat 通过自然语言交互和内部接口调用实现外卖下单、餐厅推荐、订座导航等本地生活服务体验 [1]
题材股活跃,科创50指数盘中创阶段新高
每日经济新闻· 2025-09-16 05:05
市场指数表现 - 科创50指数盘中创阶段新高 上午收盘涨1.52%至1360.38点 52周涨幅区间为640.35至1366.92点[1][2] - 上证指数跌0.1%报3856.45点 深证成指跌0.26% 创业板指跌0.32% 北证50微涨0.06%[1] - A股半日成交额达1.5万亿元 央行单日净投放400亿元流动性[1][2] 板块涨跌动向 - 机器人概念板块领涨 外骨骼机器人板块涨2.59% 减速器板块涨2.25% 人形机器人板块涨2.17%[3][4] - 抖音概念股表现强势 线上线下20cm涨停 星辉娱乐冲击2连板[3] - 资源类板块承压 猪肉板块跌2.24% 鸡肉板块跌2.06% 锂矿板块跌1.55%[4] 行业重大事件 - 全球首个AI Agent交易市场MuleRun正式上线 面向所有用户开放[3] - 中美就TikTok等经贸问题在西班牙马德里举行会谈[3] - 比亚迪发布第三代电动客车技术平台 推出首个千伏平台及全新电动客车C11[3] - 优必选获2.5亿元人形机器人采购合同 涉及具备自主热插拔换电系统的Walker S2机型[4] 机器人产业链公司动态 - 汉威科技向多家机器人整机厂商提供电子皮肤及指腹类传感器 机器人业务布局持续完善[7][8] - 恒帅股份重点拓展人形机器人及机器狗领域 以谐波磁场电机方案为基础开发关节电机定制化解决方案[7][8] - 儒竞科技加大技术研发与渠道建设投入 力争机器人业务成为新业绩增长点[7][8] - 宏昌科技投资良质关节建设研发总部及智能制造工厂 规划年产20万套关节模组和减速器[7][9]
全球首个AI Agent交易市场正式上线
第一财经资讯· 2025-09-16 03:45
9月16日,全球首个AI Agent交易市场MuleRun(译名"骡子快跑")正式上线,面向所有用户开放使用, 这也是全球首个AI worker marketplace,即AI数字劳动力市场。 ...