AI Agent
搜索文档
港理&清华等首个具身程序性综述:让机器人从第一人称视角学习步骤、纠错与问答
具身智能之心· 2025-12-01 10:00
文章核心观点 - 文章提出构建第一人称视角程序性AI助手(EgoProceAssist)的概念,旨在通过可穿戴设备辅助人们完成日常程序性任务,例如烹饪、装配等 [6] - 该研究首次系统性地总结了构建此类助手所需的三大核心技术任务:第一人称视角程序性错误检测、程序学习和程序问答,填补了现有综述的空白 [1][2] - 通过补充实验验证,现有主流视觉语言模型和AI代理在辅助程序性任务方面表现不足,存在巨大发展空间 [7][8][23] 核心技术任务分类与总结 - **第一人称视角程序性错误检测**:根据输入数据模态划分为仅需视频数据的方法和需要多模态数据的方法,程序性错误检测不同于视频异常检测,它关注于步骤序列中的特定顺序约束 [9][11] - **第一人称视角程序学习**:按照监督水平划分为无监督、弱监督和自监督三大类,其核心目标是识别出对实现目标真正重要的关键步骤序列,过滤无关动作 [14][15][16] - **第一人称视角程序问答**:根据算法结构分为以大型语言模型为固定推理引擎的方法和专门训练理解第一人称视角视频的模型两类,后者能更好地捕捉细微的视觉差异和时空关系 [17][19][20] 补充实验发现 - **程序性错误检测实验**:在CaptainCook4D数据集上,传统方法EgoPED的精确度为56.5,EDA为69.8,而主流VLM如Video-LLaVA的精确度为40.1,EDA为60.8,显示出现有模型识别程序性错误的能力有限 [25][26] - **程序学习实验**:在EgoProceL数据集的电脑装配任务中,传统方法RGWOT的F1分数为43.6,IoU为28.0,而AI代理Vinci 7的F1分数仅为14.1,IoU为7.5,表明现有方法在关键步骤识别和时间定位上准确性不足 [27][28] 行业面临的挑战 - **数据稀缺**:现有第一人称视角视频数据集场景单一,缺乏多样性,且与程序性任务相关的细粒度动作标注较少 [29] - **理解能力有限**:现有模型难以捕捉程序性活动中的逻辑和时间依赖关系,在计算效率、语义理解和多模态信号整合方面存在困难 [30] - **实时性不足**:严重依赖人工标注限制了在真实世界环境下的实用性,目前很少有方法能在实时在线环境中有效运行 [31]
除AI手机外,字节12月还有年度AI大会将举办,Agent仍是重要看点
选股宝· 2025-12-01 08:21
2025火山引擎原动力大会 - 大会将于2025年12月18-19日举行,聚焦人工智能技术与产业融合,可能发布新品 [1] - 大会亮点集中于“豆包大模型全新成员发布”以及“Agent行业前沿探索深度解析” [1] - 大会议题包括“构建下一代Agent应用”、“面向企业智能应用的基础设施与Agent平台”等 [1] 字节跳动的AI产业布局 - 公司已形成模型、平台、应用、硬件的全AI产业链布局 [3] - 其模型能力基准测试略低于海外大厂,但在多模态产品化与矩阵完整度方面占优 [3] - 应用层以豆包为核心,调用量及月活数均持续高增,并同步布局各领域原生AI产品以构建完整生态 [3] AI硬件与“AI原生手机”发布 - 端侧硬件是公司持续布局的重点,产品包括智能体耳机、陪伴玩具等 [4] - 公司于12月1日发布豆包手机助手技术预览版,嵌入中兴手机系统,并与努比亚手机在红魔8S Pro、9Pro等多款机型上合作 [3][4] - 该AI助手具备高权限Agent能力,可模拟人工跨App操作,实现“全网比价后自动点外卖”、“根据屏幕内容回微信”等复杂指令 [4] - 这款“AI原生手机”由字节与中兴努比亚团队深度合作,对硬件层、软件层及操作系统层进行了更深入的整合与重构,核心差异化在于高权限Agent能力 [4] - 豆包方面表示,这是一款需要和手机厂商一起完成的产品,正与多家手机厂商洽谈助手合作,没有自己开发手机的计划 [4] 合作伙伴与相关公司 - 大会合作伙伴包括英伟达、英特尔、AMD等科技公司 [3] - 合作的上市公司包括恺英网络、华胜天成、中科创达、润欣科技等 [3][7] - 其他相关概念公司包括创梦天地、致景科技、Cocos等 [8] 历史事件与市场反应 - 2024年12月10日,在2024火山引擎冬季Force原动力大会前夕,字节跳动的视频生成模型PixelDance在豆包电脑版开启内测,用户每日可免费生成十支视频 [5] - PixelDance于9月底首次发布,早期通过即梦AI、火山引擎面向创作者和企业客户小范围邀测 [5] - 在2024年12月11日开盘,相关龙头公司亚康股份股价20cm涨停 [5]
一字涨停!一部电影引爆整个板块,龙头涨停封单超20万!机构预测:净利润增速有望超50%!
雪球· 2025-12-01 07:58
市场整体表现 - 12月1日三大指数齐涨,沪指涨0.65%收复3900点,深成指涨1.25%,创业板指涨1.31% [3] - 沪深两市成交额达1.87万亿元,较上一交易日放量2881亿元,全市场近3400只个股上涨 [3] AI端侧与消费电子板块 - AI手机概念股大幅拉升,带动消费电子板块走强,两千亿市值的中兴通讯等多股涨停 [3][4][5] - 驱动因素是字节跳动旗下豆包团队发布“豆包手机助手”技术预览版,该助手是与手机厂商在操作系统层面合作开发的AI软件 [7] - 搭载该助手的工程样机努比亚M153已少量发售,售价3499元,主要面向开发者和科技爱好者 [8] - 券商分析认为,豆包大模型深度集成至手机是尝试在操作系统底层渗透,其能力将推动AI Agent形态形成 [8] - 苹果Siri也有望加速向AI Agent形态迈进,可能带动手机换机潮及AR眼镜等端侧产品渗透 [8] - 但AI Agent(如管家类智能体)大规模推广面临挑战,包括可能冲击电商和社交媒体APP的商业模式、引发反爬虫措施及潜在的法律问题 [9] - AI助手若流行可能影响广告生态,而字节跳动自身也是全球头部广告商,面临利益冲突 [10] 影视院线板块 - A股影视院线板块高开高走,中国电影一字涨停,收盘封单超20万手,幸福蓝海、奥飞娱乐等个股跟涨 [11][12] - 中国电影涨停价报19.02元,涨幅10.01%,成交额3.66亿元,总市值355.10亿元 [13] - 上涨直接催化剂是《疯狂动物城2》票房表现强劲,该片由公司参与国内发行 [14] - 影片在周末“引爆”市场,IMAX等多制式影厅一票难求,排片率从11月29日的76.8%升至11月30日的83.3% [14] - 该片11月29日票房超7.3亿元,11月30日票房超5.1亿元,猫眼专业版预测其总票房为42.5亿元,灯塔专业版预测为38.4亿元 [14] - 影片已打破多项纪录,包括2025年贺岁档票房冠军、中国影史进口喜剧片票房冠军等 [14] - 中国电影表示,除《疯狂动物城2》外,《阿凡达:火与烬》等进口片将陆续上映,公司已新设专营进口影片发行的分公司 [14] - 券商观点认为,电影市场为供给驱动型,优质进口续作有效激活需求,有望推动全年票房稳健增长 [14] - 另有券商预测,四季度影视板块营收同比增速将达35%,其中院线板块净利润增速有望超50%,当前板块市盈率约28倍,低于近五年均值35倍 [15] 贵金属板块 - 贵金属板块飙升,白银领涨 [3][16] - 现货白银价格历史首次触及57美元/盎司,日内涨超1%,年内涨幅超98% [18] - COMEX白银首次突破58美元/盎司,沪银涨超6% [18] - 价格上涨核心驱动力之一是中国市场供需变化,贸易商因担心潜在关税将白银从伦敦等地运往纽约,导致国内库存急剧消耗 [18] - 金交所与上期所白银库存已下降至2015年以来近十年最低水平,凸显实物稀缺性 [18] - 宏观层面,交易员普遍押注美联储将在12月宣布降息,货币宽松预期提升了白银等非生息资产的吸引力 [18]
北京AI产业规模有望超过4500亿元,促进技术普惠发展
环球网· 2025-12-01 01:13
北京人工智能产业发展预测与规划 - 北京市科委、中关村管委会发布的白皮书预测,各类AI Agent将迎来爆发式增长 [1] - 具身智能的发展将实现从信息处理到物理作业的跨越 [1] - 人工智能将促进技术普惠发展,端侧智能催生应用新蓝海,智能手机、个人电脑、智能汽车等端侧设备将具备更强的智能处理能力 [1] - 白皮书初步估算,2025年全年北京AI产业规模有望超过4500亿元 [1] 全球人工智能竞争格局 - 新加坡海峡时报发文称,中国的人工智能发展迅速,特别是在生成式AI领域,挑战了美国的领先地位 [1] - AI将增加下一个十年的生产力增长,推动经济增长,在最好的情况下,它将驱动人类经历类似于工业革命的转型 [1] - 美国越来越多的硅谷公司正在采纳中国生产的性能强大且可免费定制的开源人工智能模型,如DeepSeek的R1和阿里巴巴的Qwen,以降低成本和提高效率 [4] - 这些中国模型在技术上接近甚至超越美国封闭模型,引发了关于美国人工智能行业可能依赖外国技术以及本土封闭模型策略是否合理的讨论 [4] - 尽管美国公司仍保有在人工智能能力前沿的优势,但中国模型的崛起和对外开放策略正挑战着美国在开源领域的领导地位 [4]
但斌谈AI眼镜:我很看好这个东西
新浪证券· 2025-11-30 04:18
行业观点与趋势 - 在2025分析师大会上,行业专家、券商基金私募负责人及首席分析师共同探讨了穿越周期的投资策略 [1] - 人工智能领域的竞争极为关键,任何一家公司都不可能放弃,都将全力以赴参与其中 [3][4] 特定产品与形态展望 - 行业专家非常看好AI眼镜等智能穿戴设备的发展前景,并以mate眼镜为例 [3] - 专家引用观点称,未来五年手机形态可能消失,将被AI Agent驱动的其他形态设备取代 [3] - 未来的交互形态可能是多样化的,包括眼镜、耳环、手表或别针等 [4] - AI Agent将实现强联系,能通过语音指令直接完成复杂任务,例如用户只需对AI眼镜说一句话即可预订从上海飞往深圳的机票 [3][4]
字节中兴合作的AI手机将于12月初发布,主打高权限Agent能力
36氪· 2025-11-30 01:36
产品发布与合作模式 - 字节跳动与中兴通讯合作的AI手机计划于12月初发布,字节主导豆包大模型与AI交互,中兴主导硬件定义、产品设计和生产制造[1] - 该产品被定义为“AI原生手机”,对硬件层、软件层及操作系统层进行了深度整合与重构,核心差异化在于高权限Agent能力,能跨应用执行复杂指令[1] - 第一代机型备货量级约为3万台,第二代机型已完成立项,计划于明年上半年推出,AI能力与硬件配置将升级[1] 公司战略与动机 - 字节跳动于2024年上半年启动手机业务,旨在通过亲自下场做手机,深入集成豆包大模型,探索新的UI交互形式[2] - 公司致力于构建终端AI布局的“三位一体”,即结合大模型能力、超级App与硬件终端,其全栈AI布局涵盖算力层、模型层、应用层和硬件层[3] - 字节跳动的硬件之路核心逻辑是寻找流量新入口,避免在下一代计算平台中仅作为寄生于他人操作系统的App开发者[6] 合作伙伴与能力互补 - 中兴通讯旗下的努比亚品牌提供深厚的硬件研发、供应链管理、工业设计及生产制造能力,弥补了字节跳动在硬件落地上的短板[2] - 合作对中兴而言是重要契机,有望在AI时代找到新增长极,并通过联合研发重塑软硬件能力,成为AI时代第一梯队手机品牌[5] 行业竞争格局与影响 - 2024年被视为AI手机元年,国内竞争格局初步分为三大梯队:先锋阵营(荣耀、OPPO、华为)、生态协同者(小米、vivo)及跨界入局者(字节跳动、中兴努比亚)[4] - 字节跳动的入局为手机市场带来新变量,其优势在于推荐算法、自然语言处理及用户需求洞察,可能推动手机交互逻辑从“点击图标”转向“意图识别”[5] - 行业预测到2026年将出现杀手级AI应用,字节与中兴的合作被视为共同面对早期阶段挑战与机遇的举措[4][7]
北京人工智能产业白皮书:各类AI Agent将迎来爆发式增长
新京报· 2025-11-29 07:55
北京人工智能产业现状 - 2025年上半年全市人工智能核心产业规模达2152.2亿元,同比增长25.3% [2] - 初步估算2025年全年产业规模有望超过4500亿元 [2] - AI企业数量超过2500家,已备案大模型183款,持续保持全国第一 [2] 产业生态与商业化进展 - 人工智能产业链日趋完整,形成具有全球竞争力的产业生态 [2] - 商业化路径逐渐清晰,百度、抖音等公司营收和产品活跃用户数均创新高 [2] - 豆包、文心一言、GLM、Kimi等模型在权威测评中表现优异,部分成果达国际顶尖水平 [3] 前沿技术成果 - 北京智源人工智能研究院发布FlagOS,实现"模芯协同"的纵向贯通 [3] - 北京通用人工智能研究院推出"通通2.0",完成从理论创新到能力验证的重大跨越 [3] - 北京科学智能院发布全球首个覆盖"读文献-做计算-做实验-多学科协同"的AI科研平台玻尔科研空间站 [3] 未来发展趋势 - 能胜任个人助理、企业流程自动化、科学研究助手等角色的各类AI Agent将迎来爆发式增长 [1][3] - 具身智能发展将实现从信息处理到物理作业的跨越 [1][3] - 人工智能将拓展认知能力边界,世界模型将显著提升AI系统的泛化能力和可靠性 [3]
做「最内行」的AI职业搭档Agent丨对话小麦招聘
量子位· 2025-11-29 06:02
文章核心观点 - 招聘行业正被AI快速重塑,其核心痛点是信息密度高但结构化程度低,导致供需双方在信息黑箱中决策,错配成本高昂[4][15] - 小麦招聘作为原生AI Agent产品,旨在用Agent逻辑重构整个求职链条,追求“结果交付”而非“流量变现”,通过深度理解业务语境和持续记忆用户,实现更精准的人岗匹配[4][9][17] - AI招聘将创造增量市场,通过将单次招聘成本从十几万降至一两千,激活大量原本无猎头预算的岗位和服务不到的人群,提升市场交易密度和频次[6][9][20] - 行业仍处早期发展阶段,格局未定,领先玩家仍在寻找产品市场契合点,全链路数据闭环是构建壁垒的关键,但门槛很高[11][29][37] AI对招聘行业的重塑与价值创造 - **行业本质痛点**:招聘链条长、决策复杂,核心痛点是**信息不对称**,岗位需求常隐藏在模糊的职位描述背后,沟通中存在**结构性信息损耗**,导致供需双方在“信息黑箱”中决策,“错配”带来的隐性成本(如项目停滞、错过时间窗口)远高于显性招聘费用[15] - **AI的核心价值**:AI带来了前所未有的**“理解与连接”能力**,其价值在于**重写人和机会之间的理解方式**,通过在各个环节实现“信息对齐”,基于更多上下文协调沟通,从而彻底改写系统效率和体验[9][16][21] - **创造增量市场**:传统猎头服务客单价高(例如一个算法工程师招聘成本达十几万),大量企业岗位和候选人因费用过高而未被服务,AI能将成本降至一两千,效率提升数个数量级,从而**激活“没有猎头预算”的岗位和“服务不到的人群”**,当企业和个人都愿意为结果和体验付费时,市场交易密度和频次将大幅提升[6][9][20] 小麦招聘的产品理念与设计 - **产品定位与逻辑**:小麦招聘定位为**AI Agent驱动的系统**,旨在重构求职招聘服务链条,其产品逻辑与传统平台有根本区别:传统平台是“流量变现”模式,追求用户停留和曝光;小麦招聘追求**“结果交付”**,希望用户更快、更准地找到合适机会并“毕业”,这两种逻辑天然矛盾[9][31][39][40] - **核心功能与设计**:产品具备岗位推荐、求职洞察、简历优化、面试辅导、职业规划、行业信息洞察六大功能,其设计围绕**“让信息连续、上下文一致、持续理解”**展开,核心模块**User Memory**能记住用户个人信息、求职目标和偏好,实现长期记忆,减少重复沟通[12][17] - **实现精准匹配的关键**: 1. **更全面的信息和上下文**:整合全链路数据[26] 2. **基于业务知识的语义理解**:AI不只匹配关键词,而是理解岗位背后的**业务语境**,例如区分不同公司背景下“AI产品经理”的真实职责[27] 3. **完整链条上的数据反馈**:通过端到端服务记录沟通、推荐、投递、面试反馈等数据,让系统持续学习优化匹配逻辑[27] 行业现状、竞争格局与壁垒构建 - **发展阶段与格局**:AI招聘赛道尚在**早期发展阶段**,格局远未定型,最领先的玩家也在不断调整方向、重新寻找产品市场契合点,全球范围内多数产品仍停留在简历优化、AI面试等“功能阶段”,真正贯穿全链路的系统尚未成熟,渗透率非常低[11][35][37] - **与传统平台的差异**:传统招聘平台即使上线AI功能,也难转向“AI服务逻辑”,因为这会动摇其原有的流量与广告收入模型[41] - **构建核心壁垒**: 1. **形成数据飞轮**:每一次推荐、沟通、反馈都沉淀为可学习数据,推动AI进化[43] 2. **用真实数据让Agent持续迭代**:AI通过真实交互持续成长[44] 3. **打通B、C两端形成完整闭环**:让系统同时理解企业需求与候选人画像,从“推荐岗位”进化为“撮合结果”,并用规模化数据验证系统的自我演化能力[44] - **全链路的门槛**:全链路的最大价值在于**数据闭环**,而非功能连通,整合全链路的门槛极高,需要同时懂招聘业务逻辑、AI工程与系统设计,并拥有自营业务场景进行持续验证和数据反哺[29] AI与人的协同及商业化思考 - **AI与猎头的关系**:AI**不会完全替代猎头**,其价值在于“提升效率”而非“取代人”,AI在知识广度和分析速度上超越人类个体顾问,但在捕捉语气变化、潜在动机及建立信任等复杂场景中,与真人顾问仍有差距,在中高端市场,AI更多扮演增强和协同角色;在中低端标准化程度更高的市场,AI有望更快实现全流程自动化[24][25] - **商业化与估值逻辑**:海外AI求职产品估值较高,原因包括当地**人力成本高**(如硅谷HR薪资与算法工程师持平),替代人工的ROI立竿见影;企业订阅文化成熟,客户愿为SaaS产品长期付费,使得用户生命周期价值可预测性强;以及更成熟的风投与退出机制[38] - **公司背景与起源**:小麦招聘从人力资源公司TTC孵化,TTC自2022年成立起就定位为科技公司,已服务**超过1000家泛AI行业客户**,覆盖**10万+ AI从业者**,并完成了内部AI化转型,沉淀了行业知识库与AI能力,为推出直接面向B/C两端的产品奠定了基础[23]
睿亿科技创始人樊睿哲:从6万本金到管理8000万美金,AI量化投资的跨界新星
搜狐财经· 2025-11-28 11:15
公司创始人与背景 - 温州睿亿科技有限公司创始人樊睿哲大学期间以6万元人民币起步投资,目前个人资产突破1.6亿元 [2] - 其创立的RY Capital管理规模达8000万美元 [2] - 2021年创始人获得“第21届全国职业金融投资大赛”冠军,并在“第八届全国证券投资模拟实训大赛”区域赛中带领团队获市场交易组东部赛区团队一等奖 [2] 公司业务与技术发展 - 公司专注于金融科技领域创新与研发,在AI量化交易与数字货币投资分析领域取得突破 [2] - 自主研发的“数字货币量化投资AI技术应用软件”获得多项技术认证并应用于实际投资决策 [2] - 构建了具备自主知识产权的AI交易系统,融合多因子模型、机器学习与动态风控机制,能在高频交易中实现稳定超额收益 [4] 投资机构表现与合作 - RY Capital在三年内管理规模从200万美元增长至8000万美元,投资回报超过40倍,年化夏普比率稳定在2.3以上 [4] - 2025年1月RY Capital与AC Capital联合宣布推出一支专注于加密资产二级市场的基金,规模达5000万美元 [4] - 该基金由双方共同管理,计划投资于多种主流虚拟资产 [4] 跨界布局与产业协同 - 以杭州、温州为支点布局商业地产、供应链管理、汽车租赁、内容传媒等多个实体板块 [6] - 通过睿亿商业地产、睿亿供应链管理等企业串联资金流、物流与品牌流,形成去中心化实业网络 [6] - 创始人提出“用结构去对抗不确定性”的投资哲学,将投资决策转化为数据驱动的自动化流程 [5] 行业影响与观点 - 创始人频繁活跃于行业前沿论坛,曾在香港Web3峰会期间与以太坊创始人Vitalik Buterin同台并就AI与Web3融合路径发表观点 [6] - 强调AI Agent将在区块链系统中扮演自动化金融交互主体的技术趋势 [6] - AC Capital与RY Capital的合作被视为加密资管领域新范式,标志着工程语言、金融逻辑与跨界视野共同驱动的新时代开启 [7]
服务品牌出海的AI Agent企业QuickCEP,拿到了近亿元融资
搜狐财经· 2025-11-28 08:28
融资与战略规划 - 北京快牛智营完成近亿元融资,由啟赋资本领投,老股东复星锐正超额跟投 [1] - 融资后公司将依托行业领跑地位,持续通过AI赋能中国品牌出海企业,进一步夯实跨境电商领域业务布局 [1] - 服务将延伸至海外物流、汽车出海、金融出海、游戏出海等领域,并继续扩大海外市场收入规模 [1] 客户基础与市场地位 - 公司服务客户包括泡泡玛特、TCL、荣耀手机等中国知名品牌,以及傲雷、几素、赛维时代等原生DTC跨境品牌,还包括海外提供实体服务的物流、茶饮品牌企业 [1] - 已服务中国出海品牌Top 100强中的60家 [3] - 2025年收入同比增长超400%,用户规模和客单价双双增长超200% [3] AI Agent解决方案的核心价值 - AI Agent具备推理、记忆、反思、执行任务的能力,可支持品牌满足全球消费者营销和运营的各个场景需求 [2] - 80%的企业借助AI Agent在导购和销售环节给予客户满意回复和正确引导,AI能基于客户需求和意图进行准确售前答疑 [2] - 90%的客户通过AI Agent完成海外售后服务体系的搭建,AI Agent能够7X24实现服务接入,85%的消费者会与AI进行良好互动并在完成服务后给予5星好评 [2] 行业趋势与公司定位 - 中国品牌出海正从2.0向3.0过渡,3.0阶段要求企业在海外本地提供更加具体和多样化的营销和服务体验 [2] - AI能帮助企业解决语言差异、时差、文化、人才筛选等问题,助力实现过渡 [2] - 公司定位为“Consumer Engagement Platform”AI Agent的消费者运营系统,致力于让每一个出海品牌都具备世界级的用户运营能力 [4] 技术能力与产品优势 - 公司能够把海外消费者从接触品牌的第一刻开始,一直到整个消费者生命周期,与组织的营销、运营、客户服务、用户体验进行串联和协作 [5] - AI Agent具备对消费者和客户全周期“记忆”能力,会记忆客户与品牌的每一次互动,并建立标签画像体系,为后续营销转化和售后服务提供准确且有温度的体验 [5]