Workflow
AI智能体
icon
搜索文档
锦秋基金与 NVIDIA 初创加速计划共话AI智能体与出海新机遇|Jinqiu Spotlight
锦秋集· 2025-10-09 06:10
活动概述 - 2025年9月成功举办以“AI智能体与物理AI出海”为主题的NVIDIA创业企业展示——北京站活动 [1] - 活动聚焦AI智能体与物理AI的前沿技术,并深度讨论AI出海等热门议题 [1] - 锦秋基金与NVIDIA、亚马逊云科技、丽台科技等多家企业组织共同举办本次活动 [1] 活动核心内容 - 活动包含嘉宾主题演讲及圆桌讨论环节,圆桌主题为“解锁全球增长引擎——技术驱动、生态共建的AI出海新范式” [1] - 路演环节有13家来自NVIDIA初创加速计划的会员企业进行展示,覆盖具身智能、智能制造、AI文创、AI营销、生物科技等多个领域 [4] - 活动吸引了众多创业者、投资人与产业同仁到场参与及对接 [4] 公司战略与关注点 - 锦秋基金将持续关注AI Agent的技术趋势与AI出海的产业格局变化 [5] - 公司积极寻找处于创新前沿的技术产品新锐人物及团队 [5] - 锦秋基金作为12年期的AI Fund,以长期主义为核心投资理念,寻找具有突破性技术和创新商业模式的通用人工智能初创企业 [9] 行业生态合作 - NVIDIA初创加速计划为免费会员制,旨在培养颠覆行业格局的优秀创业公司,提供产品折扣、技术支持、市场宣传、融资对接等服务 [10] - 亚马逊云科技云创计划是一个全球性创业加速扶持计划,为初创企业提供云资源和技术服务,帮助其加速发展 [11]
独家洞察 | CTO拆解AI智能体:摸透金融的下一个增长引擎!
慧甚FactSet· 2025-10-09 03:52
AI智能体的核心定义与能力飞跃 - AI智能体是人工智能系统的重大飞跃,超越生成式AI的信息检索和语言处理层面,能够代表用户执行操作[4] - 智能体能够理解用户目标、制定行动方案、与工具及数据交互、不断迭代并进行逻辑推理,最终自主完成任务[4] - 具备对环境的感知能力,能实现自主学习并与其他智能体交互[4] 推动AI智能体崛起的关键因素 - 智能体能够以前所未有的速度、规模和复杂程度执行任务[5] - 传统自动化依赖僵化模式和逻辑,稳定性差,界面或服务更新后易失效[5] - 现代智能体融入更强推理能力,通过灵活逻辑与推理处理复杂工作流程,并通过反思迭代不断修正任务[5] - 智能体使AI成为真正的效率工具,增强人类在创新、研发和战略思考方面的能力[5] 智能体的技术架构与交互机制 - AI智能体通常依赖LLM作为"大脑"或实现不同技能模块[6] - LLM帮助智能体进行计划与推理,实现API中结构化与非结构化输入输出的转换[6] - LLM与工具/服务结合形成强大合力:LLM提供推理和自然语言处理能力,工具/服务提供精确性、可靠性及API接入现实世界操作的能力[6] 标准化协议与互操作性发展 - MCP(模型上下文协议)作为新标准被广泛采用,本质是一种协议,允许工具声明自身功能并让LLM安全可预测地调用这些工具[7] - MCP为LLM与外部工具/服务/数据之间搭建标准化接口,提高互操作性、可扩展性与可靠性[7] - FactSet慧甚将服务、功能与数据封装为通过API开放的微服务,为智能体发展奠定优势,这些API可轻松适用于MCP服务器[7] 智能体在金融工作流程中的具体应用 - 智能体通过为用户分担工作、提供大规模新洞察来提升整个行业效率[8] - 最高性能依赖高度专业化智能体,这些"专家级"智能体在特定任务或数据领域经过专门训练[8] - 企业需明确工作流程中能够触发人工操作的"信号",将市场数据变化或事件作为触发AI智能体自主操作的起点[9] - FactSet慧甚的Signals Product和API能推送市场动态、机器学习预测信号及数据重大变化,这些原本由人工完成的操作正逐步转向智能体自主执行[9] 数据质量与基础设施的关键要求 - 干净、妥善记录且标注清晰的数据是AI智能体取得成功的最关键因素[10] - 错误数据会导致错误操作,且鉴于智能体自主性,这类错误会大面积发生[10] - 企业需确保数据支持LLM做出明智决策,关键举措包括:解决数据质量问题、通过丰富元数据详细描述标记数据、投入资源搭建系统确保数据大规模程序化供智能体使用、建立可追溯至数据源的审计机制[10] - 数据应被视为关键基础设施[10]
想选AI智能体培训,论靠谱程度,麟哥团队没理由不被考虑吧?
搜狐财经· 2025-10-08 12:20
行业积累 - 讲师团队拥有二十余年的技术实践积累,从早期互联网电商运营到AI营销落地均有涉猎 [1] - 团队创始人刘哲麟是国内较早接触AI营销的从业者之一,见证过智能技术在产业中的迭代过程 [1] - 团队成员包括来自阿里云、字节跳动等企业的技术人员,如张冲老师拥有10年AI算法研发经验并参与过智能体相关项目 [1] 课程设计 - 课程体系采用理论拆解加工具实操再加案例复盘的模式,解决理论与实操脱节问题 [2] - 将复杂智能体架构拆分为数据采集、特征提取等可上手操作模块 [2] - 细致拆解108个常用运营指令,每个技巧搭配场景化练习,从生成直播话术到优化文案逻辑 [2] - 2025年新增AI伦理与合规内容,贴合当下政策方向 [2] 学习成果 - 累计接触学员超1200人,不少学员在3个月内找到相关工作且薪资获得提升 [4] - 有学员开发的智能体系统应用于杭州亚运会场馆管理、萧山机场服务机器人等场景 [4] - 某环保设备企业参考团队分享的场景化训练法后,线索获取成本降低10.7% [4] - 团队提供终身学习资源库和企业对接渠道支持 [4] 资源支持 - 依托杭州数字经济地域特点,与当地市政府、之江实验室等机构合作 [4] - 学员有机会参与智慧亚运、数字孪生等项目的实习,形成培训-实习-就业衔接 [4] - 课程设置结合当地产业特色,如2025年新增AI加跨境电商专题,考虑杭州跨境电商发展需求 [4] 核心优势 - 团队具备二十余年实战积累,课程设计偏向实用,资源支持与产业结合 [5] - 教学内容能跳出纯理论局限,帮助学习者实现理论能落地、工具会使用、场景能适配 [5]
谷歌加入CUA战场,发布Gemini 2.5 Computer Use:让AI直接操作浏览器
36氪· 2025-10-08 07:06
产品发布与核心能力 - 谷歌DeepMind发布了基于Gemini 2.5的计算机使用模型Gemini 2.5 Computer Use,该模型允许AI直接控制用户的浏览器,执行点击、滚动和输入等操作 [1] - 模型的核心能力是通过Gemini API中新增的computer_use工具实现的,其工作流程为迭代循环:模型分析用户请求、当前环境截图和动作历史记录后生成UI动作函数调用,客户端执行动作后将最新截图和URL返回模型,循环直至任务完成或终止 [11][13] - 该模型主要针对网页浏览器优化,在移动端UI控制方面也展现出潜力,但暂未针对桌面操作系统级控制进行优化 [13] 性能表现与基准测试 - 在Online-Mind2Web基准测试的官方排行榜上,Gemini 2.5 Computer Use性能达到69.0%,高于OpenAI Computer-Using Agent模型的61.3% [5] - 在WebVoyager基准测试中,模型自报告成绩为88.9%,高于OpenAI模型的87.0%;由Browserbase测量的成绩为79.9%,高于Claude Sonnet 4.5的71.4%和OpenAI模型的61.0% [5] - 在AndroidWorld基准测试中,模型性能达到69.7%,高于Claude Sonnet 4.5的56.0%和Claude Sonnet 4的62.1%,其速度表现也优于其他对比模型 [5] 实际应用演示与当前局限 - 官方演示显示,模型能准确完成从指定链接获取宠物详细信息并添加到水疗中心CRM系统,以及为艺术俱乐部整理看板笔记等任务 [3][4] - 在演示环境中,模型完成简单任务(如在维基百科上找到John Wick页面)时准确度较高,但执行稍复杂任务(如找到页面后总结信息并给出中文版,或整理指定网站的报道)时容易失败 [8] 行业竞争与战略意义 - 谷歌DeepMind发布Gemini 2.5 Computer Use标志着AI智能体领域的竞争进入白热化阶段,科技巨头正竞相定义未来的人机交互方式 [16][17] - 这一发布被视为一个清晰信号,表明通过自然语言直接驱动数字世界的时代正在加速到来,键盘和鼠标的主导地位受到挑战 [17] 安全机制与开发者资源 - 为应对用户恶意使用、模型意外行为及网页环境下的提示词注入与诈骗等风险,公司在模型训练阶段直接融入了安全机制 [14] - 公司为开发者提供了安全控制选项,包括逐步安全服务(在推理阶段由独立服务评估每个拟执行动作)和系统指令(可设定在高风险操作前必须拒绝或请求用户确认),以防止模型自动执行如损害系统完整性、绕过验证码等潜在高风险操作 [14][15] - 开发者已可通过Google AI Studio和Vertex AI的Gemini API获取这些能力,也可在Browserbase托管的演示环境中进行试用 [8]
谷歌加入CUA战场,发布Gemini 2.5 Computer Use:让AI直接操作浏览器
机器之心· 2025-10-08 03:18
产品发布与核心能力 - 谷歌DeepMind发布了基于Gemini 2.5的计算机使用模型Gemini 2.5 Computer Use,该模型允许AI直接控制用户的浏览器,执行点击、滚动和输入等操作[1] - 模型在视觉理解和推理能力的基础上,能够准确快速地完成收集网络信息与执行动作、整理杂乱笔记等任务[5] - 其核心能力是通过Gemini API中新增的computer_use工具实现的,开发者需在一个循环流程中运行,输入包括用户请求、当前环境截图和最近执行动作的历史记录[15][17] 性能基准测试表现 - 在Online-Mind2Web基准测试中,Gemini 2.5 Computer Use在官方排行榜上的成绩为69.0%,由Browserbase测量的成绩为65.7%,优于Claude Sonnet 4的61.0%和OpenAI Computer-Using Agent模型的44.3%[7] - 在WebVoyager基准测试中,其自报告成绩为88.9%,由Browserbase测量的成绩为79.9%,高于Claude Sonnet 4.5的71.4%和OpenAI模型的61.0%[7] - 在AndroidWorld基准测试中,其成绩为69.7%,高于Claude Sonnet 4.5的56.0%和Claude Sonnet 4的62.1%[7] - 模型的速度表现也优于其他几个相比较的模型[8] 当前能力局限性与可用性 - 模型在完成简单任务时准确度较高,但在执行稍微复杂的任务时容易失败,例如在维基百科上找到页面并总结信息给出中文版,或打开特定网站整理近期报道等任务均未能成功完成[9][11][12] - 开发者已可通过Google AI Studio和Vertex AI的Gemini API获取这些能力,用户也可在Browserbase托管的演示环境中试用,但最多仅支持5分钟的流程且不支持用户中途接管[13] 行业竞争与战略意义 - 谷歌DeepMind携Gemini 2.5 Computer Use入场,标志着AI智能体领域的竞争进入白热化阶段,科技巨头们正竞相定义未来的人机交互方式[25] - 这一发布被视为一个清晰的信号,表明键盘和鼠标的主导地位正受到挑战,一个通过自然语言直接驱动数字世界的时代正在加速到来[25]
北汽集团:发生翻车的212汽车与集团及旗下品牌北京越野无关;今年首个诺贝尔奖揭晓;美知名药店宣布关闭全美所有门店丨邦早报
创业邦· 2025-10-07 01:06
诺贝尔奖 - 2025年诺贝尔生理学或医学奖授予科学家玛丽·E·布伦科、弗雷德·拉姆斯德尔和坂口志文,表彰他们在外周免疫耐受方面的研究贡献 [1] 新能源汽车行业 - 阿维塔06新能源汽车在福建宁德起火,连带烧毁7辆邻车,涉事车辆为8月28日购置的新车,行驶里程1066公里,官方与消防正在调查中 [2] - 北汽集团声明发生翻车的212汽车与北汽集团旗下品牌北京越野无关,涉事车辆属于山东魏桥新能源汽车科技集团有限公司 [3] - 赛力斯一直在推进2024款问界M9汽车的硬件升级,工厂已完成第一批内部车型改造,涉及接近20万台车型 [5] - 五菱缤果S纯电小车上市不到10天销量突破1万台,指导价6.68万元起 [9] 人工智能与科技 - OpenAI在开发者日宣布多项更新,推动ChatGPT向综合性平台转型,包括Apps SDK、AgentKit、Codex编程助手正式上线以及扩展API [2][3] - OpenAI调整版权策略,Sora将允许正版动画角色客串出镜,未来引入正版虚拟角色合作功能 [6] - OpenAI和AMD宣布达成价值数百亿美元的合作协议,共同开发基于AMD处理器的AI数据中心,OpenAI获得AMD认股权证,允许其以每股1美分价格收购该芯片制造商最多10%股份 [6] - 脑机接口公司Neuralink首次提交包含人体数据的同行评审论文 [6] - 大疆跟拍手机稳定器Osmo Mobile 8曝光,售价149美元,预计2025年11月上市 [7] 汽车与交通 - 车评人陈震回应劳斯莱斯车祸,称已道歉并将全力支付应负担的赔偿,对方为滴滴网约车,有司乘人员保险 [5] - 法拉第未来表示FX Super One美国本土化生产组装方案已最终确定,团队全力冲刺年底实现美规版首车下线 [6] 游戏与娱乐 - 微软被曝将终止Xbox新主机开发,原定2026年投产的新主机计划转为悬而未决,公司可能转向全平台软件与服务战略 [6] - 任天堂向Switch盗版商James "Archbox" Williams索赔450万美元(约合3208.9万元人民币),因其通过Reddit子版块推广Switch游戏ROM下载服务 [6] 航空航天与国防 - 波音计划最快10月将737 Max月产量提高至42架,并为2025年4月和2026年底再次提高生产速度做准备,明年年底可能提升至每月约53架 [6] - 美国航空航天公司Firefly将以约8.55亿美元收购国家安全科技公司SciTec,其中3亿美元现金支付,5.55亿美元以股票形式支付 [7] 金融与并购 - 吉利汽车批准最高23亿港元的股份回购计划,将通过自动化机制于公开市场回购股份 [5] - Fifth Third Bancorp同意以约109亿美元股票交易方式收购Comerica Inc,缔造美国第九大银行,资产规模约达2880亿美元,每股交易价格较Comerica上周五收盘价溢价17% [7] - 美国知名连锁药店来德爱宣布关闭全美最后89家门店,正式终结60余年经营历史,公司负债已超40亿美元 [6] 制造业与经济 - 2025年9月全球制造业PMI为49.7%,较上月小幅下降0.2个百分点,连续7个月在49%-50%区间内,亚洲制造业PMI连续5个月运行在50%以上 [11]
从“招聘工具”到“人才生态”:人瑞人才(06919)押注AI智能体的三年
智通财经网· 2025-10-06 03:03
公司战略转型 - 公司通过万码优才平台实现从传统人力资源服务商向AI驱动的人才科技平台跃迁 [1] - 数字化转型始于2022年,历经三年从招聘工具演进为连接企业、人才与技术的生态枢纽 [2] - 平台90%以上功能由模型重构,语义理解与智能匹配取代传统关键词打分,实现以能力为中心的人岗匹配 [3] - 公司商业模式从靠人赚钱升级为靠系统和数据赚钱,突破传统人力服务的人力密集型天花板 [5] - 未来战略将持续提升平台AI能力,并将AI能力向灵活用工场景全流程延伸,构建从招聘到用工管理的数字化闭环 [10] 平台运营与技术能力 - 万码优才平台每日AI调用峰值突破500万次,每日Token平均消耗超过10亿 [1] - 平台2023年推出,2024年接入DeepSeek-V3大模型,2025年焕新接入R1大模型 [2] - 平台接入文心一言、阿里通义、讯飞星火等多款大模型,并自主开发应用层智能体 [2] - 核心AI功能包括智能发岗、智能简历解析、人岗精准匹配、智能盘活人才库、智能交互、智能面试等 [4] - 平台通过百万私域用户技术社区每日产生数万条专业讨论,AI系统从中挖掘潜在人才线索 [9] 财务与业绩表现 - 2025年上半年人均净利润同比增长34.5% [6] - 2025年上半年营收同比增长26.6%,数字人才生态链贡献显著提升 [8] - 2025年上半年数字技术与云服务板块贡献营收9.5亿元,占比达38.2% [8] - 数字技术与云服务板块贡献毛利占整体毛利比例约43.0%,已成为公司第二增长极 [8] 竞争优势与护城河 - 公司积累覆盖500多个岗位的用工需求、项目周期、人才结构与绩效反馈数据,形成训练AI模型的黄金语料 [6] - 累计上千万的外包员工及候选人数据库为AI模型提供海量岗位需求和行为数据 [6] - 业务—数据—技术闭环形成越用越聪明、越聪明越有用的飞轮效应,是纯技术公司难以复制的护城河 [6][7] - 通过与阿里云、百度智能云战略合作获得大模型应用优先接口,与德勤联合发布行业报告奠定标准制定话语权 [9] 生态构建与行业影响 - 平台为企业提供高效数字人才解决方案,为求职者提供全职业周期服务,成为技术人才的终身职业伙伴 [2] - 与华为战略合作鸿蒙生态人才培养,与百度、阿里达成AI人才培养计划 [4] - 平台重新定义人力资源服务本质:人才从静态资源变为动态资产,企业从雇主变为人才成长合伙人 [5] - 万码优才被视为第三代招聘网站的代表,是解决数字人才数量缺口与质量缺口的最优解 [8]
云迹科技通过港交所聆讯,冲刺“机器人服务智能体第一股”
经济观察网· 2025-10-05 05:41
上市进程 - 公司于10月3日通过港交所聆讯,从9月22日更新招股书到通过聆讯仅耗时10天 [2] - 公司通过18C规则申请上市,该规则允许未盈利科技企业上市 [2] - 若上市成功,公司将成为港交所“机器人服务智能体第一股” [2] 公司业务与技术定位 - 公司专注于机器人服务智能体研发与商业化,主打酒店场景,产品覆盖送物、迎宾、外卖配送等,并向医院、楼宇等场景延伸 [6] - 公司是国内少数同时掌握AI Agent系统与机器人本体技术的团队,具备“大脑(AI智能体系统)+四肢(机器人及功能套件)”全栈能力 [3] - 公司的智能体应用包含HDOS(离身服务智能虚拟助手)和YJ-Platform(集成平台)两个主要组成部分 [4] 技术能力与产品演进 - 公司已实现AI系统从“辅助工具”向“自主协同”的关键跨越,其技术核心是“具身智能+AI” [3][4] - 公司的服务能力闭环包括感知、认知、决策、执行、反馈五个层面,形成“越用越聪明”的进化闭环 [3][5] - 公司专攻酒店配送机器人赛道,共推出“润”系列、“格格”系列和UP系列三代产品 [6] 市场地位与财务表现 - 以2023年酒店场景收入计,公司以9%的全球市场份额和12.2%的国内市场份额位居行业第一 [7] - 以2024年收入计,公司在中国机器人服务智能体整体市场占有率为6.3%,酒店场景细分市场份额约为13.9% [7] - 公司营收从2022年的1.61亿元增长至2024年的2.45亿元,年复合增速23.2% [6] - 2025年前5个月营收为8833万元,同比增长18.9% [6] - 经调整净亏损由2022年的3.65亿元收窄至2024年的1.85亿元 [6] 运营数据与行业前景 - 截至2024年底,公司机器人进入全球超3.4万家酒店,单日在线峰值达3.6万台,累计服务超5亿次 [6] - 预计到2029年,中国机器人服务智能体市场将增长至135亿元,2024年至2029年的年复合增长率为29.3% [7] - 具身智能有望达成从“局部普及”到“广泛应用”的跨越,推动传统产业智能化转型 [6] 融资历史与股东背景 - 公司自成立以来共进行8轮融资,累计融资金额达12.02亿元 [7] - 投资方包括阿里巴巴、联想创投、腾讯、启明创投、携程等 [7]
Sora独立App爆火之后 OpenAI火速推进版权管控与AI变现框架
智通财经· 2025-10-04 07:03
核心观点 - OpenAI为其视频生成应用Sora推出精细化的版权控制选项和营收分成计划,旨在平衡AI创新与知识产权保护,同时探索变现模式 [1][2][3] - Sora以独立App形式上线,凭借其社交闭环和低使用门槛迅速获得市场认可,标志着AI应用从技术演示向成熟社交产品的跨越 [3][7][8] 版权管理与合作框架 - 公司将很快为内容权利所有者提供更精细化的角色使用控制选项,允许其决定角色在Sora中的使用方式并可随时允许或阻止使用 [1][2] - 计划与允许使用其版权的权利方分享营收数据或进行销售额分成,但具体框架需要通过试错来摸索并即将开始实施 [1][3][4] - 内容权利所有者涵盖大型影视制片厂、动漫游戏IP版权方、体育联盟吉祥物、品牌代言形象等主体 [2] - 版权政策并非一刀切许可,具体IP的使用及外部平台转发取决于权利人设置与各平台规则,例如迪士尼已选择不让其素材出现在Sora中 [3] Sora产品特性与市场表现 - Sora作为独立AI视频生成应用在美国和加拿大推出,生成视频长度最长可达10秒 [3] - 应用内置类TikTok信息流、二创/Remix功能,形成从生成到分发再到互动的社交闭环,极大降低使用门槛 [7] - 基于新一代Sora 2模型,强化了物理世界一致性、镜头稳定性和视听同步能力,并提供Cameos功能授权采集肖像/声纹 [7] - 应用上线后迅速登上苹果iOS免费应用榜首,同时也是苹果美国App Store“摄影与录像”类别第一名 [8] 行业竞争与影响 - OpenAI在多模态AI技术领域与Meta、谷歌等公司的文本生成视频工具展开激烈竞争,例如Meta近期发布了由AI生成短视频的应用Vibes [6] - 高盛认为Sora 2模型的风靡确认了“AI/大语言模型吞噬传统软件/应用”的叙事,可能对现有社交平台构成颠覆性威胁 [7] - AI应用软件发展方向集中于生成式AI应用以及能自主执行复杂任务的AI智能体 [6]
先发制人!Anthropic发布Claude 4.5 以“30小时独立编码”能力狙击OpenAI大会
智通财经网· 2025-09-30 02:05
新产品发布 - 公司发布全新人工智能模型Claude Sonnet 4.5,设计目标是进行更持久、更高效的代码编写[1] - 新模型在指令遵循能力上更出色,能连续自主编程长达30小时,而前代模型Claude Opus 4仅能处理约7小时任务[1] - 新模型优化了“借助用户计算机代执行操作”的功能,该功能在一年前推出,此次实现了进一步升级[1] 公司竞争地位与财务表现 - 在开发“AI智能体”领域,公司是早期领导者,尤其在简化代码编写与调试流程方面表现突出[2] - 公司估值已达1830亿美元,今年8月的年化营收突破50亿美元,其编码软件的受欢迎程度是推动增长的重要因素之一[2] - 包括OpenAI和谷歌在内的其他企业也在凭借类似功能竞相争夺程序员,公司发布新模型的时间恰在OpenAI年度开发者大会召开前一周[2] 产品性能与路线图 - 公司联合创始人兼首席科学官表示,Claude Sonnet 4.5在“几乎所有方面”都比公司最新的高端模型Opus更出色[2] - 公司也在研发Opus的升级版本,预计将于今年晚些时候推出,两种不同规模的模型各有应用场景,能从实际使用中分别获得改进灵感与收益[2] - 新模型在满足实际业务需求方面取得显著进展,在网络安全、金融服务等行业的特定任务中表现尤为突出[2] 行业挑战与合作 - 要让企业充分挖掘AI的价值,既需要AI模型本身的持续优化,也需要用户逐渐适应并调整自身工作流程[3] - 前沿AI实验室与企业之间还需建立更深层次的合作关系[3]