Workflow
智能体
icon
搜索文档
阿里智能体多轮推理超越GPT-4o,开源模型也能做Deep Research
量子位· 2025-06-06 04:01
核心观点 - 通义实验室推出自主信息检索智能体WebDancer,具备多步推理与连续动作执行能力,解决复杂信息检索需求[1][2] - WebDancer通过创新的数据合成方法(CRAWLQA、E2HQA)和两阶段训练策略(监督微调+强化学习),显著提升智能体在开放网络环境中的适应性与泛化能力[5][6][12][13] - 实验结果显示WebDancer在GAIA、WebWalkerQA等基准测试中性能超越主流基线模型,最高达到61.1% Pass@3分数[17][18][19][20] 背景与挑战 - 传统搜索引擎难以满足深层次、多步骤信息获取需求,尤其在医学研究、商业决策等领域[3] - 构建智能体面临训练数据稀缺(现有数据集如2WIKI仅支持浅层问题)、复杂网页解析、多步决策等挑战[4][5] 数据构建创新 - **CRAWLQA**:模拟人类浏览行为爬取权威网站(arXiv、Wikipedia),生成多样化真实问答对[6] - **E2HQA**:采用"由简到难"策略构建多步推理问答,通过问题改写保持答案合法性[6] - 数据过滤采用规则剔除重复/冗余内容,确保逻辑性与多样性[9][10] 训练方法 - **监督微调(SFT)**:屏蔽Observation干扰,专注Thought-Action损失计算,提升鲁棒性[12] - **强化学习(RL)**:采用DAPO算法动态采样低利用率数据,优化奖励函数设计,降低训练成本[13][15] 实验结果 - **GAIA数据集**:WebDancer+QwQ-32B组合达到56.4% Level 1准确率,显著高于Qwen-2.5-32B(20.5%)[20] - **WebWalkerQA数据集**:中等难度任务中WebDancer表现最优(55.0% vs 基线35.0%)[20] - **BrowseComp数据集**:中文任务得分22.2,远超GPT-4o(6.2)[21][22] 未来方向 - 扩展工具集成(浏览器建模、Python沙盒)以支持更复杂任务[29] - 从短答案检索向开放域长文本写作任务延伸,提升生成能力[30] - 通过原生ReAct框架推动开源Agentic模型生态建设[30][31]
突破视频时长限制!Manus上架视频生成功能,网友:比Sora更好
量子位· 2025-06-04 09:14
视频生成技术突破 - Manus通过连续拼接技术突破视频时长限制,可将多个5秒视频自动合成为完整故事[1] - 仅需一个提示词即可自动规划场景、制作视觉效果并呈现完整视频[5] - 采用"智能体style"生成方式,与其他平台功能联动(如生成神话形象并创建展示平台)[7][8] 产品功能与用户测试 - 当前功能仅限会员使用,普通用户暂不可用[9] - 生成流程分三步:需求明确→分段生成→剪辑合成[23] - 用户测试显示10分钟可生成30秒视频,消耗约1000积分[24] - 支持自然语言编辑,精通编辑者可批量制作视频[29] 技术优势与行业影响 - 呈现"拍电影"式生成形态,Agent自动分镜并合成故事[16] - 视频优化门槛降低,理论上支持无限生成与直接优化[36][40] - 采用神经网络实时生成技术,根据用户注意力训练模型[43] 公司近期动态 - 5月13日开放免费注册,新用户获1000积分+每日300积分[47] - 陆续推出图像生成、团队协作、PPT制作等新功能[48][49][50] - 与微软达成合作,加速布局智能体赛道[49][51] 用户反馈与产品现状 - 网友评价开启"新纪元",但效果未显著超越竞品[13][18] - 生成质量不稳定,部分效果被指"噱头大于实际"[32][34] - 积分消耗低于预期,玄幻类内容生成优于Sora[21][20]
智能体成下一代用户界面,AI手机龙头实现逆势上扬
财富在线· 2025-06-04 07:03
全球智能手机市场概况 - 2025年第一季度全球智能手机市场出货量达2 969亿台 [1] - 全球智能手机市场收入同比增长3% [2] - 中国智能手机销量同比增长2 5% [2] - 2025年中国新一代AI手机市场出货量预计达1 18亿部 同比增长59 8% 占整体市场的40 7% [3] 行业技术趋势 - 智能体正成为趋势 被视为下一代用户界面 [1][2] - 未来智能手机将呈现多智能体共存格局 互联网巨头可能在OEM版本基础上开发自有Agent [1][2] - 单台智能手机可能共存多个智能体 分别作为不同服务的入口 [2] - AI agent能根据简单指令执行任务 并在后台协同完成任务 [2] - 智能体重塑全球科技格局 不仅能回答问题还能执行任务 [2] 市场竞争格局变化 - 手机厂商争相布局AI 以避免沦为硬件组装厂 [3] - 自有智能体将成为中介 把用户需求导流至合作伙伴 [3] - 智能体可能成为手机厂商强大的变现工具 [3] - 当前手机厂商掌握应用分发主导权 尤其在中国市场 [3] 联想集团市场表现 - 联想智能手机业务在美国市场增长15% 市场份额位居前三 [1] - 联想摩托罗拉2025年Q1收入达34 2亿美元 同比增长16 7% [6] - 联想全球市场份额2 5% 同比提升0 3个百分点 增速16 4%远超行业4 3%的平均水平 [6] - 北美市场收入10 1亿美元 同比增长20 4% 份额3 6%排名第四 [6] - 美国市场收入9 9亿美元 排名从第四升至第三 [6] - 亚太新兴市场营收同比激增92 1% [6] 联想产品与技术布局 - 摩托罗拉Razr系列折叠屏手机在高端市场树立独特品牌形象 [7] - moto razr 60 Ultra AI元启天禧超级智能体支持全天候私人管家功能 全局语音唤醒 跨应用操作 [7] - 支持DeepSeek-R1大模型 复杂问题即时解答 [7] - 具备AI识屏与翻译功能 支持12种语言实时翻译 [7] - 超级互联2 1实现与联想电脑 平板无缝协作 [7] - 联想发布超级智能体天禧 核心能力包括感知与交互 认知与决策 自主与演进 [9] - 天禧的发布标志"超级智能体"从概念走向规模化落地 [9] 联想战略与前景 - 公司基于AI agent领域布局 将进一步上扬业务增长曲线 [1] - 通过多元产品矩阵满足不同层次消费者需求 [6] - 积极布局端侧AI 将AI同自身产品深度融合 [6] - 在AI驱动的技术创新周期中把握机遇 增强产品竞争力 [9]
当AI从卖工具,变为卖收益,企业级AI如何落地?丨ToB产业观察
搜狐财经· 2025-06-03 03:54
AI行业趋势 - 红杉资本合伙人Pat Grady认为AI下一阶段的核心是"卖收益"而非工具,OpenAI CEO和谷歌首席科学家均认同这一"万亿美元机会"的观点[2] - 英伟达研究主管Jim Fan提出具身智能时代的关键指标是"机器人通过物理图灵测试时,收益=自动化的现金流"[2] - IBM CEO指出当前AI需聚焦四大层面:智能体、数据、集成、基础设施[2] 企业AI落地关键 - 企业AI落地的三大核心问题:高质量数据获取、数据应用效率、数据价值转化,其中数据被视作"核心生产力"[3] - 制造业中AI与传统自动化设备(如流水线、机械臂)的融合成为技术发展关键点,视觉识别技术已实现零部件自动检测(提升效率与准确度)和操作流程监控(降低事故率)[3][4] - 企业级智能体需满足三大要求:实际场景有效性、技术复用性、可量化ROI[5] 智能体市场动态 - OpenAI推出o3/o4-mini推理模型,预测2029年AI Agent营收将超ChatGPT,2030年总营收达1740亿美元[6] - 头部厂商加速布局:阿里"心流"智能体公测、百度发布"心响"超级智能体、联想推出三大超级智能体矩阵[6][7] - IBM发布企业级智能体解决方案watsonx Orchestrate,预集成80+企业应用,支持多智能体协同及现有IT资产整合[7] 垂直领域应用案例 - IBM AskHR智能助手处理94%的HR问询,降低40%运营成本,同时推出HR/代码/维修等垂直场景智能体[8][10] - 车企案例显示AI从维修部门(构建知识库)向客服/财务/HR/销售部门复用的路径,验证ROI后大规模部署[12] - 研发领域通过watsonx Code Assistant提升代码开发效率,生成式AI构建专属知识库加速研发流程[10][11] 技术实施差异 - 企业级智能体与C端产品的核心差异:需杜绝"幻觉",依赖专有数据训练而非大参数模型[8] - 制造业数据质量分层明显,ERP系统数据质量优于其他系统,直接影响智能体落地难度[9] - 实施方法论强调"从点及面":选择细分场景POC验证,再规模化复制[12]
“令人敬畏”的粤产AI企业背后 智能体狂飙与“全球化”博弈
搜狐财经· 2025-05-31 22:06
中国AI行业竞争格局 - 英伟达CEO黄仁勋评价中国AI竞争对手"相当令人敬畏",特别提及广东头部企业如腾讯转向华为的现象[2] - 中国AI技术发展迅猛,五个月内从DeepSeek惊艳全球到获得国际顶级玩家认可[2] - 腾讯与阿里分别通过"落地生根"和"扬帆出海"战略推动行业创新[2] 腾讯AI战略与业绩表现 - 腾讯首次全景展示大模型战略,涵盖混元大模型、AI云基础设施、智能体开发工具等[3] - 2025Q1腾讯营收同比增长13%,净利润增长22%,毛利率达55.8%,经营利润率35.2%[3][4] - ToB业务收入549.1亿元(+5%),企业服务双位数增长受益于AI收入及云服务提升[5] - 智能体应用被视为元年,微信或形成独特智能体生态连接社交图谱与小程序[5] - 腾讯AI工具ima半年内成为明星产品,资源投入不设算力人力限制[6] - QQ浏览器升级AI浏览器,集成混元与DeepSeek双模型,推出高考智能体等五大功能[7] 阿里云全球化与AI投入 - 阿里宣布未来三年投入3800亿元建设云和AI基础设施,超过去十年总和[9] - 阿里云加速打造全球云计算网络,增强出海服务团队,推动中国企业全球化[9] - 2025Q1阿里年营收9963.47亿元(+5.86%),净利润同比增62.62%[10] - 阿里云收入连续七季度三位数增长,2025财年收入实现双位数增长[10] - 公司计划3-5年内所有业务AI驱动,传统行业如养殖、制造业加速AI应用[10] 粤港澳大湾区AI生态 - 广东形成"硬核技术+超级应用+海量场景"的独特AI生态[12] - 腾讯与文博会合作开发AI会展助手"文小博",集成混元与DeepSeek模型[12] - 华为芯片能力被评价为"每年成倍增长",产量大幅提升[12]
下一代入口之战:大厂为何纷纷押注智能体?
36氪· 2025-05-30 04:09
智能体的定义与核心价值 - 智能体(AI Agent)是具有自主规划、决策和执行能力的智能应用,区别于传统对话式AI,能深度理解用户意图并完成任务[2] - 智能体改变了人机协作范式,用户仅需发出指令即可完成复杂任务,无需主动操作工具[1][6] - 类比云计算架构:大模型相当于IaaS(基础设施),平台工具相当于PaaS(平台服务),智能体相当于SaaS(软件服务),提供即买即用的智能[2] 智能体的应用场景与优势 - **To B场景**:智能体可简化企业系统操作,用户通过自然语言指令即可自动调用系统资源完成任务,提升生产力[3] - **To C场景**:例如酷开超级智能体电视,用户通过语音描述电影情节即可直接播放,并联动智能家居调节环境[5] - 智能体成为下一代交互入口,掌握用户需求承接权意味着控制资源分配权[6] 智能体行业竞争格局与三大流派 - **AI厂商派**(百度、谷歌、OpenAI等):以大模型为底座构建智能体开发生态,目标打造类似AppStore的智能体分发平台[8] - **企业服务派**(微软、IBM、阿里云等):聚焦垂直场景,将智能体集成至企业现有系统,解决财务、销售等业务自动化问题[9] - **软硬件厂商派**(华为、酷开、三星等):将智能体植入终端设备,例如酷开超级智能体实现1.5秒内响应,形成"长记忆、快思考、秒行动"标准[11] 智能体发展趋势与挑战 - **垂直智能体优先落地**:医疗、教育等场景的垂直智能体因边界明确、行业知识丰富,比通用智能体更早实现实用化[16] - **多智能体协同需求**:复杂任务需多个智能体协作,如酷开超级智能体已展示家庭服务整合能力,但多数产品仍停留在单任务阶段[17][18] - **硬件入口价值提升**:智能体重塑硬件交互逻辑,电视、学习机等设备可能成为服务中枢,例如教育智能体实现"千人千面"个性化方案[19][20] 行业动态与市场潜力 - 红杉AI峰会预测智能体市场潜力为"10倍于云计算"[1] - 2025年谷歌I/O、微软Build等大会均将智能体列为核心议题,覆盖编程、医疗、金融等行业[1] - 酷开在2025年春季发布会推出六大智能体构成的超级智能体系统[1]
AI浪潮录丨王晟:谋求窗口期,AI初创公司不要跟巨头抢地盘
贝壳财经· 2025-05-30 02:59
北京AI产业发展 - 北京正成为AI大模型领域的战略高地,汇聚了智源研究院的"悟道"大模型、月之暗面、智谱等人工智能独角兽 [1] - 北京积极打造"全球开源之都",开源技术已深入汽车、机器人等行业 [1] - 在北京市科委和中关村管委会支持下,新京报AI研究院推出"AI浪潮录"专栏,深度访谈AI浪潮亲历者 [1] 投资人视角 - 天使投资人是AI初创企业迈出"第一步"的关键支持者,英诺基金较早关注生成式模型潜力,2022年6月投资了深言科技 [4][5][6] - 投资人更青睐有经验的创始人,如深言科技的岂凡超团队虽有技术实力,但融资竞争力不如王小川、王慧文等有创业经历者 [12] - 过半投资项目为"水下"项目,不投资完全市场化、公开化的路演项目 [14] AI大模型发展历程 - 2013年以CV和自动驾驶为主导的第一波AI浪潮,2018-2019年"AI四小龙"经历高峰与低谷 [7] - 2018年BERT出现,大幅提升NLP能力,Transformer架构提供多元化能力 [7] - 2020年OpenAI发布GPT3和Diffusion模型,显示AI多维爆发潜力,新时代到来 [8] - 2021年底国内除百度和阿里外,仅智源研究院关注大模型方向 [8] 创业者特点 - 当前AI大模型创业者多为科学家或"技术大牛",圈子收敛,属于科学共同体 [18] - 学术能力和科研能力是基本保障,高技术壁垒要求创业者是学界或行业翘楚 [16] - 高校技术基因影响创业,清华和浙大创业文化最踊跃,哈工大技术强但创业者较少 [16] 投资策略 - 天使基金偏向长期主义,关注公司创新力度和生产力提升,接受企业长期亏损 [21] - 体系化布局产业链上下游,如机器人领域投资机器人公司、供应链公司和场景化公司 [22] - 2024年投资重点是Agent(智能体),DeepSeek验证了推理模型前景 [23] 行业趋势 - Llama开源缩短了大模型研发差距,使创造新模型不再困难 [13] - 大模型训练从"暴力美学"转向细致工程化,"用钱换能力"路径失效 [26] - 初创公司应避免在超级共识形成后做无窗口期的事,不要试图占领巨头地盘 [27][28] - 产业在推动AI技术范式上的作用增强,论文数量和质量超过学界 [20]
Jeff Dean:一年内 AI 将取代初级工程师,网友:“Altman 只会画饼,Jeff 说的话才致命”
AI前线· 2025-05-28 05:17
谷歌AI发展现状与未来展望 - 谷歌传奇工程师Jeff Dean预测一年内将出现具备初级工程师能力的24/7全天候AI系统 [1][14][15] - 谷歌在AI领域贡献包括Transformer架构、BERT论文、TPU研发等关键技术 [1][5] - 谷歌AI发展遵循"模型越大、数据越多、结果越好"原则,12-15年来持续验证该规律 [5][6] AI技术演进路径 - 多模态成为重要趋势,AI可处理音频/视频/图像/文本/代码等多种输入输出形式 [6] - 智能体技术潜力巨大,未来几年物理机器人智能体将能完成数十种实际工作 [7][8] - 知识蒸馏技术可将强大模型压缩为轻量级模型,适配更多应用场景 [8][9] 硬件与基础设施 - 谷歌TPU硬件历经多代演进,最新Ironwood将接替Trillium版本 [17] - Pathways系统实现单一Python进程控制上万设备,已向云客户开放 [20] - 模拟计算在功耗效率方面具优势,数字计算仍有专业化空间 [18][19] 行业竞争格局 - 构建最先进模型需巨额投资,最终市场可能仅存少数几个通用强大模型 [8][13] - 算法改进与硬件投入同等重要,Gemini模型代际演进中算法贡献显著 [13] - 稀疏模型(如混合专家结构)可提升10-100倍效率,是未来重要方向 [26][27] AI应用场景突破 - AI已能根据YouTube视频自动生成教育游戏,成功率约30% [11] - 大型多模态模型将重塑搜索引擎,可能深度集成至Chrome浏览器 [12] - AI加速科学发现,神经网络替代传统模拟器速度提升30万倍 [18][19] 开发者生态 - 云TPU开发者体验存在改进空间,正推进Google Cloud与Gemini堆栈统一 [21] - 计算范式变革要求算法分析需考虑网络/内存带宽等硬件特性 [24][25] - 未来计算平台需适应训练/推理差异化需求,平衡资源分配 [22][23]
腾讯AI,加速狂飙的这半年
雷峰网· 2025-05-27 13:15
腾讯AI战略加速 - 公司从低调布局转向快速落地阶段,2024年第一季度资本开支达274.8亿元,同比增长91% [2][4] - 组织架构调整推动AI业务整合,混元大模型团队、QQ浏览器等并入云与智慧产业事业群(CSIG) [2][22] - 高层战略决心明确,马化腾在年会上强调持续投入算力并推动产品化落地 [25] 模型技术突破 - 混元TurboS大语言模型全球排名第八,理科推理能力提升10%,代码能力提升24%,竞赛数学成绩提升39% [6][7] - 混元T1模型在竞赛数学、常识问答、复杂任务Agent能力分别提升8%、8%、13% [7] - 多模态技术实现代际飞跃:图像生成达毫秒级,3D模型几何精度提升10倍,文生3D在17个类目中15项第一 [8] 产品化与场景落地 - 推出游戏视觉生成模型,美术设计效率提升数十倍,覆盖技能特效、角色立绘等五大子模型 [9] - 智能体开发平台支持零代码多Agent协同,演示案例中5分钟完成跨境寄件全流程 [12][15] - 知识库产品腾讯乐享实现企业人效两位数提升,科沃斯案例节省百万级运营成本 [17][18] 市场与用户增长 - 腾讯元宝接入DeepSeek-R1后下载量跃居苹果免费榜第二,Q1月活达2358万,环比增长1546% [23] - QQ浏览器升级AI功能后用户活跃度提升,内置QBot支持双模型调用,覆盖4亿用户 [24][25] 行业趋势与竞争 - 全球AI智能体市场规模预计从2024年52.9亿美元增至2035年2168亿美元,年复合增长率40.15% [18] - 国内大模型竞争加剧,DeepSeek等对手推动公司加速资源集结与产品迭代 [21][22]
百度心响上线iOS版,多智能体协作应用终于卷对地方了
量子位· 2025-05-27 03:53
产品发布与更新 - iOS版心响APP正式上线 苹果用户可通过APP Store搜索下载[2] - 安卓与iOS版本均实现完全免费且不限次数使用[3][4] - 新增网页生成功能 可自动将长文本转化为图文并茂的模块化网页[10] 核心功能与用户体验 - 支持多场景智能体协作 包括旅游攻略生成 深度研究 法律咨询 试题讲解等[14] - 旅游攻略功能可自动拆解任务 调用221篇攻略数据 节省用户37小时20分钟规划时间[17] - 深度研究功能可生成专业级分析报告 如小米3nm芯片报告包含技术解析 竞品对比 战略意义等模块[40] - 健康咨询功能集成多位医生AI分身 可逐步询问症状并生成综合诊断建议 覆盖100+检查报告类型[46][48] - 工伤赔偿计算功能依据地区法规自动生成赔偿方案 显示具体计算过程与法律依据[58][61] 技术架构与创新 - 采用1个主智能体+多领域智能体架构 主智能体负责任务拆解与调度[66] - 支持MCP Server接入 开发者可扩展智能体能力[66] - 实现完全自主执行 用户确认需求后可在后台自动运行并交付结果[62][69] - 当前覆盖10大场景200+任务类型 计划扩展至10万+任务类型[65] 市场竞争与行业趋势 - 智能体应用成为行业焦点 谷歌 Claude等厂商均重点布局[72][73] - 产品差异化体现在零门槛交互 无需邀请码/提示词工程 直接解决实际问题[69][79] - 未来将上线图片/文件输入功能 首页改版为个性化模式[70]