AGI

搜索文档
Manus还活着,还上新了
虎嗅APP· 2025-08-01 10:26
Manus新功能Wide Research发布 - 公司推出新功能Wide Research(广度研究),目前仅对Pro用户开放,未来将向Basic和Plus用户开放,暂无免费用户开放计划 [3] - 该功能是公司内部耗时最长的开发项目,耗时超两个月 [6] - 功能定位为"广度研究",与OpenAI的"深度研究"形成差异化竞争,直接挑战行业巨头 [6] 技术特点与性能对比 - Wide Research采用并行计算技术,可将任务拆分为批量子任务处理,计算能力扩展100倍,但算力消耗显著增加 [9] - 实际测试显示,Wide Research能完成全球前100MBA学校列表等广度任务,而ChatGPT Agent仅能处理10所学校 [7] - 功能演示显示可同时比较100双运动鞋或生成50张风格海报,展现横向扩展优势 [9] 用户成本与行业竞争格局 - 单个Wide Research任务预计消耗1000积分(子任务约10积分/个),远超免费用户每日300积分限额 [10] - 行业存在技术路线分化:Wide Research强在并行效率,Deep Research长于复杂逻辑推理,两者结果可靠性均需提升 [10] - AI Agent领域陷入同质化竞争,公司通过Wide Research实现差异化创新,突破行业"深度研究"内卷现状 [12] 战略意义与行业影响 - 新功能发布被视为公司技术实力的重要证明,回应市场对其发展状况的质疑 [5] - 从产品推出到功能迭代仅用5个月,展现快速创新能力 [5][6] - 行业面临AGI技术瓶颈,公司尝试通过计算范式创新开辟新竞争维度 [12]
2025款林肯冒险家SUV车型上市:可选2.0T燃油/1.5T混动;比亚迪公布自动充电及充气机器人专利丨汽车交通日报
创业邦· 2025-08-01 10:20
1. 【比亚迪公布自动充电及充气机器人专利】天眼查App显示,8月1日,比亚迪股份有限公司申请 的"一种机器人"专利公布。该机器人无需车端改造,集成充电与充气功能,通过智能判断、精准对接 及闭环控制,实现自动充电、胎压监测与充气,提升智能化体验,确保安全,降低使用成本。(腾讯 网) 2. 【奇瑞汽车公布全固态电池专利】天眼查App显示,近日,奇瑞汽车股份有限公司申请的"全固态 电池及其制备方法、电池包和车辆"专利公布。摘要显示,本公开属于电池技术领域。全固态电池包 括多个料区极组、多个第一集流体和多个第二集流体,料区极组包括依次压制在一起的正极料区、固 态电解质和负极料区,其中,第一集流体与料区极组的正极料区贴合,第二集流体与料区极组的负极 料区贴合。本公开的全固态电池及其制备方法、电池包和车辆能够减小采用等静压技术压制全固态电 池时集流体受到的损伤。(网易) 车辆提供2.0T燃油和1.5T混动两种动力,其中2.0T发动机最大功率192千瓦,峰值扭矩395牛・米, 匹配8挡自动变速箱,并提供四驱系统。1.5T混动版发动机最大功率142千瓦,峰值扭矩226千瓦; 驱动电机最大功率96千瓦,峰值扭矩235牛・米; ...
Manus还活着,还上新了
虎嗅· 2025-08-01 09:36
产品发布 - Manus于8月1日发布新功能Wide Research(广度研究) 目前仅对Pro用户开放 未来将逐步向Basic和Plus用户开放 但暂无免费用户开放计划 [1] - 该功能开发耗时超两个月 是公司内部开发时间最长的功能 [6] - Wide Research功能不会以独立产品或页面形式呈现 而是根据用户任务需求自动触发 [9] 技术特性 - Wide Research采用并行计算技术 可将用户任务拆分为批量子任务处理 计算能力提升100倍 [9] - 该技术强调横向扩展和并行处理 但需承担高昂算力消耗和Token剧增成本 [9] - 在测试中成功完成"列出全球前100的MBA学校"任务 而ChatGPT Agent仅能列出10所 [6] - 支持同时比较100双运动鞋和生成50张风格各异的海报等广度任务 [9] 商业模式 - 免费用户每日积分限额为300 credits Wide Research单任务预计消耗1000 credits 相当于每个子任务消耗10 credits [10] - Basic套餐定价为19美元/月 包含每日300 refresh credits和基础功能权限 [4][5] - Pro套餐提供高级模式访问权限 支持2个并发任务和2个图像生成任务等增值服务 [5] 行业竞争 - OpenAI于上月推出ChatGPT Agent 其"Deep Research"功能主打深度信息整合和复杂问题推理 [6][10] - Wide Research被定位为对Deep Research的精准反击 形成"广度"与"深度"的技术路线对决 [6] - 行业陷入同质化竞争 根本制约因素在于AGI(通用人工智能)技术进步速度 [10] - AGI发展遭遇瓶颈期 企业通过细节优化争夺用户 但难以实现颠覆性突破 [11] 市场定位 - Manus自2025年3月进入市场后 持续通过创新功能打破行业固有格局 [11] - 在AI Agent领域普遍聚焦"Deep Research"的背景下 公司率先推出广度研究功能实现差异化竞争 [11] - 行业资深人士指出 两种技术各具优势:Wide Research在广度任务效率占优 Deep Research在复杂逻辑推理更具深度 [10]
GPT-5发布倒计时?全网泄露来了:微软Copilot憋大招,GPT-5上线最后冲刺
36氪· 2025-08-01 02:05
GPT-5技术进展 - GPT-5-Alpha已由Cursor团队内部测试,表现惊艳,几乎能一次性完成任何任务[1][3] - 在macOS ChatGPT应用中发现了GPT-5-Auto和GPT-5-Reasoning模型,路径为`~/Library/Caches/com.openai.chat/fsCachedData`[5][7][8] - GPT-5可能包含o系列模型,网友从"reasoning"字眼推测其已具备高级推理能力[9] 合作伙伴准备情况 - Perplexity已完成网站上的GPT-5发布准备工作,Pro用户将能立即使用[10] - 微软工程师正在为Copilot集成GPT-5做准备,包括消费者版和企业版[12][17][19] - Windows 11 Copilot将推出基于GPT-5的智能模式,可根据查询自动切换推理/非推理模式[17][22] 技术特性与行业影响 - GPT-5将采用智能路由技术,可能已开始逐步推出[15] - 微软计划在AI套件中全面部署GPT-5,覆盖Copilot、Microsoft 365 Copilot和Azure三大平台[17][18] - OpenAI研究员认为GPT-5的压缩能力(文本理解与总结)已达到智能标准,展示了理解力和创造力[31][38][46] 商业模式创新 - GPT-5将打破付费墙限制,Windows 11 Copilot免费版也将搭载其智能模式[17] - AI产品已形成自我改进循环,ChatGPT每日数亿用户、数百万付费用户为AGI研究提供持续资金[55] - 技术商业化路径明确,通过微软生态(消费者/企业/API)实现大规模落地[17][22]
VLA-OS:NUS邵林团队探究机器人VLA做任务推理的秘密
机器之心· 2025-07-31 05:11
机器人VLA模型研究突破 - 新加坡国立大学邵林团队发表突破性研究VLA-OS,首次系统解构和分析机器人VLA模型的任务规划与推理能力 [3] - 研究通过控制变量实验方法,专注于任务规划的"范式"和"表征"两大方面,统一其他因素 [19] - 研究提出五大核心问题,包括规划表征选择、范式选择、性能瓶颈、scaling law和规划带来的提升 [21] VLA-OS实验平台设计 - 构建架构统一、参数递增的VLM模型家族,选取Qwen 2.5 LLM的0.5B/1.5B/3B/7B四个模型作为基座 [23] - 设计可组合的VLA-OS模型家族,实现ActionOnly-VLA、Integrated-VLA和Hierarchical-VLA三大范式的公平对比 [25][26] - 收集整理六类数据集共约10,000条轨迹,覆盖多种视觉模态、操作环境和执行器种类 [28][29] 关键研究发现 - 视觉规划表征和目标图像表征相比语言表征具有更优性能、更快推理速度和更低训练成本 [46][47] - Hierarchical-VLA范式展现出最强泛化能力和规划能力,优于Integrated-VLA [49][57][63] - 所有VLA范式性能随数据量增加而提升,但模型规模超过3B时性能下降 [72][75] - 含任务规划的VLA范式前向迁移能力更强但遗忘速度更快 [76][79] 设计指南与未来方向 - 首选视觉表征和目标图像规划,语言规划仅作为辅助 [81] - 资源充足选Hierarchical-VLA,资源有限选Integrated-VLA [81] - 未来方向包括探索空间表征神经机制、设计解耦训练机制、开发高效VLM信息蒸馏架构和构建万亿级规划数据集 [86]
直击CJ|AI赋能下的高效工作模式!三七互娱王传鹏:让思考者做选择,让梦想家去创造
新浪科技· 2025-07-31 04:52
公司AI战略 - AI战略涵盖文化 组织 人才 能力 投资六个方面 [1] - 自研游戏行业大模型"小七大模型"对数字化能力进行重构 [3] - AGI发展路径包含自然语言 视觉语言 编程语言三个技术方向 [3] 行业应用前景 - AI可打通游戏开发全流程包括方案策划 创意来源 创意制作 版权检测 [3] - 实现AI全流程覆盖赋能行业高效工作模式 [3] - 技术应用目标为思考者做选择 梦想家去创造的工作范式 [3] 行业活动 - 第二十二届ChinaJoy于8月1日至4日在上海新国际博览中心举办 [1] - 公司技术中心数据副总裁在CDEC高峰论坛发表AI战略演讲 [1]
扎克伯格:个人超级智能很快降临,眼镜是AI理想终端
虎嗅· 2025-07-31 02:03
借势超出市场预期的强劲季报,加上巨资刚刚组建的AI"梦之队",扎克伯格高调宣布了Meta最新的AI 战略:个人超级智能。 扎克伯格坚持AI眼镜至少与手机同样重要。他在分析师会上表示:"我仍然认为,眼镜基本上是人工智 能的理想形态,因为你可以让人工智能看到你一整天看到的东西,听到你听到的东西,并与你对 话,"他认为,一旦在眼镜上装上显示器,可以全天与人工智能系统互动。 他在视频中说:"在过去的几个月里,我们开始隐约看到一个重大转折的端倪——我们的AI系统,已经 在尝试改进自身。这种进步尚属初级,速度也不快,但其趋势已无法否认。超级智能的诞生,如今已近 在眼前。" 扎克伯格的讲话,传出三个最重要的信息: 首先,Meta将对开源做出重大调整。扎克伯格称这是出于缓解超级智能风险的考虑,将会"非常小心选 择开源的范围"。 其次,超级智能将拥有超级个人终端,即AI眼镜或者头显,它们甚至将像手机一样,成为个人计算主 平台。 最后,他公开反对奥特曼等人的AGI主张,未来的社会将是由掌握了超级智能的个人组成,而不是像 OpenAI所主张的那样,AGI凌驾于社会,然后向个人发放"全民基本工资"的福利。 个人超级智能将贯穿于Met ...
丰田上半年销量超过554万辆,时隔3年再创新高;零跑B01车型第1万台整车量产下线丨汽车交通日报
创业邦· 2025-07-30 10:10
德国车企业绩下滑 - 梅赛德斯-奔驰2025年上半年销售收入726亿欧元同比减少8.6% 税后净利润27亿欧元同比大幅降低55.8% [1] - 奥迪2025年上半年税后利润13.46亿欧元同比下降37.5% 美国关税导致损失约6亿欧元 全球汽车交付量同比下降约6% [2] - 美国关税政策导致德国三家主要汽车制造商今年现金流或将减少100亿欧元 [2] 中国新能源汽车发展 - 零跑B01纯电轿车第10000台整车量产下线 该车型售价8.98万至11.98万元 [3] 日本车企表现 - 丰田汽车2025年上半年全球销量5,544,880辆同比增长7.4% 预计将超过大众的441万辆 连续6年位居全球首位 [4]
商汤发布「日日新V6.5」大模型,多模态能力大幅提升,让AI从“生产力工具”进阶“生产力”
财经网· 2025-07-30 05:40
多模态AI技术突破 - 多模态信息感知与处理是AGI核心要求及从语言模型迈向AGI的必由之路[1] - 多模态智能演进将驱动AI下一阶段发展 涵盖感知 推理及交互[1] - 商汤科技发布日日新SenseNova V6 5大模型体系 实现多模态基座大模型突破性升级[1] 日日新V6 5技术升级 - 实现三大突破性升级:强推理能力比肩Gemini 2 5 Pro和Claude 4-sonnet 性价比提升3倍以上 智能体支持端到端场景落地[3] - 多模态推理与交互性能大幅提升 超越Gemini 2 5 Flash和GPT-4o 成为国内首个实现图文交错思维的商业级大模型[4] - 采用改进的多模态融合架构 视觉编码器显著变轻 视觉表征在早期与语言对齐 预训练吞吐量提升20%以上 强化学习效率提升40% 推理吞吐量提升35%以上[5] 商汤小浣熊智能体升级 - 基于日日新V6 5多模态数据分析能力全面升级 可处理多模态复杂输入并实现专业可视化输出[6] - 在客户场景测试中达到Claude 4 Opus水平 大幅领先OpenAI o3 时序计算 数据匹配 数理计算和异常检测准确率接近100%[6] - 能够解析含合并单元格 缺失值 子表格及内嵌图表的复杂Excel表格 并生成完整分析报告[10] 实际应用场景 - 支持从截图提取表格信息并导出可编辑Excel表格 实现多模态全流程处理[10] - 教育版覆盖500+院校 10余种教育场景 25万+师生 帮助学生提升学习效率15-30% 降低学业焦虑发生率40% 课堂参与度提高2 1倍 资源错配率降低30% 心理健康干预及时性提升50%[13] - 金融版提供知识助手 智能问数及多模态智能理赔解决方案 构建人机协同智能决策新范式[14] - 产品矩阵累计服务用户数量超1000万[15] 行业意义 - AI凭借多模态融合能力突破逐步触达AGI边界 向类人标准靠近[1] - 实现从生产力工具到生产力的跨越 推动AI完成从工具到人的跃迁[3][6]
我在WAIC看见的十大趋势
量子位· 2025-07-30 02:29
核心观点 - AI行业热度空前,WAIC展会呈现十大核心趋势,展现中国AI产业的快速发展和创新活力 [2][3][5] 十大核心趋势 趋势一:中国AI因DeepSeek而不同 - DeepSeek带来观念改变,AGI在中国被真正相信,中国人可能率先实现AGI [6] - DeepSeek-R1让普通人不再认为AI是"智障",唤醒中国AI创始人直接瞄准AGI [7] - 前谷歌CEO施密特等国际专家认可中国AI实力 [6] 趋势二:基础大模型综合实力比拼 - 基础大模型竞逐重点从SOTA转向推理、多模态和低成本 [8][9] - 阶跃星辰Step-3模型总参数321B,具备多模态推理能力,联合千里科技和吉利汽车落地智能座舱 [12] - 商汤日日新V6.5在多模态推理能力上表现优异,部分指标超过Gemini 2.5 Pro和Claude 4-Sonnet [14][15] - 讯飞深度推理X1升级版在幻觉治理、综合能力等方面有提升 [15] 趋势三:开源大模型进入中国时间 - 开源成为中国大模型领域的标配,通义千问是开源旗手 [17][18][21] - 阿里通义千问系列模型和通义万相2.2全部开源 [18][20] - 中国开源模型方阵蔚为壮观,包括基础大模型和垂直模型 [23][24][26] - 开源共识形成,中国可能成为AI时代的"安卓" [28][31] 趋势四:国产化AI生态闭环 - 国产芯片与国产大模型协同构建生态 [32][33] - 摩尔线程实现100token/s跑满血DeepSeek,推动AI训练向万卡级规模演进 [37] - 后摩智能发布能效比最高的存算一体AI芯片M50,功耗仅10W [39] - 中昊芯英发布中国首枚TPU架构高性能AI芯片"刹那®"和计算集群"泰则®" [41] - 联想、燧原科技等推出国产算力+国产模型的大模型一体机 [44][46] 趋势五:AI基建与垂直行业应用 - 华为展示昇腾384超节点真机,支持万张算力卡的数据中心 [51] - 中国电信展出五大技术体系,包括智传网、算网一体服务等 [53] - PPIO发布国内首个Agentic AI基础设施服务平台 [56] - 国家电网和南方电网展示电力行业大模型"大瓦特",机器人代人率达80% [60] - 蚂蚁数科推出金融大模型Agentar-Fin-R1,在金融基准测试中表现优异 [62] - 百度展示数字人技术NOVA,曾支撑罗永浩数字人直播间创5500万GMV [64] 趋势六:ToC创新与AI Agent - C端产品创新开始,AI Agent成为新风口 [66][67] - WPS发布原生Office办公智能体,通过自然语言完成文档创作等 [76] - 钛动发布全球营销AI Agent,赋能营销全链路 [77] - 深势科技发布通用科学智能体SciMaster,提供专家级科研助手 [79] - Agent被视为AI时代的软件形态产品,将革新各领域应用 [82][83] 趋势七:商业化AI终端 - 汽车、耳机和眼镜成为第一批商业化AI终端 [86][87] - 特斯拉、吉利等车企展示AI能力,座舱领域创新打开新增长空间 [88][90][94] - 讯飞AI耳机iFLYBUDS Pro 3和Air 2主打商务办公场景 [99][100] - AI眼镜备受关注,Rokid预定量达25万台,Halliday中国首秀 [104][105][107] - 夸克发布AI眼镜,集成阿里和支付宝生态 [109][110] 趋势八:具身智能机器人 - 具身智能机器人赛道白热化,今年实现大飞跃 [112][113] - 智元、银河通用、北京人形机器人创新中心等展示能走能动的机器人 [117][119][121] - 宇树科技通过"机器人打拳击"展示灵活运动能力 [129] - 戴盟聚焦触觉感知技术,展示精细化操作能力 [135][137][139] - 行业开始向人形收敛,VLA和世界模型成为共识 [133] 趋势九:非Transformer架构 - 非Transformer架构从学术研究进入产业应用 [144][145] - RockAI展示自研非Transformer架构驱动的机器狗和灵巧手 [146] - RWKV元我智能公开RWKV-7s架构,KV cache仅为MLA的1/9大小 [146] 趋势十:中国与硅谷AI差距 - 中国与硅谷AI差距缩短至6个月,集中在大模型先进技术层面 [154] - 发展目标转向AGI实现,而非追赶硅谷 [155] - 中国拥有发展AI的宝贵资源——人才和用户基础 [157][158]