Workflow
通用人工智能(AGI)
icon
搜索文档
厉害了,智谱造了全球首个手机通用Agent!人人免费,APP甚至直接操控云电脑
36氪· 2025-08-20 07:34
产品发布与核心功能 - 智谱发布全球首个手机通用Agent AutoGLM 可免费使用 [2] - AutoGLM通过云端执行任务 不占用本地资源且不影响设备正常使用 [4][23] - 支持生活助手和办公助手两类任务 例如点外卖、比价、生成调研报告等 [5][14][16] 技术实现与行业突破 - 基于云端智能手机和云电脑执行任务 预装应用并支持跨APP操作 [13][22] - 依托GLM-4.5和GLM-4.5V模型 整合推理、编码、研究等多项能力 [32] - 解决行业痛点:本地设备算力有限且任务执行干扰用户体验 [24] 应用场景与生态扩展 - 支持手机、PC、智能音箱、车载系统及物联网设备集成 [26] - 推出移动端API和开发者生态共建计划 开放能力赋能第三方产品 [26] - 办公场景中可自动生成基于近100份参考源的数千字调研报告 [17] 战略定位与行业影响 - AutoGLM是智谱AGI路线图中实现L3"自主学习智能体"的关键步骤 [29] - 行业玩家积极布局云端Agent 如阿里云推出无影AgentBay [25] - 提出3A原则:全时待命、零干扰运行、全域设备连接 [35][36][37] 用户体验与效率提升 - 复杂任务如跨平台比价可自主执行 用户仅需发起指令 [14] - 原需一天完成的调研报告生成任务 现仅需几分钟 [17][21] - 云端备用机机制释放本地存储空间 提升设备运行流畅度 [23]
厉害了,智谱造了全球首个手机通用Agent!人人免费,APP甚至直接操控云电脑
量子位· 2025-08-20 04:33
产品发布与核心功能 - 智谱发布全球首个手机通用Agent AutoGLM 实现云端执行任务 支持跨APP操作如点外卖、比价等[1][5][9] - 产品免费向公众开放 兼容安卓和iOS系统 并可操控云电脑执行复杂任务[6][9][23] - 提供生活助手和办公助手两类任务 用户通过"接管手机"进入云端界面操作[11][15][17] 技术实现与架构 - 采用云端执行模式 不占用本地设备资源 任务流畅且与用户本地操作互不干扰[9][33][37] - 依托智谱开源模型GLM-4.5和GLM-4.5V 整合推理、编码、多模态等能力于单一模型[50][52] - 为每位用户配备云手机和云电脑 预装应用生态 支持数据持久化存储[31][32] 应用场景与案例 - 生活场景:自主完成外卖订购、跨平台比价(如淘宝、京东、拼多多对比200元保温杯)[19][20][21] - 办公场景:自动生成调研报告(参考近100份源文件、输出数千字)及制作PPT[25][26][29] - 支持多设备集成 包括智能音箱、车载系统等 并通过开放API赋能开发者生态[42] 行业意义与趋势 - 解决Agent落地痛点:云端执行规避本地算力限制和高并发任务宕机问题[36][37][53] - 行业竞相布局云端Agent 如阿里云推出无影AgentBay、PPIO推出Agent沙箱产品[38][39][40] - 推动Agent从"信息辅助"向"直接操作"升级 成为处理复杂场景的全能型工具[31][54][55] 公司战略与AGI路径 - AutoGLM是智谱AGI路线图中L3"自主学习智能体"的关键一步 通过真实应用反馈推动模型自我进化[48][49] - 提出3A原则:全时待命(Around-the-clock)、零干扰(Autonomy)、全域连接(Affinity)[56][57] - 目标是通过技术与应用的正向飞轮 夯实公司在Agent领域的领先地位[48][49]
研判2025!中国通用人工智能(AGI)行业发展历程、相关政策及市场规模分析:中国AGI行业驶入高速发展快车道,技术突破与场景落地双轮驱动[图]
产业信息网· 2025-08-20 01:33
行业概述 - 通用人工智能(AGI)定义为具备自主感知、认知、决策、学习、执行和社会协作能力的通用人工智能体,涉及计算机科学、认知科学、心理学和神经科学等多学科领域[2] - 行业市场结构分为基础设施层(算力、数据)、模型层(语言及多模态模型)、中间层(微调、Prompt、RAG、Agent)和应用层(应用程序、插件、硬件)四层[2] - 应用层典型厂商包括出门问问、商汤科技、作业帮、秘塔科技、美图、聆心智能、钉钉和WPS等[4] - 中间层典型厂商包括阿里巴巴、腾讯、京东、网易有道和海贝等[4] - 模型层典型厂商包括百度、阿里巴巴、科大讯飞、智谱AI、百川智能、零一万物和MiniMax等[4] - 基础设施层典型厂商包括中国电信、中国移动、华为和浪潮等[4] 行业发展历程 - 人工智能行业经历初期探索与技术积累阶段后,逐步迈入技术突破与商业化探索的关键时期[5] - 随着技术成熟与应用场景持续拓展,市场迎来快速发展爆发期,并逐渐步入以人工通用智能(AGI)为主导的新时代[5] 行业产业链 - 产业链上游包括芯片与算力、数据资源与服务、算法与框架等基础设施与技术支撑[7] - 产业链中游为通用人工智能(AGI)开发集成环节[7] - 产业链下游主要应用于金融(智能风控、量化交易、客服自动化等)、医疗(辅助诊断、医疗问答、药物研发等)、制造(智能调度、缺陷检测等)和智慧城市(交通优化、应急管理、政务AI平台等)等行业[7] 相关政策 - 国务院2025年3月《政府工作报告》提出持续推进"人工智能+"行动,支持大模型广泛应用,大力发展智能网联新能源汽车、人工智能手机和电脑、智能机器人等新一代智能终端以及智能制造装备[10] - 国家网信办等七部门2023年8月《生成式人工智能服务管理暂行办法》采取有效措施鼓励生成式人工智能创新发展,实行包容审慎和分类分级监管[12] - 工信部等四部门2024年6月《人工智能产业综合标准化体系建设指南(2024版)》提出到2026年制定国家标准和行业标准50项以上,开展标准宣贯和实施推广的企业超过1000家,参与制定国际标准20项以上[12] - 全国网络安全标准化技术委员会2024年9月《人工智能安全治理框架》强调构建各方共同参与、技管结合、分工协作的治理机制,打造全过程全要素治理链条[12] 市场规模 - 2024年中国通用人工智能(AGI)行业市场规模为204.93亿元,同比增长44.97%[13] - 金融领域智能投顾、风险控制等应用预计2030年市场规模超800亿元[13] - 零售营销领域AGI驱动的商品推荐、营销文案生成等场景实现效率提升300%以上[13] - 工业领域中控TPT大模型在氯碱生产、煤化工绿电调度等场景中实现能耗降低5%、年减碳41.94万吨[13] 技术发展 - 多模态大模型成为核心方向,2024年9月腾讯Hunyuan-Turbo-Preview模型在SUPERCLUE评测中得分78.64分位列第二,接近OpenAI ChatGPT-4o水平(79.67分)[13] - DeepSeek-R1等开源模型性能对标国际领先产品,推动技术普惠[13] - 2025年多模态与量子计算重构AGI能力边界,DeepSeek-R1模型通过"快思考-慢思考"双通道机制将数学推理准确率从68%提升至82%[20] - MiniMax 01系列模型首次大规模应用线性注意力机制,突破传统Transformer架构效率瓶颈[20] - 量子计算与AGI融合成为关键突破口,中科院计划2025年发布50量子比特商用平台,算力成本预计降至传统架构的1/5[20] - 量子退火算法优化的知识图谱以每秒10^15次连接重组速度动态更新,在医疗诊断中实现72小时内整合最新研究论文与病例数据[20] - 具身智能实体化进程加速,特斯拉Optimus机器人量产在即,工业富联人形机器人代工订单激增[20] 重点企业经营情况 - 行业形成科技巨头主导基础设施、初创企业深耕垂直应用、政策与资本协同驱动的立体化竞争格局[15] - 科技巨头凭借算力、数据与资金优势主导AGI基础设施与通用技术研发,初创企业聚焦垂直场景打造差异化产品[15] - 腾讯在AGI领域布局广泛,混元大模型T1已接入微信、游戏、广告等场景,豆包大模型部分指标居国产第一[16] - 腾讯2025年一季度总营收为1800亿元,同比增长12.87%;毛利为1005亿元,同比增长19.82%[18] - 云知声以全栈式AGI技术为核心,山海大模型在医疗领域表现全球领先,门诊病历生成系统单份病历采纳率达98%[16] - 昆仑万维专注AGI与AICC全产业链布局,2024年营业收入为56.62亿元,同比增长15.20%;研发投入金额为15.98亿元,同比增长59.78%[16] - 深度求索专注于AGI基础技术研发,R1模型支持多模态任务处理,参数达6850亿,训练成本仅为同类模型的1/10[16] - 阿里巴巴以"AGI端到端布局"为核心,通过平头哥芯片自研、算力中心基建和通义千问基础大模型打造AI底座[16] 行业发展趋势 - 医疗领域云知声山海大模型通过动态推理与跨模态数据处理将门诊病历生成系统采纳率提升至98%,手术病历撰写助手使医生效率提升40%[22] - 联影医疗AI影像解决方案渗透率突破15%,误诊率下降18%[22] - 金融领域智能投顾与反欺诈系统成为标配[22] - 工业与制造领域中控TPT大模型在氯碱生产中实现能耗降低5%、年减碳41.94万吨[22] - 教育与零售场景AI辅导与个性化营销内容生成效率提升300%以上,虚拟试衣间、数字人导购等创新应用加速落地[22] - 政策层面构建"技术突破-场景落地-伦理治理"闭环体系,国家发改委《人工智能+行动实施方案》设立"揭榜挂帅"制度攻关算力芯片、量子计算等12项卡脖子技术[23] - 伦理与安全框架逐步完善,《人工智能安全治理框架》1.0版强调"包容审慎、风险导向",要求算法透明度与可解释性[23] - 欧盟2025年7月10日公布《通用人工智能行为准则》为通用人工智能模型提供透明度、版权及安全与保障三方面的自律指导[23]
阿里通义千问再放大招 多模态大模型迭代 加速改写AGI时间表
21世纪经济报道· 2025-08-20 00:08
阿里通义千问多模态模型更新 - 阿里推出Qwen-Image-Edit,基于20B参数的Qwen-Image,支持双语文本修改、风格迁移及物体旋转,拓展生成式AI在专业内容创作中的应用 [1] - 阿里半年内连续推出Qwen2.5-VL、Qwen2.5-Omni、Qwen-Image等多模态模型,Qwen2.5-VL 72B版本在13项权威评测中视觉理解能力超越GPT-4o与Claude3.5 [3] - Qwen-Image-Edit将输入图像同时输入到Qwen2.5-VL和VAE Encoder,兼具语义与外观双重编辑能力,在中文图像编辑领域树立新标杆 [3] 多模态AI行业发展趋势 - 大模型发展从单一语言模型迈向多模态融合新阶段,被认为是通向AGI的必经之路 [1] - 谷歌研究报告显示,预计2025年全球多模态AI市场规模将飙升至24亿美元,2037年底预计达989亿美元 [1] - 2025年被业内人士普遍视为"AI应用商业化元年",多模态技术是核心驱动力,已在数字人直播、医疗诊断、金融分析等场景应用 [6] 国内厂商多模态布局 - 阿里、智谱、阶跃星辰等大模型厂商密集布局多模态,从视觉理解到全模态交互,2025年迭代加速 [1] - 阶跃星辰发布Step 3基础大模型,原生支持多模态推理,多模态模型占基座模型矩阵7成 [4] - 商汤发布日日新V6.5大模型,从6.0开始全部为多模态模型,多模态推理与交互性能大幅提升 [4] - 智谱推出开源视觉推理模型GLM-4.5V,昆仑万维一周内发布六款多模态模型,覆盖数字人生成、世界模拟等核心场景 [5] 多模态技术发展现状与挑战 - 多模态领域仍处于发展初期,基础性问题尚未解决,复杂性远超自然语言处理 [7] - 视觉数据表征空间达百万维度连续空间,与文本数万维度低维问题存在本质差异 [7] - 当前多模态模型主要依赖逻辑推理,缺乏空间感知能力,面对简单空间问题表现不佳 [9] - 技术瓶颈需要类似ChatGPT、强化学习范式的大技术变迁才能解决 [8]
阿里通义千问再放大招 多模态大模型迭代加速改写AGI时间表
21世纪经济报道· 2025-08-19 12:57
多模态大模型发展现状 - 阿里通义团队推出Qwen-Image-Edit,基于20B参数的Qwen-Image,专注于语义和外观编辑,支持双语文本修改、风格迁移及物体旋转 [1] - 阿里半年内连续推出Qwen2 5-VL、Qwen2 5-Omni、Qwen-Image等多模态模型 [1] - 谷歌研究报告显示,预计至2025年全球多模态AI市场规模将飙升至24亿美元,2037年底预计将达到989亿美元 [1] - 商汤科技联合创始人林达华表示未来多模态模型甚至能在纯语言任务上超越单一语言模型 [1] 国内厂商布局 - 2023年12月谷歌原生多模态Gemini 1 0模型上线,将AI竞赛由文本领域带入多模态领域 [2] - 阿里推出Qwen2 5系列强化多模态能力,Qwen2 5-VL在13项权威评测中视觉理解能力全面超越GPT-4o与Claude3 5 [3] - 阿里发布首个端到端全模态大模型Qwen2 5-Omni,支持文本、图像、音频、视频的实时交互 [3] - 阶跃星辰发布Step 3基础大模型,原生支持多模态推理,其多模态模型占比达7成 [4] - 商汤发布日日新V6 5大模型,多模态推理与交互性能大幅提升 [4] - 智谱推出开源视觉推理模型GLM-4 5V,涵盖图像、视频、文档理解等任务 [5] - 昆仑万维一周内连续发布六款多模态模型,覆盖数字人生成、世界模拟等场景 [5] 技术挑战与发展 - 多模态领域仍处于发展初期,诸多基础性问题尚未解决 [6] - 视觉数据表征空间达到百万维度的连续空间,与文本存在本质差异 [6] - 视觉数据本身不包含语义信息,需要建立跨模态映射关系 [7] - 当前多模态模型对于图形和空间结构的推理能力薄弱 [7] - 主流多模态模型后续思考推理过程仍主要依赖纯语言推理 [7] 行业趋势 - 2025年被业内人士普遍视为"AI应用商业化元年",多模态技术是核心驱动力 [6] - 多模态能力将成为AI系统的标配,如何转化为实际生产力是产业界下一步重点 [8]
阿里通义千问再放大招,多模态大模型迭代加速改写AGI时间表
21世纪经济报道· 2025-08-19 12:21
多模态大模型发展现状 - 阿里通义团队推出Qwen-Image-Edit,基于20B参数的Qwen-Image,支持双语文本修改、风格迁移及物体旋转,拓展生成式AI在专业内容创作中的应用 [1] - 阿里半年内连续推出Qwen2.5-VL、Qwen2.5-Omni、Qwen-Image等多模态模型,Qwen2.5-VL 72B版本在13项权威评测中视觉理解能力全面超越GPT-4o与Claude3.5 [3] - 阿里Qwen-Image-Edit登上AI开源社区Hugging Face模型榜单首位,成为全球热度最高的开源模型 [3] 行业竞争格局 - 谷歌原生多模态Gemini 1.0模型上线,将AI竞赛由文本领域带入多模态领域 [2] - 阶跃星辰发布Step 3基础大模型,原生支持多模态推理,其基座模型矩阵中多模态模型占比达7成 [4] - 商汤发布日日新V6.5大模型,从6.0开始全部为多模态模型 [5] - 智谱推出开源视觉推理模型GLM-4.5V,昆仑万维一周内发布六款多模态模型 [5] 市场规模与趋势 - 预计2025年全球多模态AI市场规模将达24亿美元,2037年底预计达到989亿美元 [1] - 2025年被业内人士视为"AI应用商业化元年",多模态技术是核心驱动力 [7] - 中国企业在视觉推理、视频生成等多个细分领域已排在权威榜单前列 [7] 技术挑战 - 多模态领域仍处于发展初期,诸多基础性问题尚未解决 [8] - 视觉数据表征空间达到百万维度的连续空间,与文本的数万维度存在本质差异 [8] - 当前多模态模型对于图形和空间结构的推理能力薄弱,无法解决简单空间问题 [10] - 多模态模型思维方式主要依赖逻辑推理,缺乏空间感知能力 [10] 发展方向 - 多模态能力将成为AI系统标配,如何转化为实际生产力和社会价值是下一步重点 [10] - 未来多模态模型可能在纯语言任务上超越单一语言模型 [1] - 2025年下半年或将迎来多模态模型的全面普及 [1]
蚂蚁的边界革命:技术驱动下的医疗健康新布局
经济观察报· 2025-08-19 08:49
蚂蚁集团业务拓展 - 公司从支付宝支付业务拓展至芝麻信用体系,再进入数字医疗健康领域,边界不断扩展[2] - 2024年推出医疗健康服务平台及AI健康管家AQ,战略升级为问题解决者[2][4] - 医疗健康布局始于2014年,已覆盖全国5000多家公立医院,8亿多用户激活医保码,1.2亿用户使用亲情账号[4] 医疗健康战略与技术 - AI健康管家AQ基于万亿级医学数据训练,医疗大模型在MedBench评测中接近满分,皮肤识别准确率超96%,报告解读覆盖率99%[3][5] - AQ具备"拍图打假"和"AI鉴真"功能,打击虚假医疗广告,破解健康谣言[5] - 技术提升供给侧效率,如好大夫平台30万医生AI分身可服务更多患者,缩小城乡医疗差距[6] 数据与合作资源 - 公司积累11年真实医疗服务数据,与好大夫等平台合作,汇聚超30万名注册医生[4][5] - AQ累计服务用户超1亿,日咨询量超100万人次[5] 社会问题与商业逻辑 - 瞄准医疗资源分配不均、虚假广告等痛点,超四成老年人曾因保健品被骗[4][8] - 发展逻辑为"问题导向",技术投入聚焦社会痛点而非单纯商业利益[8] 技术特点与创新 - 医疗大模型从教材、论文等高质量数据学习,避免虚假信息污染[5] - AGI技术从"获取信息"转向"像医生一样解决问题",重构医疗技术底层逻辑[3] 挑战与长期策略 - 技术幻觉问题尚未完全解决,仅20%用户遇医疗问题时会咨询AI[7] - 采取长期主义策略,计划十年以上投入,目标包括缩小城乡差距、连接家庭健康硬件等[7] - 开源部分模型能力,推动行业合作[7] 行业思考 - 科技企业边界由社会问题定义,医疗健康领域需平衡商业活力与专业性、公益性[8][9] - 移动支付和信用体系已成为基础设施,医疗健康拓展体现技术的社会价值导向[8][9]
诺奖得主谈「AGI试金石」:AI自创游戏并相互教学
36氪· 2025-08-19 00:00
Genie 3 世界模型 - Genie 3 是 DeepMind 多个研究分支融合的成果,核心目标是构建“世界模型”,让 AI 理解物理世界的规律,包括物理结构、材料特性、液体流动、生物行为等 [3] - 通过 3D 游戏引擎等模拟环境生成大量数据,让 AI 在虚拟场景中学习现实规律,能生成具有一致性的世界,用户返回虚拟场景时状态与离开时保持一致 [4] - 已用于内部训练,游戏 agent SIMA 可直接操控电脑游戏,Genie 3 实时生成对应的环境变化,形成“AI 生成世界、另一个 AI 探索”的闭环,为机器人技术和 AGI 系统创建无限训练数据 [4] - 在互动娱乐领域有潜在价值,可能催生介于电影与游戏之间的新型娱乐形式,与视频模型共同为探索现实本质提供新维度 [5] Game Arena 评估平台 - Google DeepMind 与 Kaggle 合作推出 Game Arena,作为评估 AGI 进展的新测试平台,让模型玩各种游戏并测试能力 [6] - 游戏是非常纯粹的测试场所,通过 Elos 等级分客观衡量性能,没有主观性,不需要人类进行 A/B 测试 [9] - 随着 AI 系统能力提升,游戏难度可自动调整,系统在比赛中相互较量,能力增强则测试自动升级 [9] - 未来支持 AI 自创游戏并相互教学,避免训练数据过度拟合,更真实检验通用学习能力 [10] - 将与其他新型评估工具共同作用,确保 AI 系统在认知能力的各个维度得到全面检验 [11] AI 系统现状与挑战 - 当前 AI 系统存在能力不均衡现象,能在 IMO 中获得金牌,却可能在高中数学、简单逻辑问题或特定游戏中犯低级错误 [7] - 现有评估基准存在局限性,很多 benchmark 开始变得饱和,例如数学领域 AIME 的正确率已达 99.2%,进入回报非常有限的阶段 [7] - 需要更难、更广泛的 benchmark,涵盖物理世界理解、直觉物理、物理智能及安全特性等维度 [8] Thinking 模型与工具使用 - Thinking 模型演进是重要方向,以 Deep Think 为代表的系统延续 AlphaGo 等早期游戏 AI 的 agent 系统思路,强调思考、规划与推理能力 [12] - 可进行深度思考和并行规划,在数学、编程、科学问题等领域通过反复推演优化结果,而非直接输出初始结论 [12] - 工具使用成为 AI 能力扩展的新维度,在推理过程中可调用搜索功能、数学程序、编码工具等,更新规划方案 [12] AI 系统架构转变 - AI 正从权重模型向完整系统转变,早期模型输入输出模式较简单,如今系统能结合工具使用、规划与思考能力,实现更复杂功能 [13] - 产品设计需具备前瞻性,预判一年后技术水平,允许底层引擎定期更新,周期可能短至三到六个月,以适应技术快速迭代 [13]
腾讯研究院AI速递 20250819
腾讯研究院· 2025-08-18 16:01
Meta首款带显示AI眼镜 - Meta将于9月发布首款带显示屏的智能眼镜,价格定为800美元起,低于此前预期的1000美元以上 [1] - 该眼镜代号Hypernova,配备小型单目抬头显示(HUD)和sEMG神经腕带,可通过手指手势控制 [1] - 眼镜可显示时间、天气、通知,框架和预览照片,提供转弯导航和实时字幕翻译功能,重量约70克 [1] AI游戏伙伴 - "逗逗AI"是一款专注游戏陪玩的AI产品,拥有庞大的游戏知识库,能实时读取游戏画面并提供攻略和情感陪伴 [2] - 平台提供丰富的角色选择,包括官方原创角色和知名UP主形象,支持游戏间的长期记忆和良好的上下文理解能力 [2] - 其月卡订阅模式提供无限通话时长和长期记忆功能,目前支持《黑神话:悟空》、《原神》、《星露谷物语》等多款游戏 [2] AI游戏《Whisper from the Stars》 - 蔡浩宇的AI游戏《Whisper from the Stars》完整版正式上线,售价27元,玩家可通过语音或文字与AI角色Stella进行全英文交流 [3] - 游戏通过对话推进剧情,主角Stella为一名天体物理学生,在星际调研中遇险,玩家需要与其对话帮助她解决困境 [3] - 游戏AI响应能力佳,记忆持久,但随着游戏深入,聊天负担增加,节奏偏慢,缺乏明确目标导向 [3] 西班牙AI独角兽微型AI模型 - 西班牙公司Multiverse Computing发布两款极小体积的高性能AI模型:"超级苍蝇"(9400万参数)和"鸡脑"(32亿参数),采用量子压缩技术 [4] - 这些微型模型可在智能手机、手表和物联网设备上本地运行,实现离线功能、提升隐私保护、降低延迟和运营成本 [4] - 公司由物理学家罗曼·奥鲁斯创立,基于量子计算技术开发了名为CompactifAI的模型压缩技术,已获1.89亿欧元融资 [4] 百度文库通用智能体GenFlow 2.0 - 百度文库与百度网盘发布全球首个全端通用智能体GenFlow 2.0,支持100+专家智能体同时工作,3分钟并行完成5项以上复杂任务 [5] - 系统自主识别简单对话与复杂任务,提供分钟级并行工作和交付,生成速度超主流同类产品10倍 [5] - GenFlow 2.0兼容MCP协议,可连接百度文库14亿专业文档、百度学术6.8亿文献库,还能在用户授权后调用网盘文件 [6] 世界人形机器人运动会 - 首届世界人形机器人运动会在北京闭幕,来自16个国家的280支队伍、500余台人形机器人参赛,比赛包括田径、足球、武术和场景挑战赛 [7] - 宇树科技H1机器人获1500米、400米和4×100米接力三项冠军,北京天工队的"具身天工Ultra"机器人以21.5秒成绩获100米冠军 [7] - 赛事创新设置场景赛单元,测试机器人在工业、医药、酒店和仓储场景的实际应用能力 [7] 鸿蒙操作系统 - 华为常务董事余承东宣布单框架鸿蒙5.0设备突破1000万,称已过"生死线",每年研发投入超万人,总投入数百亿,开发1.3亿行代码 [8] - 回应"安卓套壳"质疑,表示鸿蒙5.0以前为双框架支持安卓应用,5.0及以后所有应用都是重新开发 [8] - 余承东期望鸿蒙与中国应用一起出海,预计未来操作系统"三分天下,其一必有鸿蒙" [8] AI控制与伦理 - "AI教父"Hinton在Ai4 2025大会上警告AGI可能在几年内到来,认为人类试图控制AI终将徒劳 [9] - Hinton提出AI将很快演化出自我存续和获取更多控制权两个子目标,并建议在AI中建立"母性本能" [9] - 李飞飞则持相反立场,呼吁打造"以人为本的人工智能",维护人类尊严与自主权 [9] AI时代设计师指南 - 创造而非画图:杰出设计师不仅交付效果图,还亲手打磨可运行产品,将蓝图变为现实 [10] - 敏捷迭代学习、构建而非堆砌、洞悉技术脉络是适应AI时代的必备能力 [10] - 人性是永恒优势:设计关乎共情和对微妙情境的洞察,顶尖设计师懂得将人性温度注入冰冷算法 [10] 小模型Agent研究 - 英伟达最新研究表明小模型在Agent任务中优于大模型,以更低资源消耗、更经济灵活的方式完成任务 [12] - 小模型通过针对GPU资源优化和任务定制部署两大方面实现"四两拨千斤",降低10-30倍推理成本 [12] - 小模型可快速适配新需求,在边缘计算中部署更便捷 [12]
天工称冠机器人百米赛;与辉同行否认董宇辉年入20亿
21世纪经济报道· 2025-08-18 02:34
人形机器人技术突破 - 北京人形机器人创新中心研发的"具身天工Ultra"机器人以21.50秒成绩获世界人形机器人运动会100米短跑冠军 采用全自主导航系统无需人工遥控 [2] - 宇树科技因舆论压力参与比赛 作为硬件厂商原避免与客户同台竞争 筹备时间约一个月 [5] 人工智能技术进展 - 谷歌DeepMind发布Genie 3世界模型 凭文本实时生成互动虚拟世界 保留一分钟空间记忆 被视为通向AGI的关键突破 [4] - OpenAI高管承认GPT-5仍存在幻觉问题 建议用户核对答案 强调可靠性与完全可靠性存在不连续性 [5] - 清华大学团队实现量子计算架构突破 首次支持任意两比特量子门直接编程的指令集架构AshN 成果发表于《自然·物理》 [11] 半导体行业格局变动 - SK海力士2025年上半年以36.3%市占率超越三星成为全球最大DRAM制造商 终结三星33年霸主地位 三星市占率降至32.7% [10] - SK海力士HBM业务贡献DRAM营业利润54% 自2024年3月起保持英伟达HBM3E主要供应商地位 美国子公司销售额同比增长103% [10] 操作系统生态建设 - 华为鸿蒙操作系统用户突破千万 目标推动全球终端运行鸿蒙 年底生态力争与安卓iOS看齐 鸿蒙5终端数量超1000万 [7] - 鸿蒙采用"一次开发 多端部署"理念提升开发效率 框架将推动中国应用出海 [7] 新能源基础设施 - 蔚来G318川藏换电路线全线贯通 全长2950公里部署15座换电站 实现全程换电至珠峰 [8] - 我国首个搭载气象雷达的海上升压站完成安装 监测半径230公里 为三峡江苏大丰800兆瓦海上风电项目提供气象监测与灾害预警 [9] 智能硬件产品发布 - 智元机器人推出OmniHand 2025灵巧手系列 包含灵动款与专业款 灵动款指导价1.48万元 首发限时降至9800元 [12] - 西北首条城市无人机医药配送航线在西安启用 航线长度10.5公里 配送时间11分钟 效率为地面运输3倍 未来将拓展至疫苗与血液运输场景 [13][14] 行业热点事件 - 罗永浩称董宇辉年收入达20-30亿元 与辉同行官方否认该信息 董宇辉曾以28.541亿元登顶网络主播收入排行榜后辟谣 [3] - Meta为扎克伯格支付2700万美元(约1.9亿元)安保费 超苹果等五家科技巨头CEO安保支出总和的26% [5] - 机场拦截充电宝通过二手平台回流市场 每吨回收价约9000元(单个成本2-3元) 转卖利润达8000-12000元/吨 某回收企业月处理量超20吨 [6]