Workflow
多模态大模型
icon
搜索文档
中国工程院发布“人工智能新兴技术备选清单” 提出近300项热点
新华社· 2025-07-31 12:34
技术类别与分布 - 清单围绕三个类别提出近300项技术[1] - 信息工程科技领域技术创新包含163项技术 包括6G技术 多模态大模型 超级通用智能体等[1] - 传统产业改造升级和学科交叉融合包含122项技术 包括计算神经科学 智能可穿戴设备 AI辅助药物设计等[1] - 民生相关AI热点技术包含12项 包括大模型技术 具身智能 智能无人系统等[1] 研究背景与价值 - 清单由中国工程院信息与电子工程学部与中国信息与电子工程科技发展战略研究中心联合发布[1] - 研究时间跨度覆盖未来5至10年[1] - 汇集数十名院士和数百名专家的智慧成果[1] - 旨在为人工智能发展顶层设计和战略谋划提供参考依据[1]
商汤-W(00020.HK)完成配售新B类股份
格隆汇· 2025-07-31 11:54
交易完成情况 - 认购协议和配售协议的所有条件均已达成并于2025年7月31日完成 [1] - 以每股1.50港元认购1,666,667,000股认购股份 [1] - 认购股份相当于完成前已发行B类股份约4.58%及总股份约4.50% [1] - 经扩大后相当于B类股份约4.38%及总股份约4.31% [1] 资金用途规划 - 认购事项获得净额约24.98亿港元 [2] - 资金主要用于发展AI云和扩大人工智能基础设施商汤大装置 [2] - 支持生成式AI研发及多模态大模型衍生产品开发落地 [2] - 重点推进智能硬件等垂直场景商业化应用 [2] - 探索人工智能在具身智能机器人、区块链、RWA、数字资产等创新领域 [2] - 扩展人工智能大模型在数字金融风控及结算应用 [2] - 部分资金用作一般营运资金 [2]
人形机器人从舞台“动起来”向工厂“用起来” 提“智”向“新”点燃智能经济新引擎
央视网· 2025-07-30 06:36
行业定义与特点 - 保姆机器人是一种具备自主性与具身性的智能系统 可执行护理辅助 健康监测和社交陪伴等任务 [9] - 技术发展将推动保姆机器人进化出多源感知 自主决策 人机协同和自进化等显著特点 [10] 市场驱动因素 - 中国60岁及以上老年人口达3.1亿 占总人口22% 预计2035年突破4亿 占比超30% [12] - 人口老龄化加速使居家照护和生活辅助刚性需求持续增长 [14] - 人工智能终端产品层出不穷 包括AI手机 AI电脑和AI眼镜等 [31] 应用场景 - 主要覆盖智慧康养 智能家居 家庭教育和社区管家四大垂类赛道 [5] - 人形机器人应用扩展至工业制造 物流运输 零售 娱乐产业及教育领域 [29] - 具体应用包括街头交通协管 生产线作业和饮料供应等服务 [29] 成本与普及预期 - 保姆机器人成本将以每年15%-20%幅度降低 [15] - 预计5年内普通家庭花费5万元可购买基本功能机型 [18] - 使用5年成本仅为住家保姆成本的七分之一 [18] 技术发展现状 - 人形机器人实现站得住 走得稳 跑得快 从实验室迈向规模化量产 [21] - 宇树科技G1格斗机器人可流畅完成拳击动作 [24] - 百度推出具备决策能力的"数字人" 其虚拟主播带货表现优于真人 [24] 产业规模预测 - 中国机器人产业规模在"十五五"时期将增长至4000亿元左右 [21] - 智能经济有望推动全球GDP年增长率提高一个百分点 [31] 创新成果展示 - 2025世界人工智能大会展示3000余项前沿展品及100余款首发新品 [22] - 上海人工智能实验室发布十项"AI+科学"成果 覆盖量子计算 生命科学和材料科学等领域 [27]
AI驱动下,通信云行业的全球化变革
艾瑞咨询· 2025-07-30 01:18
行业投资评级 - 全球互联网通信云市场规模2024年约68亿美元 预计未来2-3年将迎来新一轮增长 [3] - AI在云通信市场的渗透率约15% 中国5G+AI渗透率达5.6% [16] - 未来3-5年厂商将围绕"多模态大模型×场景化服务"构建竞争壁垒 [5] 核心观点 技术演进方向 - 开发者需求向安全合规(82%国家已建立数据隐私法规)、智能(生成式AI应用占比54%)、开放(跨平台兼容)三大方向收束 [4][6][31] - 量子加密(QKD)、区块链存证等新技术提升跨境数据传输安全性 [39][43][45] - 通信云与AI协同进化 从辅助工具向沉浸式人机交互进阶 短期聚焦低准确性/低实时性场景 [51][52] 市场竞争格局 - 中国市场IM PaaS TOP3市占率90% 融云在TOP1000 APP中份额达56% [64][65] - RTC PaaS市场集中度CR3约70% 头部厂商转向差异化服务竞争 [66][67] - 典型企业技术路线: - 融云:安全合规底座+50+大模型API开放 [70][80] - Sendbird:全渠道AI Agent客服平台 [75] - 声网:VAD技术实现650ms超低延迟硬件交互 [85] 分章节要点 AI时代基础设施 - 通信云从传输管道升级为AI交互中枢 需满足多模态(文本/音频/视频融合)、高可靠、低时延需求 [10][11] - 2024年增速放缓至4% 主因AI场景成熟度不足及宏观经济影响 [15] - 中国市场进入存量竞争 开发者需求聚焦通信稳定(56%厂商设备支持量)、数据价值挖掘、跨平台开发效率 [20][22] 技术演进 安全升级 - 欧美通过GDPR等立法强化数据本地化 中东/东南亚加速本地化法规建设 [31][32] - 政企办公场景需硬件加密+传输协议+权限管理全链路可控 [34][36] 智能升级 - 全球TOP50 GenAI应用中聊天/角色扮演类占36% 通信云厂商通过开放第三方模型接入满足需求 [46][48] - 技术落地路径:IM场景侧重上下文数据分析 RTC场景需平衡ASR/LLM/TTS时延 [49] 开放升级 - 产品开放体现为API接口标准化 生态开放包括Flutter/uni-app等跨平台框架支持 [54][56] - 社交/游戏/教育等场景存在支付集成、内容审核、AI模型自定义等复合需求 [55] 竞争格局 - 产业链上游依赖IT基础设施厂商 下游连接ISV/SI及终端用户 [60] - 融云案例: - 安全方案:量子加密通信+中东本地化部署(JACO直播) [71] - 开放架构:支持Dify/扣子等AI平台+MCP接口标准化 [88][89] 发展趋势 - 技术层面:轻量级模型推动端侧落地 业务数据融合催生AI Agent类应用 [93][94] - 商业层面: - 智能眼镜/玩具等穿戴设备市场CAGR超10% 成新增长点 [96] - 多模态交互需求推动通信云向"神经中枢"升级 [95]
VLA上限更高,为何博世坚持“一段式端到端”,力赞特斯拉?
观察者网· 2025-07-28 09:35
导读:博世智能驾控中国区总裁吴永桥:"过去中国需要博世,现在博世需要中国。" 在7月26日开幕的2025世界人工智能大会上,博世智能驾控中国区总裁吴永桥就此分享。 博世智能驾控中国区总裁吴永桥 WAIC 其中,VLA是一种融合了视觉(Vision)、语言(Language)和操作决策(Action)的多模态大模型, 能够通过视觉和语言指令直接生成车辆控制动作。 从理论上分析,作为多模态大模型,VLA具有强大的场景推理和语言理解能力,可适应复杂、边缘情 况或动态交通环境。此外,由于融入了"世界知识"和"常识推理",VLA理论上具备更高上限的智能行 为。 (文/观察者网周盛明 编辑/高莘) 如今,中国的智能化技术、智能辅助驾驶技术的发展日新月异。面向未来,各个企业也对技术演进的方 向提出了不同的理解。 深入技术细节,智能辅助驾驶的未来发展是世界模型(VLA)还是一段式端到端?如何工程化落地? 汽车智能化未来的技术演进路线是什么? 把一段式端到端做到极致 在智能辅助驾驶的发展过程中,VLA和一段式端到端是两个较为主流的技术路径。 举例来看,VLA可以理解城市中的"潮汐车道""公交车道"等指示牌的文字信息,甚至可以理 ...
2025年AI驱动下通信云行业的全球化变革
艾瑞咨询· 2025-07-28 09:04
市场规模与增长 - 2024年全球互联网通信云市场规模约68亿美元,未来2-3年将迎来新一轮增长 [1] - AI在云通信市场的渗透率仅约15%,未来3-5年有望回暖,主要驱动因素包括AI陪伴、AI助理等新场景拓展 [7] - 市场需求放缓主因包括大模型AIGC落地场景观望期及宏观经济下行,中东、拉美等新兴市场增长较快但规模较小 [7] 技术焦点 - 开发者需求向安全、智能、开放收束:数据主权和隐私保护成为出海刚需,需明确数据所有权归属并加密敏感数据 [2] - 通信云向AI交互中枢进化,开放第三方大模型接口、提供低代码智能体创建工具成为基础套件 [2] - 跨平台开发兼容与AI能力开放整合是厂商主要竞争力之一 [3] 发展趋势 - GenAI推动文本、语音、视频融合交互,未来3-5年厂商将围绕"多模态大模型×场景化服务"构建壁垒 [3] - 通信云从基础管道升级为沉浸式AI交互基础设施,满足可靠性、实时性和多模态需求 [4] - 短期优先落地低准确性、低实时性场景,长期将深入游戏、教育、办公等高价值领域 [26] 国内市场特征 - 中国进入存量竞争阶段,企业通过精细化运营提升竞争力,聚焦通信稳定性、数据支撑业务和跨平台开发效率 [11] - IM PaaS市场TOP3占比90%,RTC PaaS市场TOP3占比70%,融云在第三方厂商中份额达56% [36] - AI原生应用尚未出现爆款,当前以"模型即应用"为主流 [11] 国际市场特征 - 欧美市场重视数据隐私与合规性,新兴市场聚焦本土化适配与场景创新 [14] - 社交娱乐领域,欧美偏好AI虚拟恋人等新玩法,新兴市场需适配本地语言和操作系统 [14] - 全球82%国家和地区已建立或正在制定数据隐私法规,欧美或出台更严苛跨境数据流动限制 [17] 安全升级 - 各国对自主可控通信平台需求提升,政企办公场景需硬件加密、传输协议全流程闭环 [19] - 运用QKD、MAF和BC技术提升数据传输链路安全性是未来趋势 [22] - 欧美通过立法强化数据本地化,中东偏好数据加密与高性能服务,拉美非洲跟进性价比方案 [17] 智能升级 - 通信云厂商聚焦核心通信能力建设,开放接入第三方AI模型,IM PaaS侧重个性化交互,RTC PaaS需平衡生成质量与时间 [24] - 由辅助工具向沉浸式人机交互进阶,短期优先突破低准确性、低实时性场景 [26] 开放升级 - 产品开放通过API接口实现功能定制,生态开放构建开发者社区支持技术交流与孵化 [29] - 跨平台兼容性成为开发者选型重要考量因素,未来将加强多设备和系统支持 [29] 产业链与竞争格局 - 头部厂商通过封装全栈大模型能力优化交互体验,主权明晰、防篡改服务成为出海竞争力关键 [36] - 厂商加速大模型、安全技术融合与属地化生态合作,适配本地合规要求 [33] 技术趋势 - AI向多模态、云端协同发展,通信云厂商将强化上下文数据分析,打造千人千面交互体验 [40] - 业务数据融合助力AI应用从辅助工具迈向具备自主决策能力的AI Agent [40] 商业趋势 - 多模态大模型+穿戴式硬件是未来3-5年主要发力场景,社交娱乐领域加速涌现AI复合型玩法 [43] - 通信云升级为商业基座,数据价值挖掘与商业化应用成为发展核心议题 [43]
“AI六小虎”战局升级:阶跃星辰冲刺10亿元营收,大模型进入商业化比拼时代|聚焦2025WAIC
华夏时报· 2025-07-28 04:19
公司战略与目标 - 公司宣布2025年冲刺10亿元年收入目标,为"AI六小虎"中公开的最高目标 [2] - 商业化聚焦智能终端Agent方向,重点布局汽车、手机、IoT设备等场景 [2] - 坚持"超级模型+超级应用"战略,模型能力决定应用上限,应用提供场景和数据 [6] 商业化进展 - 2025年上半年已签订数亿元合同,毛利健康,下半年旺季有望实现10亿元确认收入 [3] - 终端市场覆盖超一半国内头部手机厂商,与吉利合作推出AI智能座舱并实现端到端语音大模型首次量产上车 [3] - 垂直行业拓展金融财经、内容创作、零售等领域,与行业头部公司合作打造C端场景化应用 [3] 技术研发与产品 - 发布新一代全尺寸原生多模态推理模型Step 3,性能提升且适配国产芯片优化成本 [2][7] - Step 3在国产芯片推理效率达DeepSeek-R1的300%,对所有芯片友好 [7] - 多模态布局涵盖3D、图像、视频、语音、音乐等,被称为"多模态卷王" [6] 融资与资本动态 - 上海国有资本投资有限公司生态体系将参与最新一轮融资 [4] - 上一轮融资为2023年12月B轮,投资方包括上海国有资本 [4] - 若融资进展快,公司或成"AI六小虎"中第三家公开新融资企业 [4] 行业竞争与趋势 - AI领域资本转向应用层投资,基础大模型热度降低 [4] - 多模态大模型被视为关键突破,可解决数据局限并赋能多元应用 [7] - 公司联合华为昇腾、沐曦等近10家芯片厂商发起"模芯生态创新联盟" [7] 财务与盈利 - 公司坦言暂未盈利,但模型通用性增强将扩大未来盈利空间 [2][4] - 行业现状显示尚无纯AI企业实现盈利 [3] 技术合作与生态 - 与千里科技、吉利汽车联合开发智能座舱Agent OS预览版,展示自然交互能力 [6] - 未排斥英伟达体系,Step 3在NVIDIA Hopper架构芯片上推理吞吐量提升超70% [8][9]
全球约八成医疗机构正在部署或设点生成式AI工具 人工智能正重构医疗健康全产业链
上海证券报· 2025-07-27 18:48
AI在医疗健康领域的应用趋势 - 人工智能正以前所未有的深度与广度重塑全球医疗健康产业链,覆盖临床诊疗、药械研发、医院管理等环节 [1] - AI技术为医疗健康产业打开新的发展空间和产业机遇,催生智能化、精准化、个性化的医学新范式 [1] - 全球约80%的医疗机构正在部署或设点生成式AI工具,这些系统被整合进运营、临床、行政等医疗工作流程中 [2] AI技术的具体应用 - AI技术在医疗健康领域的应用包括癌症早筛的智能诊断系统、阿尔茨海默症的AI预测模型、高效缩短新药研发周期的生成式AI以及高精度智能手术机器人 [1] - 从AlphaFold破解生命密码到大模型驱动诊疗效率革命,再到具身智能、生命纤维引领的医疗健康新可能,AI成为医药健康产业跨越式发展的核心引擎 [2] - AI技术呈现出从科研实验室走向临床医疗、卫生政策和医院管理体系的趋势 [2] AI在医疗健康领域的挑战 - AI在医疗健康领域的应用面临数据壁垒、监管伦理和技术标准等多重挑战 [3] - AI模型在医疗健康领域存在模型幻觉、逻辑不一致、缺乏可追溯性等具体问题 [3] - 信任危机与算法"黑箱"成为AI应用于医疗健康领域的最大障碍 [3] 行业应对措施 - 为确保AI医疗发展的安全性和有效性,需建立透明、包容和公平的制度,并加强机构合作 [3] - 推动数据安全网建设,加快制定医疗健康数据应用相关实施方案,完善数据分级分类管理体系,创新"数据可用不可见"的安全共享机制 [3]
AI教父辛顿尖峰对话:各国应大量研究并分享让AI善良的技术
21世纪经济报道· 2025-07-27 06:30
人工智能意识与主观体验 - 多模态聊天机器人已具备意识 当今的多模态聊天机器人已经具有意识 这取决于如何定义"主观体验"或"意识" [4][5] - 人类对意识的理解存在根本性错误 几乎每个人都对"主观体验"这类术语有着根深蒂固但完全错误的理论 这与人们对"水平"和"垂直"等日常词汇的错误理解类似 [4][5] - 智能体可从自身经验学习 一旦出现像机器人这样的在世界中的智能体 它们可以从自己的经验中学习 最终学到的会比人类多得多 [6] AI训练与安全 - 训练AI聪明与善良需不同技术 如何训练AI变得聪明和如何训练它变得善良是不同的问题 这是同一个AI但会通过不同的技术来实现 [6][7] - 各国应分享AI善良技术 各个国家应该分享让AI善良的技术 即便他们不愿意分享让AI聪明的技术 [6][7] - AI善良技术需随智能水平调整 随着系统变得更加智能 让它变得善良的技术也会发生变化 现在需要对其进行大量研究 [8] AI与科学进步 - AI在科学领域已有显著成就 在预测蛋白质如何折叠方面 AI可以做得更好 这是一个早期信号 预示着AI将在众多科学领域带来进步 [8] - AI在气象预测表现优异 在预测台风登陆地点和天气预报方面 人工智能可以做得比基于PDE的传统物理模型更好 [8][9] 科研方法论 - 寻找"所有人都搞错了"的领域 如果想做出真正原创的研究 就要寻找那些"所有人都搞错了"的领域 [10] - 坚持新思路直至验证 不要因为导师说"这个方法很蠢"就放弃 忽略导师的建议 坚持你笃信的 直到你自己弄懂 [10] - 重大突破来自坚持 偶尔你会发现你的信仰其实是正确的 重大突破正是由此而来 它们从不属于轻易放弃之人 [10]
AI教父Hinton对话上海AI Lab周伯文:多模态聊天机器人已经具有意识,让AI聪明和让AI善良是两件事
量子位· 2025-07-26 15:56
核心观点 - 人工智能教父Geoffrey Hinton首次访华并在上海参与高规格AI学术对话 认为当前多模态聊天机器人已具备意识[1][2][9] - 上海人工智能实验室发布全球领先科学多模态大模型Intern-S1 多模态综合能力超越Grok4等前沿闭源模型[3] - Hinton提出AI发展需区分"聪明"与"善良"的训练路径 各国可共享AI伦理技术但保留核心算法[14][15] - AI将显著推动科学进步 蛋白质折叠和气象预测已展现突破性应用前景[16] - 原创性研究应聚焦"多数人可能错误"的领域 坚持独立见解直至验证错误或实现突破[18] 人物背景 - Geoffrey Hinton:深度学习之父 发明反向传播算法 获图灵奖和诺贝尔物理学奖 家族与中国有深厚渊源[4][5][6] - 周伯文:上海人工智能实验室主任 提出Transformer自注意力机制理论基础 两篇生成式AI论文被引5000余次[6][7] 技术观点 - 意识本质是主体与客体的关系 非实体存在 人类对"主观经验"等概念存在普遍认知偏差[9][12] - 三维空间中物体方向概率分布存在114倍数量级差异 水平杆状物与垂直平面更具普遍性[10][11] - 智能体通过自身经验学习将超越人类数据训练效果 需警惕主观经验学习带来的未知风险[13] 行业动态 - 上海人工智能实验室提出"SAGE"技术框架 实现基础模型层-融合层-评估层的闭环反哺[3] - 科学多模态大模型Intern-S1具备多学科交叉、深思考能力 在多模态领域建立技术优势[3] - AI在蛋白质结构预测和台风路径预报等科学领域已展现超越传统方法的性能突破[16] 研究建议 - 年轻研究者应专注挑战共识性认知 即使被权威否定也需坚持至自我验证阶段[18] - AI伦理训练需建立动态调整机制 类似物理定律需随智能层级变化而迭代更新[15][16] - 科学发现与AI技术存在双向驱动关系 交叉领域将产生突破性创新机遇[16][17]