Workflow
大模型技术
icon
搜索文档
当国产AI嵌入国产智能终端交互,AI应用落地加速
财富在线· 2025-06-19 09:27
大模型技术发展 - 大模型技术突破工具属性边界 成为驱动产业革新的核心引擎 场景化落地成为行业竞争核心命题 [1] - 2024年火山引擎在中国公有云大模型调用量市场份额达46.4% 位居首位 [1] - 火山引擎豆包大模型日均Tokens使用量超16.4万亿 较去年5月发布时增长137倍 [1] - 豆包大模型1.6版本在推理能力、多模态理解能力、GUI操作能力达到全球一流水准 [1] 技术应用与场景落地 - 火山引擎构建"技术-场景-生态"智能化落地合作新范式 加速AI应用场景落地 [3] - 公司与国产智能终端建立"技术支撑方+场景落地方"协同创新模式 聚焦手机AI助理、AI端云协同隐私安全、AI多模态交互、AI创作四大领域 [4] - 荣耀AI助手基于豆包大模型推出"一语修图"功能 实现语音指令完成AI场景扩图、图片换风格等任务 [4] - vivo系统级AI助手通过豆包大模型实现联网信息实时抓取 提升答案时效性与交互人性化 [4] 终端厂商合作案例 - OPPO手机AI意图搜索功能借助豆包大模型打破应用界限 提升模糊指令搜索能力 [6] - 努比亚与火山引擎合作开发多模态智能助手"小星" 构建听、说、读、写全场景交互体系 [6] 行业发展趋势 - AI能力需与真实场景深度融合 形成"应用反哺技术 技术赋能应用"的正向循环 [8] - 未来AI将通过生态共建增强产业渗透力 推动国产智能终端走"场景定义技术 生态驱动进化"差异化路径 [8]
具身智能领域,全球Top50国/华人图谱(含具身智能赛道“师徒关系图”)
Robot猎场备忘录· 2025-06-18 04:48
具身智能技术发展 - 具身智能赛道涉及大语言模型(LLM)、视觉多模态模型(VLM)、强化学习(Reinforcement Learning)、深度强化学习(Deep Reinforcement Learning)、模仿学习(Imitation Learning)等前沿技术 [1] - 人形机器人算法从早期基于模型的控制算法(LIPM+ZMP)发展到动态模型控制(MPC+WBC),再到当前主流的模拟+强化学习(IL+RL) [1] - IL+RL成为人形机器人公司最常采用的技术路径,主要由高校和头部科技大厂研发机构主导 [1] 顶尖研究机构与人才分布 - UC Berkeley在AI+Robotics研究领域排名第一,斯坦福大学次之 [2] - 全球Top50华人研究者主要毕业于UC Berkeley、斯坦福大学、MIT、CMU等顶尖院校,并师从行业权威导师 [4] - 具身智能领域华人学者普遍具有"清华大学-UC Berkeley-清华交叉信息研究院-创业"的职业发展路径 [2] 代表性华人学者与创业案例 - UC Berkeley"归国四子"吴翼、高阳、许华哲、陈建宇均师从Vision领域权威Trevor Darrell教授,后加入BAIR实验室并创业 [2] - 斯坦福博士王鹤师从美国三院院士Leonidas J Guibas,现任北大助理教授并创立银河通用机器人公司 [3] - 卢策吾曾任斯坦福AI实验室博士后(导师李飞飞/Leonidas Guibas),现为上海交大教授兼非夕科技首席科学家、穹彻智能创始人 [3] 行业研究资源 - 全球AI+Robotics领域华人图谱包含50位顶尖研究者的院校背景、导师关系、科研成果及创业公司详情 [3][5] - 行业研究资料涵盖具身智能赛道"师徒关系图"及970+从业者的深度讨论资源 [5]
百度高说服力数字人技术突破背后:文心大模型如何让罗永浩数字人“出圈”?
环球网· 2025-06-18 03:23
百度AI Day电商进展 - 公司宣布打造业界首个超头主播罗永浩数字人并展示高说服力数字人四大技术突破 [1] - 罗永浩数字人直播首秀吸引超1300万人次观看 GMV突破5500万元 部分核心品类带货量反超真人直播 [3] - 公司推出慧播星数字人产品 实现体验 内容 视觉 效果四大突破 带货能力与真人相当 [5] 高说服力数字人技术 - 高说服力数字人进入3 0时代 形神音容高度协调 具备思考决策和协作完成任务能力 [5] - 数字人技术基于文心4 5T实现多模规划与深度思考的剧本生成 实现"神 形 音 容 话"高度统一 [11] - 语音合成采用文本自控大模型 结合直播台词及发音人特征 实现自然流畅的声音 [11] - 数字人形象生成克服高可控交互 高精度 长时间一致性保持等难点 实现超拟真长视频生成 [11] 慧播星产品升级 - 慧播星实现双数字人互动直播间 复刻罗永浩与朱萧木默契配合 [7] - 产品在剧本 动作 声音 脚本 问答 互动等维度实现全方位升级 [9] - 通过海量数据训练生成数字人主播 结合商品特性与罗永浩人设定制直播剧本 [9] - 实现双数字人默契配合 属行业首创 支持一个直播间多种玩法 [9] 商业化布局 - 罗永浩担任慧播星首席产品体验官 数字人将不定期开播 [12] - 公司推出梦蝶计划实现超头主播数量倍增 繁星计划追加10万个慧播星数字人 [12] - 投入1亿元数字人消费补贴和千万级别运营扶持 助力普通人及中小企业开启数字人直播 [12] - 公司与交个朋友达成战略合作 结合AI能力与直播运营经验 供应链资源 [12]
特斯联空间智能赋能阿联酋图书馆:具身智能全场景服务
IPO早知道· 2025-06-18 01:26
中国科技企业出海 - 特斯联与阿联酋穆罕默德·本·拉希德图书馆的合作成为中国科技企业出海的典型代表之一 [2] - 合作始于2022年,旨在将智能机器人投入图书馆日常运营,提供自动化储藏、图书检索、递送、巡控、火灾探测等服务 [2] 特斯联智能机器人技术 - 依托自研计算机视觉算法,机器人具有定位误差小、响应速度快的特点,能精准完成导引、检索、递送任务 [5] - 通过多模态交互系统串联电梯、书架等40余类设备,为读者提供多样化服务 [5] - 大语言模型能力的突破推动智能机器人从"知识提供者"向"自主行动者"进化,弥补大模型在空间智能中的局限性 [5] 特斯联过往合作案例 - 作为2020迪拜世博会官方首席合作伙伴,提供超150台智能机器人,打造机器人协作系统 [5] - 为约1250万名访客提升接待、出行和配送体验,累计服务超84,000小时,进行超650,000次对话,行程超322,000公里 [5] 大模型技术与空间智能 - 大模型技术通过多模态融合、生成式智能等能力重塑空间智能技术范式,推动从单一感知向多维度智能决策演进 [6] - 中国科技企业发挥场景、应用层优势,加速技术出海,搭建跨国协作平台,构建空间智能的中国路径 [6]
北京打造“人工智能第一城”,核心产业规模近3500亿元
新京报· 2025-06-17 12:53
北京人工智能产业概况 - 北京人工智能企业数量突破2400家,核心产业规模近3500亿元,均占全国一半 [1] - 北京已成为中国人工智能创新资源最丰富的城市,拥有21家全国重点实验室和超40%的顶尖人才 [2] - 北京备案上线大模型132款,数量全国第一 [4] 技术创新与研发成果 - 北京建设4家人工智能领域新型研发机构,产出全球首个原生多模态大模型Emu等原创成果 [2] - 智源研究院发布"悟界"系列大模型,其中脑科学多模态通用基础模型见微Brainμ已完成超100万单位神经信号预训练 [3] - 北京产出全球首款光训练芯片,并布局光计算、晶圆级芯片等颠覆性技术路线 [4] 大模型技术发展 - 智源研究院2021年推出悟道1.0(中国首个超大规模信息智能模型)和悟道2.0(1.75万亿参数规模全球最大预训练模型) [2] - 智源开源技术体系FlagOpen已开源约200个模型和160个数据集,模型全球总下载量超6.4亿次 [3] - 面壁智能推出端侧模型小钢炮MiniCPM,集成无限长文本、超清OCR识图等功能 [4] 行业应用与场景落地 - 面壁智能在教育领域推出MAIC全自动课堂,实现AI辅助备课、自适应授课等功能 [5] - 北京前瞻布局AI+生命健康、AI for Science等前沿交叉领域 [6][7] - 北京构建"一委一业、一区一品"应用发展格局,推进大模型产品落地应用 [7] 基础设施与政策支持 - 北京2024年新增算力8620P,累计智能算力规模超3.3万P [7] - 北京发布中文互联网语料库CCI 4.0,上线人工智能数据运营平台,汇聚180余个数据集(总量超2000TB) [7] - 北京市支持新型研发机构创新体制机制,深化目标导向的有组织科研 [7]
【快讯】每日快讯(2025年6月17日)
乘联分会· 2025-06-17 08:43
国内新能源汽车发展 - 深圳启动"超充之城2.0"计划,重点推进重卡超充换电及乘用车闪充技术应用 [3] - 一汽奥迪Q6Le-tron家族首批100家授权店投入运营,覆盖全国核心城市,计划7月中旬扩展至超500家门店,预售车型CLTC续航达709-765公里 [4] - 极氪汽车智能座舱接入豆包大模型,整合抖音生态服务,实现语音交互与大模型无缝切换 [5] - 上汽通用五菱9款新能源车型入选2025下乡活动,预计三四五线市场销量占比超60% [6] - 比亚迪公布车辆无线充电专利,涉及系统、方法及存储介质 [7] 自动驾驶与新兴技术 - 文远知行与Uber及迪拜RTA合作,计划2026年实现纯无人Robotaxi商业运营 [8] - 吉利沃飞长空eVTOL产品AE200进入适航取证第四阶段,预计2026年商业化 [9] - LG新能源与奇瑞签署6年8GWh大圆柱电池订单,可满足12万辆电动车需求 [10] 国际汽车市场动态 - 英国政府投入40亿英镑扩建充电网络,目标新增10万个充电桩,吸引60亿英镑私人投资 [10] - 加拿大4月汽车总销量同比增长11.3%至195,659辆,但零排放车份额降至7.5% [11] - 美英贸易协议设定英国汽车进口配额为10万辆/年,征收10%关税 [12] - 现代汽车印度工厂投产乘用车发动机,VinFast计划2030年电动车年产能提至100万辆 [13] 商用车与氢能产业 - 一汽解放与厦门建发股份战略合作,聚焦国际化投资及供应链协同 [13] - 湖南省发布氢能三年行动方案,目标2027年形成10家骨干企业,构建"一港两廊多区"格局 [14][15] - 货拉拉首款车型"多拉八方"亮相,基于长安汽车资质生产 [15][16] - 北汽福田在巴西上市Tunland V皮卡,覆盖城市及农场多场景需求 [17]
企业级AI新赛道:字节跳动HiAgent如何与扣子协同布局?
搜狐财经· 2025-06-11 15:33
大模型技术演进与应用 - 大模型技术初期因"幻觉"特性受到企业生产环境应用的质疑,但随着技术进步,疑虑逐渐消散 [1] - 2025年6月11日,火山引擎发布豆包大模型1.6和视频生成模型Seedance 1.0 pro,标志技术进入新应用阶段 [1] - 深度思考、多模态和工具调用等模型能力提升是构建企业级智能体的关键 [5] - 豆包1.6采用"输入长度"区间定价策略,降低企业使用高级模型的成本 [5] 企业级智能体发展 - 2025年被视作智能体元年,技术、商业和生态需达到临界点才能实现真正爆发 [5] - 智能体商业模式将从按算力、按token收费转向按效果、按价值收费 [5] - 企业客户对AI智能体认知存在两极分化:高层高估能力,一线人员低估 [6] - 企业常将AI智能体视为传统软件工程,忽视持续学习和调优的必要性 [6] 技术平台与工具 - HiAgent企业级智能体开发平台完成大版本更新,补全企业级智能体版图 [5] - 基于Agent DevOps理念,HiAgent提供从策略规划到优化的全生命周期管理 [6] - HiAgent实现开发和运营一体化,支持智能体持续迭代优化 [6] - 平台提供统一智能体入口、行业样板间、模板库和一站式模型训推平台 [6] 行业应用前景 - 咨询机构IDC预计2025年生成式AI将优先在生产力提升场景和垂直行业落地 [5] - 金融、能源、零售、制造等行业将成为AI应用前沿阵地 [5] - 火山引擎定位为人机协同入口,支持千人千面的专属智能体呈现 [7] - 上一轮所有应用都将被AI重构成为行业新共识 [5]
开启端侧长文本时代!面壁全新架构,让小钢炮最快提升220倍
机器之心· 2025-06-09 08:03
端侧大模型技术突破 - 面壁智能发布MiniCPM 4.0模型,实现行业首个系统级上下文稀疏语言模型创新,稀疏度达5%,开启端侧长文本时代[3][4] - MiniCPM 4.0分为8B和0.5B两个版本,8B版本在长文本推理速度上比Qwen-3-8B等模型快5倍,极限场景下最高220倍加速[5] - 在128K长文本场景下,8B版本仅需Qwen3-8B 1/4的缓存存储空间,大幅降低资源需求[5][16] 性能表现 - MiniCPM 4.0-8B在MMLU、CEval等基准测试中性能对标Qwen-3-8B,超越Gemma-3-12B[10] - 0.5B版本实现每秒600 token高速推理,性能超越Qwen-3 0.6B[11] - 采用"高效双频换挡机制",根据任务自动切换稀疏/稠密注意力模式,实现不同任务的高效响应[13] 技术创新 - 提出InfLLM v2可训练稀疏注意力层,稀疏度从行业40%-50%降至5%,计算量仅为1/10[26][29] - 自研CPM.cu推理框架实现5倍速度提升,BitCPM量化算法实现4-bit量化,模型瘦身90%仍保持性能[31][32] - 开发UltraClean数据过滤策略,验证成本下降90%,处理15万亿token数据仅需1000小时CPU时间[33] 行业影响 - 模型已在英特尔、高通、华为昇腾等主流芯片平台完成适配,支持多种开源框架部署[18] - 与DeepSeek形成技术互补,面壁专注端侧稀疏化方案,DeepSeek强化云端模型能力[42][43] - 提出大模型"密度定律",认为语言模型能力密度每100天翻一番[49] 未来发展 - 计划近期推出更多MiniCPM系列基础模型及多模态模型[51] - 模型已在可信调查问卷生成、工具使用等场景展现广泛可用性[38] - 技术突破将推动手机、车机等端侧AI模型更新,可能重塑应用生态[19]
中国手机行业发展趋势分析与投资前景预测报告(2025-2032年)
搜狐财经· 2025-06-09 03:40
市场回暖与出货量增长 - 2024年全球手机市场销量同比增长7.1%,结束2023年十年最低点 [1] - 2024年中国手机出货量3.14亿部,同比增长8.7%,其中12月出货量3452.8万部,同比增22.1% [3] - 2025年1-2月国内市场出货量4690.5万部,同比增长1.9%,2月单月出货量1966.2万部,同比增37.9% [3] 5G手机成为主流 - 2024年中国5G手机出货量2.72亿部,同比增13.4%,占比86.4% [6] - 2025年1-2月5G手机出货量占比86.4%,2月单月占比达91.5% [6] - 2024年新上市5G手机207款,占新机型总量49.2%,2025年1-2月5G新机型占比升至61.2% [7] 国产品牌崛起与竞争格局 - 2024年国产品牌手机出货量2.69亿部,同比增16.3%,占同期出货量85.6% [10] - 小米2024年出货量1.69亿部,稳居全球前三;华为出货4840万部,同比增35.8%,增速居前十大厂商之首 [12] - 传音出货1.067亿部,同比增15%,首进全球第四;OPPO和vivo分别出货1.036亿部(+3%)和未明确数量(+14%) [13] 技术创新与AI驱动 - 2024年手机新机型数量同比下降4.5%,5G新机型降3.3%,反映技术创新难度加大 [14] - AI手机成为2025年关键趋势,Canalys预测2024-2028年AI手机市场CAGR达63%,2028年占比将达54% [16] - 华为、小米等厂商通过端侧大模型和生态整合布局AI赛道,如小米投入8.1亿构建算力集群,华为鸿蒙系统深度整合AI能力 [18][20] 市场竞争与品牌分化 - vivo成为2024年出货量最大厂商,华为次之,苹果出货量下滑17%,跌幅居前五品牌之首 [21] - 中端市场(2000-3000元)竞争加剧,vivo推出Y300 Pro+等新品,搭配AI大模型和长续航技术,售价1799-2499元 [5] - 高端市场技术迭代周期缩短至18个月,小米4000元以上机型销量增37%,vivo、OPPO分别聚焦影像芯片和折叠屏技术 [21] 区域市场与未来预测 - 华东、华南、华北为手机消费主力区域,2025-2032年市场规模预测显示持续增长 [36] - 2025年或成AI手机生态分水岭,厂商竞争围绕"终端入口-算力支撑-场景服务"链条展开 [20] - 行业未来增长点集中于AI技术渗透、5G普及及国产品牌高端化突破 [16][21]
智源研究院院长王仲远:大模型技术远没有发展到尽头
中国经营报· 2025-06-08 14:54
大模型技术发展现状 - 大语言模型性能提升速度明显放缓 主要受限于互联网数据使用瓶颈 [1] - 智源研究院推出"悟界"系列开源大模型 涵盖多模态世界模型 脑科学模型 具身大脑框架等创新方向 [1][3] - 行业从"百模大战"转向多元化探索 大语言模型竞争不再是唯一焦点 [1] 大模型性能突破路径 - 行业探索三种主要路径:强化学习提升推理能力 数据合成技术突破 多模态数据开发利用 [2] - 多模态数据规模是文字数据的成百上千倍 但当前利用率低下 [2] - 智源研究院聚焦原生多模态世界模型 旨在实现AI对物理世界的感知与交互 [2] 悟界系列大模型技术细节 - 包含Emu3多模态世界模型 Brainμ脑科学模型 RoboOS 2.0具身框架等四大核心模块 [3] - RoboOS 2.0与RoboBrain2.0适配轮式 双足 四足等各类机器人形态 已与20多家企业建立合作 [3] - AI Agent发展进入"好用"阶段 产业开始基于基础模型开发解决实际需求的智能体 [3] 具身智能与人形机器人进展 - 人形机器人2024年实现行走 2025年目标达到奔跑能力 但稳定性仍需突破 [6] - 行业面临"循环悖论":具身能力不足限制数据采集 数据稀缺又制约模型发展 [6] - 解决方案包括降低硬件成本至数千元级别 以及通过仿真数据补充训练 [7] 产业合作与生态建设 - 智源研究院与香港投资管理公司建立战略合作 推动人才 技术 资本协同发展 [4] - 机器人硬件厂商聚焦展示能力上限与成本控制 认为亲民价格将加速数据积累 [7] - 银河通用等企业展示具身大模型在商超场景的落地应用 [6]