数字人
搜索文档
“技术迭代速度是唯一护城河!”李彦宏把百度 AI 秀了个遍,还称芯片拿大部分钱的 AI 生态不健康
AI前线· 2025-11-13 05:25
AI产业结构转变 - 当前AI产业关注点过度集中在底层技术与模型上,而市场对AI实际价值存疑[2] - 过去AI产业架构为不健康的“正金字塔”,芯片获得绝大部分价值,模型和应用经济效益依次递减[2] - 未来健康产业生态应为“倒金字塔”,模型需产生芯片10倍价值,应用需创造芯片100倍价值[2] - AI产业正从“智能涌现”走向“效果涌现”,AI成为企业发展和个人成长的原生推动力[2] 百度AI能力内化与验证 - 百度重点展示自身如何内化AI能力以验证“效果涌现”[3] - 公司已成为首家全线产品完成AI重构的公司,核心搜索业务已完成AI化改造[8] 数字人作为交互界面 - 数字人是AI时代的通用交互界面,具备完整形象与情感,可实现多模态交互[6] - 百度数字人交互体验接近真人,能感知环境并评论用户穿着[6] - 慧播星数字人带货GMV同比提升91%,开播直播间数同比增长119%,83%开播主播使用数字人[6] - 数字人已落地巴西市场,后续将拓展东南亚、美国及Shopee、Lazada等平台[6] - 百度发布“实时互动型数字人”,能深度理解真实世界并流露自然情绪[7] AI重构搜索业务 - 百度是全球搜索引擎中AI化改造最激进的,用AI重构搜索结果页[8] - 搜索从文字链接应用转化为以图片视频等富媒体为主的AI应用[8] - 绝大部分搜索结果由AI生成,首条结果富媒体覆盖率达70%[8] - 已有625家厂商通过百度智能云接入百度搜索API,与三星、荣耀、vivo等合作[8] 秒哒2.0开发平台 - 秒哒2.0提供两大核心能力:全流程覆盖的一键生成和一体化开发与多端部署[9] - 平台通过智能体协同工作,用户仅需自然语言描述需求即可生成应用[9] - 构建完整电商系统传统需数周,该平台仅需几分钟[10] 萝卜快跑无人驾驶 - 百度无人驾驶萝卜快跑每周全无人订单超25万,全球服务次数超1700万,成为全球第一[12] - 服务覆盖全球22座城市,全无人驾驶里程突破1.4亿公里,自动驾驶总里程超2.4亿公里[12] - 至2030年,美国robotaxi每英里成本预计降至约0.25美元,打车需求或放大5到7倍[11] 企业内化AI能力方向 - 企业内化AI能力有三个方向:自动化重复性工作、生产力无限供给、超越人类认知边界[15] - 百度已有52%新增代码由AI生成,目标提升至80%甚至90%[15] AI基础设施 - 百度智能云提供全栈式AI能力,包含AI Infra和Agent Infra两部分[16] - 发布新一代昆仑芯M100和M300芯片,分别于2026和2027年上市[17] - 发布天池256和512超节点,单个天池512超节点可完成万亿参数模型训练[17] - 昆仑芯已累计完成数万卡部署,成为百度AI关键底座[18] 智能体平台与大模型 - 百度AI智能体平台集成自研文心大模型及150多个主流开源模型[19] - 发布文心大模型5.0,参数量达2.4万亿,采用原生全模态统一建模技术[21] - 模型在40余项权威基准评测中与Gemini-2.5-Pro、GPT-5-High等模型持平[23] 自我演化超级智能体 - 发布全球首个可商用“自我演化”超级智能体百度伐谋,应用于交通、能源、金融等领域[24] - 百度伐谋能模拟生物进化过程,发现人类未发现的全局最优解[24]
李彦宏:数字人是AI时代一个全新通用交互界面
搜狐财经· 2025-11-13 03:23
行业技术发展趋势 - 模型能力已超越聊天机器人范畴,在数字人技术、代码智能体技术及通用场景中自主演化寻找全局最优解的技术方面取得长足发展[1] - AI产业结构正从“正金字塔”转向“倒金字塔”,即芯片之上的模型应产生10倍价值,基于模型的应用应创造100倍价值,形成健康生态[3] - 公司认为行业正跨越临界点,从“智能涌现”走向“效果涌现”,AI成为可用的解决方案而不仅是演示[3] 数字人技术进展与应用 - 数字人被视为AI时代的基础性技术和全新通用交互界面[1][3] - 公司宣布慧播星数字人技术向全球开放,其“实时互动型数字人”能深度理解真实世界并做出即时反馈,互动中流露自然情绪,实现全模态精准匹配[3][4] - 今年双11期间,慧播星数字人带货GMV同比提升91%,开播直播间数同比增长119%,83%的开播主播使用过数字人[4] - 慧播星数字人加速出海,已落地巴西市场,后续将拓展东南亚、美国及Shopee、Lazada等平台[5] 搜索业务AI化重构 - 公司搜索绝大部分结果由AI生成,首条结果的富媒体覆盖率达70%,10个问题中有7个答案为富媒体形式(如图片、视频、直播或数字人)[5] - 公司用AI重构搜索结果页,将搜索从文字链接应用转化为以富媒体内容为主的AI应用,自称是全球搜索引擎中AI化改造最激进的[5] - 公司通过AI API开放搜索能力,已与三星、荣耀、vivo等厂商合作,625家厂商通过百度智能云接入搜索API,该API正成为行业技术底座[5] AI能力价值定位 - 当AI能力内化为原生能力时,智能不再是成本而是生产力,成为企业发展和个人成长的原生推动力[3] - 公司强调AI需与每一项任务有机结合,任何企业或个人只有用好AI才能立于不败之地和掌控未来[3]
百度数字人现场演示失败 李彦宏表示“有些遗憾”
凤凰网· 2025-11-13 03:06
公司产品发布与演示 - 公司在百度世界2025大会上重点介绍了慧播星数字人技术,并进行了现场演示 [1] - 现场演示环节中,“数字人罗永浩”的实时互动出现黑屏故障,几经尝试未能成功,最终以“留下一个悬念”结束 [1] - 公司创始人李彦宏对此次演示表示“有些遗憾” [1] 产品技术定位与性能 - 公司将数字人定位为AI时代的一个全新通用交互界面,本质上是一种基础性技术 [1] - 公司发布了“实时互动型数字人”,能基于真实世界信息做出即时反馈,并在互动中流露自然情绪 [1] - 今年“双11”期间,慧播星数字人带货GMV同比提升91%,开播直播间数同比增长119% [1] - 83%的开播主播使用过数字人产品 [1] 市场拓展与战略 - 目前,慧播星数字人已落地巴西市场 [1] - 公司后续将发力东南亚、美国等重点国家和区域市场 [1] - 公司计划拓展Shopee、Lazada等电商平台 [1]
视频|李彦宏对话“罗永浩”:你下一次带货的方向是什么?
新浪科技· 2025-11-12 12:48
公司动态 - 2025百度世界大会将于11月13日举办 [1] - 百度创始人李彦宏提前视察大会展区,关注展区布局、文心大模型及AI眼镜等创新成果 [1] - 李彦宏与百度和罗永浩团队共同打造的数字人“罗永浩”进行互动 [1] 产品与技术 - 公司展示文心大模型及AI眼镜等前沿创新成果 [1] - 数字人“罗永浩”表示其带货方向将跟随科技趋势,例如智能手表 [1] - 李彦宏提及小家电领域也颇具潜力,数字人回应互动愉快 [1]
李彦宏对话“罗永浩”:你下一次带货的方向是什么?
新浪科技· 2025-11-12 12:38
公司动态 - 百度创始人李彦宏在2025百度世界大会前视察展区布局、文心大模型及AI眼镜等前沿创新成果 [1] - 李彦宏与百度与罗永浩团队共同打造的"罗永浩"数字人进行互动,讨论带货方向 [1] 产品与技术 - 公司展示了文心大模型及AI眼镜等前沿创新成果 [1] - 公司展示了与罗永浩团队共同打造的"罗永浩"数字人 [1] - 数字人互动中提及未来带货方向可能包括智能手表等科技产品 [1]
2025年世界互联网大会|数字人闪耀乌镇峰会 中国电信以技术+场景能力竞逐产业赛道
搜狐财经· 2025-11-10 17:33
行业技术发展 - 百度“剧本驱动多模协同的高拟真数字人技术”荣获2025世界互联网大会领先科技奖,该技术突破多模态实时协同、复杂动态交互等难题,实现语言、声音和形象协调一致,效果超过真人[1][3] - 科大讯飞推出具备高度多模态交互能力的数字人导览“小飞”,可实现多人自由对话、多语种交流并具备个性化记忆能力[3] - 数字人技术正从“形似”迈向“神似”,在交互自然度、场景适配性上实现飞跃,加速渗透商业直播、场景服务及文化传播等多元领域[3][4] 中国电信技术布局 - 公司构建算力、模型、平台三位一体的技术支撑体系,总算力规模超77EFLOPS,建成国产化全液冷单集群万卡智算中心[5][6] - 自主研发千亿参数星辰大模型,支持30种方言混说语音交互和文生4K视频,幻觉率降低40%,并打造“AI数智人创作平台”降低开发门槛[6] - 通过星辰AaaS、TaaS体系推动技术接口标准化,联合23家单位成立“AI投资联盟”,并与中国煤科、联想集团等开展跨界合作构建产业生态[7] 数字人应用场景 - 在文旅领域,3D数字熊猫“苏琳”荣获“正能量网络传播AI精品案例”,支持多方言识别且无网络环境也能稳定服务[8] - 在文化传播场景,新疆图书馆“AI馆员古丽图”依托专属知识库担任数字主持人,上海电信数字人“娜姐”和江苏电信AI“媒婆”分别在劳模讲堂和传统节庆中提供互动服务[9] - 数字人已形成多形态、广覆盖的应用格局,在形象逼真度、交互智能性及行业适配性上持续升级[10]
2025中国国际智能传播论坛-AI数字人论坛在无锡举办
江南时报· 2025-11-10 07:01
论坛概况 - 2025中国国际智能传播论坛-AI数字人论坛于11月7日在江苏无锡举办,主题为“构建数字人产业创新生态” [1] - 论坛由央视网、中国互联网协会、无锡市人民政府联合主办,吸引了政府部门、行业专家、企业领军者、高校代表及投资机构负责人等数百位嘉宾参会 [1] 政策与战略支持 - 无锡市已为人工智能产业构建完整的政策支持体系,覆盖关键技术攻关、场景开放应用到企业梯度培育等关键环节 [2] - 江苏省将人工智能创新发展作为主攻方向,全面实施“人工智能+”行动,全力打造“数实融合”强省 [2] - 数字人技术正深度融入无锡政务服务、城市治理、数字消费、教育医疗等多个领域,成为赋能千行百业的新兴力量 [2] 行业发展趋势与核心命题 - AI数字人发展的核心命题已从“如何打造”转向“为何打造” [2] - 数字人与智能体和智能终端相互融合,对产业链上下游的连接、嵌入、聚合作用不断增强,带动作用不断凸显 [3] - 行业一致认为AIGC对文化产业发展带来前所未有的挑战,同时也是巨大的机遇 [7] 企业战略与业务布局 - 央视网从“媒体+”、“文化+”、“生态+”三个方向开展AI数字人应用的探索与实践,推动构建开放共赢的产业共同体 [2] - 央视网科普频道正式上线,整合中央广播电视总台资源打造权威科普生态 [4] - 央视国际网络无锡有限公司与青岛尘元科技联合发布“元视智能-空间网络IA视觉处理平台”,使视频数据分析摆脱对GPU算力的依赖 [4] 产业合作与生态构建 - 论坛期间共有5项合作协议落地,覆盖央地媒体数字化升级、全流程产业招商体系共建等领域 [4] - 3组校企签约开展产教合作项目,包括共建“AIGC漫剧创作实践基地”和《AIGC大宋印画短剧制作》项目 [4] - “长三角AI数字人产业联盟”、“长三角AIGC产教融合共同体”、“中国互联网协会数字人应用(无锡)联合实验室”等一批机构同步揭牌 [5] 技术创新与平台发布 - “元视智能-空间网络IA视觉处理平台”仅使用X86架构服务器即可高效处理视频拆条、节目版权监测、视频检索、广告监播等多场景需求 [4] - 该平台实现了系统简单、高效、能耗低,能高效处理视频舆情、智能审核等任务 [4] 应用场景与成果落地 - 无锡正致力于推动数字人从“场景试点”走向“体系化赋能”,通过“政策+要素+生态”的组合拳培育产业森林 [7] - “数字人+AIGC”在文化IP开发、短剧创作、文旅场景创新等领域取得成果 [7] - 10个院校和企业负责人代表共同启动“人工智能赋能教育高质量发展长三角推进行动”,旨在构建“技术研发-场景落地-实训赋能-就业衔接-生态共建”的全链条推进体系 [5][6] 人才培养与产教融合 - 论坛设置AIGC产教融合研讨会,进一步细化人才培养校企合作方案 [8] - “人工智能赋能教育高质量发展长三角推进行动”探索共建人工智能产业学院、联合实验室和实训基地,形成“研发-试点-推广-就业”闭环 [5][6] - 参会嘉宾实地考察数字媒体应用落地场景,推动论坛成果转化为产业发展成果 [8]
高拟真数字人直播带货有多强
科技日报· 2025-11-09 23:41
核心技术优势 - 百度自主研发的剧本驱动多模协同高拟真数字人技术获得世界互联网大会领先科技奖 [1] - 该技术通过剧本驱动实现多模态协同 解决传统数字人语音、语言、视觉多模态割裂的问题 如台词生硬、情感匹配不佳、表情手势单一等 [1] - 基于大模型生成直播剧本 剧本自带视觉标签和语音标签 指导系统生成相应动作 [2] - 采用文本自控的语音合成方案 使数字人语音能精准传递调侃、得意、强调等细微情绪 提升自然度和感染力 [2] - 高一致性超拟真数字人长视频生成技术能对多模态信号进行分析 生成高表现力片段、复杂人—物—场交互片段及大动作大表情片段 并实现长时间跨度的统一调度 确保语音、口型、表情与动作高度一致同步 [3] 行业应用与经济效益 - 数字人是融合大语言模型与多模态技术的创新应用 电商直播是其落地的极佳场景 [1] - 数字人技术使商家无需投入大量人力物力进行现场直播 显著降低场地租赁、设备采购、人员培训等费用 [1] - 数字人可以24小时不间断直播 增加商品曝光时间和销售机会 提升经济效益 [1] - 数字人正逐渐从实验室走向各类应用场景 商业化进程显著加快 [3] 技术实现细节 - 台词生成需贴合主播人设与语言风格 确保个性化与一致性 在多主播场景中实现语义逻辑、语调节奏和情感风格的整体协调 [2] - 为提升台词内容深度 引入内容规划、知识增强与事实校验机制 以降低人工智能幻觉风险 [2] - 系统能对输入的历史视频数据、剧本脚本、语音信息以及骨骼驱动等多模态信号进行分析与理解 [3]
会写剧本、能凹人设,还顺带站上领奖台,这数字人包“会”的
猿大侠· 2025-11-09 04:11
文章核心观点 - 百度“剧本驱动多模协同”高拟真数字人技术实现了重大突破,能够生成具备“人味”的数字人,其不仅能说会演,还能有效进行商业转化 [2][4][7] - 该技术已从演示阶段进入大规模实际应用,在电商直播等领域显著降低了成本并提升了转化效率 [29][31][37] - 数字人正成为内容产业的新型基础设施,提供了一种更稳定、可控的内容生产路径 [39][40] 技术原理与创新 - 技术核心是“剧本驱动多模协同”,包含五项创新技术,旨在解决数字人语言、动作、表情协同问题,使其能像真人一样“说、演、动、听、想” [5][7] - 基于文心大模型,技术可扮演资深编剧角色,自动生成包含说话内容、方式、时机及动作表情配合的全流程直播剧本 [9][11] - 在罗永浩直播案例中,系统调用知识库超过1.3万次,生成了9.7万字的讲解内容 [13] - 采用自研文本自控语音合成大模型和上下文编码器,使数字人语音合成具备语气、节奏和情绪,并能实现自然的双人对话接梗 [23] 应用效果与数据 - 罗永浩数字人直播持续6小时,吸引观众超1300万,实现GMV超5500万元 [1][32] - 该技术已孵化超过10万个数字人,活跃于电商、教育、法律、政务等数十个行业 [29][30] - 应用该技术可使商家开播成本降低80%,转化率提升31% [31] - 具体案例显示,知识博主艾弥儿数字人将用户停留时长提升101%,蒙牛悠瑞数字人使转化率提高33%,山东夏津县助农直播1个月卖出3.3万斤农产品 [32] 行业影响与趋势 - 数字人解决了真人主播的疲劳问题,能保持长时间直播的状态、语气和人设一致性,成为品牌塑造IP和流程可控的新解法 [24][27][28] - 技术带来了“绿色降本逻辑”,通过算法驱动减少碳排放,并促进产业链协同创新 [33] - 该技术已成为百度电商生态的“默认选项”,支持24小时不间断直播,显著增加商品曝光和用户触达机会 [34][35] - 数字人不再仅是演示,而是在真实场景中拉动业绩、带动节奏、撬动增长的新型生产力 [37][38]
硅基智能递交港股IPO,8万个数字人今年开始赚钱了
21世纪经济报道· 2025-11-07 00:09
公司概况与市场地位 - 南京硅基智能科技集团股份有限公司于2017年成立,是国内市场份额第一的数字人智能体提供商,累计为电信、金融等行业提供超8万个“硅基劳动力”[1][3] - 根据灼识咨询报告,2024年公司在国内数字人智能体行业市场份额为32.2%[3] - 公司已完成D轮融资,估值达31.5亿元[2] 财务表现与业务转折 - 公司营收从2022年的2.23亿元持续增长至2024年的6.55亿元,但这三年均处于调整后亏损状态,亏损额分别为4622万元、2941万元和3524万元[3] - 2025年上半年公司首次实现扭亏为盈,营收3.26亿元,经调整净利润529万元[1][3] - 盈利转折得益于策略性地将更多资源集中于大型客户,减少对业务前景不明或资金流不稳定客户的投入[3] 客户结构与相关风险 - 公司收入高度集中于少数大客户,2025年上半年前五大客户贡献了87.5%的总收入,其中最大客户(某国内领先的电信运营商)收入占比达64.4%[2][4] - 自2024年起,公司新客户数量明显下滑,从2023年的890个减少至461个,2025年上半年仅新增145个[4] - 为维持大型客户,公司采取更具竞争力的定价模式,导致数字人解决方案毛利率从2023年的45.8%降至2025年上半年的31.6%[5] 业务模式与技术核心 - 核心业务是为B端企业提供数字人解决方案,技术核心来自自研的多模态大模型DUIX ONE,可在外貌、声音、表情等维度模拟真实人类[3] - 数字人主要应用于四个场景:AI电话语音客服、AI克隆视频生成、AI直播和AI智能交互[3] - 标准数字人劳动力解决方案售价一般在0.55万至2.5万元之间[5] 行业监管与市场环境 - 各大直播平台对数字人直播态度不一并加强监管,抖音要求AI背后的真人使用者需实名注册和认证,腾讯拟禁止非真实直播内容,快手反对利用AIGC生产低质量内容,淘宝要求数字人服务商必须通过官方认证[6][7] - “AI复活”等应用引发隐私和伦理争议,行业面临技术滥用风险[8] - 公司回应称在提供相关服务时会确保获得本人或家属授权,并对生成内容进行严格审核[9] 分销渠道演变 - 公司销售结构更偏向直销模式,分销渠道占比萎缩,分销商收入从2023年的约两千万元下滑至2025年上半年的五百万元,仅占总营收的1.7%[5] - 2023年数字人直播风靡时,公司分销商数量达到巅峰(251家)[5] - 部分分销代理商的不合规操作导致平台规则收紧,客诉出现,公司被指有虚假宣传嫌疑[6]