剧本驱动多模协同的高拟真数字人技术
搜索文档
2025年世界互联网大会|数字人闪耀乌镇峰会 中国电信以技术+场景能力竞逐产业赛道
搜狐财经· 2025-11-10 17:33
行业技术发展 - 百度“剧本驱动多模协同的高拟真数字人技术”荣获2025世界互联网大会领先科技奖,该技术突破多模态实时协同、复杂动态交互等难题,实现语言、声音和形象协调一致,效果超过真人[1][3] - 科大讯飞推出具备高度多模态交互能力的数字人导览“小飞”,可实现多人自由对话、多语种交流并具备个性化记忆能力[3] - 数字人技术正从“形似”迈向“神似”,在交互自然度、场景适配性上实现飞跃,加速渗透商业直播、场景服务及文化传播等多元领域[3][4] 中国电信技术布局 - 公司构建算力、模型、平台三位一体的技术支撑体系,总算力规模超77EFLOPS,建成国产化全液冷单集群万卡智算中心[5][6] - 自主研发千亿参数星辰大模型,支持30种方言混说语音交互和文生4K视频,幻觉率降低40%,并打造“AI数智人创作平台”降低开发门槛[6] - 通过星辰AaaS、TaaS体系推动技术接口标准化,联合23家单位成立“AI投资联盟”,并与中国煤科、联想集团等开展跨界合作构建产业生态[7] 数字人应用场景 - 在文旅领域,3D数字熊猫“苏琳”荣获“正能量网络传播AI精品案例”,支持多方言识别且无网络环境也能稳定服务[8] - 在文化传播场景,新疆图书馆“AI馆员古丽图”依托专属知识库担任数字主持人,上海电信数字人“娜姐”和江苏电信AI“媒婆”分别在劳模讲堂和传统节庆中提供互动服务[9] - 数字人已形成多形态、广覆盖的应用格局,在形象逼真度、交互智能性及行业适配性上持续升级[10]
会写剧本、能凹人设,还顺带站上领奖台,这数字人包“会”的
猿大侠· 2025-11-09 04:11
文章核心观点 - 百度“剧本驱动多模协同”高拟真数字人技术实现了重大突破,能够生成具备“人味”的数字人,其不仅能说会演,还能有效进行商业转化 [2][4][7] - 该技术已从演示阶段进入大规模实际应用,在电商直播等领域显著降低了成本并提升了转化效率 [29][31][37] - 数字人正成为内容产业的新型基础设施,提供了一种更稳定、可控的内容生产路径 [39][40] 技术原理与创新 - 技术核心是“剧本驱动多模协同”,包含五项创新技术,旨在解决数字人语言、动作、表情协同问题,使其能像真人一样“说、演、动、听、想” [5][7] - 基于文心大模型,技术可扮演资深编剧角色,自动生成包含说话内容、方式、时机及动作表情配合的全流程直播剧本 [9][11] - 在罗永浩直播案例中,系统调用知识库超过1.3万次,生成了9.7万字的讲解内容 [13] - 采用自研文本自控语音合成大模型和上下文编码器,使数字人语音合成具备语气、节奏和情绪,并能实现自然的双人对话接梗 [23] 应用效果与数据 - 罗永浩数字人直播持续6小时,吸引观众超1300万,实现GMV超5500万元 [1][32] - 该技术已孵化超过10万个数字人,活跃于电商、教育、法律、政务等数十个行业 [29][30] - 应用该技术可使商家开播成本降低80%,转化率提升31% [31] - 具体案例显示,知识博主艾弥儿数字人将用户停留时长提升101%,蒙牛悠瑞数字人使转化率提高33%,山东夏津县助农直播1个月卖出3.3万斤农产品 [32] 行业影响与趋势 - 数字人解决了真人主播的疲劳问题,能保持长时间直播的状态、语气和人设一致性,成为品牌塑造IP和流程可控的新解法 [24][27][28] - 技术带来了“绿色降本逻辑”,通过算法驱动减少碳排放,并促进产业链协同创新 [33] - 该技术已成为百度电商生态的“默认选项”,支持24小时不间断直播,显著增加商品曝光和用户触达机会 [34][35] - 数字人不再仅是演示,而是在真实场景中拉动业绩、带动节奏、撬动增长的新型生产力 [37][38]
百度获得世界互联网大会领先科技奖
北京商报· 2025-11-08 10:37
公司技术成就 - 百度“剧本驱动多模协同的高拟真数字人技术”获得2025世界互联网大会领先科技奖 [1] - 公司连续三年获得该奖项,是唯一连续三年获奖的人工智能公司 [1] - 此前获奖技术包括2023年“知识增强大语言模型关键技术”和2024年“文心智能体技术” [1] 技术核心特点 - 技术包含融合多模规划与深度思考的剧本生成、动态决策的实时交互、文本自控的语音合成、高一致性超拟真数字人长视频生成等创新 [1] - 突破了多模态实时协同、复杂动态交互等技术难题,实现数字人语言、声音和形象的协调一致 [1] - 技术特色为“高情商、强互动、长续航、更专业”,效果超过真人 [1] - 提升了数字人直播内容的质量和交互能力 [1]
创新成果与人才活力相互赋能 乌镇峰会搭建对接桥梁加速数智红利落地
央视网· 2025-11-08 02:56
峰会概况 - 2025年世界互联网大会乌镇峰会于11月7日在浙江乌镇召开,主题为“共筑开放合作、安全普惠的数智未来——携手构建网络空间命运共同体” [1] 前沿技术成果 - 领先科技奖共征集来自全球34个国家和地区的400余项有效申报成果,涵盖大模型、智联网、具身智能、量子计算等前沿领域 [4] - 最终有17个具有国际代表性的项目获奖,包括北斗三号卫星导航信号关键技术及应用、剧本驱动多模协同的高拟真数字人技术等 [4] 产业人才对接 - 峰会期间举办专场人才招聘会,通过线上线下联动方式汇聚1100多家企业,提供近万个就业岗位 [3] - AI开发工程师、资深算法工程师等人工智能相关职位成为招聘会上的热门选择 [3] 创新与人才协同 - 乌镇峰会通过领先科技奖发布、产业人才招聘会等多元举措,推动创新成果与人才活力相互赋能 [1][6]
会写剧本、能凹人设,还顺带站上领奖台,这数字人包“会”的
量子位· 2025-11-07 04:10
文章核心观点 - 百度“剧本驱动多模协同”高拟真数字人技术通过整合语言、动作、表情与反应,显著提升了数字人的拟人化程度和商业应用价值 [6] - 该技术已从演示阶段进入大规模商业应用,在电商、教育、政务等多个行业实现降本增效,并成为百度电商生态的重要基础设施 [22][28][34] - 技术核心在于使数字人具备自主生成剧本、实时互动决策及保持长时间一致性的能力,从而在直播等场景中达到甚至超越真人主播的效果 [8][13][20] 技术原理与创新 - 技术体系包含剧本驱动的数字人多模协同、融合多模规划与深度思考的剧本生成、动态决策的实时交互、文本自控的语音合成、高一致性超拟真数字人长视频生成五项创新 [4] - 基于文心大模型,数字人能自主生成包含说话内容、语气、动作及互动节点的全流程直播剧本,例如在罗永浩直播中调用知识库超1.3万次,生成9.7万字内容 [8][12] - 通过文本自控语音合成大模型和上下文编码器,数字人可实现带情绪语调的语音输出及自然对话衔接,使交互更具“人味” [15][16] 应用成效与数据 - 已孵化超10万个数字人,应用于电商、教育、法律、政务等几十个行业,助力商家开播成本降低80%,转化率提升31% [22][24] - 在罗永浩6小时直播中,数字人吸引观众超1300万,GMV达5500万+;知识博主艾弥儿数字人将用户停留时长提升101%;蒙牛悠瑞数字人转化率提高33% [12][25] - 在山东夏津县,数字人“慧播星”助农直播1个月卖出3.3万斤农产品,总销售超15万元,账号订单量近万单 [25] 行业影响与趋势 - 数字人技术提供了一种更稳定、可控的内容生产力路径,实现24小时不间断直播,显著提升商品曝光和转化机会 [29][35] - 技术推动“绿色降本逻辑”,通过算法驱动减少碳排和资源投入,并带动产业链协同创新 [26] - 数字人正从实验室演示转变为能“拉业绩、带节奏、撬增长”的商业工具,成为内容产业的新型基础设施 [32][34]
聚焦人工智能!2025世界互联网大会17个领先科技奖项目揭晓
搜狐财经· 2025-11-06 15:35
颁奖典礼概况 - 2025年世界互联网大会领先科技奖颁奖典礼在浙江乌镇举行,共揭晓17个具有国际代表性的年度获奖项目 [1] 获奖技术领域与特点 - 获奖技术覆盖广泛,包括日常应用的人工智能大模型、北斗卫星导航,以及前沿的光量子计算、卫星互联网 [3] - 具体获奖项目包括剧本驱动多模协同的高拟真数字人技术、低空智联网关键技术研究与应用、大众智能手机直连天通卫星系统的关键技术及规模应用等 [5] - 今年奖项评选吸引了全球34个国家和地区的400余项科技成果参选,涵盖类脑计算、群体智能、6G通信、高性能芯片、量子计算、卫星互联网等前沿领域 [5] - 奖项特点明显集中在人工智能,覆盖从芯片、操作系统、软件、模型、智能体到应用程序的全产业链,展示了行业在前沿科技上的前瞻性创新 [7]
美股异动丨百度涨超5.2%,连续三年获世界互联网大会领先科技奖
格隆汇· 2025-11-06 14:54
公司股价表现 - 百度股价上涨超过5.2%,报收于129.75美元 [1] 技术成就与行业地位 - 公司“剧本驱动多模协同的高拟真数字人技术”荣获2025世界互联网大会领先科技奖 [1] - 公司大模型技术连续三年获得该奖项,此前分别为2023年的“知识增强大语言模型关键技术”和2024年的“文心智能体技术” [1] - 公司成为唯一连续三年获奖的人工智能公司 [1]
百度数字人技术获2025世界互联网大会领先科技奖
新华财经· 2025-11-06 11:08
公司技术成就 - 百度“剧本驱动多模协同的高拟真数字人技术”荣获2025世界互联网大会领先科技奖 [2] - 该奖项为面向全球互联网领域的国际性科技奖项 本届大会收到来自34个国家和地区的424项科技成果申报 最终评选出17项年度领先科技奖 [2] - 百度首席技术官王海峰介绍 该技术包含融合多模规划与深度思考的剧本生成、动态决策的实时交互、文本自控的语音合成、高一致性超拟真数字人长视频生成等创新 [2] 技术优势与特点 - 技术突破了多模态实时协同、复杂动态交互等技术难题 实现了数字人语言、声音和形象的协调一致 [2] - 技术提升了数字人直播内容的质量和交互能力 具有高情商、强互动、长续航、更专业的特色 效果超过真人 [2] 应用成果与效益 - 基于百度数字人技术已生产超过10万个数字人 应用于电商、教育、法律等各行各业 [2] - 该技术帮助降低开播成本达80% 提升直播转化率31% [2] - 技术已在百度电商场景的明星、图书和健康直播上落地应用 [2]