数字人
搜索文档
科大讯飞发布AI软硬一体方案,实测抗噪能力远超iPhone 17 Pro
格隆汇· 2025-11-06 04:08
公司产品发布 - 公司在2025年1024开发者节上发布AI软硬一体解决方案,旨在通过AI与硬件深度融合提升复杂环境下的感知能力[1] - 讯飞智能办公本X5采用首创的上4下4环八麦克风阵列,在远场高噪环境下实测效果远超iPhone 17 Pro[1] - 讯飞AI翻译耳机在复杂噪声环境下识别准确率高达97.1%[1] - 讯飞双屏翻译机2.0在90dB的工厂轰鸣声中实现98.69%的识别率[1] 技术创新与应用 - 公司发布基于星火语音大模型的“百变声音复刻”技术,用户仅需一句录音即可高保真复刻任意音色[1] - 该技术通过一条指令便可创造任意声音风格,为数字人、有声读物、内容创作等领域带来新变革[1]
中邮消费金融科技创新赋能消费金融服务提升
搜狐财经· 2025-11-05 18:55
公司战略与技术应用 - 公司充分发挥业务场景优势和应用研发能力,与浙江大学联合研发数字人员工“邮小宝” [1] - 公司战略以科技为先,积极引入数字人、大模型等新技术赋能业务创新和运营升级 [2] - 公司理念以客户为中心,旨在提升服务效率和客户体验 [1] 数字人员工“邮小宝”的功能与特点 - “邮小宝”具备灵动逼真的虚拟形象和专业自然的交互能力 [1] - 与传统在线客服相比,“邮小宝”能高度模拟真人的形态、行为和情感表现,增强服务互动性 [1] - “邮小宝”可提供24小时不间断服务,实现快速响应和及时解决客户问题 [1] 业务场景应用与成效 - “邮小宝”广泛应用于客户服务、风险面审、知识科普、新闻播报等业务场景 [1] - 在风险面审、优客贷首次提现等场景中,“邮小宝”能完成视频语音认证、人脸识别等动作,提升防欺诈能力 [2] - 通过化身虚拟讲师和新闻主播,“邮小宝”能生动科普产品知识并自动生成新闻播报 [2] 行业发展趋势 - 金融与科技融合的新时代到来,推动金融服务向个性化、智慧化、便捷化方向发展 [2]
昆仑万维全新SkyReels正式焕新上线
证券日报网· 2025-11-04 07:41
产品发布与定位 - 昆仑万维旗下AI视频创作平台SkyReels于11月4日正式上线Web端与移动端App [1] - 平台核心定位为一站式与多模态AI创作平台 独家优势在于聚合全球顶尖AI多模态模型 [1] - 平台集成图片生成 视频生成 数字人 音乐生成等多种AI创作方式 [1] 核心技术能力 - 此次更新搭载自研模型SkyReels V3 代表一系列多模态视频生成模型 [1] - 模型基于Multi-modal In Context Learning框架预训练 并通过子任务精调优化 [1] - 核心更新能力包括无限画布 数字人 模板功能 专家Agent 视频延长和风格化 [1] - 所有AI功能和全球顶尖模型集成于同一创作空间 实现多模态内容无缝融合 [2] - 用户可通过AI编辑 Agent Chat和拖拽三种方式在无限画布上自由组合素材 [2] 智能系统与交互创新 - 平台推出Agentic Copilot模式 提供双核智能系统支持多模态输入输出 [2] - 未来将实现Super Agent(1个全能创意助手)与Expert Agents(28位行业专家)的相互协作 [2] - SkyReels V3是业内首个支持单镜头多人多轮对话的数字人模型 [2] - 模型能精确控制每个角色的说话时机与节奏 实现多角色自然流畅互动 [2] 数字人功能与应用场景 - 数字人功能覆盖全场景对口型 支持单人图片驱动 视频驱动及多人多轮对话的图片驱动对口型 [3] - 支持最长4分钟的连续对口型 并具备丰富的运镜组合 [3] - 模型可应用于影视级对话场景 电商双人口播 游戏素材创作等多种专业场景 [3] - 音频驱动的视频生成模型首次具备多人场景的生成能力 [3] 行业趋势与未来展望 - 视觉/音频等生成模型预计保持高速迭代与更新 [3] - 模态之间的融合创作将进一步加速 模型效果与可控性将持续提升 [3] - 内容生成成本预计持续降低 [3]
连续三年亏损、目标1亿硅基劳动力仅完成0.8% “数字人”制造商硅基智能冲刺港股
每日经济新闻· 2025-11-04 02:26
公司财务表现 - 公司2022年至2024年连续三年亏损,期内亏损分别为1.11亿元、9591万元、1.12亿元,三年累计亏损超3.18亿元 [3] - 2025年上半年报告期内净亏损829万元,但经调整净利润为529万元,经调整净利率为1.6% [3] - 公司收入从2022年的2.23亿元大幅增长至2024年的6.55亿元,2025年上半年录得收入3.26亿元 [3] - 公司收入高度依赖大客户,2022年至2024年及2025年上半年,来自五大客户的收入占比分别为56.4%、57.7%、78.9%、87.5% [3] - 最大客户为一家领先电信运营商,其贡献的收入占比从2022年的16.6%大幅上升至2023年的64.4% [3] - 公司成立至今已完成8轮融资,获得腾讯、红杉资本、招银基金等知名机构投资,最新一笔融资于2025年6月来自嘉兴高新,金额2亿元,投后估值为31.5亿元 [3] 公司业务与目标 - 公司是一家深耕数字人领域8年的AI企业,主要从事硅基智能语音、硅基数字人视频、硅基数字人直播及硅基数字人智能交互等产品研发 [1][3] - 公司创始人司马华鹏设定目标,计划到2025年为全球提供1亿硅基劳动力 [5] - 硅基劳动力是公司对数字劳动力的创新性命名,区别于碳基人类劳动力 [6] - 截至2025年10月底,公司已向电信、金融、医疗、教育及公共服务等行业客户提供超过8万个硅基劳动力,完成1亿目标的0.8% [1][7] - 这8万多个硅基劳动力已在智能客服、虚拟主播、数字员工等场景实现商业化落地 [7] - 公司计划将此次港股募资用于研发投入、营销推广及全球范围内的收购及生态合作 [7] 行业市场状况 - 2024年中国数字人智能体市场规模为20亿元,全球市场规模为41亿元 [7] - 预计到2030年,中国数字人智能体市场规模将达到155亿元 [7] - 数字人智能体行业处于快速增长期,但面临技术落地与商业化的双重挑战 [7] - 不同行业对数字人的需求差异较大,金融、电商等领域落地较快,而医疗、教育等专业领域因合规要求高、场景复杂,规模化推广难度较大 [7] 创始人背景 - 公司创始人司马华鹏现年43岁,为连续创业者,毕业于南京航空航天大学电气工程及其自动化专业 [4] - 司马华鹏在全球113项专利中被列为发明人,其中包含公司拥有的82项中国注册专利 [5] - 公司打造了一系列大司马IP,如硅基大司马、科技大司马等 [5]
大模型爆发后,数字人行业开启淘汰赛
36氪· 2025-10-30 12:43
行业演变与市场格局 - 2021年数字人成为风口,但大模型出现后相关概念公司减少,AI智能体和AI助手成为新焦点 [1] - 大模型爆发对3D数字人公司提出更高要求,缺乏AI能力的公司被淘汰,行业公司数量减少 [1] - 2024年2D数字人市场落地迅速,市场份额占比70.1%,3D数字人市场份额较小,占比29.9% [1] - 行业存在产品质量参差不齐现象,GPU成本高且服务不稳定,难以实现7×24小时无差错服务 [1] 3D数字人发展的挑战 - 3D数字人发展受限于技术迭代速度,其能力未能匹配已规模化的大模型语言能力 [1][2] - 制作高质量3D数字人需要高质量数据积累、稀缺人才储备及强大美术能力 [2] - 涉及人体动作和环境交互的3D数据稀缺,大部分公司缺乏积累此类数据的能力 [2] - 3D内容制作人才与AI研究人才存在割裂,将两类人才聚集存在难度 [2] 技术驱动与平台化趋势 - 大模型爆发加速行业洗牌,3D数字人制作呈现平台化发展趋势 [3] - 生成式AI与大模型驱动AI数字人技术架构升级,多模态能力持续突破 [4] - AI技术普及降低终端设备部署数字人成本,使规模化应用成为可能 [4] - 魔珐科技上线具身智能3D数字人开放平台,开发者可在3分钟内完成数字人接入 [4] 商业化应用与未来前景 - 数字人方案落地领域集中在展馆、文旅景区、教育培训等工具化属性更强的场景 [3] - 各地发布鼓励人工智能发展战略,促使机构重视数字化应用 [3] - 开放平台可成为基础设施,3D数字人未来更大市场是扮演白领角色 [5] - 更多开放平台出现将降低数字人制作门槛,但其在AI时代的具体作用尚无定论 [6]
刘润年度演讲:AI智能体的L1 形态,数字分身!
搜狐财经· 2025-10-28 12:23
文章核心观点 - 数字人正从概念性的科技表演转变为企业不可或缺的生产力工具,是离普通企业最近的AI应用形态 [1][3] - 人工智能正从分析式AI、生成式AI向代理式AI和实体式AI进化,数字人是连接数字世界与物理世界的桥梁 [3] - 数字人应用的核心价值在于解决实际问题并创造真实的商业价值,而非作为技术“花瓶” [3][6] AI智能体演进与数字人定位 - AI智能体被划分为L1到L5五个等级,L1数字分身是数字人的核心应用形态 [3] - 数字人是AI智能体演进中最易被普通人感知和理解的形式 [3] - 未来企业将像养员工一样把AI数字人作为重要资产 [3] 风平智能公司概况 - 公司已完成累计近亿元A轮系列融资,并实现盈亏平衡,在AI行业中较为少见 [3] - 公司演进路径从“保险查查”平台到将AI数字人单独产品化,核心思路始终围绕市场需求 [6] 风平智能技术优势 - 技术大幅降低使用门槛,仅需一张照片即可完成形象建立,常规建模周期仅需3分钟 [3] - 技术突破使成本降低90%、效率提升500%,让数字人成为中小型企业也能负担的“日用品” [3][5] 数字人应用的商业价值 - 在直播领域,可将企业年成本从几十万元以上优化至一年只需几千元 [6] - 对出海企业,视频制作成本从每部500-1200元降至几十元 [6] - 在医疗健康行业,客户原每年支付超1亿元的费用,使用数字人后预计降低80% [7] - 数字人能将专业人士的知识和经验标准化、规模化,提高内容生产效率 [7] 数字人作为企业资产的特性 - 数字人不会离职,不会状态不佳,其能力和知识可以持续积累和迭代 [8] - 数字人会成长,伴随企业不断快速迭代自身能力 [8] 企业应用数字人的行动指南 - 明确需求先行,思考用数字人解决降本增效或扩展市场等问题 [8] - 小步快跑验证,从小场景如客服、培训或营销切入,验证效果后再扩大应用 [8] - 关注数据积累,数字人的价值在于持续学习,需有意识地积累数据和优化模型 [9]
丰源投资:钟情“文化+科技”领域,推动好项目广东落地生根
21世纪经济报道· 2025-10-20 11:08
公司概况 - 丰源投资成立于2022年 是一家专注于前沿科技商业化 制造业转型升级和城市更新领域的股权投资平台 [1] - 公司创始团队拥有深厚金融背景 创始人符正曾供职于UBS瑞士银行亚洲并购和企业融资部 后加入CVC Capital Partners担任中国区投资总监 [1] - 公司最初起家于文化消费科技领域投资 其生态企业英雄游戏曾是《黑神话:悟空》开发商游戏科学的重要早期投资方 [1] - 公司创始团队曾参与对英雄体育的早期投资 目前英雄体育已成为全球最大的电竞内容制作方 [1] 公司战略与诉求 - 公司期待通过2025粤港澳大湾区文化产业投资大会这一平台 为资金找项目 为项目找资金 发现更多代表未来生活方式的优质项目 [1][2] - 公司希望获得更多精准的符合其投资赛道的高成长性项目推荐 [5] - 公司有兴趣与当地政府或机构探讨共同设立或参与面向文化科技产业的专项基金 推动好项目在广东落地生根 [5] - 公司希望在游戏 影视等领域的产品版号申请等方面为其关联企业获得必要指导与支持 [5] 行业趋势与区域优势 - 文化产业与科技领域融合加速 AIGC 元宇宙 数字人 智能硬件等已渗透到生活各方面 重塑文化产品创作和消费方式 开辟崭新投资空间 [3] - 广东省是文化产业第一大省 文化产业规模总量连续22年居全国首位 2024年广东省规模以上文化企业营业收入达2.5万亿元 约占全国六分之一 [4] - 广东文化新业态表现亮眼 2024年营业收入达9150亿元 增长10.5% 在数字创意 动漫游戏 网络视听 数字文化制造等领域有较强竞争力 [4] - 广东发展文化产业核心优势明显 包括完整的文化产业链条 高效的政务服务 明显的综合成本优势 强大的媒体资源网络以及丰富的高质量人才储备 [3] 平台与政策支持 - 2025粤港澳大湾区文化产业投资大会以“为资金找项目 为项目找资金”为运营理念 [1] - 从2023年开始 文投会已成功举办两届 两届大会共发布文化产业投资基金约250亿元 [4] - 2023年文投会意向投资签约金额20亿元 1年内实际融资金额15.1亿元 2024年大会意向签约金额56亿元 截至目前实际融资金额63.87亿元 [4] - 2024年5月广东出台了新一轮推动文化产业高质量发展的政策包 覆盖六大领域 一次性释放87条政策 全力托举文化新业态实现新突破 [4]
【财联社早知道】国常会要求推动AI与物流深度融合,机构称物流领域AI技术的整体渗透率已超37%,这家公司已完成本地化部署
财联社· 2025-10-19 10:21
人工智能与物流融合 - 国常会要求推动人工智能与物流深度融合 [1] - 物流领域人工智能技术的整体渗透率已超过37% [1] - 某公司已完成DeepSeek大模型的本地化部署 并表示将持续推动人工智能技术在物流行业的创新应用 [1] 生成式人工智能发展 - 中国生成式人工智能用户规模达到5.15亿人 [1] - 人工智能当前处于政策、技术、需求三维共振阶段 [1] - 某公司打造了融合AIGC内容生成、Agent智能体协同、数字人交互三大核心能力的企业级媒体数智台 [1] 机器人产业链 - 某公司研发的刀具可用于人形机器人丝杠加工 [1]
百度搜索重磅升级文心助手:8模态创作+实时数字人智能体重构AI交互生态
搜狐财经· 2025-10-16 23:36
产品升级概述 - 百度搜索正式宣布文心助手AIGC创作能力全面升级,推出涵盖AI图片、AI视频、AI音乐、AI播客等8种模态的创作矩阵[3] - 此次升级标志着搜索引擎从信息检索工具向“全能创作与服务平台”的深度转型[3] - 同步发布行业首个开放式实时互动数字人智能体[3] AIGC创作能力突破 - 核心突破集中在视频生成领域,依托百度蒸汽机(文心专精)模型的技术迭代,突破传统AI视频10秒左右的时长限制,实现输入一段话生成3分钟故事大片的长视频实时交互创作[3] - 从情节设计、角色建模到镜头运镜、配乐合成全流程由AI自动完成,生成速度已超越国内主流同类模型[3] - 平台集成“一句话写歌”、MV制作、名场面模仿秀等特色功能,搭配超30种特效模板,形成覆盖静态图像处理、动态视频制作、音频创作的完整生态链[3] - 文心助手用户日均生成AIGC内容已突破千万量级[3] 任务解决能力升级 - 通过构建多工具调用引擎,用户可一键触发跨领域服务,覆盖生活规划、健康咨询、教育辅导、职场办公等核心场景[4] - 系统可根据用户查询自动整合文本、图片、短视频等多种资源并生成解决方案,无需用户多次切换工具[4] - 该功能通过持续学习用户交互数据,正不断优化工具组合策略与响应效率[4] 数字人智能体技术亮点 - 开放式实时互动数字人智能体基于文心大模型4.5构建,融合NOVA数字人技术优势[4] - 通过10分钟真人样本数据即可复刻声音特征、动作习惯与微表情,口型准确率与表情自然度达到行业领先水平[5] - 采用云渲染与端渲染双引擎适配,兼容多终端场景,实时对话延迟控制在百毫秒以内[5] - 目前已接入法律、情感、旅游等领域的专家数字分身,用户可直接就专业问题展开深度对话,未来还将开放第三方开发者平台[5]
百度世界2025启幕:聚焦AI核心议题,智能体数字人引领应用创新浪潮
搜狐财经· 2025-10-15 15:22
大会概况 - 百度世界2025大会定于11月13日在北京国家会议中心二期举办 以“效果涌现|AI in Action”为主题 [1] - 大会将全方位呈现公司在人工智能领域从前沿探索到产业落地的成果 [1] 核心议程与内容 - 公司创始人将通过主题演讲发布多项重大技术突破 涵盖智能体开发、数字人应用、AI计算架构等六大核心领域 [3] - 分论坛设置覆盖从底层模型训练到行业解决方案的全链条 将举办40余场AI公开课 [3] 技术产品进展 - 文心大模型迭代至X1.1版本 在逻辑推理、多模态理解等关键指标上超越国际主流模型 [3] - 搜索服务完成十年来最大规模改版 文库、网盘等产品的日活用户持续增长 [3] - 零代码开发平台“秒哒”已助力用户创建20万个应用 [3] - 千帆企业服务平台累计服务46万家企业 [3] 商业化与生态成果 - 新一代数字人支撑的直播首秀单场GMV突破5500万元 [3] - 千帆平台累计孵化的智能体数量达到130万个 已渗透至教育、医疗、金融等多个领域 [3] 无人驾驶业务 - 萝卜快跑与Uber、Lyft等国际出行平台达成战略合作 服务网络覆盖16个国际城市 [4] - 自动驾驶出行服务累计完成超1400万次 [4] - 公司自动驾驶技术方案已在亚洲、欧洲及中东市场实现商业化运营 [4] 行业影响与历史定位 - 百度世界大会自2006年首届举办以来 已成为全球AI技术演进的重要见证者 [4] - 大会持续推动AI技术从实验室走向产业前沿 构建起覆盖芯片、框架、模型、应用的完整生态体系 [4]