智能语音技术
搜索文档
人民日报专访科大讯飞董事长刘庆峰
搜狐财经· 2025-12-04 03:55
公司战略与定位 - 公司从智能语音识别技术起家,大模型研发是智能语音技术的延续,并非没有技术积累的“后来者”,2017年设立了认知智能国家重点实验室[3] - 公司选择“AI+行业”作为市场开拓方向,强调大模型需有看得见摸得着的应用场景,并通过统计数据证明成效,例如将技术应用于普通话教学、医疗服务等场景[4] - 公司正沿着原有路径开发“讯飞星火大模型”,并将其应用在科研、工业生产、民生等领域,以进一步助力解决实际问题[4] - 公司认为人工智能技术落地应用时,软硬协同、云端融合非常重要,通过终端设备与云端计算的有机结合,才能满足用户多样化需求[5] - 公司强调“讯飞星火大模型”的国产属性,认为必须利用国产算力进行大模型训练,以避免被别人“卡脖子”,并为此付出了巨大努力[7] - 公司坚持“顶天立地”的发展理念,“顶天”指关键源头技术要做到全球领先,“立地”指技术要大规模产业化形成自我造血[10] 业务聚焦与运营 - 公司通过不断尝试进行业务聚焦,回归最擅长的产品,产品线最多时有200多条,现已相应减少,未来还将进一步优化[6] - 公司专注于最擅长、有历史积累、熟悉情况的赛道,旨在让技术懂行业、懂用户,其余领域则通过开放平台,以技术赋能的方式支持广大创业者及优质企业[6] - 公司认为一家企业精力有限,如果什么都想干最终无法实现且存在很大风险,主张长期深耕于某一个行业,做深做透[6] - 公司2022年营收实现增长,但归母净利润出现下降,利润下滑主要由于公司加大了技术研发投入,这部分投入约占公司销售收入的20%[6] - 公司认为在通用人工智能时代来临之际,加大研发投入是避免被淘汰的必要之举,发展人工智能需要有长期主义精神[6] 技术发展与行业观点 - 公司认为人工智能产业链各环节需有自主创新的能力和决心,并相互深度融合,做大模型的公司需有耐心和底气承受创新与国产化过程中的成本与代价[8] - 公司认为人工智能技术迭代速度重要,但可靠和安全才是基石,强调“流水不争先,争的是滔滔不绝”[9] - 公司在中文语音合成技术、多语种合成和识别等方面取得了一定成果[10] - 公司认为发展人工智能离不开资本,但决不能只搞资本概念,指出前两年有企业利用大模型热潮进行资本运作但因缺乏实际应用场景而陷入困境[13] - 公司认为无论是大企业还是中小创业团队,都应对技术有敬畏之心,“朝前看”而非单纯“朝钱看”,需围绕社会刚需构建长期的综合竞争力[13] - 公司认为人工智能将从根本上改变生活方式并极大提升生产效率,但需避免只有少数人享受红利的情况[13] - 有研究显示,未来5年内大模型技术将替代全球约9000万个工作岗位,同时创造超过1亿个新兴就业岗位[14] - 公司认为需加大对人工智能时代所需的复合型人才的培养,并进一步加强民间资本的引入以助推科技成果加速转化[15] 应用实践与社会责任 - 在选择人工智能赋能的行业时,公司会评估行业是否欢迎、社会是否需要,以及公司自身是否有能力[11] - 以智慧医疗为例,公司判断人工智能可在该领域发挥作用,2017年其人工智能技术通过国家执业医师资格考试,并从合肥开始做全科医生助手提供辅助诊断[12] - 公司致力于用技术让世界更有温度,特别是在帮助特殊群体方面,例如为80多所特教学校提供产品和服务,累计为数十万听障人士提供超2亿分钟的免费转写服务[16] - 公司主张从社会刚需出发,让人工智能解决真问题,推动社会进步,目前致力于利用人工智能助力提升教育、医疗、科研水平,促进产业高质量发展[16] - 公司认为人工智能企业要有家国情怀,一定要把源头技术构建在自主可控的平台上,成为国家可以借助和使用的力量[16]
发展人工智能,要有长期主义精神(与企业家谈“新”) ——科大讯飞董事长刘庆峰访谈
人民日报· 2025-12-03 21:52
公司战略与市场定位 - 公司选择“AI+行业”作为市场开拓方向,强调大模型需有看得见摸得着的应用场景,并通过统计数据证明成效,例如将智能语音技术应用于普通话教学、医疗服务,并沿此路径开发“讯飞星火大模型”应用于科研、工业生产、民生等领域[2] - 公司认为人工智能技术落地应用时,软硬协同、云端融合非常重要,通过终端设备与云端计算的有机结合,才能满足用户在不同场景下的多样化需求[3] - 公司正在尝试中不断聚焦,回归最擅长的产品,产品线最多时有200多条,现已相应减少并计划进一步优化,专注于有历史积累、熟悉情况的赛道,其余领域通过开放平台以技术赋能的方式支持创业者和优质企业[3] - 公司强调一家企业精力有限,如果什么都想干最终一定无法实现且存在很大风险,主张长期深耕于某一个行业,做深做透[3] 技术研发与投入 - 公司2023年营收实现增长,但归母净利润出现下降,利润下滑主要由于公司加大了技术研发投入,这部分投入约占公司销售收入的20%[4] - 公司认为通用人工智能时代正在来临,现阶段加大研发投入必不可少,发展人工智能需要有长期主义精神[4] - 公司强调“讯飞星火大模型”的国产属性,认为如果不利用国产算力进行大模型训练,就始终存在无法突破的重大短板,缺乏长期发展的安全保障,使用国产算力训练大模型是为了避免被别人“卡脖子”[5][6] - 公司承认当前国产算力水平与国外仍存在差距,并面临部分国家的技术封锁,认为人工智能产业链各环节需有自主创新的能力和决心并深度融合,实现完全自主可控需要有耐心和底气承受创新和国产化过程中的各种成本与代价[7] - 公司认为人工智能技术的迭代,速度很重要,但可靠和安全才是基石,提出“流水不争先,争的是滔滔不绝”[8] 技术优势与积累 - 公司的大模型研发是智能语音技术的延续,并非没有技术积累的“后来者”,公司于2017年设立了认知智能国家重点实验室,拥有很好的研究基础[1] - 公司在中文语音合成技术、多语种的合成和识别等方面取得了一定成果,公司理念是“顶天立地”,“顶天”指关键源头技术要做到全球领先,“立地”指技术要大规模产业化形成自我造血[9] 行业应用与选择逻辑 - 在选择人工智能赋能的行业时,公司首先看行业是否欢迎、社会是否需要,然后评估公司自身能力,最终才会选择相关行业[10] - 以智慧医疗为例,公司判断人工智能可以在该领域发挥作用,该领域也需要提质增效、升级服务模式,2017年公司的人工智能技术通过国家执业医师资格考试,并从合肥开始做全科医生助手提供辅助诊断[10] 行业竞争与资本观点 - 公司认为在人工智能领域,创业者要找准自己的发力点和优势,从特定角度切入,避免做同质化竞争,大厂有体系化能力但“船大难掉头”,年轻创业者根基不深但灵活[11] - 公司认为发展人工智能离不开资本,但决不能只搞资本概念,指出前两年有些企业利用大模型热潮进行资本运作,但由于缺乏实际应用场景支撑,最终陷入发展困境,强调要对技术有敬畏之心,“朝前看”而非单纯“朝钱看”,需围绕社会刚需构建长期的综合竞争力[12] 社会影响与责任 - 公司认为人工智能将从根本上改变人们的生活方式,极大提升生产效率,但也要避免只有少数人享受红利,有研究显示未来5年内大模型技术将替代全球约9000万个工作岗位,同时创造超过1亿个新兴就业岗位[13] - 针对岗位被替代的劳动者,社会需要提前谋划兜底保障,对于人工智能产生的新岗位,需快速梳理并研究如何让劳动者获得免费的再就业培训,以适应新要求,减少产业革命对社会的冲击[14] - 公司认为要加速科技成果转化,需加大对人工智能时代所需的复合型人才的培养,培养既懂人工智能又懂各专业领域的顶尖人才,并进一步加强民间资本的引入[14] - 公司致力于发展“负责任的人工智能”,主张用技术让世界更有温度,更好地服务于社会公益,特别是在帮助特殊群体方面,例如目前公司给80多所特教学校提供了相关产品和服务,累计为数十万听障人士提供超2亿分钟的免费转写服务[15] - 公司强调人工智能企业要有家国情怀,一定要把源头技术构建在自主可控的平台上,成为国家可以借助和使用的力量,致力于利用人工智能助力提升教育、医疗、科研水平,促进产业高质量发展[15]
智能语音如何从可用到好用
经济日报· 2025-10-09 22:12
智能语音技术发展现状与驱动力 - 智能语音技术作为人机交互重要接口正加速融入生产生活 在虚拟助手和智能同传等场景实现流畅对答与跨语种无缝交流 [1] - 中国企业在语音识别、语义理解、语音合成等技术领域已跻身全球领先阵营达到国际先进水平 [1] - 中国拥有丰富的语料资源、完备的产业链条和庞大的用户市场为智能语音技术落地提供有力支撑 [1] 智能语音技术面临的挑战 - 技术规模化落地面临高质量场景化语料库缺乏、与核心业务融合尚浅以及跨系统互联互通存在障碍等制约 [1] - 技术应用需从“可用”向“好用”演进 把技术潜力转化为现实生产力是当前关键 [1] 技术应用优化与基础夯实路径 - 需联合行业主管部门、龙头企业及行业协会推动技术与实际业务场景深度契合 避免技术供给与产业需求脱节 [2] - 着力突破复杂环境下的抗噪处理、专业术语识别 提升机器精准理解连续对话的能力 [2] - 支持建设一批高质量、场景化的语音数据库和行业语料库以持续优化模型在实际应用中的表现 [2] 垂直领域深度融合与价值创造 - 智能语音技术已在医疗、教育、金融等领域形成典型应用 但与行业核心业务融合仍有广阔空间 [2] - 需坚持分业施策和应用导向 驱动技术与行业知识体系、核心业务流程深度耦合 实现从单点功能向核心赋能的价值跃升 [2] - 构建行业知识图谱与语音技术深度融合机制 推动应用从执行指令向解决业务问题跃迁形成完整业务闭环 [2] 创新消费场景与增长动能培育 - 智能家居、车载系统、可穿戴设备等终端是智能语音技术落地的重要载体 用户期望已从“听得见”转向“听得懂、会办事” [3] - 支持企业构建跨终端、跨场景的一体化服务生态 推动功能创新与体验优化 [3] - 积极培育融合语音交互的健康管理、车载娱乐、居家养老等智能原生业态 打造“终端+服务+内容”深度融合的新消费模式 [3] 政策支持与发展前景 - 国务院印发《关于深入实施“人工智能+”行动的意见》提出加快人工智能与经济社会深度融合 推动形成智能经济新形态 [3] - 智能语音技术将在“人工智能+”的广阔空间中发展 更好描绘赋能千行百业的生动前景 [3]