Workflow
语音同传大模型
icon
搜索文档
给杰弗里·辛顿做AI翻译的科大讯飞,怎么解决智能硬件体验瓶颈问题?
新浪财经· 2025-07-28 01:51
公司技术升级 - 公司在WAIC2025上展示最新语音同传大模型能力,中英同传首字响应时间提升至最快2秒,达到人类高阶同传标准[1] - 公司采用文本自适应调度的流式语音合成技术,实现边译边说功能[2] - 公司在医疗、制造业、金融等专业领域覆盖超过8万个垂直领域专业词汇,提升翻译准确度[2] 大模型布局 - 公司训练星火系列大模型,目前已更新至星火X1,强调多语言能力和推理特性[2] - 公司引入端侧大模型能力,提升无网络环境下的翻译水平,对硬件端侧算力提出更高要求[3] - 大模型的语义理解能力可更好消除口音造成的理解偏差,公司正在探索端到端解决方案[5] 智能硬件战略 - 公司通过录音笔、学习机、办公本等品类重点投入智能硬件领域,AI翻译是核心应用功能[2] - 公司将智能硬件分为三类:基础设备(手机、PC)、可穿戴设备、家庭机器人等新型产品形态[2] - 公司认为智能硬件市场需求不足源于未能真正解决消费者需求,以及缺乏软硬件结合思路[2] 产品体验优化 - 公司注重翻译场景下的软硬件强耦合,需进行大量软硬一体化优化工作[2] - 针对嘈杂环境,公司目标是翻译机能隔绝一米距离外的所有声音,需同时优化硬件和算法[3] - 公司正在研发多模态能力,通过增加信息维度提升转写和翻译效果[5] 全球化挑战 - 公司同传服务已覆盖全球50多个国家和地区,面临小语种和非母语者口音识别挑战[5] - AI翻译涉及语音识别和机器翻译两个层面,口音造成的误差可能被放大[5] - 解决方案包括扩大训练数据覆盖范围(标准和非标准口音)以及采用端到端方案[5]
直击WAIC丨科大讯飞携超20款AI展品,亮相2025世界人工智能大会
新浪科技· 2025-07-27 07:17
2025世界人工智能大会专题 - 公司作为大会翻译合作伙伴,承担多场学术论坛与技术交流同传工作,并展示医疗、教育、城市、金融、法律科技等领域的20余款AI展品 [1] 语音同传技术突破 - 最新升级的语音同传大模型首字响应时间最快达2秒,达到人类高阶同传标准,支持边译边说 [3] - 在医疗、制造业、金融等专业领域覆盖8万+垂直词汇,专业内容翻译得分突破90分 [3] - 讯飞同传累计服务超40万场次会议,覆盖全球50+国家和地区,服务超4亿人次 [3] 星火X1大模型进展 - 在翻译、推理、文本生成、多语言、数学等任务表现亮眼,支持130+语种交互 [3] - 生成内容真实性把控和外部资料引用忠实度显著提升,增强行业应用可靠性 [3] AI+医疗应用 - "智医助理"覆盖全国75000+基层医疗机构,累计提供超10亿次辅诊建议 [4] - 医学影像互联互通平台整合数据获取、存储、治理等功能,提供远程影像、智能辅诊等综合服务 [4] AI+城市与法律 - "星火智法·律小助"实现合同风险智能审查,可解析合同主体、条款性质并提示风险等级 [4] - 展示星火AIPC、城市智算中心、文旅大模型等城市建设领域创新应用 [5] AI+教育创新 - AI黑板整合数字化板书、分屏讲解等技术,可通过语音指令一键生成教学设计和课件 [5] AI+企业服务 - 星火飞码iFlyCode已服务数百家企业,覆盖能源、金融行业,提供代码生成、单元测试等全流程开发辅助 [5] - 星火知识库赋能企业知识全生命周期管理,吸引众多企业问询 [5] AI+机器人技术 - 聆动具身智能采训推一体机支持多品牌机器人数据采集和模型训练 [5] - 讯飞超脑平台"即插即用"智能语音背包无需硬件改造即可赋予机器人语音交互能力 [5] 学术参与计划 - 公司将举办多语言基座大模型国际学术研讨会,并深度参与财务、智能终端、医疗健康等分论坛 [6]