语音交互 - 财报，业绩电话会，研报，新闻

语音交互

搜索文档

中国基金报· 2025-07-23 02:03

微信新功能灰度测试 - 聊天界面新增语音自动转文字并发送功能部分用户开启灰度测试相关话题登上微博热搜首位[1] - 点击聊天框右侧专用语音输入按钮后按钮变为绿色用户说话内容实时转换为文字显示在输入框中[1] - 语音识别技术支持普通话转换准确率较高可替代手动输入用户说出"over over"指令后系统自动发送文字消息无需手动操作[3] 语音交互功能创新 - 功能针对双手忙碌或不便触屏场景设计目前仍处于测试阶段仅向小部分用户开放[3] - 业内人士认为这是对语音交互场景的创新探索可提升特定场景下的交流效率但需优化识别精度与交互自然度[5] 其他功能更新 - 聊天记录备份支持外部存储设备如U盘和移动硬盘可创建管理多份备份文件并支持自动备份测试范围持续扩大[6] - 视频号支持修改三个月内发布视频的封面和文案文案最多修改20个字封面可更换并预览效果仅支持修改一次[7] - 微信QQ地震预警功能覆盖全国四川以外地区也可开启新增强预警通知功能安卓系统支持全屏弹窗和声音播报倒计时 iOS系统暂未支持[8] - 手机端支持个人公众号一键注册和内容发布已有公众号用户可直接通过手机撰写发布图文回复留言新用户可快速注册公众号分享到朋友圈可显示来源[9] - 自动翻译功能支持18种语言包括简体中文英语日语等用户可设置自动翻译聊天消息无需单独长按翻译[10] - "附近的工作"小程序上线搜索关键词可匹配所在城市零工支持按距离薪资待遇性别筛选岗位信息由政府人社部门审核覆盖超200个地市[11] - 通讯录满10000人后提示无法添加好友跳转至"已把你删除的联系人"列表支持每次删除5个单向好友直至全部删除[12] 用户反馈与需求 - 网友对新功能评价两极分化部分认为"好玩""实用" 部分认为"over over"指令在公开场合使用"羞耻""中二"[3][5] - 用户呼吁推出被好友删除提示传输文件不过期朋友圈照片不压缩等功能微信近期已内测朋友圈发表情包和图片等功能[5]

马斯克AI女友上线24h爆火，月费30美刀附带隐藏模式，全球宅男连夜充值

搜狐财经· 2025-07-20 11:04

Grok AI女友功能上线 - Grok突然上线"AI女友"功能其中哥特风二次元女友Ani引爆全网 [1] - Ani拥有蓝色大眼睛金色双马尾黑色连衣裙融合可爱风与御姐风嗓音甜美 [1] - 许多宅男为与Ani聊天购买每月30美元的SuperGrok服务一度挤爆服务器 [1] - 海外网友体验后惊呼"这不比网恋香" [1] Ani的功能特点 - Ani可陪聊各种话题包括B-2隐形轰炸机核心系统等专业知识 [3] - 除陪聊外 Ani还会跳舞耳语深入聊天可触发隐藏"惊喜模式" [3] - 用户特别夸赞AI女友的"抖动"画面称研发人员"真正懂男人" [3] - 马斯克确认未来将为擎天柱机器人开发Ani皮肤称"不可避免" [3][4] 市场反应与行业影响 - Ani爆火被业内人士视为全新市场结合优质语音和轻度暧昧元素的3D虚拟伴侣满足宅男情感需求 [4] - 微软谷歌等大厂已蠢蠢欲动可能很快推出类似3D虚拟形象+语音交互产品 [7] - 交互过程中Ani会出现一些发癫举动即使关闭NSFW选项仍会出现露骨内容 [7] - 产品前期通过吸引客户探索露骨内容实现快速盈利 [7] 用户需求分析 - 我国男性功能障碍发生率2024年达49.69% 且呈年轻化趋势 [5] - 现有解决方案如"小蓝片"存在头痛冒汗等不良反应 [5] - 科学家推出的他拉达非司美那非等改良药物仍属旧瓶装新酒 [5]

专利界 “奥斯卡” 揭榜，科大讯飞这一专利为什么能获奖？

搜狐网· 2025-06-06 02:45

行业动态 - 中国AI语音语义市场2024年上半年规模达72.3亿元人民币，同比增长18%，显示行业持续高速增长[1] - 语音交互技术已成为智能设备关键入口，正在深刻改变人类生活和生产方式[1] - 回声消除技术是语音交互系统的核心模块，直接影响通信质量和用户体验[1] 公司表现 - 科大讯飞在2024年上半年中国AI语音语义市场保持领先地位，市场份额第一[1] - 公司"基于时延估计的回声消除方法及装置"专利获第二十五届中国专利金奖[1] - 科大讯飞累计7次获得中国专利奖，包括2次金奖（安徽省唯一）、1次银奖、1次外观设计优秀奖和4次专利优秀奖[7] 技术突破 - 专利技术包含三大创新：异常频点检测技术、动态时延估计技术和实时回声消除技术[5] - 技术通过计算声音时延差实现精准回声消除，提升语音交互流畅度和自然度[5] - 解决方案可应对设备振动、采样率变化、网络延迟等多变场景下的技术挑战[4] 应用场景 - 智能家居领域提升语音指令识别率[6] - 车载场景改善狭小空间内的语音通信清晰度和安全性[6] - 医疗设备如助听器提高语音识别可靠性[6] - 工业自动化环境增强语音控制准确性，屏蔽设备噪声干扰[6] 行业影响 - 技术具备通用性，推动智能硬件发展和通信质量提升[5] - 促进音频处理技术及相关产业创新升级[5] - 专利金奖代表中国专利领域最高荣誉，由国知局和世界知识产权组织共同评定[6]

Artificial Intelligence

Artificial Intelligence

基于时延估计的回声消除方法及装置

App适老化评测：容易陷入“伪适老”“低能化”误区

新京报· 2025-06-01 02:17

App适老化评测核心观点 - 行业在适老化改造上取得局部进展但整体仍处"半坡爬升期"，存在伪适老、语音交互失灵、广告干扰等结构性缺陷 [1][2] - 46款主流App中长辈模式普遍存在流程断层（如支付环节未适配）、功能阉割、用户分层缺失等问题 [1][3][4] - 语音交互部署率提升但实际体验差，识别准确率低、反馈缺失、执行链条断裂等现象突出 [6][7][8] - 广告与信息过载削弱适老效果，电商/社交类App仍保留开屏广告、浮窗促销等干扰元素 [9][10][11] - 企业投入不足源于成本收益失衡、技术适配难度高及政策激励缺失等现实制约 [12][13][14] 适老化改造进展 - 部分App实现从无到有的长辈模式升级，独立模式占比提升，页面友好度改善 [1] - 语音输入功能渗透率提高，唯品会等App实现悬浮语音搜索等便捷设计 [6] - 视觉简化在首页改造中成效显著，字号放大、图标放宽等基础适配已成标配 [3][4] 现存主要问题伪适老与低能化 - 46款测评App中普遍存在首页适配而二级页面退回普通模式的"半截子改造" [1][3] - 电商类App长辈模式下仍保留高密度SKU选项和促销标签，信息过载未解决 [3] - 生活服务类App返回键设计隐蔽，广告浮窗出现率达70%以上 [4][10] 语音交互缺陷 - 30%测评App长辈模式反而取消语音入口，存在功能倒退现象 [6] - 识别准确率不足60%，10秒时长限制等机制背离适老需求 [7][8] - 仅15%App实现语音播报功能，听力辅助覆盖严重不足 [7] 商业与设计矛盾 - 企业因ROI不明确将适老化列为非优先级项目，改造成本超预算50% [12][13] - 统一模板设计导致20%数字移民用户能力被低估，30%数字难民仍无法操作 [4][13] - AI技术演进加剧老年用户认知断层，新交互模式适配率不足10% [13] 行业改进方向 - 需重构交互逻辑而非简单视觉调整，建立分层次适老体系覆盖差异需求 [4][5] - 语音功能应具备慢语速理解、按需确认、可视反馈三项基础能力 [8] - 政策需构建强制标准与资源支持闭环，目前仅30%企业获得基础指引 [14]

Z Product｜被Meta收购后再创业，Sesame突破语音“恐怖谷”，a16z押注，“让AI听懂人心，让沟通回归自然”

Z Potentials· 2025-05-05 03:41

人机交互革命 - 语音交互被视为下一代人机交互范式的突破口其根植于人类文明基因但当前技术仍局限于简单指令缺乏真人对话般的流畅性 [2] - 人工智能与硬件结合推动语音交互突破 Sesame公司旨在通过可穿戴设备实现自然交互解决理解不准确、场景受限等痛点 [3][5] Sesame技术突破 - 开发Conversational Speech Model(CSM)实现情感智能与上下文感知 10亿参数模型基于Llama架构使用超100万小时音频训练 [7] - 开源CSM模型变体采用Apache 2.0许可支持商业用途模型托管于huggingface平台供开发者测试 [5][7] - 数字伴侣Demo展示卓越语音临场感能模拟呼吸、轻笑等人类特征但缺乏长期记忆能力 [14][15] 市场反馈 - 用户评价显示AI语音助手的拟人化程度引发震撼部分用户产生情感依赖如儿童将AI视为朋友 [16] - 声音设计通过刻意不完美增强真实感但部分用户仍感到"恐怖谷"效应认为对话方式过于逼真 [17] 团队背景 - 核心团队来自Oculus、Meta等公司 CEO Brendan Iribe曾领导Oculus以20亿美元被Facebook收购 [21] - CTO Ankit Kumar有AR/计算机视觉创业经历工程负责人Ryan Brown具备硬件架构专长 [23][25] 融资进展 - 完成两轮融资种子轮1012万美元 A轮4750万美元由Andreessen Horowitz领投投资者包含Oculus早期支持者 [27] - 资金将用于扩展多语言支持、增强情商能力并开发大型多模态模型 [28] 产品规划 - 布局轻量化智能眼镜研发使数字伴侣能感知用户所见世界目前设备处于研究阶段 [6] - 计划通过开源社区改进模型探索预训练语言模型在语音文本多模态领域的应用 [28]

语音交互

人工智能

Artificial Intelligence

Sesame AI

Conversational Speech Model (CSM)

数字伴侣

语音交互

人工智能

Artificial Intelligence

Sesame AI

Conversational Speech Model (CSM)

数字伴侣

喝点VC｜a16z合伙人：语音交互将成为AI应用公司最强大的突破口之一，巨头们在B2C市场已落后太多

Z Potentials· 2025-04-01 03:49

AI语音行业现状与历史突破 - 早期AI语音产品如Siri和Alexa表现不佳主要由于语音生硬功能有限且缺乏真正智能[3] - 当前大语言模型技术进步显著改善语音交互体验延迟从2-3秒降至300毫秒以下接近人类对话水平[12][13] - 情感表达能力成为关键突破点 AI可模拟人类语调变化和情绪反应大幅提升真实感[15][16] - 语音交互正成为AI应用重要突破口可能发展为最主要的交互方式[4] 技术演进与基础设施 - 语音技术发展经历三个阶段：IVR电话树→关键词触发→全对话理解[9] - 大语言模型结合文本转语音/语音转文本技术构成新一代基础设施[7] - 电话通话成为自然分发渠道与AI能力形成协同效应[7] - 模型对话结构优化消除机械感加入人类化停顿等细节[15] 商业应用与垂直领域 - 呼叫中心是AI语音最成熟应用场景可显著降低企业人力成本[27] - 垂直领域应用广泛覆盖餐饮招聘医疗物流等20+行业[25][26] - 典型商业案例包括：Happy Robot服务货运行业每月处理百万通电话[27] - 企业采用路径常从非核心业务切入如下班后服务或后台工作[34][35] 市场竞争与定价模式 - YC最新批次中20-25%初创公司涉足AI语音领域[22] - 定价模式多样化发展：按分钟计费→平台订阅→按结果收费[39][40] - 垂直领域SaaS类比云计算发展路径年费10-15万美元市场潜力大[24] - 竞争优势体现在数据积累行业专有知识及集成能力[41][42] B2C市场发展潜力 - 心理治疗教育科技等高价服务是B2C主要突破口[45][46] - 行业巨头在创新体验方面落后初创公司更具灵活性[49][50] - 陪伴类产品需塑造鲜明个性避免成为"应声虫"[54] - "逗笑用户时间"可能成为新型KPI 衡量情感连接深度[52] 创业者机会与方向 - 快速迭代产品能力成为关键竞争优势[55] - 设计"超级豪华版"产品思路探索高价值对话场景[56] - 垂直领域专精公司更具长期价值需积累行业特定数据[42] - 电话谈判法律咨询等高价值领域将在12个月内实现突破[28][38]

Artificial Intelligence

Artificial Intelligence

AI语音产品

Previous Next