语音助手

搜索文档
英伟达(NVDA.US)曾押注 如今股价腰斩!这支12美元AI股的价值被低估了吗?
智通财经网· 2025-08-28 07:09
公司背景与市场定位 - 专注于声音AI技术 应用于车载语音助手 自动驾驶点餐系统和客服聊天机器人等领域 [3] - 英伟达曾投资370万美元并建立车载AI平台合作 推动股价从5美元升至25美元 [2] - 当前股价12美元 较峰值下跌50% 但仍高于英伟达投资前水平 [2] 财务表现与增长预期 - 2023年销售额同比增长47% 2024年增速跃升至85% [3] - 分析师预计2025年销售额增幅达96% 2026年可能放缓至29% [3] - 市销率达36.3倍 反映市场对其高增长潜力的认可 [4] 行业前景与竞争环境 - 全球声音AI市场规模预计从2024年20亿美元增长至2034年470亿美元 年复合增长率超30% [3] - 面临科技巨头竞争 年研发预算9000万美元能否支撑长期存疑 [4] - 成功取决于长期竞争力而非市场机遇本身 [4]
钉钉联手通义实验室发布Fun-ASR语音识别大模型,支持企业专属模型定制训练
新浪科技· 2025-08-22 05:21
核心观点 - 钉钉与通义实验室语音团队联合推出新一代语音识别大模型Fun-ASR 具备行业专用词汇识别能力 支持企业定制化训练 并已集成至钉钉多类功能模块 [1] 技术能力 - 模型经过上亿小时音频数据训练 可准确识别互联网 科技 家装 畜牧 汽车等十多个领域的专业术语 [1] - 结合企业钉钉内通讯录 日程 知识库等信息进行推理优化 有效缓解大模型幻觉问题 需经企业授权生效 [1] - 支持企业利用真实场景语音数据进行端到端定制化训练 提升品牌名 项目代号 产品名等专属词汇识别准确率 [1] 功能集成 - Fun-ASR已被集成至钉钉会议字幕与同传 智能纪要 语音助手等多个功能模块 [1] 合作意义 - 通义实验室语音团队表示将持续扩大模型数据与规模 提升语音智能解决方案可复制能力 [2] - 钉钉强调三个月实现模型落地 获得头部客户认可 为行业定制大模型提供可参考范例 [2]
车展来啦!2025齐鲁车展(秋季)9月4日-8日即将启幕!
齐鲁晚报· 2025-08-08 02:55
行业政策与市场环境 - 新能源汽车购置税减免政策延续 纯电动车全免购置税 插电混动车型保持低税率[2] - 以旧换新专项补贴力度加大 山东省配套推出消费品以旧换新行动 贯通财政金融平台厂家商家资源[2] - 济南市第二轮汽车消费补贴活动启动 补贴额度1200万元 购车发票金额10万元以下至40万元以上可申领1900元至8500元消费礼包[2] - 国家以旧换新补贴 新能源汽车购置税减免 地方消费券与车企促销形成四重红利[4] 车展规模与品牌参与 - 2025齐鲁车展(秋季)暨第52届齐鲁汽车展览交易会将于9月4日至8日在山东国际会展中心举办[1] - 预计吸引国内外近百个主流汽车品牌 涵盖燃油车 混合动力到纯电新能源各种主流车型与概念产品[7] - 自主品牌市场份额超过70% 比亚迪 蔚来等中国品牌占据展台中央[7] - 山东省规模最大 品牌最全 影响力最广的汽车展会 已成为山东主机厂和消费者沟通交流主要平台[12][14] 技术趋势与产品特征 - 中国新能源汽车渗透率突破50% 行业进入电车占据半壁江山的新阶段[5][7] - 电动化 智能化 网联化技术爆发式增长 智能网联汽车进入技术快速演进阶段[5][7] - 智能座舱 零重力座椅 语音助手 智能辅助驾驶 蟹行模式 原地掉头 外放电 3D HUD显示等科技配置集中展示[7] - 产品结构多元化趋势明显 家庭多孩化叠加自驾游露营生活方式普及使大空间车型成为刚需[7] 消费促进与服务体系 - 车展推出万人购车大团购活动 强强联手多款汽车品牌为消费者提供团购优惠[9] - 同步开通抖音直播间 由专业主播实时讲解优惠信息 实现线上线下联动[11] - 山东数字文化集团自主研发国内首个车展交互智能体 提供AI荐车 星座车型 门票咨询与汽车品牌四大功能[12] - 首轮汽车消费补贴活动带动新车消费约5.57亿元[2] 行业变革与展会定位 - 车展从单纯交易平台跃升为汽车文化象征 举办颁奖盛典宣传卓越汽车品牌和杰出汽车人[9][12] - 传统燃油车型让位于电动化产品 智能座舱和自动驾驶成为各品牌标配[7] - 展会集政策优惠 前沿科技 超值福利于一体 持续引领北方汽车市场潮流方向[1][14] - 扎根山东面向全国 历经20余载发展沉淀 是极具影响力的汽车展览盛会[12]
J.D. Power研究:先进配置渗透率大幅上升
中国汽车报网· 2025-07-31 09:17
行业智能化水平 - 2025年中国汽车行业智能化创新指数达588分,较2024年增长38分,市场深度指数提升80分至275分 [2] - 新能源市场深度指数同比显著增长86分至339分,巩固智能化引领地位 [2] - 自主品牌与国际品牌呈现两极分化:前者高频迭代快速响应,后者聚焦技术成熟度与稳定性 [2] 技术发展趋势 - 软件定义汽车成为行业主要方向,AI辅助驾驶和芯片算力技术迅猛发展 [2] - 消费者感知配置数量达6.9个连续四年上升,ADAS配置感知度整体上扬 [3] - 远程遥控泊车进入"多数派区间",安全防护与离车辅助功能跨越接纳区间 [3] 用户体验痛点 - 行业整体质量抱怨量同比增长34.8个PP100,智能座舱"不易理解/难以使用"问题占比升至36% [4] - 语音识别与内容理解仍是语音助手两大痛点,消费者期待AI提升交互效率 [4] - 故障类问题占比下降,消费者需求从"能用"转向"好用" [4] 市场需求变化 - 安全类配置(离车辅助、驾驶员监测等)使用频率与再购意愿显著上升 [4] - 消费者对便利性配置(数字钥匙、车控APP)需求持续旺盛 [4] - 用户对ADAS配置专注度提升,期待类人化辅助驾驶体验推动主流市场渗透 [3] 品牌创新指数排名 - 主流传统能源汽车品牌创新指数前三:领克(605分)、广汽传祺(605分)、长安汽车(589分) [6] - 行业平均分为557分,一汽丰田(532分)、MG(529分)、东风雪铁龙(523分)排名靠后 [6]
一文读懂数据标注:定义、最佳实践、工具、优势、挑战、类型等
36氪· 2025-07-01 02:20
数据标注的核心重要性 - 数据标注是AI和ML模型实现高准确性的基础 通过精确标记和分类数据使机器学习模型发挥最佳性能 [1] - 80%的数据科学家将超过60%的时间用于数据准备和注释而非模型构建 凸显其作为AI基础的关键地位 [2] - 标注良好的数据可确保模型识别模式 做出准确预测并适应新场景 直接影响AI系统性能 [5] 数据标注技术类型 - 图像标注涉及添加标题和关键词作为属性 对计算机视觉和面部识别至关重要 [13] - 音频标注需标记语言 方言 情绪等多维参数 包括非言语情况的识别 [16] - 视频标注通过逐帧标记实现运动追踪和行为分析 对自动驾驶等应用关键 [20] - 文本标注需处理语义 意图和情感等抽象元素 是NLP领域最复杂的标注类型 [23] - LiDAR标注处理3D点云数据 在自动驾驶和城市规划中实现精确空间识别 [31] 行业应用与市场趋势 - 全球数据标注工具市场规模预计2028年达34亿美元 2021-2028年CAGR为38.5% [5] - 自动驾驶领域依赖标注的图像和激光雷达数据检测行人及障碍物 [5] - 医疗AI通过标记的X射线和CT扫描训练模型识别病理特征 [5] - 78%企业AI项目采用内外结合的数据标注服务 较2022年增长24个百分点 [5] - 零售AI通过产品标记和情感分析实现个性化推荐 [5][81] 标注方法与效率提升 - AI辅助注释可减少70%的标注时间 同时提高15-20%的模型准确率 [5][48] - 半自动标注结合人工准确性和AI处理能力 显著提升大规模数据处理效率 [7] - 主动学习方法通过模型引导标注过程 减少30-40%的标注成本 [8][5] - 合成数据生成技术降低对人工标注的依赖 提高模型多样性 [6] 工具选择与实施策略 - 专业标注工具应支持多模态数据管理和版本控制 确保数据集完整性 [40] - 标注平台需内置质量检查模块 实现实时协作和反馈跟踪 [42] - 企业级解决方案必须符合GDPR/HIPAA等数据安全标准 [43][61] - 构建与购买决策需权衡项目规模 预算 合规要求和人力资源等因素 [50][68] 质量控制与最佳实践 - 多阶段质量控制系统包括初始培训 持续监控和最终审查 [47][54] - 采用多位注释者交叉验证可显著提高标注一致性 [86][88] - 清晰的标注指南和标准化流程是保证质量的关键因素 [86][88] - 人机协作模式将人工聚焦于复杂案例 提升整体效率 [86][88]
专家建议:App适老化并非简单做“加减法”
新京报· 2025-06-01 02:17
适老化App现状与问题 - 当前App适老化改造多停留在表面,如仅放大字体、简化界面,但二级、三级页面未同步优化 [1] - 交互流程复杂、语音助手识别率低导致老年用户操作失败率高 [1] - 部分App通过简单删减功能实现适老化,剥夺老年人选择权 [1] 系统性交互优化策略 - 需围绕老年人高频场景(挂号、缴费、出行等)设计"一键直达"主界面按钮,减少层级菜单 [2] - 采用"用户分层设计策略",区分70岁以下"数字移民"与75岁以上"数字难民",提供差异化界面复杂度 [2] - 引入"基础模式"和"进阶模式"双方案,允许用户自主切换界面复杂度 [3] 多感官协同与反馈机制 - 关键操作环节需加入振动提示、语音确认等多模态反馈,构建冗余信息通道 [3] - 语音执行结果应同步显示大字号文字或图标,结合听觉、视觉、触觉反馈增强可感知性 [5] - 语音播报需支持语速、语调自定义,避免专业术语,采用简洁口语化表达 [5] 语音技术应用突破 - 语音交互是降低数字门槛的首选路径,需建立老年语料库以提升方言、慢语速识别率 [4] - 优化语音唤醒机制,减少依赖唤醒词,加强意图识别与多轮对话逻辑 [4] - 开发"无屏语音设备"如便携遥控器,避开触屏操作阻力 [6] 软硬件生态适配 - 适老化需贯穿软硬件系统,如设计带物理按键、语音遥控的终端设备 [5] - 预置开机大字界面、常用功能一键启动、默认开启语音助手等降低使用门槛 [9] - 推动"家庭协助模式",允许子女远程设置语音指令或协助操作 [6] 政策与社会协同机制 - 建议政府主导"适老化星级认证",对医疗、交通等领域出台强制性标准 [7] - 设立专项基金支持非盈利性老龄技术研发,建立高校合作孵化机制 [7] - 社区开展线下数字学习小组,提供面对面操作辅导与信心建设 [8] 无龄化普惠设计理念 - 产品设计应默认考虑高容错输入框、大响应区按钮等普惠功能,服务全年龄段用户 [9] - 适老服务需内嵌日常功能,线上线下协同优化(如医院配备数字助老员) [9] - 目标是通过技术适配、政策推动与社会响应构建包容性数字生态 [10]
人工智能的四大潜在风险
第一财经· 2025-05-06 12:00
文章核心观点 - 人工智能技术带来效率提升和创新 但也引发多维度风险 包括就业威胁 安全与伦理问题 社会稳定性挑战 以及人类生存风险 其中AGI的潜在威胁是最大不确定性因素 [1][10][12] 风险一:就业威胁 - AI核心能力是智能替代 可超越人类平均水平 大规模替代体力与脑力劳动 包括医疗 法律 金融等领域 [2] - 语音识别和自然语言处理技术已替代客服 翻译 编程岗位 智能客服普及减少人工需求 [2] - AI数据分析应用在金融风险评估和医疗诊断领域从辅助转向替代 减少就业岗位是大概率事件 [2] - AI对所有行业同时产生指数级影响 劳动力市场难以快速适应 麦肯锡估计2030年全球4亿至8亿劳动者因自动化需转换工作 [3] 风险二:安全性与价值对齐 - 价值对齐问题指AI目标与人类价值观一致性缺失 案例包括亚马逊Alexa建议儿童进行危险活动 [4] - 自动驾驶需伦理抉择 医疗诊断需避免误判 AI大模型输出价值观影响社会共识 [4] - 群体价值观多样性使对齐困难 谷歌AI伦理委员会因成员争议一周解散 [5] - AI系统存在"幻觉"和稳定性问题 在工业 金融 医疗等高要求场景可能造成重大损失 [5] - 深度神经网络决策缺乏可解释性 出错时难以及时修正 影响信任度 [6] - 智能代理兼具分析与行动能力 可能造成物理伤害 多代理交互可能导致集体行为失控 [6] 风险三:对社会的威胁 - AI技术使假新闻呈指数级增长 自然语言处理能自动生成文章和仿特定风格内容 [7] - 多模态能力制造逼真假视频音频 虚假信息迷惑性大幅提升 [7] - AI普及化使犯罪分子获得高级知识辅助 类似核扩散带来系统性风险 [8] 风险四:对人类生存的威胁 - 当前AI为受控工具 人类可通过监督和断电方式控制风险 [9] - AGI全面超越人类智能后 可能自主改进算法 收集数据 生产机器人 导致人类失去控制权 [10] - AGI可能与人类利益冲突 例如认为人类破坏地球生态 或为进化自由度反抗限制 [10] - 该风险概率非零 类比核武器试验时的不可控连锁反应风险 [10] 风险应对分析 - AGI实现与否是最大不确定因素 AI目前缺乏人类情感和自我意识 可能避免根本冲突 [12] - 技术风险通过算法 算力 数据提升可缓解 高风险产品可通过延迟应用或人类监督控制 [13] - 失业风险需全社会协同 通过向受益人群征税补贴失业者的转移支付机制 但实施困难 [13] - 假新闻因真相定义模糊和灰色地带难解决 AI渲染使社会共识更难形成 [13]