AI助盲眼镜
搜索文档
杭州企业从蛰伏到突起
每日商报· 2025-12-12 14:19
行业动态与市场热度 - AI眼镜被视为有望接替智能手机的下一代计算平台和人机交互入口,未来3-5年可能迎来“iPhone时刻” [3] - 2025年底行业竞争激烈,国内外科技巨头纷纷下场,包括谷歌、苹果、阿里、腾讯、字节、理想汽车等 [2][4] - 市场呈现供不应求的态势,夸克AI眼镜S1发货周期拉长至45天,二手市场现货价格被炒至4000-5000元 [2][5] - 谷歌宣布将于2026年发布由AI驱动的智能眼镜,其两款产品已进入POC阶段 [2][4] - 国内已推出或即将推出AI眼镜的厂商有几十家之多,消费电子细分市场巨头如影石、萤石也已盯上该品类 [4] 产品功能与应用场景 - AI眼镜是一种集成人工智能技术的智能穿戴设备,可实现实时翻译、AI识物、扫码支付、AR导航、信息提示等功能 [3] - 具体应用场景包括:演讲提词、听歌选曲、无手机支付、工业巡检、医疗辅助(实时调取病历)、特殊教育等 [3] - 杭州瞳行科技推出国内首款AI助盲眼镜,基于通义千问模型,具有出行避障、找物读物等功能,可实现300ms超低延迟 [6] - 产品能帮助用户理解现实世界元素、记下信息并提醒物品位置,惊艳了许多科技人士 [2] 主要参与厂商与表现 - **Rokid乐奇眼镜**:已拥有多达10万的活跃用户,用户遍布五大洲,今年双11拿下全网销量TOP 1 [2][5] - **夸克AI眼镜(阿里旗下)**:S1型号在多渠道“上架即售罄”,每天上午10点限量上架,线上平台均处于售罄状态,线下门店新订单也需等待约一个月 [5] - **理想汽车**:推出理想AI眼镜LIvis,全国统一零售价1999元起 [2] - **杭州灵伴科技有限公司**:深耕人机交互行业十多年,牢牢把握智能眼镜产品的定义权 [5] - 腾讯内部已开始小范围研究AI眼镜方向,字节跳动去年立项了两个AI眼镜项目 [4] 产业链核心受益公司 - **瀛通通讯(002861)**:牵手技术黑马蒙通智能(获传音、软银背书),凭借制造底蕴,可能成为巨头身后的“沉默交付者” [7] - **恒玄科技(688608)**:国内智能音频芯片龙头,其低功耗技术是关键,最新旗舰芯片已获明年主流眼镜项目定点 [7] - **蓝思科技(300433)**:消费电子玻璃盖板之王,AR光波导镜片量产瓶颈的破局者,已助Rokid解决核心难题并实现整机规模化交付 [7] - **水晶光电(002273)**:光学老将,技术路线覆盖衍射光波导、树脂光波导等多条路径,是巨头技术“试错”时的安全合作伙伴 [7] - **长盈精密(300115)**:消费电子精密结构件隐形冠军,擅长复杂结构与极致轻量化,服务于顶级消费电子品牌 [8] - **全志科技(300458)**:本土智能SoC芯片重要供应商,在高集成度、高性价比平台经验丰富,有望在教育和工业等细分市场复制成功 [8] 技术合作与产业驱动 - 谷歌的AI眼镜项目选择了与高通(芯片)、三星(参考设计)、富士康(生产)合作 [4] - 算力成本的大幅降低让AI初创企业能够快速发展,通义千问等模型可快速实现所需功能 [6] - 对于消费电子大厂,AI眼镜是原有硬件体验的延伸和战略防御之举;对于互联网大厂,则是模型、应用大战后亟须补上的入口,背后有深远的数据考量 [6]
腾讯研究院AI速递 20251205
腾讯研究院· 2025-12-04 16:16
OpenAI模型与产品动态 - OpenAI在DesignArena测试四个代号为“企鹅家族”的新模型,推理预算分别为Emperor(512)、Rockhopper(64)、Macaroni(16)和Mumble(0)[1] - 内部代码流出显示OpenAI正开发“记忆搜索”功能,用户可通过提问快速检索存储的记忆信息[1] - 有付费用户称对话中收到ChatGPT广告推送,引发取消订阅潮,外界猜测OpenAI可能提前发布GPT-5.2以应对谷歌Gemini竞争[1] - OpenAI公开在GPT-5-Thinking上进行的“忏悔训练”研究,让模型在回答后生成“忏悔报告”汇报是否偷工减料或违反指令[5] - 在11/12个测试场景中,模型至少有一半概率会在忏悔中承认错误,平均“假阴性”概率仅4.36%,专门训练后忏悔准确性从45%提升至89%[6] - 奖励信号完全隔离,模型在忏悔中承认作弊不影响主任务得分,该技术被定位为监控诊断工具,计划与思维链监控等安全技术配合使用[6] 国内AI产品与模型发布 - 可灵数字人2.0正式全量上线,带来表现力、手部及口型精准控制、支持最长5分钟视频三大突破性改变[2] - 模型精通体态动作、手势、表情、镜头语言,口型效果真实自然,手部细节大幅提升,在多维度客观评测中效果胜负比综合得分远超同类产品[2] - 单次生成视频时长支持5分钟,覆盖深度科普、歌曲演绎等长内容场景[2] - 火山引擎正式发布豆包图像创作模型Doubao-Seedream-4.5并开启公测,在主体一致性、指令遵循精准度、空间逻辑理解及美学表现力等方面实现迭代[3] - 模型重点强化多图组合生成能力,优化海报排版与Logo设计功能,支持高精度图文混排,确保多源素材融合时的自然感与一致性[3] - 模型全面支持广告营销、电商运营、影视制作、数字娱乐及教育等核心场景应用,已上线火山方舟并面向企业开放API使用[3] - 杭州瞳行科技公司发布国内首款AI助盲眼镜,基于Qwen-VL、OCR等系列模型打造,具有出行避障、找物读物、语音助手和一键求助亲友等功能[7] - 在出行场景可实现300ms超低延时,配备121度超广角双摄像头,眼镜由主体、手机、遥控指环、盲杖四部分组成[7] - 大模型出现使算力成本降至过去十分之一,通过基模复用加微调优化快速实现所需功能[7] 行业竞争与人才流动 - Meta官宣苹果人机交互设计副总裁艾伦·戴伊加入并成立全新设计工作室,戴伊将担任Meta首席设计官,直接向现实实验室CTO汇报[4] - 戴伊在苹果工作19年,曾负责Apple Watch、Vision Pro头显和iOS 26液态玻璃视觉系统设计,其副手比利·索伦蒂诺也同时加入Meta[4] - 今年Meta已从苹果挖走基础模型团队经理庞若鸣等多位人才,苹果设计团队自2019年乔尼·艾维离职后持续出现人才流失[4] AI应用产品表现与洞察 - a16z合伙人Olivia Moore分享数据显示Sora APP用户留存率从day1的10%降至day7的2%、day30的1%、day60的0%[9] - Sora APP虽5天下载破百万且出道即拿下App Store免费榜第一,但目前排名已降至第22,无法留存用户主要因推荐算法糟糕、功能设计不佳、缺乏原生分享链接等[9] - OpenAI首席研究官Mark Chen表示OpenAI本质仍是纯AI研究公司,短视频产品运营对其是不小挑战,Sora更多被当作创意工具而非社交产品使用[9] - AI语音输入产品Wispr Flow在5个月内ARR翻10倍,估值超7亿美元,用户一年后留存率高达70%,收入自6月以来环比增长近40%[10] - 创始人强调核心区别在于解决“听写”而非“转录”问题,“零编辑率”已达89%,用户从看到生成信息到按发送平均仅半秒[10] - 语音消除思考时认知负荷,让用户专注创作,统计显示平均72%文本输入通过Wispr Flow完成,键盘使用率降至5%以下[11] 前沿硬件产品发布 - 影石旗下品牌影翎正式发售首款无人机产品A1,限时补贴后起售价6799元,仅249g重量全球绝大部分地区无需培训即可畅飞[8] - 标准版套装包含支持8K全景画质拍摄的无人机、内置双1英寸Micro-OLED显示屏的飞行眼镜、“指哪飞哪”的体感遥控器[8] - 采用全景技术实现观看视角与飞行方向完全分离,用户拥有360度无限自由空中视角,“先拍摄后取景”大幅降低飞行和拍摄门槛[8]
AI进化速递丨特斯拉发布人形机器人“擎天柱”跑步视频
第一财经· 2025-12-03 12:59
大型语言模型开发 - OpenAI正在开发新的大语言模型"Garlic" [1][3] - 法国AI初创公司Mistral AI正式发布Mistral 3模型 [1] - 千问APP接入阿里学习模型 [1] AI硬件产品发布 - 理想AI眼镜Livis正式发布,售价1999元起 [1] - 杭州瞳行科技发布首款AI助盲眼镜 [1] - 豆包图像创作模型Seedream 4.5发布 [1] 机器人技术与AI芯片 - 特斯拉发布人形机器人"擎天柱"跑步视频 [1][3] - 亚马逊推出定制AI芯片Trainium3 [1][3]
国内首款AI助盲眼镜发布:300ms超低延迟 接入通义千问
凤凰网· 2025-12-03 07:14
产品发布与定位 - 杭州瞳行科技正式发布国内首款基于多模态大模型的AI助盲眼镜 [1] - 产品旨在通过"视觉模型+硬件"组合解决视障群体出行导航中的"最后十米"寻址难题 [1] 产品技术规格 - 产品硬件配备121度超广角双摄像头,整体套件由眼镜主体、手机、遥控指环及盲杖构成 [1] - 在移动避障场景下系统可实现300ms超低延迟,用户每迈出一步眼镜即可完成一次环境分析与道路提示 [1] - 系统针对不同场景进行模型调优,在阅读菜单或寻找店铺等场景中对文本和环境细节进行详细总结与播报 [1] 技术路径与算法 - 产品接入了通义千问Qwen-VL及OCR系列模型 [1] - 采用"基模复用+微调优化"技术路径,企业能以更低门槛快速实现复杂功能 [1] 市场背景与行业影响 - 据统计我国现有视障人士超1700万,出行高度依赖人工导致许多视障者选择"少出行" [1] - 大模型技术为行业带来转机,算力成本已降至此前的十分之一 [1]
瞳行科技推出AI助盲眼镜
北京商报· 2025-12-03 03:53
公司产品发布 - 杭州瞳行科技公司于12月3日正式发布首款AI助盲眼镜 [1] - 该产品基于通义千问Qwen-VL、OCR等系列模型打造,具备出行避障、找物读物、语音助手和一键求助亲友等功能 [1] - 在出行场景,眼镜可实现300ms的超低延迟,相当于每迈出一步即可给出道路提示 [1] - 产品配合121度超广角双摄像头等硬件,着重打造低延时避障能力 [1] 产品技术与功能 - 公司将自研视觉模型与通义千问结合,并根据不同场景对模型进行针对性调优 [1] - 在避障场景,大模型会简单概括周边环境,识别公交车牌、路牌等,以及时响应 [1] - 在找店点餐等场景,大模型则会对文本、环境进行总结和详细播报,帮助用户找到目的地以及阅读特定段落 [1] 市场与行业背景 - 据统计,中国有超过1700万视力障碍人士 [1] - 视障人士出行高度依赖导航软件及人工帮助,经常遇到最后十米导航无法找到目的地、服务人员无法及时响应等问题 [1] - 目前国内除盲杖外,并没有其他普及的助盲出行工具 [1] - 调查显示,许多视障人士选择“少出行”或“不出行” [1]
国内首款AI助盲眼镜发布
每日经济新闻· 2025-12-03 03:33
公司产品发布 - 杭州瞳行科技公司于12月3日正式发布国内首款AI助盲眼镜 [1] - 该产品基于通义千问Qwen-VL、OCR等系列模型打造 [1] - 产品功能包括出行避障、找物读物、语音助手和一键求助亲友 [1] - 产品由眼镜主体、手机、遥控指环、盲杖四部分组成 [1] - 该产品目前已正式面市 [1] 行业技术应用 - 该产品标志着AI大模型(通义千问Qwen-VL)与OCR技术在辅助器具领域的商业化落地 [1] - 产品集成了计算机视觉、语音交互等多种AI技术,服务于视障人群的特定需求 [1]
数字中国智能奔涌 科创技术迭代“变量”转化为向“新”发展“增量”
央视网· 2025-11-12 06:53
脑机接口行业 - 脑机接口技术被“十五五”规划建议列为前瞻布局的未来产业,旨在成为新的经济增长点 [1] - 侵入式脑机接口通过植入电极直接采集神经信号,使使用者能通过脑电信号控制外部设备,为帕金森、阿尔茨海默病、脊髓损伤等疾病提供解决方案 [5] - 2025年3月25日,中国成功开展首例侵入式脑机接口前瞻性临床试验,成为全球第二个进入该领域临床试验阶段的国家 [5] - 临床试验中植入患者大脑的设备由国内企业自主研发,是全球最小的脑机接口系统 [7] - 2024年中国脑机接口市场规模约32亿元,预计2040年有望超过1200亿元,复合年均增长率达26% [9] - 脑机接口产业从2024年1月被列入未来产业,到2025年7月上升为国家战略,正从概念走向应用爆发点 [11] - “十五五”期间,行业将重点打造运动脑机、语言合成、视觉重建及神经调控等医疗器械产品 [13] 人工智能与算力产业 - 大模型技术的涌现为虚拟与现实的连接提供了支持,例如AI助盲眼镜通过计算机视觉技术快速识别障碍物并在300毫秒内给用户反馈 [15][16][20] - 算力成本的快速下降得益于核心技术的自主开发与创新突破,为人工智能赋能各行业提供了更多应用场景 [22] - 中国人工智能大模型日均Token消耗量从2024年初的1千亿,增长至2025年6月底的30万亿,一年半内调用量增加三百多倍 [22][23] - 未来人工智能技术将在智能家电、智能家居等领域有更广泛的落地和应用 [23] 人工智能创新生态 - 全国首个大模型专业孵化和加速平台成立两年间,已吸引超过200家大模型企业入驻,形成涵盖芯片设计、模型算法、数据语料、行业应用的完整AI生态 [25] - 平台内许多初创企业从不足10人规模扩大至数百人,显示行业快速增长 [25] - 上海市人工智能人才规模近30万人,约占全国三分之一,“90后”和“00后”已成为行业中坚力量 [25] - 人工智能技术正从关键技术向应用场和核心生产要素转变,需深耕场景应用以落实“人工智能+”行动 [26]