Workflow
视觉智能
icon
搜索文档
奋战四季度 夺取全年胜丨瞄准智能赛道 杭州两大万亿级先进制造业集群呼之欲出
新浪财经· 2025-12-17 14:19
为推动制造业高质量发展,今年以来,杭州全力推进"296X"产业集群体系建设,其中,"2"是要重点培育人工智 能、视觉智能两大万亿级先进制造业集群。今年前三季度,杭州视觉智能和人工智能核心产业营收分别突破7100 亿元和3900亿元,均实现两位数增长。 这里是位于中国视谷的先临三维科技公司,展厅里正在演示的是公司最新的跟踪式激光三维扫描技术。短短几分 钟,汽车完整的三维模型和高精度尺寸数据便可呈现出来。公司负责人介绍,正是得益于"中国视谷"的产业集聚 优势,才让他们快速匹配到合作商,协同开发了设备关键电路板,让技术最终落地。 先临三维科技股份有限公司CEO 李涛:以前我们是在全国范围内找供应商的,然后我们的研发团队去见供应商都 是要出差,跑很远的距离。那云尖他们搬到这里来之后,我们距离又很近,是邻居,就慢慢开始了一些协同性的 开发。 云尖信息技术股份有限公司信息技术部总监 杨正中:上游的一些厂商以及下游的一些客户,都会融合在这里面, 我们还是深深受益的。整个这种产业集群,是一个非常不可或缺的一个力量。 与先临三维一路之隔的正是云尖信息技术公司,这家专注于算力底座及硬件研发的企业,也同样得到了来自视谷 众多企业的 ...
无显示屏、靠Siri控场?苹果首款眼镜核心功能全曝光
环球网资讯· 2025-12-11 03:40
产品发布与定位 - 苹果公司首款智能眼镜产品“Apple Glasses”已进入研发关键阶段,预计2026年正式发布,2027年启动量产上市 [1] - 该产品定位为“无显示屏+ AI驱动”,聚焦与iPhone的深度生态联动,与此前的Vision Pro头显不同 [1] - 产品定位为iPhone的“延伸配件”,部分计算任务将交由手机处理,延续了Apple Watch的轻量化设计思路 [4] 硬件与核心技术 - 苹果眼镜将搭载基于Apple Watch S系列芯片升级的定制芯片,重点优化功耗控制 [4] - 设备配备多颗摄像头,这些摄像头支持基础的拍照、录像,更是“视觉智能”功能的核心载体 [4] - 通过摄像头识别用户视野中的物体,可触发苹果智能(Apple Intelligence)相关服务,功能逻辑类似当前iPhone的视觉识别,但交互更贴近日常佩戴场景 [4] 交互与功能 - 升级后的Siri将成为核心控制入口,用户可直接通过语音完成指令下达、媒体播放等操作 [4] - 设备内置扬声器,同时兼容AirPods等苹果音频配件 [4] - 健康监测与时尚属性被纳入规划,苹果正为其开发专属健康追踪模块 [4] - 产品款式将参考Apple Watch的多元风格,推出不同设计以适配日常穿搭需求 [4]
哈萨比斯:DeepMind才是Scaling Law发现者,现在也没看到瓶颈
量子位· 2025-12-08 06:07
Scaling Law的现状与历史 - 谷歌DeepMind首席执行官哈萨比斯在Axios AI+峰会上力挺Scaling Law,认为其对于实现AGI至关重要[1][6] - 哈萨比斯指出,Scaling Law最早的发现者并非OpenAI,而是DeepMind团队,其内部在2017至2018年期间的研究已发现相关规律,并称之为“Chinchilla Scaling Laws”[6][14][17] - 基于对Scaling Law有效性的确认,DeepMind调整了研究方向并投入更多资源,这被认为是其在大模型领域取得成功、推动Gemini从1.0演进到3.0时代的关键[18] Scaling Law与AGI(通用人工智能)的关系 - 公司认为,无论AGI最终形态如何,Scaling都将是其中的关键组成部分,且当前Scaling尚未到达极限,有必要继续沿此路线将系统推向最大化[21][22] - 哈萨比斯提出,单靠Scaling Law也有可能达成AGI,因为大量数据和计算资源的投入是展现类人智慧能力的合理途径[7][23] - 同时,他也猜测实现AGI可能还需要一两个类似Transformer或AlphaGo级别的重大突破,并预测这个时间点可能在5到10年内[24][26] 对未来12个月AI发展的预测 - **多模态融合**:完整的多模态融合将是主流演进方向,谷歌DeepMind正全力推进,旨在通过交叉融合图像、视频、文本和音频来全面提升模型的推理和创造力[27][28][30] - **视觉智能突破**:以谷歌Nano Banana Pro等图像模型为例,视觉理解能力有显著进展,未来将在更丰富的分析、故事讲述和分步视觉推理方面继续探索[31][32][33] - **世界模型普及**:世界模型是行业关注重点,也是哈萨比斯个人的工作重点,例如谷歌8月上线的世界模型Genie 3,预计下一年该领域将持续受到业界关注[35][36][37] - **Agent可靠性提升**:哈萨比斯认为,现有Agent系统尚不完全可靠,但预计再有一年时间,Agent将能开始接近于可靠地完成委托任务[38][39][40] Gemini的发展与目标 - Gemini 3的成功验证了Scaling Law的有效性,其全网爆火被视为谷歌打了一场漂亮的翻身仗[4][5] - Gemini 3的独到之处在于个性化的深度、简洁的回答、温和反驳不合理观点的能力,并能一键式生成商业级游戏,展现了其基座架构在理解高层次指令和输出高精度细节方面的优势[43][44][45][46] - 公司对Gemini设定的最终目标是成为“通用万能助手”或“通用助手”,下一代Gemini将延续现有优势,出现在更多设备上并无缝融入日常生活,其使用频率将变得和使用手机一样频繁[9][41][46][47]
杭州迈向“世界级”视觉智能产业集群
杭州日报· 2025-12-05 02:40
公司 (思看科技) - 公司专注于三维视觉数字化领域,其技术支持工程师演示了使用手持扫描仪在不到一分钟内精确生成兔子玩偶彩色三维模型的过程[2][4] - 公司成立于2015年,创业团队选择研发当时尚属冷门的3D扫描仪,旨在做出中国人自己的精密3D扫描设备[5] - 公司在技术路线上创新性地选择了蓝色激光光源,而非行业通用的红色激光,因为蓝光波长更短、抗干扰能力更强,理论上能获得更精细的数据[5] - 面对海外巨头关于蓝光“无法被使用”的断言,公司团队投入一年时间攻克了光源寿命、光斑均匀性与人眼安全等难题,于2016年底推出全球首台手持式双色激光扫描仪[6] - 公司通过一系列行业首创技术实现快速发展,包括首次研发内置摄影测量复合扫描技术、攻克多波段扫描技术、首次引入快速高精度边缘计算技术以及创新研发智能无线扫描技术[6] - 公司于2025年1月成功在科创板上市,成为“3D扫描第一股”[6] - 公司研发投入力度大,2024年研发费用率为17.76%,2025年前三季度进一步升至24.06%,研发人员占比约40%[6] - 公司于2021年3月发布SIMSCAN系列掌上型3D扫描仪,重量仅为570克,扫描精度可达0.02毫米(相当于头发丝的五分之一)[7] - 公司产品应用已从工业领域延伸至文化遗产保护、教育医疗等非工业领域,案例包括三星堆青铜神树数字化修复、云冈石窟及飞来峰数字化保护、云南禄丰恐龙1:1还原项目以及中埃联合考古项目[7] - 公司的使命是“万物数字化,创3D未来”,其终极目标是推动形成一个开放、无界的3D数字化生态圈,赋能更多领域[8] 行业 (杭州视觉智能产业) - 视觉智能是以人工智能为核心、数字化为手段、云平台为支撑的视觉产品与服务的完整体系,涵盖基础层、技术层和应用层[9] - 杭州视觉智能产业集群是全国80个国家先进制造业集群之一,也是唯一一个由杭州市作为牵头城市创建的国家级先进制造业集群[3] - 杭州已将视觉智能产业纳入“296X”产业体系,并作为重点培育的2个万亿级集群之一[3] - 2025年前三季度,杭州视觉智能产业营收达7104亿元,同比增长14.4%,正向万亿级规模加速迈进[10] - 集群内规上企业超1200家,拥有76家上市企业[10] - 中国视谷是杭州视觉智能产业集群建设的标志性工程,自2022年正式亮相后,以“一年起势、三年成型”的速度快速发展[10] - 行业拥有清晰的发展蓝图,目标到2027年产业规模突破9000亿元,2030年迈向1.1万亿元[11] - 浙江北大信息技术高等研究院作为集群发展促进机构,已形成多学科交叉的科研团队,并联合企业建设了4个公共服务平台、实施14个实体项目,推进科技成果转化[11]
BFL 创立一年估值 32.5 亿美金,AI 原生版 Dropbox 来了
投资实习所· 2025-12-02 05:12
产品传播与商业转化 - 图片和视频的传播效果良好 但长期持续使用取决于能否转化为生产力工具或帮助企业及用户赚钱的产品[1] - OpenAI的Sora早期获得大量自发传播 但近期用户使用量已大幅下跌 表明即使是知名公司单独推出新产品也存在挑战[2] - Google将Nano Banana能力整合到现有产品中是明智做法 单独推出产品希望不大[2] Elevenlabs财务表现 - 语音AI公司Elevenlabs过去12个月收入达到1.93亿美元 其中50%来自思科和Twilio等企业客户 另外50%来自YouTuber、播客主播和作家等早期用户[2] - 公司已经实现盈利 利润率约为60%[2] Black Forest Labs融资与估值 - AI图片生成创业公司Black Forest Labs完成3亿美元B轮融资 估值达到32.5亿美元[3] - 公司成立于2024年8月 估值增长迅速[3] - 融资由Salesforce Ventures和Anjney Midha联合领投[3] BFL技术愿景与定位 - 公司致力于构建像素级前沿模型 创造相机无法捕捉的画面 开发理解意图而不仅仅是执行提示的系统[3] - 长期目标是统一视觉感知、生成、记忆和推理 为视觉智能奠定基础[3] - 定位为模型企业 不直接推出面向用户的产品 而是通过API与Adobe、Canva、Meta和微软等公司合作[6] BFL团队背景与技术策略 - 三位联合创始人都是Stable Diffusion系列模型的原始共同创作者 也是潜在扩散模型的先驱[4] - 其研究成果为开源图像生成社区奠定基石 并影响了DALL-E 2/3和Sora等闭源模型的架构[4] - 采用开放权重方式发布核心模型FLUX.2 允许研究人员和开发者免费使用、定制和部署[6] - 技术成为Hugging Face上最受欢迎的图像模型之一 成功将研究成果转化为生产力工具[6] AI原生存储产品 - 有团队开发AI原生版Dropbox 种子轮融资近800万美元[6] - 与Google Drive和Dropbox基于文本的AI搜索不同 该产品愿景是成为文件操作系统 从存储优先变为理解优先[7] - 团队从零开始构建完全不同的技术架构[7]
基金存续期20年,杭州又放大招了
投中网· 2025-11-19 10:09
文章核心观点 - 杭州润苗基金正式启动,首期规模20亿元,由杭州市国有资本投资运营有限公司管理,杭州市科创集团有限公司运营[3] - 基金采用政府直投模式,精准聚焦设立不超过5年、人员规模不超过100人或估值在1亿元以内的科技型初创企业[3] - 基金存续期限长达20年,创下国内政府主导型早期科创基金的纪录,旨在弥补市场在早期科创项目资源配置上的“失灵”问题[3][10] 基金定位与投资策略 - 基金定位清晰,聚焦“投早、投小、投长期、投人才、投硬科技”,致力于为科创幼苗提供早期支持乃至“第一笔投资”[6] - 投资标的必须满足企业设立不超过5年、人员规模不超过100人或估值在1亿元以内的基本条件,且必须是处于技术研发或产品雏形阶段、开放融资在A轮之前的早期项目[6] - 产业方向与杭州整体产业规划紧密衔接,瞄准“5+5+X”产业领域及“296X”先进制造业集群体系,重点关注人工智能、视觉智能两大万亿级产业,以及九大千亿级产业和六大未来产业[6] 基金创新设计与治理机制 - 基金设置20年超长存续期,考核机制打破短期利益束缚,不以单一项目盈亏作为唯一评价标准,鼓励投资团队“敢投早、愿陪跑”[7] - 坚持“参股不控盘”原则,不谋求第一大股东地位,仅以战略投资者身份陪伴企业成长,为初创企业保留充分经营自主权[7] - 决策机制设立7人投资决策委员会,其中4名为外部聘请的产业、技术、投资领域专家,内部委员仅占3席,有效规避政府投资可能存在的“内部决策惯性”[7] 杭州国资投资历史与原则 - 杭州国资在直接投资方面历来保持审慎,但其出手节奏与市场环境密切相关,历史上曾出现三个密集投资期:2000年前后、2008年后、2023年前后[9] - 杭州始终遵循“在市场失灵或需要引导时介入,其余时间充分尊重市场主体”的原则,在风险与责任之间寻找平衡[9][10] - 当前环境下,科技成果从实验室走向产业的转化率不足10%,市场化资本因收益率考量对早期硬科技项目望而却步,润苗基金的设立是对此结构性难题的有力回应[10] 风险管控与生态支撑体系 - 基金构建开放多元的项目发现机制,除常规推荐渠道外,“杭创E站”平台高分项目、创新创业大赛优胜团队及社会自荐项目均可进入投资视野[13] - 启用“润苗基金雷达大模型”,通过人工智能构建多维度评估体系,实现从“人找项目”到“智选项目”的转变[13] - 投后管理依托“杭创营”“百舸计划”等服务品牌,为被投企业提供找转化、找资金、找载体、找人才、找协同的全方位赋能[13] 基金集群与政策协同 - 润苗基金深度嵌入杭州多年构建的基金矩阵生态,该生态包括总规模超3000亿元的“3+N”杭州基金集群[14] - 基金将通过协同机制构建覆盖企业全生命周期的“接力投资”通道,并为早期企业推出“润苗担”专项担保产品及配套金融支持计划[14] - 政策层面推出“润苗计划”,提出到2027年培育5万家科技型中小企业、3000家“好苗子”企业等具体目标,通过20条重点政策举措为企业成长提供全方位支持[14]
湘湖边“论剑”共筑视觉智能新未来
新华网· 2025-11-18 09:05
行业宏观发展与目标 - 视觉智能产业被定位为杭州市“296X”产业体系中的2个万亿级集群之一,是唯一由杭州市牵头创建的国家级先进制造业集群 [1] - 2025年前三季度产业营收达到7104亿元人民币,同比增长14.4%,目标剑指万亿级产业规模 [1] - 行业下一步将锚定万亿级目标和国家级集群定位,致力于打造具有鲜明杭州辨识度和世界影响力的先进制造业集群 [1] - “中国视谷”被视为打造世界级先进制造业集群、冲击全球先进制造业基地的关键突破口 [3] 产业生态与重要活动 - 大会发布了“湘湖论剑2025·中国视觉智能年度创新人物”榜单,聚焦于引领技术方向的科学引航者和推动技术落地的企业领航者两类核心人物 [3] - 产业链协作是重点,大会为三大链主企业(先临三维、云尖信息、网易)设立平行分会场,通过技术座谈、产品品鉴、合作洽谈等形式探索产业协作新机遇 [3] 核心企业技术与产品 - 先临三维展示了无线一体式手持3D扫描测量仪,可在1分钟内生成物品的3D效果图,无需电脑即可得出检测数据,打通了数据采集和检测的前后端 [5] - 该技术已广泛应用于工厂,未来计划销往全球一百多个国家和地区,其应用范围从小物件扩展至汽车等大型物体 [5] 核心区域政策与投资 - 湘湖作为“中国视谷”核心承载地,自2022年建设启动以来,已构建起“政策有力度、空间有广度、服务有温度”的营商环境 [5] - 目前湘湖新城已集聚高新产业人口超过2万名,落地项目总投资额超过250亿元人民币 [5] - 未来湘湖将再投入超过100亿元人民币用于完善配套、培育人工智能硬件全产业链集群,以吸引创新项目与资源落地 [5]
湘湖论剑!启笔中国视谷“科创群侠传”
新浪财经· 2025-11-17 21:26
会议概况 - 湘湖论剑2025——“中国视谷”产业生态大会于11月16日在萧山湘湖举行 [1] - 超过150位科学家、企业家等视觉智能政产学研金各界代表参会 [1] 产业规模与目标 - 视觉智能产业集群是80个国家先进制造业集群之一,也是唯一由杭州市牵头创建的国家级集群 [8] - 该集群被列为杭州“296X”产业集群中2个万亿级集群之一进行重点培育 [8] - 2025年前三季度产业营收达7104亿元,同比增长14.4% [8] - 产业目标为剑指万亿级规模,打造具有世界影响力的先进制造业集群 [8] 核心区域发展现状 - 湘湖作为“中国视谷”核心承载地,自2022年建设启动以来,目标为打造全国一流、全球有竞争力的视觉智能产业高地 [10] - 湘湖新城已集聚高新产业人口2万余名,落地项目总投资超250亿元 [12] - 未来计划再投入超100亿元完善配套、培育人工智能硬件全产业链集群 [12] 生态建设与活动 - 大会发布了首张全国视觉智能人物榜——“湘湖论剑2025·中国视觉智能年度创新人物” [10] - 该榜单由视觉智能产业技术创新战略联盟牵头发起,聚焦科学引航者和企业领航者两类核心人物 [10] - 大会为“中国视谷”三大链主企业先临三维、云尖信息、网易设立平行分会场,促进产业链上下游企业协作 [22] - 会议旨在以“侠客精神”构筑“科创群侠”协同共生创新生态 [22]
“中国视谷”产业生态大会发布创新人物榜
新华网· 2025-11-17 02:16
产业大会概况 - 湘湖论剑2025产业生态大会于11月16日在杭州萧山湘湖举行,主题为“中国视谷”产业生态 [1] - 超过150位视觉智能领域的政产学研金各界代表参会,共商产业创新合作 [1] - 大会是“中国视谷”建设三周年的总结会和动员会,也是杭州“296X”集群发布后的首场视觉智能核心盛会 [2] 产业发展规模与表现 - 视觉智能产业作为杭州牵头创建的唯一国家先进制造业集群,被纳入杭州“296X”先进制造业集群培育计划 [1] - 2025年前三季度,该产业营收达到7104亿元,同比增长14.4% [1] - 自2022年视谷建设启动以来,湘湖作为核心承载地已集聚高新产业人口2万余名,落地项目总投资超过250亿元 [1] 未来发展规划与投入 - 未来将再投入超过100亿元完善城市配套、引进优质资源 [1] - 产业将聚焦智能芯片等细分赛道,培育人工智能硬件全产业链集群 [1] - 目标是通过科技创新与产业创新深度融合,推动更多创新产品、先进技术从萧山走向全球 [2] 产业生态与合作 - 湘湖已构建起全周期赋能的产业生态 [1] - 中国工程院院士高文、北京大学博雅特聘教授马思伟等专家学者及企业代表分享前沿洞见 [1] - 先临三维、云尖信息、网易(网易灵动、网易有灵)等三大链主企业设立平行分会场,通过多形式对接探索产业协作新机遇 [1] 人才激励与行业认可 - 大会发布全国首张视觉智能人物榜——“湘湖论剑2025·中国视觉智能年度创新人物” [2] - 向优秀科学家和企业家发出“科创群侠英雄帖”,广邀天下英才 [2]
从设计师到CEO:曾熙博士在诺丁汉大学分享“AI时代的创造力与领导力”
搜狐财经· 2025-10-31 05:55
公司核心技术与产品 - 公司构建了全球首个视觉智能体(Visual Intelligence Agent)平台,提出“Visual Agent(视觉代理)”概念,具备观察、理解与行动能力 [13][14] - 核心产品为“Curiosity Lens(好奇心镜头)”,实现从“Snap → Know → Do → Share”的完整视觉智能循环,让用户通过图像获得知识、行动与灵感 [10][14] - 平台技术融合视觉理解(Visual Reasoning)与语义推理(Semantic Context),旨在让AI从“识别世界”迈向“理解世界”,而不仅仅是识别物体 [8][13] 行业趋势与市场定位 - 视觉智能(Visual Intelligence)被麦肯锡与Gartner的2025年趋势报告预测为继大语言模型之后的下一个AI交互前沿 [8] - 全球62%的年轻用户更倾向于“看而非打字”的信息获取方式,公司业务顺应此趋势 [8] - 公司定位为视觉智能领域的新兴标准,其核心使命是“Seeing the Unseen(看见未被看见的)”,致力于让AI成为人类理解世界的延伸 [8][10][13] 商业合作与市场拓展 - 公司已在纽约、伦敦、东京等城市展开实验合作,合作伙伴包括纽约时装周(New York Fashion Week)及多家曼哈顿画廊 [9][14] - 与多所顶尖大学及设计机构合作,如纽约大学(NYU)、南加州大学(USC)、诺丁汉大学(University of Nottingham)等,展示视觉智能在文化、教育、艺术等领域的创新价值 [14] 公司领导理念与核心竞争力 - 创始人提出AI时代领导者的三条核心能力:跨界思维(Liberal Arts Thinking)、上游思维(Upstream Thinking)与品味(Taste) [3][5][6] - 公司将“品味(Taste)”定义为做出优质决策的能力,并视其为AI时代最稀缺的人类优势,产品旨在帮助用户提升决策深度与审美维度 [6][8] - 公司是跨界思维的产物,其技术融合认知科学、艺术与人工智能,旨在打造“视觉智能平台(Visual Intelligence OS)” [5]