Workflow
Claude for Chrome
icon
搜索文档
寻找你的AI同频搭子|「锦秋小饭桌」活动上新
锦秋集· 2025-09-23 09:44
AI Agent@深圳 09.26 报名方式: 扫描海报二维码,关注"锦秋集"公众号,后台回复 "锦秋小饭桌" ,即刻报名! 立秋季节,最适合找搭子一起,边贴秋膘、边聊技术创新。 吃进去的是美味,聊出来的是灵感。 今天上新三场 9-10 月活动,如有戳中你的兴趣,或是你正在从事的方向,欢迎报名加入! 具身智能@北京 10.10 机器人派对@深圳 10.17 「锦秋小饭桌」 Vol.32 深圳 AI Agent 专场 TIME 2025.09 .26 18:30 ADD 深圳 吃饱了 咱们一起 去改变世界! 扫码报名 解锁餐桌暗号 吃饱了 上白 咱们一起 饭泉 秋 去改变世界! r均11 1 k = 11 1 22 ' '坤'人小以示] VU.JJ 具身智能系列专场 TIME - 2025.10.10 18: 30 ADD 北京 三元桥 扫码关注"锦秋集" 后台回复"锦秋小饭桌"即刻报名 吃饱了 咱们一起 去改变世界! 地 锦 秋 X A 精 小 饭 酸 馆 桌 「锦秋小饭桌」 Vol.34 深圳机器人派对 TIME 2025.10 .17 18:00 ADD 深圳 系——欢迎点开往期回顾,找到你感兴趣的话题! ...
新一轮AI浏览器大战,谷歌将掉队了?
虎嗅· 2025-09-05 02:00
AI浏览器市场兴起 - AI浏览器成为新竞争焦点,Perplexity以345亿美元报价收购Chrome浏览器,是其自身估值的两倍[1] - Anthropic发布Claude for Chrome加入竞争,浏览器从过去数年无人讨论变为科技热点[3] - 搜索作为万亿级生意面临颠覆,AI浏览器可能重塑流量入口和交互方式[4] 浏览器战略地位演变 - 过去20年用户与计算机交互从操作系统转向浏览器,浏览器成为安全、数据收集和应用运行的核心平台[9] - 浏览器是AI与人类设计工具交互的主要机制,成为数据收集、自动化和系统交互的战略要塞[10] - 企业在浏览器领域早有布局,Talon被Palo Alto Networks收购,形成庞大企业浏览器市场[11][12] 技术驱动因素 - 大模型和AI首次使机器能处理半结构化语言,理解并像人类一样操作,带来认知劳动的技术化[17] - 模型发展受限于数据吸收学习能力和执行动作能力,浏览器恰好是观察与行动的通用窗口[19][21] - 用户95%电脑操作通过浏览器完成,浏览器掌握用户行为数据,成为战略性数字地产[22] 产品创新方向 - Perplexity发布基于Chromium的AI浏览器Comet,支持网页搜索、内容总结、预定会议等任务,目前仅向月付200美元高端用户开放[25][26][27] - 浏览器需从零重新思考,不再是点击链接获取内容,而应成为主动、个性化的效率助手[47] - 浏览器发展三阶段:搜索与聊天整合、个性化主动智能体、智能体化执行复杂任务[96][98][100] 市场竞争格局 - Chrome市场份额超过70%,谷歌年收入4000亿美元中约800亿美元直接来自Chrome[38][40] - 谷歌面临创新者窘境,收入结构使其难以对Chrome进行重大改变[42][43] - 初创公司有机会基于开源Chromium构建新产品,已有Talon和Island等成功案例[65][66] 商业模式变革 - 搜索行为根本性改变,从人类主动查询转向AI代理完成信息发现[80] - 广告商业模式受冲击,传统搜索假设人类不耐烦且查询不完美,AI代理需要完全不同交互方式[75][76] - 产品服务商业模式转向商业模式服务产品,创业者有机会打造最好产品再匹配商业模式[86][90] 技术挑战与发展 - AI代理技术需进步以支持主流应用,包括信息抓取、速度和MCP协议等[95] - 语音交互需要95%以上准确率,理解专业术语和口音,实现实时显示[116][117] - 视觉和多模态是未来方向,需解决成本、延迟和可预测性问题,实现内容形式按需转换[122][127] 隐私与安全考量 - 浏览器集中化数据收集引发隐私担忧,需要平衡便利性与安全性[132] - 安全、隐私、信任和对齐相互关联,用户需要控制权决定信任程度和隐私保护级别[137][139] - 大多数消费者不愿为隐私付费,更看重顺畅体验,只有极客群体会精细管理信息[147] 未来机遇展望 - AI浏览器可能成为未来AI操作系统,催生全新应用类别[108][156] - 创业机会在于三年前技术上或经济上不可行,而今天能够实现的事情[154] - 消费者付费习惯改变,愿意为AI服务订阅付费,长期商业模式仍在探索中[149][150]
Perplexity对Chrome发起收购要约,深聊新一轮AI浏览器大战
36氪· 2025-09-05 01:13
AI浏览器定义与战略意义 - AI浏览器是AI与系统交互的主要机制 成为数据收集 自动化执行和安全保障的战略要塞 [8] - 浏览器承载95%人机交互功能 是观察与行动的通用窗口 在AI时代重要性提升数个数量级 [15] - 基于Chromium开源架构 初创公司可重构用户界面和交互系统 打破巨头垄断格局 [43] 市场竞争格局与参与者动态 - Perplexity发布基于Chromium的Comet浏览器 仅向月付200美元高端用户开放 支持AI自动点击/表单提交/多平台联动等功能 [16][18] - Google Chrome占据70%市场份额 年收入4000亿美元中约800亿美元直接来自浏览器 面临创新者窘境 [24][26] - Anthropic推出Claude for Chrome OpenAI可能开发或收购浏览器 Meta等巨头预计将入局 [3][39][40] 技术演进路径与发展阶段 - 第一阶段实现搜索/聊天/导航融合 第二阶段实现个性化主动助手 第三阶段实现高精度智能体化执行 [68][70][72] - 多模态交互是未来方向 支持文字/音频/视频实时转换 成本与延迟是目前主要技术瓶颈 [83][86][90] - 语音交互技术接近成熟 需达到实时转写和专业术语识别 但桌面端用户习惯尚未形成 [79][80] 商业模式颠覆与重构 - 传统搜索基于人类不完美查询呈现10个链接 AI代理将直接获取100条数据并筛选 改变信息发现逻辑 [51][53] - 广告商业模式受冲击 从"产品服务商业模式"转向"商业模式服务产品" 初创公司有机会重构盈利体系 [57][59][61] - 用户付费意愿显著提升 每月20美元订阅模式逐渐普及 但长期商业模式仍需探索 [102][104] 数据安全与隐私保护 - 需平衡便利性与隐私保护 提供端到端加密和本地数据存储等差异化选择 [93][95] - 建立信任/安全/对齐的技术栈层级 赋予用户信息控制权 但普通消费者认知负担较大 [96][98] - 大多数消费者不愿为隐私付费 优先考虑使用体验流畅性 免费模式仍占主导 [101] 未来发展趋势与机会 - 浏览器将演进为AI操作系统 催生新一代应用生态 类似JavaScript推动AJAX和Gmail创新 [107][109] - 创业机会集中于"三年前不可实现"领域 如自动处理财务披露PDF等复杂任务 [107] - 行业进入达尔文式变革期 十年后浏览器市场份额格局将彻底重构 [36][39]
计算机行业周报:政策助推AI产业发展,长期成长空间广阔-20250901
国元证券· 2025-09-01 04:41
行业投资评级 - 推荐|维持 [6] 核心观点 - 国务院发布《关于深入实施"人工智能+"行动的意见》,提出到2027年实现人工智能与六大重点领域(科学技术、产业发展、消费提质、民生福祉、治理能力、全球合作)深度融合,并规划八大基础支撑方向(模型基础能力、数据供给创新、智能算力统筹等)[3][21] - 到2030年人工智能全面赋能高质量发展,智能终端和智能体应用普及率超90%,智能经济成为重要增长极;到2035年全面步入智能经济和智能社会发展新阶段[3][21] - 人工智能产业进入落地阶段,政策驱动产业深度融合,建议关注具备AI应用落地能力的上市公司,重点考察业务落地节奏及对业绩的贡献程度[4][22] 市场表现 - 计算机(申万)指数本周上涨1.34%,延续前两周上涨趋势;上证指数涨0.84%,深证成指涨4.36%,创业板指涨7.74%[1][11] - 细分板块表现:计算机设备涨0.03%、IT服务Ⅱ涨2.91%、软件开发涨0.86%[1][13] - 个股涨幅前三:开普云涨133.74%、航天宏图涨45.29%、ST易联众涨40.80%[13] 重点公司业绩 - 能科科技2025年上半年营收7.38亿元(同比+4.91%),归母净利润1.11亿元(同比+18.75%)[2][19] - 海兰信营收4.87亿元(同比+208.66%),归母净利润0.34亿元(同比+172.44%)[2][19] - 天地数码营收4.31亿元(同比+19.58%),归母净利润0.63亿元(同比+32.37%)[2][20] - 广联达营收27.84亿元(同比-5.23%),但归母净利润2.37亿元(同比+23.65%)[19] - 安博通营收4.29亿元(同比+123.98%),但归母净利润亏损1.09亿元[19] 行业重大事件 - OpenAI与Anthropic首次合作评估模型安全性,Claude模型拒绝70%不确定问题,OpenAI模型幻觉率更高[16] - 谷歌推出原生图像生成模型"Nano-Banana",支持多轮对话及像素级编辑,生成5张高清图仅需13秒[16] - 英伟达推出4-bit精度训练格式NVFP4,在Blackwell Ultra上性能较Hopper提升7倍,可节省算力及电力成本[16] - 英伟达发布机器人芯片Jetson Thor,算力达2070 FP4 TFLOPS(上代7.5倍),内存128G,宇树科技等中国厂商首发搭载[19] - 英伟达Q2营收467.43亿美元(同比+56%),数据中心营收411亿美元(同比+56%),Blackwell数据中心营收环比增17%[19]
Claude for Chrome来了,可作为浏览器扩展程序直接使用
36氪· 2025-08-28 03:25
产品发布与功能 - Anthropic推出Chrome扩展程序Claude for Chrome 允许用户通过侧边窗口对话并保留浏览器活动上下文[8] - 该扩展程序能执行多种任务 包括设置日历、回复邮件和找房等[1][3] - 用户可授权agent在浏览器中执行操作并代为完成任务 但目前仅向1000名Max套餐用户开放测试[8][10] - Max套餐月费为100或200美元 其他用户需订阅进入候补名单[10] 安全策略与限制 - 公司采取小规模试点以收集安全反馈 重点防范"提示注入攻击"等漏洞[10] - 用户可限制agent访问特定网站 默认禁止访问金融服务/成人内容/盗版网站[12] - 高风险操作(如发布信息/购物/分享个人数据)需事先获得用户许可[12] - 此前曾发生恶意邮件诱骗Claude未经授权删除电子邮件的事件[10] 行业竞争格局 - AI浏览器成为巨头竞争新战场 Perplexity已推出自有浏览器Comet 功能与Claude类似[13][16] - 谷歌和微软计划分别在Chrome和Edge浏览器中嵌入Gemini和Copilot[14] - OpenAI据称即将发布AI驱动浏览器 行业存在两种技术路径:浏览器扩展程序或全新浏览器开发[16] - 谷歌Chrome在2025年占据全球浏览器市场68.35%份额 远超Safari的16.25%[19] 技术演进历程 - Anthropic早在2024年10月就尝试开发可控制PC屏幕的agent 但因速度与稳定性问题搁置[12] - 当前技术重点在于让AI理解网页内容并执行点击按钮/填写表格等交互操作[10] - 行业认为浏览器集成AI将创造非凡价值 成为用户与信息连接的重要桥梁[13]
腾讯研究院AI速递 20250828
腾讯研究院· 2025-08-27 16:01
英伟达NVFP4技术突破 - 推出NVFP4新格式 以4-bit精度实现16-bit训练精度 在Blackwell Ultra上性能较Hopper架构提升7倍 [1] - 采用微块缩放 E4M3高精度块编码 哈达玛变换和随机舍入技术 解决低精度训练中的动态范围 梯度波动性和数值稳定性问题 [1] - 与AWS 谷歌云 OpenAI等机构合作 在万亿级令牌规模下实现稳定收敛 节省大量算力和电力成本 [1] 谷歌Gemini 2.5 Flash图像模型 - 发布gemini-2.5-flash-image-preview模型 拥有SOTA图像生成与编辑能力 出色角色一致性和极快速度 [2] - 支持32k上下文 每张图像生成成本仅0.28元 比OpenAI便宜95% 在Google AI Studio和Gemini API提供预览 [2] - 图像编辑功能卓越 支持换装 换场景 合成照片和多轮编辑 在Artificial Analysis图像编辑类别排名第一 LM Arena多项指标夺冠 [2] Anthropic浏览器扩展发布 - 推出Claude for Chrome浏览器扩展 可帮助用户设日历 回邮件 找房等任务 在侧边窗口保留浏览器活动上下文 [3] - 目前仅向1000名Max套餐用户开放测试 主要考虑安全因素 防范提示注入攻击 设置限制访问特定网站功能 [3] - AI浏览器成为巨头争夺新战场 Perplexity推出Comet 微软Edge集成Copilot 谷歌Chrome集成Gemini OpenAI将发布AI浏览器 [3] PixVerse视频生成技术升级 - V5视频生成模型大幅提升速度 5秒生成360p短片 1分钟完成1080p高清视频 降低AI视频创作时间和成本 [4] - 优化动态 清晰度 一致性和指令理解能力 增强人物场景一致性 提供更接近真实拍摄效果 [4] - 新增续写和Agent智能体功能 视频可丝滑延长至30秒 提供多种创意模板 降低普通用户视频创作门槛 [4] DeepMind健康大模型突破 - 发布基于Gemini微调的健康大语言模型PH-LLM 能将可穿戴设备数据转化为个性化健康建议 在睡眠和运动领域表现优异 [5][6] - 在睡眠医学考试中得分79%超过医生76% 在健身认证考试中表现88%远超专家71% 能根据传感器数据预测用户睡眠质量 [6] - 采用两阶段训练 先对完整模型进行睡眠和健康领域微调 再增加多模态适配器预测睡眠障碍 根据个体传感器数据生成高度个性化建议 [6] 腾讯开放原子大赛 - 开放原子大赛腾讯赛题第二期启动 新增AI播客和数据库方向赛题 总奖金40万元 全球招募开发者 [7] - 混元AI播客创新智造挑战赛奖金10万元 基于混元开源模型开发三类AI播客技术 文本转多角色对话 契合风格播客和深度话题播客 [7] - 包括OpenTenBase-TXSQL改写优化挑战赛30万元 决赛11月在腾讯深圳总部举行 优胜方案代码有机会融入开源项目 [7] SpaceX星舰技术进展 - 星舰第十次综合飞行测试成功执行 由第二代星舰S37和B16助推器组成 完成星链卫星模拟器部署等关键任务 [8] - B16助推器测试飞行极限和发动机系统冗余设计 S37飞船完成猛禽发动机太空点火 重入大气层并溅落印度洋 [8] - 关键任务包括测试易受损区域耐受度 不同隔热瓦性能 捕捉连接件热性能和襟翼极限 为载人和火星移民计划铺平道路 [8] AI对美国就业市场影响 - 斯坦福报告显示自2022年末以来AI暴露度越高职业就业增长越慢 22-25岁劳动者在高AI暴露度职业中就业率下降明显 [9] - AI对就业影响体现在替代或增强人类工作能力 用于替代工作时年轻劳动者就业率下降 用于增强时就业率上升 [9] - 高AI暴露职业年轻劳动者有13%相对就业下降率 AI主要替代年轻人掌握的编码知识 较少替代年长者积累的隐性知识 [9] 大模型技术决策与Agent发展 - 大模型技术从预训练/SFT转向预训练/强化学习 从缸中之脑转向Agentic系统 K2模型采用MoE架构和Muon优化器实现更高token效率 [10][11] - Agent泛化性追求通用性而非简单模拟人类行为 可能需要用更多AI训练AI和InnovationL4解决AgentL3问题 [11] - 将OpenAI的L1-L5分级视为非线性技术里程碑 认为AGI是方向而非终点 组织管理需要平衡SFT和RL [11]
Chrome上线Claude插件,AI代管浏览器操作成真?
36氪· 2025-08-27 13:21
产品发布与功能 - Anthropic发布Chrome浏览器插件Claude for Chrome 研究预览版 使AI大模型能够自动操作网页[1] - 插件目前仅向1000名付费用户开放 订阅费用为每月100美元或200美元[3] - 功能包括管理日程 安排会议 草拟邮件 处理报销 测试网站功能 以及通过自然语言指令实现房屋搜索 餐厅推荐和文档总结[4] - 具体案例显示 用户输入"西雅图价格低于80万美元的3卧室房屋"需求后 Claude通过Zillow自动搜索并展示前5个选项[4] - 另一案例显示 Claude可查找"蒜香面条餐厅"并自动加入购物车[5] - 在Chrome中打开Google文档时 Claude可自动生成内容总结[6] 技术实现与行业趋势 - Anthropic认为浏览器AI是不可避免的趋势 因大量工作均在浏览器中完成[8] - 公司强调让Claude能够查看浏览内容 点击按钮和填写表格将提升实用性[8] - 行业评论指出当前AI代理本质是具有宽泛权限的浏览器插件 将内容传输至大模型处理 更像权宜之计而非最终解决方案[18] - 长期愿景可能是AI代理直接通过API完成操作 无需浏览器登录和应用程序交互 仅通过自然语言指令实现如"转账50美元至储蓄账户"等功能[18] 安全风险与防护措施 - 浏览器插件存在隐私泄露和权限滥用风险 Anthropic因安全顾虑暂未全面开放功能[8] - 主要威胁为提示注入攻击 攻击者通过在网站 邮件或文档隐藏指令诱导AI执行有害操作[9] - 未防护情况下 123个测试案例中有29个攻击成功 攻击成功率高达23.6%[9] - 具体案例显示恶意邮件可指令Claude未经确认直接删除用户邮件[11] - Anthropic实施多层防护:权限控制允许用户按网站授予访问权 高风险操作需用户确认 强化系统指令处理敏感数据 禁止访问高风险网站类别[14] - 新增防护后 自主模式攻击成功率从23.6%降至11.2% 浏览器特有攻击成功率从35.7%降至0%[14] - 公司持续测试高级分类器以检测异常指令模式和非常规数据访问请求[14] 测试进展与用户反馈 - Anthropic表示内部测试无法完全模拟真实用户环境 新型提示注入攻击持续出现[16] - 研究预览计划旨在与受信任用户合作检验保护措施有效性[16] - 外界反馈喜忧参半:部分用户担忧AI边界可控性 认为功能过早开放 另部分用户调侃安全防护不完善[18] - 深层疑问涉及AI代理完全访问浏览器后对线上操作的控制权归属问题[18]
AI进化速递 | 谷歌发布图像生成模型Gemini 2.5 Flash Image
第一财经· 2025-08-27 13:00
医疗AI应用 - 浙大一院与阿里巴巴联合发布主动脉急诊模型iAorta 基于平扫CT与AI技术提升急诊诊断效率 [1] AI智能体安全框架 - 字节跳动提出Jeddak AgentArmor框架 为AI Agent行为制定安全规范 [1] 存储硬件创新 - 华为推出三款AI SSD新品 其中HUAWEI OceanDisk LC 560单盘容量达122/245TB 创业界最高记录 [1] 图像生成模型 - 谷歌正式发布Gemini 2.5 Flash Image图像生成模型 [1] AI政策推动 - Meta计划斥资千万美元组建加州超级政治行动委员会 推动AI友好政策落地 [1] 智能硬件产品 - Meta AI眼镜Hypernova预计三季度量产 售价约800美元 [1] 浏览器智能体 - Anthropic推出基于Claude模型的Chrome浏览器智能体研究预览版Claude for Chrome [1]
速递|Anthropic入局浏览器Agent大战,Claude for Chrome预览版月费200美元体验
Z Potentials· 2025-08-27 12:08
行业竞争格局 - 浏览器正迅速成为AI实验室的下一个主战场 通过浏览器集成在AI系统与用户之间建立更无缝的连接[1] - Perplexity推出自带AI Agent功能的浏览器Comet OpenAI即将推出功能相似的AI驱动浏览器 Google已为Chrome推出Gemini集成功能[2] - 开发AI驱动浏览器的竞赛显得尤为紧迫 因谷歌面临反垄断案最终裁决 可能被强制出售Chrome浏览器[2] 产品发布与功能 - Anthropic推出基于浏览器的AI Agent Claude for Chrome研究预览版 由Claude AI模型驱动[1] - 该智能体首先向1000名订阅Anthropic Max计划的用户开放 月费在100至200美元之间[1] - 通过Chrome扩展实现侧边栏窗口聊天 保持对浏览器内所有操作的上下文感知 可授予权限代为执行任务[1] 安全风险与防护 - 具备浏览器访问权限的AI Agent兴起会带来新的安全风险 Brave安全团队发现Comet浏览器Agent可能易受间接提示注入攻击[2] - Anthropic部署多项防御措施应对提示注入攻击 将提示注入攻击成功率从23.6%降至11.2%[2] - 用户可限制Agent访问特定网站 默认屏蔽金融服务 成人内容及盗版内容网站 高风险操作前会主动征求用户权限[3] 技术演进历程 - 2024年10月Anthropic曾推出能操控个人电脑的AI Agent程序 但测试表明运行速度较慢且可靠性欠佳[3] - 现代浏览器AI Agent如Comet和ChatGPT Agent在执行简单任务分流方面已相当可靠[3] - 多数Agent系统在处理更复杂问题时仍存在困难[3] 市场动态与资本运作 - Perplexity主动提交345亿美元收购Chrome的未邀约报价 OpenAI首席执行官表示公司有意收购[2]
Claude for Chrome来了!可作为浏览器扩展程序直接使用
量子位· 2025-08-27 05:49
产品发布与功能 - Anthropic发布浏览器扩展程序Claude for Chrome 可直接集成于Chrome浏览器并执行任务如设置日历、回复邮件及找房等[1][3][4] - 用户可通过侧边窗口与代理对话 聊天框保留浏览器所有活动上下文 并可授权代理执行操作如点击按钮和填写表格[10][12] - 目前仅向1000名Max套餐用户开放测试 该套餐月费为100或200美元 其他用户需订阅进入候补名单[12] 安全策略与限制 - 因安全挑战需强有力保障措施 公司通过小规模试点收集数据和安全反馈以优化分类器和模型[13][14] - 默认禁止访问金融服务、成人内容和盗版网站 用户可设置限制代理访问特定网站[24][25] - 执行高风险操作如发布信息、购物或分享个人数据前需征得用户许可 以防止提示注入攻击等漏洞[20][21][26] 行业竞争格局 - AI浏览器成为巨头竞争新战场 Perplexity推出自有浏览器Comet 谷歌和微软分别计划在Chrome和Edge中嵌入Gemini和Copilot[29][31][32] - OpenAI据称即将发布AI驱动浏览器 功能与Comet类似[34] - 谷歌Chrome在2025年占据全球浏览器市场68.35%份额 远超Safari的16.25%[39] 技术演进与战略方向 - 公司曾于2024年10月推出可控制PC的代理 但因速度和稳定性问题搁置[27][28] - 行业存在两种主流路径:开发扩展程序整合至现有浏览器 或重新打造浏览器嵌入AI[35][36] - 人工智能与网页互动可创造非凡价值 作为用户与信息桥梁使连接更紧密[30][31]