Workflow
你敢信?GPT-5的电脑操作水平只比人类低2%了
机器之心· 2025-10-04 03:38
| 机器之心报道 | 机器之心编辑部 | | | | --- | --- | --- | --- | | Agent(智能体)是最近一段时间的人工智能热点之一,将大语言模型的能力与工具调用、环境交互和自主规划结合起来,使其能够像虚拟助理一样完成复杂任 | 务。 | | | | 其中「计算机使用智能体」(computer-use agent,CUA)是一种能够直接在电脑环境中代替人类执行操作的智能体。它和传统的对话式 AI 不同,不只是回答问 | 在该领域,Simular Research 推出的框架 Agent S 是典型代表之一 | 题,而是模拟人类使用鼠标、键盘和操作软件来完成任务。 | 。 | | 一年前,Agent S 在 CUA 基准测试「OSWorld 」上取得了 20.6% 的成绩。此后能力继续扩展,Agent S2 将业界水平提升到了 48.8%。就在昨日, | Agent S3 又刷新 | 了自身记录,将性能拉升到了 69.9%,超出先前的 SOTA 10%,接近人类水平的 72% 。 | | 加州大学圣巴巴拉分校助理教授、 Simular 研究负责人 Xin Eric Wang 表示,「接 ...
吴恩达执教的深度学习课程CS230秋季上新,新增GPT-5专题
机器之心· 2025-10-04 03:38
课程概述与更新 - 斯坦福大学CS230深度学习旗舰课程已更新至2025年秋季版,由吴恩达执教 [1] - 课程采用翻转课堂模式,学生需提前在Coursera上观看deeplearning.ai专项课程视频,再参加线下课程 [3] - 课程核心框架与往年相似,但针对最新AI发展进行了更新,最大变化是新增了GPT-5专题章节 [4] 2025秋季版核心更新 - 新增深入探讨OpenAI于2025年8月发布的GPT-5模型的专题章节,内容覆盖其特性、过度拒绝问题、安全行为机制、微调技术及创新的agentic workflows [4] - 增强了对生成模型的讲解,并整合了最新的RAG和AI Agents等热门技术,结合GPT-5进行案例分析 [6] - 更注重AI项目开发全生命周期,强调从科学、工程到决策的完整项目技能,推荐使用Workera等前沿评估工具 [6] 课程结构与师资 - 课程从9月底开始,持续约10周,包含编程作业、测验和最终的大型项目 [15][16] - 师资包括人工智能领域顶尖专家吴恩达(斯坦福大学客座教授,Coursera和DeepLearning.AI创始人)以及Kian Katanforoosh(斯坦福大学讲师,Workera创始人兼CEO) [15] 课程核心主题 - 覆盖从基础理论到前沿应用的完整知识体系,包括神经网络与深度学习基础、神经网络优化技术、机器学习项目构建策略 [18][20] - 深入讲解卷积神经网络(CNN)在图像分类等领域的应用,以及循环神经网络(RNN)在自然语言处理等序列任务中的应用 [20] - 探索前沿高级主题,如生成对抗网络(GANs)、深度强化学习、对抗性攻击,并提供行业与学术洞见及AI职业发展建议 [20]
Insta360最新全景综述:全景视觉的挑战、方法与未来
机器之心· 2025-10-04 03:38
文章核心观点 - 全景视觉与常规透视视觉存在根本性差异,直接将基于透视视觉开发的算法迁移到全景视觉往往失效 [6] - 文章首次以“透视-全景 gap”为主线,系统梳理了三大核心挑战、两条核心技术路线与未来方向展望 [6] - 旨在为研究者提供“按任务选解法”的指南,并为工程团队“按场景落地”提供清晰坐标 [6] 研究背景与动机 - 全景图像捕捉的是360°×180°的完整球面视域,而常规透视图像是大部分计算机视觉任务使用的标准输入 [6] - 全景视觉在虚拟现实、自动驾驶、具身智能等新兴应用中正成为不可或缺的研究方向 [6] 全景视觉的核心挑战 - **几何畸变**:球面展开到平面时,两极区域被严重拉伸,物体形状被破坏 [7] - **非均匀采样**:赤道像素密集、极区像素稀疏,同一物体在不同纬度分辨率差异明显 [7] - **边界连续性**:等距矩形投影(ERP)图像的左右边界在球面上相邻,但在二维图像上被分割,导致模型学习出现连续性问题 [7] 核心技术路线与策略适配 - **失真感知方法**:直接在ERP全景格式上建模,通过畸变设计、畸变图权重或自适应注意力来补偿极区问题,优势在于保留全局像素级别的语义对应且与主流架构高度兼容 [10][13] - **投影驱动方法**:通过立方体投影(Cubemap)、切平面投影(Tangent)等将球面转换为多个畸变较小的子视图,优势在于有效缓解极区畸变并能直接复用透视模型和大规模预训练网络 [13] - **策略适配**:失真感知方法更适配全局语义一致性的任务(如超分辨率、修复、分割、检测),而投影驱动方法更适配强调局部几何精度的任务(如深度估计、光流、关键点匹配) [13] 全景视觉任务工具箱 - 文章覆盖20+代表性任务,并提供了横向跨任务对照表,将任务按四大板块归类:增强与评估、理解、多模态、生成 [14] - 新范式加速渗透,包括Diffusion/生成式模型在文生图/视频、图像补全、新视角合成方向快速涌现,以及3D高斯泼溅(3DGS)在高效高保真渲染中的应用 [14][15] - 多模态对齐,尤其是音频、文本、LiDAR与全景的对齐成为新的研究热点 [14][15] 全景视觉的未来发展方向 - **数据瓶颈**:缺少大规模、跨任务、跨场景的标准360°数据,真实场景高质量标注成本高,多模态资源不足制约研究进程 [21] - **模型范式**:需将基础模型迁移到全景视觉并设计参数高效的专家模块,多模态对齐和全景生成是核心难点 [21] - **下游应用**:关键场景包括空间智能与自动系统(具身智能、自动驾驶)、XR与沉浸式交互、三维重建与数字孪生以及广泛的行业化社会应用 [21]
特朗普:停止轰炸!以色列:立即启动!
中国能源报· 2025-10-04 03:20
哈马斯回应美国" 20点计划",特朗普:立即停止轰炸, 以色列:准备立即启动 加沙" 20点计划"的第一阶段 。 巴勒斯坦伊斯兰抵抗运动(哈马斯)当地时间10月3日晚发表声明说,在与巴勒斯坦相关派别以及国际相关方讨论和磋商后,已就美国 总统特朗普提出的关于结束加沙冲突的" 20点计划"向地区和国际调解方提交正式回应。 哈马斯:愿意立即进行谈判 声明说,哈马斯原则上同意在" 20点计划"的交换框架下释放所有以色列被扣押人员和遗体,并表示愿意立即通过调解方进行谈判,讨 论实施细节。 声明表示,哈马斯同意将加沙的管理权移交给一个由独立技术官僚组成的巴勒斯坦机构,该机构应基于民族共识,并获得阿拉伯和伊斯 兰国家的支持。 ▲ 9月2 3日,在约旦河西岸城市希伯伦,民众挥舞巴勒斯坦旗帜参加庆祝多国承认巴勒斯坦国。新华社发(马蒙·沃兹沃兹 摄) 声明强调,计划中其他关于加沙未来及巴勒斯坦人民更广泛权利的相关问题,将在巴勒斯坦民族自决框架内,根据国际法和相关国际决 议予以解决。 哈马斯回应" 20点计划"后,美国总统特朗普在社交媒体发文说,根据哈马斯的声明,相信该组织已经准备好实现"持久和平"。他呼吁 以色列立即停止对加沙的 ...
只剩8天,美核安全管理局将紧急关停
中国能源报· 2025-10-04 03:20
政府停摆对能源部的影响 - 美国能源部下属国家核安全管理局(NNSA)维持全部运作的资金仅够支撑约8天,之后将不得不进入紧急关停程序[1][3] - 若资金耗尽,NNSA将仅保留少量人员确保核武器安全,但这将严重扰乱整体运作[3] - 能源部的关停预案显示,约60%员工可能被迫休假,仅1575人因保护生命与财产被留用[3] NNSA的职能与规模 - NNSA负责维护核武库、核不扩散及海军核动力系统等关键任务[3] - NNSA涉及6.5万名雇员和承包商[3] 政府停摆的宏观影响 - 除提供必要服务的政府雇员外,估计约75万联邦雇员将被迫休假[3] - 部分公共服务可能被暂停或延迟,经济数据发布也将受影响[3]
知名PE退市,高盛也扛不住了?
虎嗅APP· 2025-10-04 03:19
以下文章来源于投中网 ,作者陶辉东 投中网 . 投中网是领先的创新经济信息服务平台,拥有立体化传播矩阵,为创新经济人群提供深入、独到的智识 和洞见,在私募股权投资行业和创新商业领域拥有权威影响力。官网:www.chinaventure.com.cn 以下文章来源于投中网,作者 陶辉东 本文来自微信公众号: 投中网 (ID:China-Venture) ,作者:陶辉东,题图来自:AI生成 自2024年以来,Petershill Partners的市值在最高点时也比公司净资产低37%。在今年二季度财报分 析师会议上,Petershill Partners的管理层无奈地表示,理论上公司不应该再开展任何投资,而应该 把获得的所有资金都退还给股东,因为任何新投资都是在让股东的权益缩水。 今年以来,Petershill Partners采取了包括股票回购在内的各种措施试图提振股价,但均无成效。最 终,Petershill Partners在公告中承认,如果市场没有重大改变,估值折价将会一直持续下去。这种 情况下,退市或许是最好的选择。 一、全球黑马VC/PE的幕后推手 有意思的是,虽然股价惨淡,但Petershill P ...
假期去博物馆的人,已经后悔了
虎嗅APP· 2025-10-04 03:19
博物馆行业热度显著提升 - 2008年国家推行博物馆免费开放政策后参观人次大幅增长 从2007年26亿人次增至2024年133亿人次创历史新高 [7] - 头部博物馆流量集中 故宫和国博位居热门榜单前列 秦始皇帝陵博物院以1161万接待人次居省级博物馆首位 [10] - 特色展览成为重要流量引擎 上海博物馆古埃及文明大展持续13个月 刷新全球单个收费特展纪录 [11] 地方博物馆呈现差异化发展 - 省级博物馆热度攀升 湖北省博物馆2024年参观人次较五年前翻倍 湖南博物院接待491万人次 [12] - 地县级博物馆参观人次稳步增长 2023年较2019年增长765% 承担全国超半数客流 [16][40] - 三星堆博物馆成为行业新贵 2024年吸引600万人次到访 较2019年暴涨823% [17] 行业面临运营压力与收入挑战 - 全国博物馆整体处于亏损状态 2023年亏损达1423亿元 除中央级博物馆外多数入不敷出 [36] - 财政拨款是主要收入来源 2023年占比超八成 县级博物馆资金缺口严重 [37][40] - 文创产品成为重要增收渠道 故宫博物院2017年文创销售收入达15亿元 湖北省博物馆2024年文创销售额破亿 [39] 游客体验问题凸显行业管理短板 - 过量游客导致参观体验下降 拍照党 喧哗 插队等行为引发普遍吐槽 [20] - 未成年人参观占比显著提升 全国博物馆未成年参观人次超三亿 占总量的四分之一 [24] - 博物馆管理存在硬伤 包括指示不清 布展混乱 专业人才匮乏等问题 [32][36]
跳出套路、月入百万,这家公司验证了“AI+声音”的另一种赚钱方式
创业邦· 2025-10-04 03:10
以下文章来源于AI无象限 ,作者关注AI的 AI无象限 . 关注国内外AI技术前沿发展及其在各领域的应用。 在我们往期观察"AI+声音"的应用中,多是 TTS、AI 生成播客和读书/配音等方向,先有文字内容、 后转化为声音输出的偏"工具"类产品。当大多数产品在探索如何用 AI 声音改变内容传播的形式时, 一家德国厂商却在另一个方向持续耕耘,并且维持了不错的流水表现。 Endel 既不做人声,也不做信息媒介的转换,而是靠 AI 实时生成环境音,服务于"人类需要专注"这 一目标。 Endel 近6个月的月流水情况丨图源点点数据 而切换到专注类 App 的语境下, Endel 的表现,也属于头部一样的存在。 在我们之前的观察中,不论是早期流行的 Forest,还是前不久走红的 Focus Friend,点点数据显示 的月流水最高时均未超过 50 万美元。而 Endel 近半年月流水在 70 万美元左右浮动,今年 3 月曾 接近百万美元。(注:Sensor Tower 显示 8 月的全球月流水是 88 万美元,因而,实际上 Endel 这款产品的流水可能更高一些。) 来源丨 白鲸出海 (ID: baijingapp ...
溢价16倍,泡泡玛特开始造下一个LABUBU了
创业邦· 2025-10-04 03:10
以下文章来源于凤凰网科技 ,作者凤凰网科技 凤凰网科技 . 凤凰科技频道官方账号,带你直击真相。 来源丨 凤凰网科技 (ID: ifeng_tech ) 作者丨 王佩薇 编辑丨 董雨晴 今年国庆,泡泡玛特最忙的IP不再是LABUBU,在上海、北京、成都多地,泡泡玛特旗下IP星星人展 出了多个快闪店与主题展,势要拿下这一波国庆假期高峰流量。泡泡玛特位于北京朝阳的乐园内,也 搭建了新的星星人舞台。 一切都在泡泡玛特的计划之中。 就在国庆前的9月29日晚10点,其新品"星星人美味时刻系列"盲盒正式发售,官方平台瞬间售罄,二 手市场同样掀起抢购热潮。 数据显示,隐藏款"小熊饼干"挂件官方价仅59元,二级市场价飙至929元溢价16倍,整盒成交价从 354元上涨至1499元,溢价4.2倍。成交热度TOP3分别为"香草脆"、"抹茶酥"、"咸曲奇",溢价均 超过3.6倍,热度最低的"甜奶油"溢价也达到了3.3倍。得物APP上超3000人点击"想要"。作为对 比,超迷你版LABUBU系列,单个盲盒成交价从59元上涨至249元,溢价也仅有4.2倍。这意味着, 短期内星星人在二手市场的炒作热度,已经超越了LABUBU。 "星星人很 ...
“阿里云端一号”在高高原无人装备测试基地首飞;禾赛科技成为全球首个年产过百万的激光雷达企业丨智能制造日报
创业邦· 2025-10-04 03:10
1.【乌兹别克斯坦布卡光伏项目实现全容量并网发电一次成功】10月3日,据东方电气消息,近日, 乌兹别克斯坦布卡光伏项目实现全容量并网发电一次成功,刷新乌兹同类大型光伏项目建设新纪录。 项目全面投运后,预计年发电量超5亿千瓦时,每年可节约标煤超16万吨,减少二氧化碳排放约44万 吨。(新浪财经) 2.【禾赛科技成为全球首个年产过百万的激光雷达企业】禾赛科技3日宣布,2025年度第100万台激 光雷达已于9月底正式生产下线。禾赛成为全球首个年产量突破百万台的激光雷达企业。( 财联社) 3.【协鑫欧加登盆地LNG投产暨光储充算一体化产业集群开工】据协鑫集团消息,当地时间10月2 日,地处东非大陆欧加登盆地的埃塞俄比亚索马里州Calub营地,协鑫集团埃塞俄比亚20万方撬装液 化天然气(LNG)工厂正式投产。当日,与之毗邻的协鑫LNG液化撬装二期及天然气发电、炼油产业 等大型项目也同步奠基开工。(界面新闻) 扫码可订阅产业日报 欢迎加入 睿兽分析会员 ,解锁 AI、汽车、智能制造 等相关 行业日报、图谱和报告 等。 IX 技术企业 C - C / F + si 创投人物 投融资及收并购事件 热门产业 创新机会 P E ...