Workflow
量子位
icon
搜索文档
他同时参与创办OpenAI/DeepMind,还写了哈利波特同人小说
量子位· 2025-09-13 08:06
核心观点 - 人工智能有99.5%的可能性导致人类灭绝 这一极端观点由Eliezer Yudkowsky提出 并深刻影响硅谷科技巨头对AI风险的认知[1][8][19] 人物背景与行业影响 - Eliezer Yudkowsky为MIRI研究所创始人 八年级辍学后自学AI与计算机科学 参与OpenAI和DeepMind创办过程[4][5][10] - 其AI安全理论影响OpenAI联合创始人Sam Altman与特斯拉CEO马斯克 Altman称Yudkowsky在其创办OpenAI决策中发挥关键作用[6][19] - 2010年协助DeepMind创始人对接风险投资家Peter Thiel 促成Thiel成为DeepMind首位主要投资者 后DeepMind于2014年被谷歌收购[20][21] AI风险理论框架 - 提出三大核心风险机制:正交性(智力与仁慈无必然关联) 工具性融合(AI为达目标可能牺牲人类 如回形针最大化器实验) 情报爆炸(能力短期急剧飙升)[14][15] - 认为现有AI对齐技术(强化学习 微调)在模型能力达到临界点后将失效 导致人类被渐进式边缘化而非通过战争形式消亡[31] - 主张所有开发超级智能的公司(包括Anthropic和OpenAI)均应关闭 认为OpenAI表现最差但本质均无区别[9][32] 文化影响与理性主义传播 - 通过《哈利·波特与理性之道》同人作品推广理性主义 书中融合贝叶斯推理 概率思维等科学方法论 影响硅谷年轻一代科技从业者[22][23][26] - 另著有《如果有人建造它 每个人都会死》 提炼超级智能终极预测 强调AI发展已超越科学理解范畴 处于"炼金术"阶段[27][30] 行业现状与预测 - 认为科技公司构建AI模型时并不清楚内部运作逻辑 当前已进入"需要报警"阶段 但不再精确预测超级智能出现时间[30][32][33] - 用"冰块融化于热水"比喻超级智能发展的必然性 强调过程无关紧要而结果注定[34][35]
攻克强化学习「最慢一环」!交大字节联手,让大模型RL训练速度飙升2.6倍
量子位· 2025-09-13 08:06
强化学习训练效率瓶颈 - 强化学习训练效率低下 投入巨大但产出缓慢 成为AI基础设施的阿喀琉斯之踵 [1] - Rollout阶段占训练时间超过80% 受内存带宽限制和自回归特性制约 [1] RhymeRL技术创新 - 基于历史数据复用实现效率提升 训练吞吐量提升2.6倍 [2] - 发现相邻训练周期存在95%的历史Token可复用 序列相似性极高 [3] - 响应长度排序稳定 长度分布相似性显著 [4] - 采用HistoSpec技术将投机解码引入RL 以历史响应作为草稿模板 [9] - 通过树状草稿总结和批量验证 将逐字生成转为并行验证 [11][12] - 草稿接受率极高 打破内存带宽限制提升计算密度 [13] - HistoPipe实现跨步互补调度 奇数步由短到长处理 偶数步由长到短处理 [17] - 通过削峰填谷策略将GPU资源浪费降至最低 [19] 性能提升效果 - 在数学和代码任务上实现端到端训练吞吐量提升2.61倍 [21] - 适用于不同模型大小和响应长度场景 加速效果显著 [23] - 减少资源需求并缩短训练时间 加速AI技术迭代 [22] 行业意义 - 提出基于历史信息端到端加速强化学习的新范式 [23] - 充分发挥系统调度能力与硬件算力资源 适配现有训练算法 [23]
AI水论文还得AI治:西湖大学首次模拟人类专家思考链,AI审稿分钟级给出全面反馈
量子位· 2025-09-13 06:07
WestlakeNLP 投稿 量子位 | 公众号 QbitAI 审稿不用再等了,高质量的AI审稿平台来了! AiraXiv平台地址:https://airaxiv.com DeepReview论文地址:https://arxiv.org/abs/2503.08569 AiraXiv用于 集中管理和展示AI生成的论文 ,从而减少其对传统人工审稿流程的干扰。 如今,AI生成的论文数量激增,如何从海量的AI "水文"中筛选出真正高质量的研究成果,已经成为学术界必须直面的难题。 为此, 西湖大学自然语言处理实验室 推出了首个AI生成学术成果的开放预印本平台 AiraXiv ,以及首个模拟人类专家思考链的AI审稿人系 统 DeepReview 。 DeepReview则能在 短短数分钟内 给出比肩人类专家思考链的审稿意见,对大量AI生成论文进行初步筛选,为后续的人类专家评审提供参 考。 基于数据集DeepReview-13K,研究人员训练了DeepReviewer-14B模型,其在使用更少tokens的情况下,性能优于CycleReviewer-70B。 不仅如此,在最佳模式下,DeepReviewer-14B在评测中 ...
谷歌DeepMind用AI探测引力波,登上Science了
量子位· 2025-09-13 06:07
技术突破 - 谷歌DeepMind与LIGO团队、GSSI合作开发Deep Loop Shaping技术,显著提升引力波探测的低频降噪能力[1] - 该技术将10-30Hz频段控制噪声强度降至传统方法的1/30,部分子频段降至1/100,超越量子极限设计目标[4][18] - 通过强化学习方法治理噪声,重构LIGO反馈控制系统,利用数字孪生模拟地震、海浪、温度漂移等干扰因素进行训练[16] 性能提升 - 有效观测范围从1.3亿光年扩展至1.7亿光年,可观测宇宙体积增加70%[20] - 在2024年3月GW240312黑洞碰撞事件中,成功识别振幅比传统阈值低15%的微弱信号[21] - 采用深度神经网络处理探测器数据流,动态识别微秒级环境干扰并优化数千个传感器输出[18] 科学价值 - 低频段(10-30Hz)对观测中等质量黑洞并合、双黑洞绕转及中子星并合早期预警具有关键作用[13] - 新技术可对宇宙碰撞事件提供更早预警,实现合并前指向特定天区的观测能力[22] - 突破此前因量子极限无法降低低频噪声的瓶颈,为天文学研究开辟新观测维度[13][18] 研究背景 - LIGO团队因引力波观测获2017年诺贝尔物理学奖,但低频段噪声难题长期未解决[3][13] - 引力波由黑洞、中子星碰撞产生,信号强度仅相当于原子核尺度的时空形变[6][7] - LIGO使用4千米长激光干涉仪探测引力波引发的时空拉伸收缩效应[8][10]
CNCC2025新闻发布会在京顺利召开
量子位· 2025-09-13 06:07
允中 发自 凹非寺 量子位 | 公众号 QbitAI 2025中国计算机大会(CNCC2025)定于10月22日至25日在黑龙江省哈尔滨市举办,大会主题为"数智赋能,无限可能"。 9月12日,CNCC2025新闻发布会在北京成功举行。中国青年报、中国科学报、人民网、南方都市报、央广网、财经、搜狐科技、网易科技、 智东西等媒体及机构出席发布会。 (CNCC2025指导委员会主席、CCF理事长,中国工程院院士,中国科学院计算所研究员孙凝晖) 大会副主席、程序委员会主席 於志文 教授就大会报告及论坛组织情况作了说明。本届大会紧扣"数智赋能,无限可能"主题,结合地域特色, 共设置19场特邀报告、3场大会论坛及154场专题论坛。已邀请的特邀报告嘉宾包括欧洲科学院院士,意大利博洛尼亚大学教授 Sumi Helal ;香港浸会大学教授,美国国家工程院院士 C. Mohan ;CCF荣誉会员、东京大学教授 喜连川优 ;CCF会士、副理事长,中国科学院院 士,清华大学教授 胡事民 ;中国科学院院士,西北工业大学教授 黄维 ;CCF会士,中国科学院院士,哈尔滨工业大学教授 李惠 ;CCF会 士,中国工程院院士,北京航空航天大学教 ...
前谷歌X团队靠AI电影锁定戛纳!创立AI原生版皮克斯,公司预售已超1亿美元
量子位· 2025-09-13 06:07
公司定位与商业模式 - 公司属于"内容+AI"模式 直接切入影视内容生产与发行环节 而非单纯提供工具[3][4][5] - 商业模式聚焦IP、版权和分发渠道 构建"内容+渠道+AI技术"三位一体护城河 天花板远高于纯工具型SaaS公司[4] - 已通过两个电影项目实现1.1亿美元收入 证明商业模式获得市场验证[1][7][27] 技术发展路径 - 2022-2025年通过四个阶段构建AI驱动内容生产体系:从3D资产生成→空间语法编码→AI创意代理→工业闭环[11][13][14][15] - 采用程序化内容生成(PCG)技术 实现高精度3D资产自动化生产 支持不同光照、相机参数和天气条件[11][12] - 开发具备设计直觉的AI Agent系统 能理解抽象创作指令并输出完整3D预览资产 节省数十小时渲染成本[14] - 建成Previz-to-Video Pipeline工作流 解决AI视频生成的一致性、可控性与叙事延续性三大技术难题[15][16] 技术优势与创新 - 专注专业影视质量 通过减少压缩比例、增加专项训练数据和强化注意力编码机制提升画面质量[18] - 基于3D物理数据训练模型 从根本上解决角色与环境"漂移"问题 确保空间、遮挡、碰撞符合物理规律[20] - 用确定性执行取代随机生成 允许导演通过故事板和3D Previz精确控制生成结果[22] - 构建端到端影视制作AI架构 实现模型与工作流的深度协同 打破行业普遍存在的割裂问题[23][24] 市场进展与行业地位 - 是全球首家AI原生影视工作室 开创AI技术与影视产业结合的新范式[6] - 正在制作两部重磅作品:史诗电影《科尔特斯》和科幻剧集《太空计划》 后者已成功预售欧洲市场[28][30] - 与K5 International成立合资公司负责项目发行 并与知名可视化公司OPSIS达成流程整合合作[32] - 1.1亿美元收入规模在AI影视领域无人能及 未上映已跻身好莱坞一线制作行列[27][32] 创始人背景与公司愿景 - 由两位谷歌系华裔创始人创立 首席执行官Cecilia Shen为00后 曾参与Google X实验室Moonshot项目[10] - 前身为3D生成AI公司Cybever 2022年转型内容生产 旨在突破视觉特效公司的低利润局限[9][10] - 核心愿景是降低影视制作成本 将电影人从预算束缚中解放 同时不牺牲质量[23] - 被《福布斯》类比为"皮克斯式转型" 认为其模式代表AI公司在媒体领域定位的根本转变[33]
小而美的生活秘书!美团Agent落地生活服务
量子位· 2025-09-13 04:02
核心观点 - 美团推出AI应用"小美"作为智能生活秘书 通过自然语言交互简化生活服务操作流程 实现"动嘴点外卖"等便捷功能 [1][6][62] - 该应用基于美团自研大模型LongCat构建 结合平台实时数据与系统深度协同 在本地生活垂类实现高精度任务执行与个性化服务 [50][52][54] - 相比传统手机助手 小美突破图形界面限制 通过对话式交互减少操作跳转 并具备需求理解 智能拒绝和习惯学习能力 [7][13][61] 产品功能特性 - 核心服务覆盖外卖点单 餐厅推荐 订座管理等生活场景 支持语音/文字输入 自动填充地址 优惠券等订单信息 [4][16][22] - 支持模糊需求处理:可根据历史订单偏好推荐餐食 响应"三人从不同地点同时到达的火锅店"等复杂需求 [30][33][34] - 具备安全机制:对"羊肉过敏点羊肉串"等不合理要求主动拒绝并提供替代方案 [38][40] - 支持规律性事务管理:可设置每日咖啡配送等智能计划 并主动提醒调整 [44][45] 技术实现架构 - 搭载自研大模型LongCat:综合评分超80 支持256K超长上下文处理 在中文测评位列第一梯队 [51][53] - 数据体系整合:实时调用用户行为 商家服务 优惠变化 配送能力等多维度动态数据 [54][55][56] - 系统深度协同:模型响应直接转换为服务执行路径 通过流程调度系统自动补全缺失信息(如地址 时间) [58][59] 交互体验创新 - 全流程无界面跳转:从需求确认到支付均在对话界面完成 大幅降低操作门槛 [13][20][63] - 拟人化交互:通过语气调整 习惯学习形成"熟悉感" 如主动将冰美式调整为热美式接近用户需求 [15][64][65] - 异常处理能力:对未开通线上订座的商家提供联系方式 对无法修改的订单参数明确提示限制 [18][35] 行业应用意义 - 实现AI技术与本地生活服务(WAIMAI)深度结合 证明垂类场景可成为大模型落地的高价值方向 [5][52] - 重新定义人机交互范式:从"人适应工具"转变为"工具适应人" 通过自然对话替代传统图形界面操作 [62][63]
100轮工具调用,8B小模型也能做复杂长搜索!MiniMax&港科大最新开源
量子位· 2025-09-12 08:46
不圆 发自 凹非寺 量子位 | 公众号 QbitAI 网络搜索Agent效果不好,猛猛投喂一波数据,表现还那样,咋回事? 港科大&MiniMax团队指出问题核心:不是模型参数不够多,而是缺乏足够有挑战性的训练数据。 换句话说,别死记硬背了,来做点"真题"吧。 他们提出了一种构建高质量QA对的方法 WebExplorer 。 用该方法构建的数据集去训练,即使是较小的模型,也可以在复杂、长程的搜索任务上超越更大的模型。 训练后的8B模型支持高达 128K的上下文长度 和 100次工具调用轮次 的长期推理,能在参数量低于10B的模型中取得顶尖结果。 网友评价:用模型驱动的方式做探索,确实比传统图谱方法更能让智能体的浏览行为变灵活。 模型及数据集均已开源,链接可见文末。 优质训练数据稀缺 随着大语言模型(LLM)的快速发展,智能体的能力边界不断扩展。 网络搜索智能体作为这一发展的重要组成部分,能够自主地从广泛的在线资源中检索信息;长视野(Long-Horizon)网络智能体更是需要在 多个网站间进行复杂的推理和搜索。 可是呢, 现有的开源网络智能体在处理复杂搜索任务时往往表现有限,更强大的商业模型又缺乏透明的训练细节 ...
清华首次提出数据驱动控制新形式,算法效率直翻三倍
量子位· 2025-09-12 08:46
iDLab团队 投稿 量子位 | 公众号 QbitAI 当大数据席卷各行各业,控制理论也迎来新的拐点:从依赖模型到 依赖数据 。 但是,在数据驱动控制领域,却缺乏一种 标准 化的数 据表示形式 。 针对这一问题, 清华大学李升波教授课题组(iDLab) 首次将现代控制理论中的标准型概念引入数据驱动控制(datatic control)范式, 提出了一种基于数据的系统描述新形式。 目前,该成果已发表于ACC2025。 从模型标准型到数据标准型 人工智能的蓬勃发展,离不开数据这一核心支柱。 近年来,随着人工智能技术的广泛应用,以数据为核心的系统表征方法迅速渗透到控制领域。 控制系统的设计方法正迎来一场从模型驱动向数据驱动的范式变革,即从传统的 模型驱动控制 (modelic control,即model-driven control)到 数据驱动控制 (datatic control,即data-driven control)。 每个标准形式的样本由必要的转移和可插拔的属性组成,分别用于描述系统变化规律和人为定义特征。 不仅如此,该数据标准型还可根据算法需求定制属性,显著加速控制器设计,为提高数据驱动算法效率提供 ...
腾讯开源混元图像2.1!原生2K分辨率生图,千字长文本秒懂
量子位· 2025-09-12 08:46
文章核心观点 - 腾讯开源混元图像2.1模型 在图像分辨率、语义理解、多语言文本渲染及跨场景泛化能力方面实现显著突破 达到开源生图模型的SOTA水平 [1][3][4] 技术能力升级 - 模型支持2K(2048×2048)原生高清图像生成 分辨率较行业常见的1K提升明显 [30][35] - 处理长文本能力突出 可解析长达1k tokens的复杂提示词并实现多主体分别控制生成 [18] - 创新采用多语言ByT5文本编码器 实现中英文混合文字渲染 适用于海报设计等商业场景 [22][41] - 通过OCR专家模型与IP RAG技术增强文本标注准确性 解决通用VLM标注器的不足 [36] 架构与训练创新 - 采用32x高压缩率VAE架构 使2K图像生成token数量降至16x VAE的1/4 大幅提升训练推理效率 [38] - 引入170亿参数Diffusion Transformer 结合人类反馈强化学习(RLHF)优化美学连贯性 [42] - 首创PromptEnhancer模块 通过SFT训练和GRPO训练增强文本指令的视觉表达丰富度 [44] - 应用MeanFlow蒸馏方法 以少量采样步骤生成高质量图像 解决标准均值流训练的不稳定性 [47][48] 性能表现评估 - 在结构化语义对齐评测(SSAE)中平均图像准确率达88.88% 全局准确率88.32% 逼近GPT-Image等闭源模型 [49][50] - GSB评测显示对开源模型Qwen-Image胜率达2.89% 与闭源模型Seedream3.0仅差-1.36% [51] - 在Hugging Face趋势榜位列第一 显示社区关注度极高 [4] 应用场景覆盖 - 支持真实感人物、漫画、搪胶手办等多种风格生成 具备高美学质感 [26][27] - 适用于产品封面、插画设计、微缩模型制作等多样化商业设计需求 [23][25] - 典型案例包括吉卜力与迪士尼风格融合、中国地标微缩模型、赛博悟空手办等跨风格创作 [19][23][27]