Workflow
量子位
icon
搜索文档
“iFold”,苹果AI新成果
量子位· 2025-09-25 11:42
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 苹果这波跨界看来玩的是 化繁为简 。 起猛了,苹果怎么搞起跨界AI模型了?? 发布了一个基于 流匹配 的蛋白质折叠模型 SimpleFold ,被网友戏称为"iFold"。 SimpleFold没有花里胡哨的专属模块设计,就靠通用的Transformer模块,搭配流匹配生成范式,3B参数版本追平了该领域顶流模型谷歌 AlphaFold2的性能。 MacBook Pro跑起来不费力 首先来说说蛋白质折叠是怎么一回事。 核心是将"一串"氨基酸折成特定的3D形状,这样蛋白质才能发挥作用。 而蛋白质折叠模型就是从氨基酸的一级序列预测它的三维空间构象。 之前最厉害的模型,比如谷歌的AlphaFold2,虽然实现了突破,但用了很多复杂的专属设计。 比如要分析大量相似蛋白质的序列,依赖多序列对比(MSA)构建进化信息、靠三角注意力优化空间约束、推理时需调用超算级算力,普通 实验室不太能用得起。 但这款"iFold"用通用AI框架解决了这个问题。 SimpleFold在架构上采用多层Transformer编码器作为核心骨干,仅通过自适应层归一化适配蛋白质序列特征,相当于用 ...
中国团队重新定义“星际之门”!全球首个太空计算星座已实现常态化商用
量子位· 2025-09-25 11:42
核心观点 - 交通行业算法首次实现在轨卫星全流程运行 标志着太空AI算力进入常态化商业运营阶段 代表全球首个太空计算星座正式投入商业使用[4][6][15] 技术实现 - 道路识别模型完全部署于轨道卫星 实现图像采集、模型推理到结果回传全流程在轨完成[1][10][11] - 图像数据未传回地面 仅回传结构化识别结果 大幅降低数据传输需求[2][10] - 系统支持亿级参数模型稳定运行 具备完整任务调度和通信回传能力[13] 基础设施 - 国星宇航"星算"计划首批卫星于2025年5月发射 提供太空算力支持[5][12] - 计划建设2800颗计算卫星组成的天基算力基础设施 系统总算力超10万P[12] - 通过星间激光通信与协同调度技术实现卫星在轨联网[12] 商业应用 - 佳都科技旗下团队成为全球太空计算星座首个商业用户[9][15] - 系统实现服务调度与链路闭环 打通商业场景应用路径[15] - 太空计算节点从技术可行阶段进入实际可用阶段[16] 行业意义 - 将响应时间压缩至最短路径 实现数据获取与处理同步进行[21] - 太空不再仅是数据来源地 而是成为算法的运行场和智能反馈系统[19][23] - 为AI模型提供新的运行维度和数据来源 重塑数据采集到决策反馈路径[22] - 中国企业在轨道AI网络系统建设方面提供新的全球范式[23]
京东AI一揽子开源!超多核心项目全开源,GitHub万star项目也有新进展了
量子位· 2025-09-25 11:42
核心观点 - 京东云开源企业级智能体平台JoyAgent 3.0及多智能体框架OxyGent 构成Agent"双子星" 在GAIA等权威评测中跻身全球第一梯队 [1][46][50] - 公司系统性开源包括医疗大模型、推理框架、安全模块等全栈AI能力 覆盖从底层基础设施到上层应用 旨在解决产业落地痛点 [5][51][52] - 通过彻底开源策略 将内部复杂场景验证的技术转化为行业基础设施 降低开发者门槛并推动生态协同 [72][73][75] 智能体平台JoyAgent - JoyAgent 3.0为行业首个100%开源企业级智能体 完整开放前后端、框架及核心子智能体 支持本地部署开箱即用 [7][10] - 新增开源DataAgent和DCP数据治理模块 集成DGP协议及智能问数、诊断分析能力 支持自然语言查询数据库及复杂问题分析 [11][13][18] - 在GAIA评测中验证集准确率77% 测试集准确率超67% 较前期稳步提升 位列全球第一梯队 [1][42] - 支持MCP、A2A等主流协议 允许第三方智能体无缝集成 并提供NL2Workflow等开箱即用工具集 [37][39][40] 多智能体框架OxyGent - 框架采用纯Python开发 将工具、模型、智能体抽象为Oxy原子组件 支持积木式组装且无需复杂配置 [46][47] - 在GAIA评测中获得59.14分 紧追开源标杆OWL(60.8分) 其中Level 1得分达77.42% [49][50] - 提供推理可视化能力 支持生命周期统一管理及未来AI应用扩展 [47][48] 医疗大模型京医千询2.0 - 为行业首个突破可信推理与全模态能力的开源医疗大模型 支持文本、影像、检验报告等多模态数据深度融合解析 [53][55][58] - 通过模拟临床诊疗路径 引入循证医学证据确保推理符合医学共识 并建立人类偏好学习闭环提升准确性 [54][57] - 在涵盖医学影像分割、报告生成等21项评测中综合表现领先 已应用于医院、健康管理机构等多类场景 [60][63] 底层基础设施与安全 - 开源专为国产芯片优化的xLLM推理框架 采用服务-引擎分离架构 实现京东零售业务5倍效率提升及90%成本优化 [64][66] - JoySafety安全模块提供全链路防护 支持流式输出检测与毫秒级风险拦截 内部验证恶意攻击降低95%以上 [68][69] - 同步开源向量数据库Vearch、跨端框架Taro等 形成完整技术栈 [71] 开发者生态与行业影响 - JoyAgent在GitHub获10.1k星标 OxyGent获977星标 显示开源社区高度关注 [3][4][47] - 通过开放内部超3万智能体实践验证的技术 使开发者可零成本基于成熟代码创新 降低企业试错门槛 [44][73][76] - 推动DGP数据治理协议等技术标准形成 促进生态协同与产业落地 [15][75][77]
不止剪辑!剪映的未来是一站式AI视频平台
量子位· 2025-09-25 02:21
鹭羽 发自 海宁 量子位 | 公众号 QbitAI 一分钟生成30条爆款视频,百万博主零帧起号。 现在用剪映AI做视频,真的有些不一样。 在剪映刚刚结束的创作者线下交流会上,剪映产品负责人正式宣布: 剪映的野心绝非仅仅只想做一款剪辑工具,而是要能一站式AI成片的创 意伙伴。 All in AI,All in One。 这就是剪映未来将全力All in的方向。 提及剪映,大家的印象或许还停留在这几个关键词:比Pr好上手、小白"一摸就会"、适合加字幕…… 但这次上手试过剪映的AI成片功能后,我才后知后觉发现,剪映真的有在认真了解视频创作痛点,让AI将创作者从dirty work中解放。 内置功能贯穿 "前期灵感启发、素材生成→中期精准剪辑、特效合成→后期优化输出" 一整条路径,筑构完整无缝的创作闭环。 剪映在探究AI视频创作边界上,远比我们想象中做得多。 一站式AI创作 今年,剪映对AI文字成片功能由内而外进行了一次 系统性升级 。 过去只支持图文匹配,其实已经能应对绝大多数日常需求,但够用只是剪映的基准线,这次升级则更聚焦 "如何更好用" 。 通过深度整合豆包、DeepSeek模型,不仅让文字转视频的效率倍增, ...
你的最快安卓芯片发布了!全面为Agent铺路
量子位· 2025-09-25 02:21
文章核心观点 - 高通发布全球最快Windows PC处理器和移动SoC处理器 旨在重塑终端芯片以支持智能体AI体验 [1][5] - 公司提出以智能体为核心的六大AI趋势理解 预示个人计算体系将发生颠覆性变革 [2][6] - 新产品采用3nm制程和第三代Oryon架构 在性能、能效和AI处理能力方面实现显著提升 [7][25][27] 产品发布概况 - 同时推出面向PC的骁龙X2 Elite系列和面向手机的第五代骁龙8至尊版移动平台 [5] - PC处理器专为超高端PC打造 目标为轻松驾驭智能体AI体验和复杂数据处理任务 [1][15] - 移动平台支持真正的个性化智能体AI助手 具备终端侧学习和多模态AI能力 [1] 技术架构创新 - 全系产品采用3nm制程工艺和第三代Oryon架构 [7][25] - PC处理器采用12个Prime核+6个Performance核组合 [7] - 移动平台采用2个Prime核心+6个Performance核心架构 [27] 性能提升数据 **PC处理器性能提升** - CPU能效功耗比提升31% 功耗降低43% [10] - 单核CPU峰值性能提升39% 多核提升50% [13] - GPU峰值性能提升2.3倍 NPU峰值性能提升78% [13] - Hexagon NPU提供80 TOPS算力 性能提升37% [15] **移动平台性能提升** - 单核性能提升20% 多核性能提升17% 响应速度提升32% [27] - 游戏性能提升23% 光追性能提升25% [28] - GPU能效提升10% 性能提升38% [29] - NPU总体性能提升37% 每秒处理220 tokens [30] 能效比较优势 **PC处理器能效表现** - 相同功耗下较竞品性能提升75% [16] - 竞品需多消耗222%能量才能达到同等性能 [17] - 单核性能领先44% 竞品需多消耗144%能量 [20] - GPU相同功耗下快52% 竞品需多花92%能量 [22] **移动平台能效表现** - CPU功耗下降35% GPU功耗下降20% [33] - 整体功耗下降16% [33] - 游戏延迟降低50% [34] AI能力突破 - PC处理器NPU提供80 TOPS算力 支持复杂AI任务处理 [15] - 移动平台支持INT2和FP8精度 具备32K 2bit上下文窗口 [30] - 首创终端AI持续学习功能 实现实时感知和多模态理解 [1][31] - ISP支持逐帧AI增强和上下文感知的自动对焦功能 [33] 产品上市计划 - 搭载骁龙X2 Elite系列的笔记本电脑预计2026年第一季度上市 [24] - 搭载第五代骁龙8至尊版的手机平台即将面市 [35] 行业趋势判断 - AI成为新的人机交互界面 从智能手机转向智能体中心 [6] - 需要构建全新计算架构体系支持智能体发展 [6] - 模型混合化发展趋势明显 边缘数据相关性增强 [6] - 6G技术将成为云边端之间的关键连接桥梁 [6]
华为手表耳机都上新了!价格比不了苹果,续航苹果比不了
量子位· 2025-09-25 01:06
看似是一次常规产品发布,实则暗藏"杀招"。 梦瑶 发自 凹非寺 量子位 | 公众号 QbitAI 刚刚,华为一口气扔出三款新品—— HUAWEI WATCH GT 6系列手表 、 HUAWEI FreeClip 2耳夹耳机 、 华为Vision智慧屏 5 Pro 。 从手腕到耳朵再到大件儿,主打一个:全都更能打、更能戴、更懂场景。 可以说,这次华为不像是在发新品,更像是在重新定义一整套穿戴音频体验该是什么样子,把那些客观存在、却总被忽略的"真问题"处理得刚 刚好。 话不多说,直接看这次的新品到底强在哪: GT系列又杀回来了 说是"又杀回来",但其实华为GT系列手表一直都不缺存在感。 华为这次带来的是WATCH GT6系列,包含 GT6 和 GT6 Pro 。外表看起来还是那个熟悉的商务质感风,但里面的功能已经不是原来的配 方。 这一代最大的变化是:把真正有用的地方全做了加强,而且"贴心"这俩字,贯穿始终。 当然,价格也给得相当有诚意,1488元起。 对经常忘带充电器、行李打包靠玄学的朋友来说,戴着出门就是俩字:省心。 这一点在国产智能手表圈里,确实不多见。 续航上大胆提速,定位功能也没落下。 这次华为给WAT ...
LeCun团队开源首个代码世界模型:能生成代码还能自测自修!传统编程模型一夜成古典
量子位· 2025-09-25 01:06
衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 刚刚,Meta FAIR推出了 代码世界模型 ! CWM (Code World Model) ,一个参数量为32B、上下文大小达131k token的密集语言模型,专为代码生成和推理打造的研究模型 这是全球首个将世界模型系统性引入代码生成的语言模型。 与现有代码大模型相比,CWM最与众不同的一点在于,它不仅能生成代码、理解语义。 更关键的是,它 "懂得"代码如何执行 ,能模拟代码运行过程中变量的状态变化与环境反馈,从而推动代码理解、调试乃至规划的整体能力提 升。 也就是说,它具备接近人类程序员的思考能力。 在多个代码与推理任务上,CWM均有出色表现,譬如其在SWE-bench Verified得分65.8%,领先所有开源同规模模型,已接近GPT-4级别。 更重要的是,Meta FAIR这次开源了模型代码、训练细节以及多个阶段的权重检查点,诚意十足。 有人给LeCun留言问: "你不是一直认为语言模型只是AI道路上的一个支线 (LLMs are an off ramp) ,怎么又推出了以语言模型为基础的世界模型?" LeCun轻松回复称: 是的,不过咱现在 ...
AIME'25满分炸场!Qwen一波七连发,全家桶大更新
量子位· 2025-09-24 06:28
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 它来了,它来了! 新一代旗舰模型 Qwen3-Max 带着 满分 成绩,正式地来了—— 国产大模型 首次 在AIME25和HMMT这两个数学评测榜单拿下 100分! 和前不久Qwen3-Max-Preview一致,参数量依旧是 超万亿 的规模。 但这次正式的发布在版本上有了一个划分: 而且Qwen3-Max在性能上也有了一定的提升(情商智商,双商增强)。 刚才我们提到的数学满分,正是思考版所拿下的成绩。 至于指令版,则是在SWE-Bench评测(大模型用coding解决真实世界问题)中斩获69.6分,位列全球第一梯队。 以及在Tau2 Bench测试(考察Agent工具调用能力)中,超过Claude Opus4和DeepSeek V3.1,拿下74.8分的成绩。 指令版(Instruct) 思考版(Thinking) 强,确实是有点强。 但有一说一,如果说Qwen3-Max是一把"火",那么在刚刚的云栖大会上,通义团队还散出了很多的"星"。 视觉:Qwen3-VL重磅开源 从Qwen3-Max散出来的第一个"星",就是视觉理解模型 Qwen3-VL 。 其 ...
Nano Banana首款官方应用,谷歌全新AI画板工具来了
量子位· 2025-09-24 05:40
产品发布与功能特点 - 谷歌发布由Banana支持的AI画板工具Mixboard 实现自然语言即时可视化创意想法 [1][2] - 工具支持自然语言编辑图板 轻松调整或合并图像 适用于创意点子与家居装饰设计 [4][5] - 可生成约15张相关图片响应文本提示 并保持新增图片与原有内容颜色风格一致 [10][12] - 支持批量编辑图片与跨区块组合操作 包括物体替换与风格迁移 无需拖入编辑框 [14][16][17] - 单张图片编辑功能包括重新生成 生成类似图 消除背景 复制与下载操作 [21] 应用场景与用户反馈 - 应用覆盖多场景:服装设计(花卉刺绣牛仔裤上身效果) 活动策划(秋季派对氛围布置) 宠物主题(万圣节宠物服装) [5][6][23] - 用户生成创意案例包括鸽子主题约会界面与儿童插图 体现高真实度与多样化形态 [23][24][26] - 网友建议尝试除Banana外其他模型 显示对工具扩展性关注 [8] 技术优势与行业定位 - 工具引入面板界面设计 解决传统聊天框翻找图片痛点 提升可视化操作效率 [28] - 谷歌定位该工具为视觉AI爆发式增长前关键布局 旨在主导全创意工作流程 [29][30] - 目前产品已开放公测 直接面向用户提供体验渠道 [30]
可灵2.5 Turbo太凶残:30%成本暴降+效果飞跃,生成体操动作可去参赛
量子位· 2025-09-24 05:40
产品升级 - 快手推出可灵2.5 Turbo视频生成模型 实现文本生成视频和图生视频功能升级[14] - 新模型在文本响应、动态效果、风格保持和美学效果维度有显著提升[15] - 高品质模式(1080p)下生成5秒视频仅需25灵感值 较2.1模型同档位成本降低近30%[16] 技术突破 - 模型能处理抽象文案并理解复杂因果关系和时间序列提示词[17][20] - 动态效果升级 可模拟高速运动(如自行车追F1镜头)和大幅动作(如体育项目)[22][23][25] - 人物情感捕捉精细 特写镜头无假人感和恐怖谷效应 生成理想效果仅需1-2次尝试[26][29][31] 性能对比 - 相比年初模型四肢不分的问题 2.5 Turbo在体操动作中展现出力量感、滞空感和物理感知进步[4][6] - 在第三方评测中与Veo3-fast等模型对比 效果获得认可[32][33] - 自发布以来累计迭代超30次 生成超2亿视频和4亿图片[36] 市场表现 - 全球创作者超4500万 每次更新后迅速抢占市场份额[36][37] - 4月底Kling-2.0-Master发布三周内占Poe平台21%视频生成请求 全系列市场份额达30%[38] - 同期导致Runway份额从约60%大幅下降至20%[39] 发展历程 - 4月15日推出2.0版本首次展现多模态编辑能力[41] - 5月29日发布2.1版本强化复杂指令理解[41] - 9月23日推出2.5 Turbo版本实现性价比与效果双提升[41]