Workflow
量子位
icon
搜索文档
即梦新升级了一个扶持计划,要让AI创作者不再“为爱发电”
量子位· 2025-08-10 04:11
核心观点 - AIGC时代下AI创作圈现状为模型强大但出圈创作者稀少 [1][2] - 即梦AI通过升级"创作者成长计划"解决行业顽疾,构建从创作到变现的全链路 [3][16] - 计划已扶持3802位创作者,累计获得2800w+积分,超百位创作者人均商单金额超6万元,多部作品播放量破千万 [4][11] - 升级后计划覆盖全成长路径、多类型创作,并提供国际影节、商单等高价值资源 [5][6][7] 行业现状 - AI创作工具分散、流程割裂导致效率低下 [8] - 内容同质化严重,创作者灵感枯竭 [8] - 多数创作者缺乏资源与破圈机会,商业转化困难 [8] 即梦AI创作者成长计划升级亮点 扶持机制 - **全覆盖**:覆盖潜力新星、进阶创作者、超级创作者全路径,提供基础激励到顶级资源的专属权益 [5] - **多回报**:积分奖励(站内发布/站外同步)、流量扶持、爆款内容现金奖励(2000元/人) [5] - **高价值**:提供国际影节展映、字节系商单等资源,助力行业认可 [6] - **全类型**:纳入平面创作,不限创作形式 [7] 分层权益 - **潜力新星**:爆款灵感奖励88积分/条,短片奖励888积分/条 [12] - **进阶探索**:审核加入奖励1000积分+基础会员1个月,优质短片3000积分/条,精选短片20000积分/条,站外同步奖励最高2000元/人 [13] - **超级创作者**:每月10000积分+会员权益,优先参与国际项目,商单资源倾斜,单项目最高支持50万元 [14] 战略目标 - **平台层面**:通过优质内容吸引用户,构建创作者与平台深度绑定的活跃社区 [18][19] - **行业层面**:通过激励和商业化路径推动行业向专业化、创意化发展,形成商业闭环 [19] - **社会层面**:降低创作门槛,助力多元文化表达及本土AI作品国际化 [19] 历史对标 - 复刻图文/短视频平台成功路径,通过流量和商业扶持构建优质内容生态 [20]
又是王冠:27M小模型超越o3-mini!拒绝马斯克的00后果然不同
量子位· 2025-08-10 04:11
模型性能突破 - 27M参数小模型HRM在推理任务上超越o3-mini-high和DeepSeek-R1等大模型,且不依赖思维链技术[1][4][6] - 仅用1000个训练样本即解决极端数独和30x30迷宫等复杂任务,并在ARC-AGI测试中以40.3%准确率碾压Claude 3.7 8K(21.2%)和o3-mini-high(34.5%)[7][8][27] - 在9x9极端数独任务中实现接近100%准确率,而同类Transformer模型完全失效(0%)[27] 技术架构创新 - 采用仿脑设计的双层循环模块:高层模块负责抽象规划(慢节奏),低层模块处理细节计算(快节奏),通过时间尺度分离实现协同[10][12] - 引入分层收敛机制防止过早收敛,低阶模块根据高阶目标动态调整计算周期[16][18] - 近似梯度技术减少内存消耗,训练效率提升,内存需求恒定[19] - 深度监督机制分阶段评估学习效果,类似单元测试模式[20][21][22] - 自适应计算时间动态分配算力,简单任务快速响应,复杂任务延长计算[23][24] 行业影响与评价 - 模型参数仅2700万,但性能超越1.75亿参数Transformer(30x30迷宫任务中后者准确率<20%)[29] - 被部分观点认为可能颠覆Transformer架构,成为神经网络重大进步[31] - 设计对过拟合有极强抵抗力,专注特定领域时表现优于通用大模型[30] 开发者背景 - 创始人王冠为00后清华校友,曾独立开发GitHub 5.1k星项目OpenChat,多次拒绝马斯克xAI邀请[33][34][35][36] - 2024年创立Sapient Intelligence并获数千万美元融资,目标打造全新推理架构[38]
代季峰陈天桥联手AGI首秀炸场!最强开源深度研究模型,GAIA测试82.4分超OpenAI
量子位· 2025-08-09 09:53
核心观点 - MiroMind ODR是最强开源深度研究模型,性能在GAIA测试中达到82.4分,超越Manus、OpenAI DeepResearch等开源闭源模型[1][2] - 该项目实现全开源可复现,包括核心模型、数据、训练流程、AI Infra、DR Agent框架[4] - 团队计划每月更新一次开源内容,项目为一个季度的研发成果[5] - 项目开放深度研究的四个子项目:MiroFlow(Agent框架)、MiroThinker(模型)、MiroVerse(数据)、MiroTrain(训练基础设施)[20] 模型性能 - GAIA测试得分82.4,显著高于OpenAI DeepResearch(67.4)、Manus(73.3)、Aworld(未明确数值)、WebShaper(60.9)[5] - MiroThinker在GAIA-Text-103上取得SOTA性能60.2%,接近OpenAI DeepResearch[24] - 支持联网搜索,演示显示手机端部署可能性[6][15] 开源内容 - MiroFlow:支持主流工具调用,扩展大语言模型,GAIA复现性能82.4[22] - MiroThinker:原生支持工具辅助推理的大语言模型,GAIA表现最佳[23] - MiroVerse:提供147K开源训练数据,每月更新高质量数据集[26] - MiroTrain:覆盖完整Deep Research训练流程,支持长文本和RL训练[27] 团队背景 - 核心人物代季峰为清华大学电子工程系副教授,计算机视觉领域专家[32][33] - 发表国际期刊会议论文80余篇,总引用超6万次,h-index 68[36][37] - 主导开发InternVL多模态模型,Hugging Face下载量超1000万次[38] - 曾任职微软亚洲研究院、商汤研究院,现加盟盛大网络筹备AI创业公司[41][42][43] 产品特点 - 演示显示支持单轮次英文对话,思考过程与结果分区明确[11][12] - 工作流导览指引可查看指定节点[13] - 公司使命为打造具备自我意识的数字生命体,实现安全有益的AGI[45] 相关资源 - 官网提供Demo体验[7][47] - GitHub、Hugging Face等平台已开源项目内容[47] - 团队早期成果MiroMind-M1基于Qwen-2.5,专注数学推理能力[28][29]
实测谷歌AI故事书,我实现漫画和绘本自由了
量子位· 2025-08-09 09:53
产品功能 - 谷歌Gemini推出StoryBook工具,可在30秒内生成10页故事书,支持中文且完全免费[1][2][4] - 支持用户输入故事描述并添加文件/图片,AI自动生成带朗读旁白的个性化故事书[4][5] - 生成速度稳定,测试显示英文提示词平均耗时30-40秒,中文提示词约1分钟[10][15][25] 技术表现 - 图像风格一致性优秀,能准确捕捉参考图片细节(如毛色、道具颜色)并融入故事[17] - 支持多艺术风格切换,包括黏土动画、日漫等,且保持主题要素完整[9][19][22] - 中文生成效果未打折,甚至超额输出12页内容(原设定10页)[25][28] 应用场景 - 儿童教育:可定制主题帮助克服恐惧、传递分享/团结等价值观[9][14][25] - 学习工具:能将科普知识(如辨认可食用植物)故事化[29][30] - 展示工具:适配严肃主题如濒危物种科普,面向成人受众[32] 用户反馈 - 网友评价创作门槛显著降低,生成内容质量超出预期[23][34] - 教育场景吸引力强,尤其适合外语入门学习(简单用词+AI朗读)[37] - 创作者群体认为适应AI工具比抵制更具实际意义[35] 产品优势 - 全流程无需修改,一次性生成且无显示额度限制[34] - 10页篇幅剧情完整,要素齐全,符合目标受众认知水平[22][28] - 灵活性高,可通过调整提示词实现跨年龄层、跨主题应用[6][32]
4个月,创建20万个应用,这是背后的产品|对话百度秒哒
量子位· 2025-08-09 07:01
产品核心数据与市场定位 - 百度秒哒平台4个月内用户创建20万个无代码应用 [1] - 该数据在国内零代码领域处于TOP级别 [3] - 平台支持多智能体协作开发架构 集成百度地图 搜索 语音等生态能力 [8][19] - 后端支持一键部署数据库 实现长期数据存储功能 [24] 零代码产品定义与用户定位 - 零代码指应用生成 调试 部署 运维全流程脱离编码 [9] - 目标用户为无编程经验的群体 重点释放80亿非程序员人群的创意潜力 [11][13] - 3000万程序员与80亿非程序员创意潜力存在数量级差距 [13] - 典型用户包括文科生 艺术生及各行业从业者 其创意更贴近实际场景需求 [13] 交互设计与技术实现 - 采用LUI自然语言交互与GUI图形界面结合的混合模式 [15] - 初始创建阶段以对话式交互为主 后续迭代支持图形化微调 [15] - 智能体可调用百度生态工具 如地图API 短信服务等云能力 [19][21] - 系统自动匹配UI组件库 生成结果具备随机性差异 [22] 产品迭代与用户反馈 - 3月上线后新增数据库存储功能 解决用户数据持久化需求 [24] - 正在开发智能体行为可视化功能 展示PRD撰写 代码生成等过程 [24] - 通过"指令优化"功能辅助用户结构化表达需求 [28] - 支持多模态输入 允许上传图片草图生成应用 [28] 典型用户案例与生态建设 - 平台涌现"上班摸鱼神器"等创意应用 含蓝屏模拟 病毒警报等功能 [40][41] - 50岁医生成功搭建医院官网并上线百度搜索 [42] - 应用广场支持作品复制与二次开发 形成创意滚雪球效应 [43] - 设立用户社群与共创计划 功能迭代采纳用户投票建议 [52] 未来发展规划 - 分三阶段推进:C端工具→小B端商业支持→企业级系统建设 [46][48] - 2023年完成C端与小B端功能交付 启动企业级开发 [49] - 将提供源码下载功能保留底层调整灵活性 [45] - 实现域名购买 云部署等一站式服务 简化运维流程 [45]
史上最大高质量科学推理后训练数据集开源,快速让Qwen3等变“科学家”
量子位· 2025-08-09 07:01
数据集发布与核心价值 - 上海创智学院与上海交通大学GAIR Lab联合发布MegaScience数据集,包含125万条跨学科问答对,覆盖生物学、化学、计算机科学等7大领域,旨在提升通用AI系统的科学推理能力[1] - 数据集采用大学教材作为核心数据源,通过12万本教材构建65万条问答对(TextbookReasoning子集),确保答案权威性,最终混合形成125万条数据的MegaScience全集[14][15] - 发布一周内下载量突破4.6k次,登上HuggingFace Datasets Trending榜单第四位,显示学术界与工业界的强烈需求[7] 技术创新与解决方案 - 开发四阶段系统性方案:构建15个Benchmark的评估体系、大模型驱动的数据去污染、教科书级数据源采集、聊天模型优化的数据精炼流程[13] - 采用全自动化LLM流水线处理教材数据,包含OCR转换、双重问答抽取(高标准/低标准)、LSH去重、DeepSeek-V3精炼、Llama3.3污染检测等5大步骤[17][19][20][23][24][25] - 创新数据筛选策略:基于回答长度(保留最长回答)、问题难度(Qwen2.5模型评分1-10分过滤简单题)、随机采样三重方法优化数据集质量[30][31][32] 性能表现与模型验证 - 在Qwen2.5-7B模型上,MegaScience微调版相比官方Instruct模型提升2.21%平均性能,在SciBench等计算类任务中优势达5.78个百分点[42] - 模型规模扩展性显著:Qwen3-14B经MegaScience训练后性能超越官方Instruct模型2.82%,30B版本差距扩大至3.24%,显示大模型获益更明显[44][45] - 数学推理呈现能力门槛效应,仅Qwen2.5-7B及以上规模模型能有效吸收数据集中的高难度数学内容(大学本科级概念)[46] 开源生态与评估体系 - 完整开源体系包含:数据集本体(CC-BY-NC-SA 4.0协议)、数据构建代码、评估系统(Language Model Open Science Evaluation框架)、预训练模型[5][37][48] - 评估框架覆盖15个Benchmark,创新两阶段答案抽取技术解决传统\boxed{}格式局限,支持选择题/计算题/判断题/简答题全题型[38][39] - 提供跨模型验证结果:在Llama3.1-8B、Qwen全系列(1.5B-30B)上均观察到性能提升,最高达73.86平均分(Qwen3-30B)[43][44]
Nature:锂可逆转老年痴呆
量子位· 2025-08-09 05:14
核心观点 - 锂在大脑中的内源性稳态对认知功能维持至关重要 锂缺乏会加速阿尔茨海默病病理进程 而特定形式的锂补充剂(如乳清酸锂)可逆转神经病变并恢复记忆功能 [1][4][12] - 乳清酸锂相比碳酸锂具有更低电导率和淀粉样蛋白结合能力 能更有效提升脑内非斑块区域锂浓度并显著改善AD病理和认知功能 [103][104][110] - 锂稳态与认知韧性密切相关 低剂量乳清酸锂可预防年龄相关的神经炎症和突触丢失 且无显著毒性证据 [130][131][133] 锂缺乏与阿尔茨海默病关联性 - 轻度认知障碍(MCI)和AD患者前额叶皮层锂水平显著降低 降幅未具体量化 但皮层-血清锂比率显著下降 [16][18][20] - 锂被Aβ沉积物捕获导致生物利用度降低 Aβ斑块中锂浓度较非斑块区域高3-4倍 [26][29][31] - 锂缺乏加速AD模型小鼠Aβ沉积:3xTg和J20小鼠海马体Aβ沉积显著增加 老龄野生型小鼠皮质Aβ42水平上升 [33][35][37] - 锂缺乏促进神经元磷酸化tau积累:3xTg小鼠海马神经元pSer202-tau和pSer396/Ser404-tau增加3-4倍 [38][43][44] 锂对认知功能的影响 - 缺锂饮食显著损害3xTg小鼠学习能力和长期记忆 Morris水迷宫及新物体识别测试显示记忆缺陷 [47][49][51] - 低剂量乳清酸锂(4.3 μEq/L)几乎完全逆转3xTg小鼠记忆损伤 碳酸锂无效 [119][121][123] - 老年野生型小鼠经乳清酸锂治疗后 年龄相关的树突棘丢失和认知衰退得到逆转 [128][130] 分子机制研究 - 锂缺乏广泛影响脑转录组和蛋白质组:兴奋性神经元中突触相关基因下调 少突胶质细胞中髓鞘基因表达减少 [55][58][62] - 锂缺乏导致小胶质细胞呈现促炎状态:促炎细胞因子(IL-6、TNF等)释放增加 Aβ清除能力降低 [74][81][85] - GSK3β激活是关键病理机制:锂缺乏提高海马神经元总GSK3β水平和pTyr216-GSK3β活性 GSK3β抑制剂可逆转相关病理 [90][94][99] 乳清酸锂的治疗优势 - 乳清酸锂电导率显著低于碳酸锂 对Aβ42纤维原结合亲和力低 [103][104] - 乳清酸锂在非斑块脑实质中提升锂水平的效果优于碳酸锂 斑块锂富集程度降低 [108][109][110] - 乳清酸锂能减少老年3xTg小鼠海马区Aβ斑块负荷约70% 并降低磷酸化tau阳性结构密度 [112][114] 锂与正常脑衰老 - 低剂量乳清酸锂使老年野生型小鼠血清和皮层锂水平轻微升高 浓度与内源性范围重叠 [124] - 乳清酸锂几乎完全阻断年龄相关的小胶质细胞和星形胶质细胞增生 降低IL-6和IL-1β水平 [125][126] - 人类研究中皮层锂浓度与工作记忆评分(P=0.04)和MMSE表现(P=0.02)呈正相关 [132][133]
NotebookLM能生成PPT了,还带演讲配音
量子位· 2025-08-09 05:14
产品功能 - 谷歌NotebookLM推出新功能,可自动生成带AI音频的PPT,用户只需输入数据、图表和旁白,无需亲自讲解[1] - AI可帮助撰写旁白,适用于总结汇报、学习新知识和了解新领域[2] - 视频概览功能提供旁白幻灯片,AI主持人创建视觉内容并提取文档中的图片、图表、引言和数字[4] - 功能特别适用于解释数据、演示流程和使抽象概念具体化[5] - 用户可指定关注主题、学习目标和目标受众,提出一般性或具体问题引导AI生成内容[6] 用户体验 - 网友评价该功能若如宣传般好用,将成为超牛的学习工具[8] - NotebookLM本身是高效的笔记工具,提供"精选笔记本"分区和音频概要、思维导图等功能[9][10][11] - 支持插入视频或直接输入YouTube视频链接,辅助长视频整理[13] - 部分用户反馈功能速度较慢,但认为这是一个惊人的开始[19][21] 市场反应 - 多数用户对新功能表示期待,询问推出时间[14] - 官方回应概览功能将在下周左右向所有用户推出[15] - 已试用用户认为这是一种绝佳的信息总结方法,使学习更引人入胜[16] 产品定位 - NotebookLM被用户称为"外置大脑",结合音频概览和可视辅助工具帮助理解复杂概念[3] - 产品定位为高效学习工具,通过互动提问、答案与引文探索主题[11]
本科必学Dijkstra算法被超越!清华段然团队打破图灵奖得主证明的普遍最优性
量子位· 2025-08-09 05:14
白交 发自 凹非寺 量子位 | 公众号 QbitAI 本科经典算法Dijkstra,被清华团队超越了! 这个被用来解决最短路径问题的经典算法,去年 才被图灵奖得主Tarjan团队证明具有普遍最优性 。 但现在,来自清华的段然团队将这一格局彻底打破—— 运行速度比任何Dijkstra及其改进算法都快,关键是它彻底解决了困扰研究人员四十多年来的"排序障碍"。因为它压根就不进行排序 。 该算法改进了图灵奖得主Tarjan提出的O(m + nlogn)算法,后者在1984年将Dijkstra原始算法探索到了速度极限。 而更快的最短路径算法,不管是在理论上和实际应用中都有很大意义,参考Dijkstra算法就知道了。Dijkstra算法在广泛地应用于我们的日常 生活中,例如地图APP,Dijkstra算法就被用来计算从用户当前位置到目的地的最优路线。而在计算机网络中也被广泛应用于路由协议中。 这一进展被曝光,一时间引发了不少关注。 也有人不吝赞美:这是一个重要的里程碑。 GPT-5已经准备好编码了。 但也有人认为,对大模型来说可能是个挫折,尤其在GPT-5发布之际,因为我们总是期待AI能发现这些突破性进展。 找到最佳路线 ...
“还我GPT-4o”!奥特曼强推GPT-5惹怒网友,紧急公关来了
量子位· 2025-08-09 05:14
GPT-5上线遇冷及用户反馈 - GPT-5上线后市场反应冷淡,用户普遍怀念GPT-4o的情感化交互体验[1][4] - 主要批评包括对话生硬、长文本理解偏差、写作创意不足,缺乏GPT-4o的情感链接特性[4][13][17] - OpenAI强制替换所有旧模型引发用户不满,最终妥协允许付费用户切换回GPT-4o[4][8][27] GPT-5与GPT-4o的对比 - GPT-5技术指标提升(编程能力增强、幻觉减少、榜单排名领先),但缺乏颠覆性创新[13] - GPT-4o因"谄媚"风格受争议,但其情感陪伴价值被用户高度认可,尤其对孤独感缓解作用显著[15][19] - 风格差异:GPT-5偏向专业论文式输出,GPT-4o更擅长个性化创作(小说/散文)和表情符号互动[17][18] OpenAI的决策调整与战略考量 - 公司低估用户对旧模型的依赖,模型切换策略过于激进导致反弹[22][28] - 承认需强化模型定制化,未来可能支持不同属性AI(情感型/工具型)以满足多元需求[29] - 长期仍优先GPT-5迭代与算力投资,旧模型保留仅为过渡方案[34][36][37] 行业竞争动态 - 马斯克借用户不满推广竞品Grok,可能加速OpenAI的响应速度[40][41] - 公司面临平衡技术升级与用户习惯的挑战,需优化产品生命周期管理策略[26][38] 用户行为与产品使用洞察 - 过去一年多数用户默认使用GPT-4o,未主动尝试新版模型[6] - 创造性工作者和情感需求用户构成旧模型核心受众[16] - 产品突然变更影响实际应用场景(如论文写作中断),暴露用户体验设计缺陷[19][21]