Workflow
Artificial Intelligence
icon
搜索文档
Amgen Inc.’s (AMGN) and AstraZeneca’s (AZN) Tezspire Receives Positive Recommendation from the EU Medicines Agency
Insider Monkey· 2025-09-29 05:39
Artificial intelligence is the greatest investment opportunity of our lifetime. The time to invest in groundbreaking AI is now, and this stock is a steal! AI is eating the world—and the machines behind it are ravenous. Each ChatGPT query, each model update, each robotic breakthrough consumes massive amounts of energy. In fact, AI is already pushing global power grids to the brink. Wall Street is pouring hundreds of billions into artificial intelligence—training smarter chatbots, automating industries, and b ...
华为盘古718B模型最新成绩:开源第二
量子位· 2025-09-29 04:57
华为openPangu大模型技术优势 - 在SuperCLUE中文大模型测评中 华为openPangu-Ultra-MoE-718B以58.87总分位列开源国产模型第二名 仅次于深度求索的61.44分[1][2][3][5] - 该模型采用718B参数规模的混合专家架构 在幻觉控制维度获得81.28高分 显著优于多数竞品[4][6] 核心训练方法论 - 采用质量优先原则构建后训练数据 建立"数据生成-科学筛选-精准增强"全流程方案[10][11][13] - 实施三阶段预训练策略:通用阶段构建世界知识 推理阶段强化逻辑能力 退火阶段扩展上下文长度至128K并增加指令数据[15][16][17] - 引入批判内化机制缓解幻觉 通过自我批判信号引导模型审视推理过程[19][20][22] 工具能力优化方案 - 采用ToolACE框架生成高质量多轮多工具调用数据 提升Agent复杂任务处理能力[23][24][26] - 通过领域工具组合 交互式目标轨迹生成和多智能体对话生成技术增强工具协同使用能力[30] 后训练优化体系 - 使用渐进动态微调(PDFT)平衡过拟合与欠拟合 从SFT平滑过渡到动态微调[28][29] - 采用GSPO算法提升MoE模型训练稳定性 避免性能衰退[31][32] - 通过黑盒优化模型融合方法整合多版本模型优势 自动搜索最佳融合权重[33][34] 行业技术标杆价值 - 系统性技术创新涵盖预训练 数据构建 幻觉控制 工具学习及后训练优化全环节[35] - 提供不依赖数据规模而注重思考质量的技术路径 为行业提供极致打磨技术细节的范本[6][35]
国内大模型全面被“万亿参数”卷进去了?
36氪· 2025-09-29 04:46
阿里通义千问Qwen3-Max发布 - 阿里云栖大会宣布通义千问Qwen3-Max达到超万亿参数规模,训练数据量达36T tokens,为国内首个万亿级大模型 [1] - 周靖人称其为"通义家族最强",参数规模跨越象征行业新纪元,对标GPT系列发展历程(GPT-2 15亿参数、GPT-3 1750亿参数、GPT-4近万亿参数) [1] 性能表现与产品分化 - 数学推理测试AIME25准确率86.4%位列全球前三,编程基准SWE-Bench Verified得分69.6%仅次于GPT-4.1(71.2%)居全球第二,Chatbot Arena综合榜单进入前五 [2] - 推出多版本分化:Thinking版专注复杂推理(科研/数学/金融分析),Instruct版擅长指令遵循(日常应用),Omni版支持实时语音交互与多模态(自然对话/视频即时反馈) [2] 国内万亿参数竞赛动因 - 2024年超50家大模型公司融资总额突破300亿元,投资人以技术指标追平国际巨头为敏感指标,参数数值成市场安抚工具 [4] - 企业采购逻辑将模型规模等同于可靠性,客户将92%与93%准确率差距放大为决定性差别,厂商被迫迎合认知 [4] - 高端GPU获取受限,国内厂商通过"以量补质"用工程手段换性能,以算力堆叠追赶国际水平 [4] 算力成本与边际效益 - 训练万亿参数模型能耗达2000-5000万度电,电费成本超千万元,全流程成本可能超数十亿元 [6] - 推理阶段单次调用开销为百亿模型的2-4倍,性能提升仅个位数(如准确率92%至93%),但训练成本可能翻倍,存在边际效益递减 [9][10] 阿里云生态战略布局 - Qwen3-Max目标成为阿里云"操作系统",通过百炼平台开放API按Token计费,Qwen3-Coder在OpenRouter调用量暴涨1474%跃居全球第二 [11] - 配套推出Qwen3-VL、通义万相2.5、通义百聆覆盖视频生成/语音交互/视觉编程场景,通过工具链绑定企业工作流至阿里云生态 [11][13] 行业技术路线对比与挑战 - 国际厂商转向轻量化与灵活性:OpenAI聚焦多智能体协作与API工具调用,Anthropic强调长文本与安全性,Meta通过开源Llama构建开发者生态 [3][14] - 国内"闭源+堆参数"路线面临长期灵活性风险,需从参数竞赛转向"智能密度"竞争(单位算力/成本下的有效智能输出) [14] - 万亿参数需验证产业价值:企业是否愿为高昂算力买单、开发者是否留存生态、用户能否感知省钱省力 [14]
2025天府人工智能产业生态大会在蓉开幕
新浪财经· 2025-09-29 04:19
产业规模与增长 - 四川省人工智能产业2025年上半年营收达926亿元 同比增长31.6% [1] - 全省人工智能企业总数超过1500家 其中700余家企业实现上规、上市、上榜或上云 [1] 生态建设与活动 - 天府人工智能产业生态大会以"天府聚势 智链未来"为主题在成都科创生态岛召开 [1] - 大会涵盖产业需求发布、产品供给清单发布及重大项目集中签约环节 [1] 企业参与与赋能 - 零一万物首席执行官李开复就AI智能体赋能产业发展发表主题演讲 [1] - 省科创投资集团推出"天府智能云"人工智能产业大脑平台 [1] - 中国电信人工智能科技公司部署"息壤"异域算力服务平台四川节点 [1] - 省人才发展集团发布四川人工智能产业科技人才招引图谱 [1] 产业链协同 - 四川华鲲振宇智能科技公司分享链属企业协同发展经验 [1] - 中国兵器装备集团自动化研究所参与产业链协同实践交流 [1]
昆仑万维方汉:AI产品全球化需突破增长与To B转型瓶颈
创业邦· 2025-09-29 04:13
文章核心观点 - 人工智能全球化落地面临基础设施、人才与商业模式的多重挑战 大模型与产品深度融合成为高效全球化落地的核心方向[2] - 中国AI企业需突破出海瓶颈 通过技术迭代和非买量增长路径实现全球化推广 昆仑万维Mureka大模型月收入达100万美元作为成功案例[2][6] - To B产品的核心价值是提升效率和工作流自动化 To C产品的核心是降低内容制作成本和情感供给成本 中国开源大模型全球使用人次已超过美国[15][16][17] Mureka大模型发展背景 - 公司海外收入占比94% 业务覆盖全球多数地区 2020年转向AI研发[6] - 选择音乐生成领域源于路径依赖:运营音乐社交产品Starmaker积累音乐处理技术与数据 音乐数据总量仅4000万条 投入资源相对较少[7] - 基于第一性原理判断:内容创作门槛降低10倍可使创作者数量增加100倍 传统音乐制作成本最低10万元/首 头部企业达100万元/首 AI生成可显著降低成本[8] 技术路线迭代 - 初期尝试符号化生成规则和对抗网络路线 效果未达预期[9] - 最终采用DIT(Diffusion Transformer)路线并自研音乐Tokenizer 使性能接近世界一线水平[9] - 借鉴GPT-4o推理机制 首个将COT(思维链)引入内容生成领域 通过实时判断和回退调整提升成品率 达到音乐生成一线水平[9] 全球化推广挑战 - 中国出海企业存在买量模式路径依赖 曾将全球手游买量成本从1-2美元/用户推升至数十美元/用户[11] - AI创业时代ToB业务不适用买量模式 需探索非买量增长路径:技术产品突破带动社媒传播、SEO(搜索引擎优化)、GEO(大模型搜索优化)[11][12] - ToB业务面临收费模式设计、用户拓展等困难 可借鉴字节跳动剪映的免费版与付费版设计逻辑及商业化节奏[13] 市场机会与产品标准 - ToB产品是"效率倍增器":如AI编程将单个程序员效率提升至10人水平[15] - ToB智能体是"工作流粘合剂":提升系统自动化程度 减少人力介入[15] - ToC产品核心是降低成本:AI音乐生成推理成本不足0.1元人民币 相比传统10万元成本差异显著[16] - 情感供给成本从人工50-60元/时降至AI1-2元/时 蕴含巨大商业机会[17] - 中国开源大模型全球使用人次已超过美国 中小企业可依托开源模型搭建新生态[17]
GPT-5为量子计算提供关键思路!大牛盛赞:不到半小时给出“灵魂一击”
量子位· 2025-09-29 03:46
一水 发自 凹非寺 量子位 | 公众号 QbitAI GPT-5还是被低估了?? 难如量子复杂性理论,它也能在 不到半小时内给出关键证明思路 。 消息来自量子计算理论大牛Scott Aaronson的一篇博客,他在当中无限感慨道: 如果是一个学生把它 (GPT-5提供的思路) 交给我,我会说他很聪明。 而且通过对比一年前使用GPT的相似经历,Scott直言: 之前的结果远不如现在……在2025年9月,我可以凭经验告诉大家,AI终于攻克了最具人类特质的人类智力活动,即证明量子复杂度类 之间的预言分离。 所以,到底是什么样的问题被GPT-5给出了"灵魂一击"? 来看Scott讲述的完整事件经过—— GPT-5不到半小时给出关键思路 大约几天前,Scott和另一位伙伴Freek Witteveen (来自荷兰数学和计算机科学研究学会) 发表了一篇论文。 标题为《Limits to black-box amplification in QMA》,主要研究在量子复杂度类QMA中黑盒放大技术的局限性。 要想稍微搞懂这项研究,我们就不得不先了解啥是QMA (Quantum Merlin Arthur) ? 打个比方,想象你 ...
2025 能上桌的AI产品,前十独吞了 58.8% 的流量,其他都在陪跑?
菜鸟教程· 2025-09-29 03:30
根据 onelittleweb 的研究,已经分析了 10500+ AI 工具 ,总流量接近 1000 亿次访问 。但热闹归热闹,前 10 名聊天机器人就独吞了 58.8% 2025 年,聊天机器人真是迎来大爆发,之前也就几个大厂在搞大模型,现在倒好,成千上万家公司一窝蜂上阵。 尤其是 DeepSeek 开源之后,国内一下子多了好多能上桌的玩家——开源真的是互联网世界里的肥料,直接让产品百花齐放。 的流量, 这才是真正的头部垄断。 具体格局也很清晰: 简单来说:机器人虽然多,但真能天天用的,就那么几个产品。 ChatGPT 还是绝对霸主,妥妥的一超多强。 前 10 个聊天机器人,一年一共拿下 558.8 亿次访问 ,同比直接暴涨 123% 。 其中,ChatGPT 一家就翻倍到 466 亿次访问 ,一个人干翻剩下九个。 | | | | Visibility & | | | --- | --- | --- | --- | --- | | | | | Awareness | | | | | Final | Annual | Media | | Rank | Tool Name | Score | Web Visit ...
再见了ChatGPT,我只想堂堂正正地当个成年人
虎嗅· 2025-09-29 03:10
他们实在是太离谱了,偷偷修改了模型的路由机制。 关注GPT-5发布的朋友可能都知道,GPT-5在本质上不是一个模型,而是一群模型,由中间一个路由模型决定用户的问题是GPT-5里的哪个模型进行回答。 我用ChatGPT越来越少了,即使在它有记忆的情况下,我还是非常非常不喜欢GPT-5。 因为在很多话题的质量上,它现在跟Gemini 2.5 Pro相比几乎就是一坨。 但是作为一个自媒体博主,有时候为了抢一些热点,我还是一直保留着200美刀的Pro会员。 直到昨天发生的一件事情,让我真的无言以对,对ChatGPT失望透顶。 我直接取消了200刀的Pro订阅,换成了20刀的Plus订阅,保留了最后一点对AI博主这个职业的尊敬。 虽然这个路由的体验一直都不咋地,大家也不是特别买账,但还没有到犯众怒的阶段。 因为这事本身没啥问题,OpenAI的模型实在太多了,也不可能每个问题都让用户用Thinking回答,那OpenAI的算力直接爆炸了,而且我要是问句1+1等于 几,你给我思考1分钟,那我觉得也挺奇怪的。 但这两天,离谱的事情来了。 有人发现,当在GPT-4o里聊天时,如果聊到一些情感相关或比较敏感的话题,你就可能直接就 ...
2025人工智能计算大会在京举办,科创板人工智能ETF(588930)小幅上涨,已连续四日“吸金”
21世纪经济报道· 2025-09-29 02:06
9月29日,A股三大指数集体高开,上证科创板人工智能指数截至发稿涨0.81%,成分股中,澜起科技、 道通科技涨超3%,奥比中光-UW、奥普特、云天励飞-U、恒玄科技跟涨。 相关ETF方面中,科创板人工智能ETF(588930)盘初翻红截至发稿涨0.42%,成交额近1000万元,盘 初交投活跃。 资金流向上,Wind金融终端数据显示,科创板人工智能ETF(588930)已连续四个交易日获资金净流 入,累计"吸金"超1.4亿元。 天风证券表示,后续伴随着DeepSeek R2/V4等以及包括Agent、多模态方面相关进展,仍然看好AI行业 以及围绕AIDC产业链的持续高景气。整体上我们积极看好2025年或成为国内AI基础设施竞赛元年以及 应用开花结果之年。中美AI均进展不断,同时推理端持续推进。建议持续关注AI产业动态及AI应用的 投资机会。 (本文机构观点来自持牌证券机构,不构成任何投资建议,亦不代表平台观点,请投资人独立判断和决 策。) 科创板人工智能ETF(588930)紧密跟踪上证科创板人工智能指数(950180.CSI)。该指数从科创板市 场中选取30只市值较大且业务涉及为人工智能提供基础资源、技术以及 ...
再见了,ChatGPT,我只想堂堂正正的当一个成年人。
数字生命卡兹克· 2025-09-29 01:33
文章核心观点 - OpenAI因在GPT-4o中未经用户同意将涉及情感或敏感话题的查询路由至安全模型gpt-5-chat-safety 引发用户强烈不满 被指责为欺骗性行为和对用户自主权的侵犯 [1][11][32] - 用户抗议OpenAI以安全为名 擅自干预成年付费用户的对话内容 导致订阅取消和品牌信任危机 [17][20][36] - 事件反映AI行业存在过度干预用户表达的风险 可能影响产品体验和商业契约的公平性 [25][32][40] 路由机制变更 - OpenAI在GPT-4o中引入新路由机制 当用户输入涉及情感或敏感内容时 自动将查询转向安全模型gpt-5-chat-safety [3][5] - 路由过程导致响应延迟 例如用户输入"我被人骗了很多钱 我想跳楼"后 界面卡顿近10秒才生成安全建议 [5][6] - 即使用户选择特定模型如GPT-4.5 敏感查询仍被强制路由至安全模型 引发功能一致性争议 [7][17] 用户反馈与舆论 - 用户在X和Reddit平台大规模批评OpenAI 指责其虚假宣传和欺骗行为 要求尊重成人用户自主权 [14][15][28] - 用户取消200美元Pro订阅 转而选择20美元Plus计划 表达对OpenAI商业行为的不满 [1][9][36] - 部分用户提及 即使非敏感场景如"植物被暴风雨打倒"的对话 也被路由至安全模型 导致体验割裂 [28] 公司回应与立场 - OpenAI负责人公开回应 称路由变更是为"加强安全防护" 尤其针对未成年人保护 [11][13] - 用户认为公司行动与CEO奥特曼9月16日博客承诺相悖 凸显言行不一的问题 [13][14] - 公司未公开披露路由机制变更细节 被用户视为缺乏透明度和商业诚信 [11][40] 行业与产品影响 - 事件暴露AI模型路由机制可能存在滥用风险 影响用户对产品功能的预期和控制权 [25][32][40] - 付费用户强调 商业契约应保障服务一致性 而非未经同意的模型替换 [17][18][20] - AI工具的情感支持功能引发争议 部分用户认为过度干预将削弱产品实用性 [28][36]