Workflow
AGI
icon
搜索文档
DeepMind哈萨比斯:智能体可以在Genie实时生成的世界里运行
量子位· 2025-08-13 07:02
世界模型与Genie 3技术进展 - Genie 3能实时生成可交互的虚拟世界并让智能体在其中运行,标志着世界模型技术取得突破[3][5][35] - 世界模型需理解物理规律、材料特性及生物行为,这是实现AGI的必要条件[33][34] - Genie 3已实现720p分辨率、多分钟交互时长及可导航的提示性世界事件生成能力[32] DeepMind发展动态 - 公司研发节奏持续加速,几乎每天都有新成果发布,包括DeepThink、IMO金牌模型等里程碑[9][15][18] - 智能体系统从早期游戏领域扩展到多模态模型,现正通过整合思考规划能力向AGI迈进[24][25] - 强化学习仍是核心技术路径,2010年至今持续投入并验证其可扩展性[27][28] AI能力评估与Game Arena平台 - 现有模型表现参差不齐:IMO金牌级数学能力与高中基础题错误并存[11][29] - 行业亟需新评测基准,需覆盖物理直觉、多目标优化等更复杂维度[13][45][46] - Game Arena平台通过数千款游戏动态测试AI能力,支持模型间对抗与自动难度调整[47][48][53] 工具整合与系统进化 - 工具使用能力成为AI新扩展维度,需平衡内置功能与外部工具调用[63][64][66] - 模型正向系统级进化,能组合调用数学软件、搜索引擎等工具完成复杂任务[68][69] - 产品设计需预测技术发展节奏,保持架构灵活性以适应快速迭代[72] 技术融合与AGI路径 - Genie、VO、Gemini等模型正朝"全能模型"方向融合,形成统一能力体系[75][76] - AGI需具备自主转化人类意图为动态奖励函数的能力,解决多目标优化难题[23][60] - 物理模拟器可能成为关键工具,帮助AI理解并操作现实世界[33][63]
AI商业化落地逻辑不变,科创AIETF(588790)冲击3连涨,涵盖模型+算力+应用,备受市场关注
新浪财经· 2025-08-13 02:13
市场表现 - 上证科创板人工智能指数(950180)上涨0 43%,成分股晶晨股份(688099)上涨7 62%,优刻得(688158)上涨2 21%,航天宏图(688066)上涨1 94%,奥普特(688686)上涨1 65%,奥比中光(688322)上涨1 50% [3] - 科创AIETF(588790)上涨0 46%,冲击3连涨,最新价报0 66元,近1周累计上涨2 82% [3] - 科创AIETF近6月净值上涨5 60%,居可比基金第一,自成立以来最高单月回报为15 59%,最长连涨涨幅为26 17%,上涨月份平均收益率为9 25%,历史持有6个月盈利概率为100 00% [7] - 科创AIETF近3个月超越基准年化收益为2 48%,排名可比基金前2/6 [7] 流动性及资金动向 - 科创AIETF盘中换手1 31%,成交9252 41万元,近1周日均成交5 22亿元,排名可比基金第一 [3] - 科创AIETF近1周份额增长3 63亿份,新增份额位居可比基金1/7,最新资金净流出8774 59万元,但近5个交易日内有4日资金净流入,合计"吸金"3 48亿元,日均净流入达6967 06万元 [7] - 科创AIETF最新融资买入额达3428 99万元,最新融资余额达8 53亿元,显示杠杆资金持续布局 [7] 行业趋势与投资逻辑 - AI商业化落地逻辑不变,国内AI应用投资已进入第二阶段,GPT5成为规模化落地的关键拐点,模型幻觉下降将增强AI在医疗、教育、金融等高信任度场景的适用性,更低的调用成本有望加速中小开发者和垂类应用爆发 [4] - 国产大模型更新及AI软硬件新产品周期推动应用端持续发力,建议关注覆盖人工智能全产业链的科创AIETF(588790) [4] - 上海证券强烈看好AI应用驱动的算力需求持续高增长,海内外AI应用进入普及拐点,国内外算力产业链共振,海外算力产业链需求旺盛 [5] 基金与指数概况 - 科创AIETF最新规模达70 34亿元,创成立以来新高,位居可比基金1/7 [6] - 科创AIETF管理费率为0 50%,托管费率为0 10%,费率在可比基金中处于较低水平,近1月跟踪误差为0 009%,跟踪精度最高 [10] - 上证科创板人工智能指数前十大权重股包括寒武纪(688256)、金山办公(688111)等,合计占比67 36% [10] 财务与估值 - 指数2025年预测净利润高达128亿元,同比增长96 34%,估值回到正常区间,2025年半年报业绩中前十大权重股净利润保持高增长态势 [4] - 科创AIETF成立以来相对基准回撤0 40%,近1个月夏普比率为1 21 [8][9]
深聊GPT-5发布:过度营销的反噬与AI技术突破的困局
虎嗅· 2025-08-12 09:05
GPT-5技术评估 - GPT-5未实现颠覆性技术突破,Transformer架构的弱点进一步暴露,包括PPT图表错误、代码bug和理论解释问题[1] - 模型开发遭遇技术瓶颈,最终选择改良架构而非革命性方案,Scaling law面临碰壁[1] - 技术路径上人类仍需寻找突破AI发展瓶颈的新方法[1] 商业化战略 - OpenAI采取激进商业化策略,重点布局教育、健康医疗和编程三大应用场景[1] - 公司通过快速场景落地来稳固市场地位,GPT-5被定位为"合格的AI产品"而非颠覆性创新[1] 行业影响 - GPT-5发布引发对AI泡沫破灭的讨论,行业面临技术创新放缓的质疑[1] - 当前AI发展进入平台期,技术突破速度低于市场预期[1]
GPT-5数字母依然翻车,马库斯:泛化问题仍未解决,Scaling无法实现AGI
36氪· 2025-08-12 03:57
GPT-5性能缺陷 - GPT-5在简单字母计数任务中表现异常,例如将"blueberry"中的b错误计数为3个[1][5][7] - 即使通过多种提示策略纠正(如展示字母位置、直接拼写单词),模型仍坚持错误答案并给出不合理解释(如"double b")[5][7][9] - 中文测试同样失效,例如将"blueberry"中的e错误计数为3个[13] 多模态与逻辑推理漏洞 - 在多模态场景中,GPT-5无法识别人工修改的图片(如5条腿的斑马、3条腿的鸭子),仍按常规对象计数[21] - 逻辑推理能力存在缺陷,包括伯努利原理演示错误、国际象棋规则违反(4回合出现非法移动)[15][16] - 阅读理解任务也被发现存在明显错误[19] 学术批评与路线争议 - 学者指出GPT-5存在"分布漂移问题",其泛化能力与1998年神经网络相似,30年未解决[26][30] - 批评认为Scaling Law无法实现AGI,Transformer架构存在根本局限[30] - 神经符号AI(Neuro-symbolic)被提议为解决泛化问题和实现AGI的替代路径[31] 用户反馈与厂商应对 - 用户通过持续交互可使GPT-5给出正确答案,但模型仍坚持最初错误的逻辑(如声称混淆了虚构单词"blueberry")[12] - OpenAI因用户批评紧急恢复GPT-4o模型下线[26]
刚刚,OpenAI内部推理模型斩获IOI 2025金牌,所有AI选手中第一
36氪· 2025-08-12 03:51
OpenAI的内部推理模型,又拿下了IOI 2025金牌,击败325名人类选手,总排名第6,AI组第1。该模型沿用IMO金牌版本,无专门训练,限时5 小时、50次提交且无联网支持。 刚刚,OpenAI内部推理模型在获得IMO金牌后,又拿下了IOI金牌。 和上次IMO一样,OpenAI 使用了草莓形象来代表这个推理模型。 只不过这次的「草莓」不仅带上了IOI的金牌,而且更加的拟人,这个形象很有可能进化为OpenAI内部推理系统代表形象。 OpenAI宣言的这个「内部推理系统」就是上次拿下IMO金牌,惹出争议的同款模型。 IMO之后,OpenAI对IMO金牌模型进行了全面评估,发现除了数学竞赛之外,它在许多其他领域(包括编程)也是目前最好的模型。 因此,OpenAI决定直接使用完全相同的IMO金牌模型,不做任何更改,并将其应用于IOI的系统中。 OpenAI官方也发帖证实了这个消息。 这个内部推理模型的得分足够高,在今年的IOI线上竞赛中,和人类一起排名位列第6,与其他AI排名则是第1。 Sheryl Hsu表示,这次内部模型参加了IOI的在线AI竞赛项目,一共330位参赛选手。 前5位都是人类。 | Rank ...
1亿美元买不走梦想,但只因奥特曼这句话,他离开了OpenAI
36氪· 2025-08-12 03:27
AI行业投资与人才竞争 - 全球AI基础设施资本开支已达3000亿美元[48] - Meta为顶级AI人才提供1亿美元签约费进行挖角[2][8] - Anthropic每年资本开支增长一倍[7] AI技术发展现状与趋势 - Scaling Law依然有效 模型发布节奏从一年加速至每月或每三个月发布新模型[10] - 单位智能成本通过算法改进下降10倍[59] - Claude Code团队用AI完成95%代码 客服领域AI工具自动解决82%客户请求[26] 变革性AI与经济影响 - 经济图灵测试定义为AI通过50%薪资计算岗位的测试时标志变革性AI到来[20] - AI发展可能导致高达20%失业率 尤其影响白领工作[21] - 2024-2026年人形机器人硬件成本将降至两万美元 2027-2028年可能迎来技术奇点[57] AI安全与研究投入 - 全球全职研究AI对齐问题的科学家不足千人[1][48] - Anthropic采用宪法式AI方法 将联合国人权宣言等原则嵌入模型[49] - Anthropic定期发布模型"犯罪记录"以促进行业透明进步[57] 企业战略与文化差异 - Anthropic团队氛围强调"没有大佬光环 大家只想做对的事"[8] - OpenAI曾存在安全 研究和创业三大阵营制衡机制 被质疑安全优先级降低[39][40] - 2020年底OpenAI安全负责人团队集体出走创办Anthropic[35][40] 技术瓶颈与资源限制 - 行业面临算力饥荒 需要10倍电力才能支持GPT-5级别模型[61] - 7nm芯片物理极限逼近 算法进步速度放缓[61] - 高质量训练语料即将耗尽 AI可能陷入自我抄袭循环[61]
廉价版MacBook售价曝光/OpenAI CEO:AGI是个没什么用的术语/雷军征集小米YU7改名意见
搜狐财经· 2025-08-12 03:11
小米汽车 - 公布碰撞检测方法专利,通过终端速度变化信息检测交通工具碰撞状态并触发报警 [1][11] - 小米YU7标准版续航达835公里,搭载700 Tops算力英伟达Thor芯片和激光雷达,1.6万用户投票中1.1万人反对改名Pro/Max版 [12] 智谱AI - 开源106B参数多模态模型GLM-4.5V,在41个视觉榜单中达到同级别开源模型SOTA性能,支持图像/视频/GUI任务等全场景推理 [13][14] - 新增"思考模式"开关,同步开源桌面助手应用支持实时截屏录屏分析 [14] 百川智能 - 开源医疗增强大模型Baichuan-M2,在HealthBench评测以60.1分反超OpenAI的gpt-oss120b(57.6分)登顶开源模型第一 [17][18] - 量化后模型可在RTX4090单卡部署,成本较DeepSeek-R1 H20降低57倍,急诊场景token速度提升74.9% [18] 奇瑞汽车 - 消息称玛莎拉蒂和阿尔法·罗密欧将采用奇瑞E0X电动平台开发新能源车型,路虎Freelander首款SUV已采用该平台 [20][21] 昆仑万维 - 发布SkyReels-A3数字人模型,支持60秒单分镜视频生成,在唇形同步指标上超越OmniAvatar等开源模型 [24][25] 广汽埃安 - 计划投资华为合作公司华望汽车不超过30%股权,首款高端智能车型预计2026年面世 [26][28] 阿里达摩院 - 开源机器人协议RynnRCP及VLA模型RynnVLA-001-7B,支持从传感器数据到机械臂动作的全流程适配 [31][33] 宇树科技 - 人形机器人降价至3.99万元起,CEO王兴兴预测具身智能的"ChatGPT时刻"或需2-5年实现 [34][35] 苹果 - 供应链称廉价版MacBook将搭载A18 Pro处理器而非M系列,配备12.9英寸屏,组件2025年Q3末量产 [3] - 2025年Q3 Mac销售额达80亿美元同比增长15%,M4 MacBook Air为增长关键 [3] 制糖工厂 - 推出68W C³充电器,体积缩小至掌心大小,支持三设备同时充电,即日起至8月31日开展抽奖活动 [4][5] 追觅科技 - 将发布全球首款双机械臂洗地机,引入具身智能理念实现AI双臂协同清洁 [40][41] 荣耀 - 与Jimmy Choo合作推出Magic V Flip 2高定版折叠手机,采用水晶镶嵌工艺背板 [43][44] 华硕 - a豆14 Air香氛版搭载AMD锐龙9 H270 AI处理器,总AI算力39 TOPS,配备2.8K 120Hz OLED屏 [47][48] 他山科技 - 机械手已应用于工业线缆插取等精细作业,预计2025年实现小龙虾预处理自动化,可节省县级市数亿元人力成本 [53][55] 电影行业 - 《F1:狂飙飞车》内地票房破4亿元,密钥延期至9月26日,全球票房达5.707亿美元 [61]
腾讯研究院AI速递 20250812
腾讯研究院· 2025-08-11 16:01
一、xAI开放Grok 4 - Grok 4向全球用户免费开放但限制每12小时使用5次 达到限制后完全不可用 [1] - 该策略被视为对标GPT-5发布 引发付费用户对订阅价值的质疑 [1] - Grok Imagine视频生成服务新增分享功能 修复下载问题并强化图片审核机制 [1] 二、浪潮发布元脑SD200服务器 - 元脑SD200将64张GPU卡融合为统一内存节点 支持四大国产开源模型并行运行 [2] - 采用3D Mesh架构与GPU虚拟映射技术 显存达4TB 内存64TB 满足万亿参数模型推理需求 [2] - 64卡运行DeepSeek R1性能提升3.7倍 Kimi K2提升1.7倍 专为Agentic AI计算需求设计 [2] 三、智谱GLM-4.5技术突破 - GLM-4.5公开预训练与后训练细节 首创单模型融合推理、编码与智能体能力 [3] - 基于MoE架构与15T通用+7T专业数据训练 强化长上下文与智能体性能 [3] - 在12项ARC测试中超越Claude Opus 4 部分指标超过OpenAI o3 [3] 四、昆仑万维SkyReels-A3视频模型 - SkyReels-A3基于DiT架构生成1分钟数字人视频 优化手部动作与运镜控制 [4] - 采用改进插帧方法与ControlNet模块 解决长视频稳定性与多视角切换问题 [4] - 作为五天技术发布周首款产品 已上线Talking Avatar工具 [4] 五、腾讯混元3D生成能力升级 - 创想三维MakeNow平台接入腾讯混元 增强CubeMe等工具的3D生成能力 [5] - 混元3D v2.5采用稀疏原生架构 几何分辨率达1024³ 纹理贴图4K级 [6] - 用户上传照片5分钟内可生成可打印Q版手办 支持三种风格个性化调整 [6] 六、阿里开源具身智能组件 - 开源RynnVLA-001视觉-语言-动作模型 能从第一人称视频学习人类操作 [7] - RynnRCP协议打通传感器到执行的机器人工作流 支持多款热门模型 [7] - RynnEC模型通过视频序列建立连续空间感知 引入多模态世界理解能力 [7] 七、百川医疗大模型Baichuan-M2 - 32B参数Baichuan-M2在HealthBench评测中仅次于GPT-5 超越所有开源模型 [8] - 集成验证系统与患者模拟器 严格遵循中国医疗指南并适配临床场景 [8] - 4bit量化后单卡RTX4090可部署 成本较DeepSeek-R1 H20降低57倍 [8] 八、灵巧智能机器人手技术 - DexHand021 Pro拥有22自由度 双绳驱动实现拇指对指等精细操作 [9] - 串并混联设计解决摩擦损耗问题 四指负载>1kg 整手抓握>5kg [9] - 集成12个电机与多传感器 成本仅为同类产品十分之一 [9] 九、Scaling Law行业观点 - Scaling Law反映数据内在幂律特性 模型能力非线性增长源于数据结构 [10] - 需通过强化学习将计算转化为新知识 建立生成-验证-学习的进化飞轮 [11] 十、2025大模型应用趋势 - 45%企业已部署大模型至生产环境 32%定制模型 27%采用API服务 [12] - 用户平均使用4.7家不同产品 ChatGPT领先但Gemini与DeepSeek增速显著 [12] - 55%接受中国模型但要求海外部署 英伟达占据78%训练硬件市场份额 [12]
智谱发布新一代开源视觉模型GLM-4.5V
华尔街见闻· 2025-08-11 13:44
智谱:今天,我们推出全球 100B 级效果最佳的开源视觉推理模型 GLM-4.5V(总参数 106B,激活参数 12B),并同步在魔搭社区与 Hugging Face 开源。这是我们在通向 AGI 道路上的又一探索性成果。此 外,在保持高精度的同时,GLM-4.5V 兼顾推理速度与部署成本,为企业与开发者提供高性价比的多模 态 AI 解决方案。 API 调用价格:低至输入 2 元/M tokens,输出 6 元/M tokens。 响应速度:达到 60-80 tokens/s。 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何 意见、观点或结论是否符合其特定状况。据此投资,责任自负。 风险提示及免责条款 ...
中国顶尖大脑,被欧美挖走了
新浪财经· 2025-08-11 04:22
AI人才争夺现状 - Meta为前苹果高管庞若鸣提供2亿美元年薪 创AI人才薪酬纪录 超过苹果CEO库克的7460万美元年薪[1] - OpenAI核心团队余家辉等四人被高薪挖走 其中余家辉薪酬包含8000万美元签字费及3亿多美元股权[2] - 马斯克旗下xAI公司Grok 4团队中超过三分之二成员为华人[11] - 扎克伯格宣布Meta超级智能实验室11位关键人才中有7人为华人[11] 华人AI人才教育背景 - 被挖角人才均毕业于中国顶级学府:庞若鸣本科毕业于上海交通大学[4] 余家辉出身中科大少年班[6] 赵晟佳毕业于清华 毕树超出自浙大 任宏宇毕业于北大[11] - 全球47%顶尖AI研究者本科毕业于中国院校 美国头部AI机构中38%研究员为华人[13] - 黄仁勋表示全球50%AI研究人员来自中国 为最大单一群体[13] 人才流动数据 - 近五年中国AI领域超200名顶尖学者流向硅谷 2024年47名清华北大毕业生被美国科技公司预定[22] - 中国培养的顶尖AI人才仅51.35%选择留华深造 最终留华工作者仅剩三成[22] - 2025年中国双一流高校STEM博士毕业生预计约3.47万人 按AI占比10%-15%估算 每年AI专业博士毕业生达3500-5200人[17] 中美科研环境对比 - 清北交大毕业生平均月薪约1万元 年薪约13万元人民币[16] - 硅谷普通公司可提供10万美元年薪 谷歌中位数年薪达30万美元(约200万元人民币)[16] - 美国提供顶级算力资源 自由研发权及全球协作网络 国内同类条件岗位数量有限[16][17] 行业竞争格局 - 全球顶尖AI专家不足千人 决定大模型能力上限与商业生态定义权[26] - Meta因Llama 4表现不及预期 通过高薪争夺人才寻求AGI领域突破[26] - AI军备竞赛进入抢人大战阶段 人才争夺关乎万亿级市场机遇[27][28]