Workflow
AGI
icon
搜索文档
OpenAI的00后“叛徒”正在碾压华尔街“老江湖”
虎嗅APP· 2025-09-06 13:30
基金业绩与背景 - 新锐对冲基金SALP在半年内实现47%净回报 大幅超越同期标普500指数6%的涨幅及科技类对冲基金7%的平均回报水平 业绩表现超出华尔街平均水平700% [2][13] - 基金专注于AGI概念投资 管理规模在2025年超过15亿美元 获得Stripe创始人Collison兄弟 前GitHub CEO Nat Friedman等硅谷顶尖投资人支持 [3][13][15] - 基金由23岁前OpenAI安全研究员Leopold Aschenbrenner创立 其因安全议题与OpenAI产生分歧并于2024年4月被解雇 后发布165页AGI预测报告《态势感知》引发行业关注 [2][10][11][13] 投资策略与哲学 - 采用"AGI现实主义"投资哲学 全部资金100%聚焦AI领域 通过多空策略结合衍生工具操作 重点押注算力 电力 基础设施等AI关键瓶颈领域 [4][15][16][18] - 投资组合高度集中 重仓AI产业链上游企业 包括博通(Broadcom)股票 英特尔(Intel)期权 电力公司Vistra及GPU云服务商CoreWeave [18][21] - 经典案例为2025年投资濒临破产的加密货币矿企Core Scientific 看好其被低估的数据中心资产转型AI计算托管的潜力 [3][22] AGI技术预测与行业影响 - 预测AGI将在2027年左右实现 之后进入智能爆炸阶段 数百万AI智能体将推动智能水平在几年内超越人类 [13] - 测算AI算力需求呈指数级增长 到2028年需1000万个H100等效设备 电力需求将超过美国多数州的功耗 2030年将占美国总电力生产20%以上 [19] - 主张将AI上升为国家战略 建立"AGI工业复合体"以应对技术爆发带来的经济结构变革和社会冲击 [17]
国家级创新领军专家带队,头部具身智能机器人创企再获数亿元融资!
Robot猎场备忘录· 2025-09-06 00:03
融资情况 - 智平方完成A++轮融资 金额超1亿元 由深创投领投 华熙生物及某大型零售集团跟投 老股东敦鸿资产和国投创盈持续加码[2] - 2025年以来完成7轮数亿级融资 包括1月7日Pre-A轮数亿元融资 3月6日Pre-A+轮数亿元融资 以及Pre-A+++轮和A+轮融资[3] - 融资资金将用于核心大模型GOVLA和机器人AlphaBot迭代 自建产线扩容及全球市场拓展[2] 公司背景 - 公司于2023年4月在深圳注册成立 致力于研发通用智能具身终端 是全球最早提出物理世界AGI的企业[5] - 创始团队具备全栈AI系统能力 核心成员来自微软、小鹏、OPPO、Momenta等企业及清华、北大、中科院等知名学府[6][7] - 创始人郭彦东为国家级创新领军专家 曾任小鹏汽车首席科学家和OPPO首席科学家[10] 技术与产品 - 公司全栈自研VLA模型 2024年6月与北京大学合作推出RoboMamba模型并实现商业化[9] - 2025年4月发布全域全身具身智能大模型Alpha Brain和新一代仿生机器人AlphaBot 2[9] - Alpha Brain采用双系统架构 由空间交互基础模型、慢系统和快系统组成 实现全身协同控制和全场景任务覆盖[9] - 首次将DeepSeek技术融入VLA模型 提升推理能力和长程复杂任务理解[11] - AlphaBot 2为第三代轮式仿生机器人 搭载Alpha Brain 适配汽车制造、半导体制造、生物科技等多行业任务[12] 商业化进展 - 2025年签署约500台订单 已部署于汽车、半导体、生物制造及公共服务四大行业[14] - 与晶能微电子、华熙生物与东风柳汽达成战略合作[14] - 启动自有产线建设 目标2028年实现万台场景应用 2033年拓展至百万台规模[16] 行业地位与优势 - 国内最早提出端到端VLA的具身智能机器人公司[9] - 具备自动驾驶背景的创始团队和全栈自研技术路线 被资本市场青睐[17][19] - 采用"大脑"与本体同时布局的路线 在软硬件上全栈推进[17] 行业趋势 - 具身智能赛道最强派系包括车企、车企产业链和自动驾驶领域行业专家[21] - 全球15家知名车企入局人形机器人赛道 其中国内11家[22] - 自动驾驶领域技术专家纷纷离职入局具身智能赛道创业 并快速获得大额融资[17]
特朗普与比尔盖茨、库克等共进晚餐,重申将对中国等征收可观的芯片关税
搜狐财经· 2025-09-05 05:22
科技企业投资与政府合作 - 谷歌确认对美国追加1000亿美元投资 使总投资额超过2500亿美元[3] - 微软宣布每年对美国投资750亿-800亿美元 并获得美国总务管理局重要云计算合同[3] - 苹果在美国进行重大投资6000亿美元 并拥有关键先进制造业[3] 半导体与AI芯片政策 - 特朗普政府计划对中国等多个国家芯片征收相当可观关税 但对在美国投资企业除外[6] - 美国参议院提案要求AI芯片开发商优先满足国内订单 限制向海外出口高性能AI芯片[7] - 法案拟对所有先进GPU实施出口管制 禁止出口最强大芯片[7] 企业战略与技术发展 - OpenAI计划2025年与博通合作量产自研AI芯片 以削弱对英伟达依赖[8] - 博通获得神秘新客户100亿美元订单 将从2026年开始强劲出货[8] - 英伟达澄清H100/H200芯片供应充足 可即时满足所有订单[8] 行业领导层表态 - 谷歌CEO确认与特朗普政府建设性对话 执行AI行动计划并确保美国领先AGI发展[3] - AMD CEO称赞政府支持半导体产业 称公司正在为AI构建"大脑"[3] - OpenAI CEO感谢政府支持商业创新 表示正将产业力量带回美国[3] 贸易政策调整 - 特朗普签署行政命令 将日本汽车进口关税从27.5%降至15%[6] - 其他日本商品关税上限设定为15%[6]
没PhD,算什么AI研究员,LeCun论文竟要28岁辍学生审批,发文“暗讽”内讧升级
36氪· 2025-09-05 03:44
Meta内部AI管理层级变动 - 首席AI官Alexandr Wang现需审核图灵奖得主Yann LeCun的论文 导致后者需向28岁上司汇报工作 [1][3] - 公司内部重组将AI团队拆分为四个部门:TBD Lab(由Wang领导)、FAIR(由LeCun创立)、产品和应用团队、基础设施团队 [13] - TBD Lab不仅审核FAIR的论文 还可能借调其研究人员进行技术落地 引发工程干预科研的争议 [13] 研究员与工程师的资质标准争议 - LeCun明确研究员需满足三项学术标准:发表论文并开源代码、拥有AI领域PhD学位、持续产出学术成果(通过Google Scholar引用量和h指数衡量) [2] - 强调研究与工程/产品开发存在根本差异 两者动机和激励机制不同 且研究转工程常见而反向转移罕见 [2] - Alexandr Wang学术背景薄弱:仅7篇论文(实际4篇独立研究) Google Scholar被引数409 h指数5 i10指数3 [6][7] - LeCun学术成就显著:2022年以来发表超80篇论文 总被引数424,352 h指数161 i10指数431 其中单篇最高被引100,845次 [8][9][10] 公司AI战略方向冲突 - LeCun主张AI突破需全新范式 反对仅依赖大模型堆砌 与Wang追求快速商业落地的思路存在根本分歧 [17] - Meta当前战略重心为追赶OpenAI和谷歌的AGI竞争 更注重产品结果而非长期学术突破 [19] - FAIR实验室历史上多次调整:先被纳入元宇宙业务Reality Labs 后划归生成式AI部门GenAI 现处于MSL超级智能实验室框架下 [23] 人事变动与潜在影响 - LeCun已担任AI视频初创公司Everlyn的学术顾问 该公司由前Meta研究科学家Harry Yang创立 [24][26][28] - 内部重组后Wang以首席AI官身份发布备忘录 被视作职权范围扩大 [13] - FAIR曾开发PyTorch、Mask R-CNN等具有行业影响力的成果 但其开放研究模式与公司当前结果导向策略存在矛盾 [19][21]
罗永浩,在B站重新蓄起了胡子
36氪· 2025-09-05 01:08
罗永浩职业转型与内容创业 - 罗永浩近期将微博名改为"罗永浩的十字路口"并推出同名视频播客节目 通过深度对话形式邀请科技、人文领域嘉宾进行3-5小时长内容对谈 [2] - 节目在B站获得高关注度 首期对谈李想播放时长超2100万分钟 对谈何小鹏播放时长近千万分钟 [4] - 视频播客结合音频播客高信息密度与视频形式 在内容分发和商业化上具备更高可能性 成为B站、小红书、喜马拉雅等平台重点发力方向 [4][17] 直播带货与债务偿还进展 - 罗永浩通过直播带货三年累计收入达6亿元 年均收入2亿元超过A股60%上市公司2020年净利润 [7] - 截至去年8月已偿还债务8.24亿元 剩余债务约5亿元 直播带货成为其偿还债务的核心手段 [7] - 其直播公司"交个朋友"成长为头部直播电商公司 入驻淘宝直播首秀带货总额超2.1亿元 [7] 科技创业历程与现状 - 2012年创立锤子科技但因供应链管理混乱、技术积累不足等问题失败 背负6亿债务并被字节跳动收购 [5] - 电子烟创业因政策禁令终止 2022年成立细红线科技投身AR创业 [6] - 近期坦言AR眼镜十年内难商业化 团队转向软件开发 纯软件方案预计两三个月内上线 [6] 视频播客行业生态与发展 - 中国播客市场仍处发展初期 去年播客广告总收入33亿元 听众规模1.34亿 较短视频平台用户规模存在差距 [16] - B站二季度日均活跃用户1.09亿同比增长7% 月活用户3.63亿同比增长8% 5分钟以上中长视频消费时长增20% [20] - B站推出《视频播客出圈计划》扶持创作者 案例显示UP主王益为频道年收入达150万元 合作嘉宾刘煜煊仅凭20万粉丝年充电收入约120万元 [21] 个人特质与商业策略 - 罗永浩强调创业驱动力非金钱而是兴趣与改变世界 曾因不善股权设计和产品命名踩坑 [6] - 其个人品牌具有强流量属性 视频播客被视为积累口碑和品牌价值管理的新渠道 [10][15] - 选择视频播客因受众含金量高 月薪2万以上高收入人群及企业管理者占比大 具备强消费潜力 [15]
腾讯研究院AI速递 20250905
腾讯研究院· 2025-09-04 22:42
OpenAI战略布局与产品更新 - OpenAI收购Xcode最流行的编程Copilot插件Alex团队 创始人Daniel Edrisian及全体成员加入OpenAI Codex团队[1] - Alex插件深度集成Xcode 提供代码自动补全和对话功能 支持在Xcode中直接操作修改代码 实现开发任务自动化[1] - OpenAI向免费版ChatGPT开放Projects功能 支持上传最多5个文件 管理项目颜色与图标 提供专属项目记忆控制选项[5][6] - Projects功能允许集中管理文档 代码 图片等文件 添加自定义指令 大幅提升使用效率 已在网页版和安卓端开放 iOS版即将上线[5][6] 苹果AI战略与人才变动 - 苹果计划2026年春季推出代号"世界知识问答"的AI搜索引擎 将与ChatGPT和Perplexity直接竞争[2] - 苹果与谷歌达成正式协议 利用谷歌模型为Siri提供部分技术支持[2] - 苹果面临AI人才流失危机 数周内失去10名AI研究员 包括基础模型团队负责人庞若鸣等核心人员 大多加入Meta[2] 中国AI技术进展 - 月之暗面发布Kimi K2-0905模型 支持256K超长上下文(K2-0711仅128K) 增强编程能力并保持创意写作SOTA水平[3] - 快手开源80亿参数多模态大模型Keye-VL-1.5 支持128k tokens扩展上下文 在多项视频理解基准测试取得SOTA[4] - Keye-VL-1.5采用慢-快视频编码策略 能在10秒内处理数分钟视频内容 自动识别AI生成内容 适用于视频推荐和内容审核[4] 企业AI应用与影响 - Salesforce裁撤4000个客户支持岗位(从9000人减至5000人) CEO称因AI客服系统Agentforce大幅提升效率[7] - Agentforce已承担公司内部50%工作量 但Salesforce仍计划增招1000-2000名销售人员向客户解释AI价值[7] - OpenAI白皮书显示早期采用AI的企业收入增长速度比同行快1.5倍 提出五大核心原则包括明确AI战略与KPI挂钩[9] 机器人技术与科研进展 - 特斯拉全新金色Optimus机器人配备类人双手 外观设计更加精简 马斯克目标2025年生产5000台 2026年达5万台[8] - 上海AI Lab联合20余家机构发布科学大语言模型全面综述 梳理600+数据集与模型 揭示2018-2025年四次范式转移[10] - 科学大模型发展至科学智能体阶段 Intern-S1等模型实现通才与专才融合 测评体系向动态过程导向型转变[10]
硅谷大换血,从小镇做题家到顶级AI研究员,华人为什么统治了AGI?
36氪· 2025-09-04 11:44
硅谷AI人才格局变化 - 生成式AI崛起导致硅谷人才格局向华人倾斜 华人成为AGI赛道最重要人才来源[2] - 过去二十年硅谷互联网由印度人主导 以勤奋高效执行力支撑软件产业[1] 华人AI人才占比数据 - 美国顶级AI机构中中国研究人员占比38% 超过美国本土的37%[5] - Meta超级智能实验室初始团队11人中7位华人 占比64%[6] - OpenAI的ChatGPT主创团队87人中9位华人 占比10.34%[9] - xAI创始团队12人中5位华人 占比超过40%[12] 核心团队华人成员贡献 - Meta为抢人提供四年3亿美元薪酬方案 首年可兑现超1亿美元[7] - OpenAI的GPT-4有30余位华人参与 GPT-4o关键团队17人中6位华人[10] - xAI的Tony Wu是联合创始人 Jimmy Ba提出AdamW优化算法论文引用超21万次[12] 人才输送路径模式 - 清北等顶尖院校本科+美国博士模式形成稳定高效人才输送渠道[5][14] - 30位华人核心研究者中22人遵循该路径 本科多来自清华北大中科大浙大[15] - 典型代表包括Meta赵晟佳(本科清华/博士斯坦福) 毕树超(本科浙大/博士伯克利)[16] 中国AI人才储备优势 - 中国每年计算机及相关专业毕业生超500万 是全球最大STEM人才输出国[18] - 中国活跃AI研究人员超3万名 博士博士后总数相当于美国AI研究人员两倍[18] - 美国AI研究人员约1万名 欧盟27国约2万名 英国约3000名[18] 教育体系适配性分析 - 中国基础教育强调数理基础与解题能力 培养结构化思维和耐心韧性[18][19] - 强化学习需要试错迭代特性 与中国学生熟悉的奥数解题逻辑高度契合[22] - 华人学者在NeurIPS 2020强化学习论文中占比30% 谷歌RL团队1/4-1/3毕业于中国高校[23]
李飞飞的答案:大模型之后,Agent 向何处去?
36氪· 2025-09-04 08:28
Agent AI核心架构 - 提出由环境与感知、认知、行动、学习与记忆五大模块构成的完整认知闭环架构 实现从感知到行动的动态迭代智能体系[5][10] - 感知模块主动从物理或虚拟世界获取多模态信息 并内嵌任务规划与技能观察能力实现有目的的信息理解[7][8] - 认知模块作为处理中枢 由大语言模型(LLM)和视觉语言模型(VLM)驱动 负责解释信息、多步推理和策略制定[8] - 行动模块生成具体操作指令 通过控制器执行物理世界交互或虚拟世界API调用[8] - 学习模块支持预训练、零样本/少样本学习、强化学习和模仿学习等多种机制 通过环境反馈实现持续优化[9] - 记忆模块突破传统上下文窗口限制 形成持久化结构系统存储知识、逻辑和推理结果[10] 大模型驱动机制 - LLM和VLM通过海量数据预训练内化世界常识 为Agent提供强大的零样本规划能力 显著降低任务规则编写成本[11][12] - 环境交互成为解决大模型幻觉问题的关键锚点 通过真实或模拟环境的物理反馈倒逼模型实现知识与现实对齐[13] - 需通过多元化数据训练和偏见检测机制解决基础模型继承的社会偏见问题 将包容性作为核心设计原则[13] - 在医疗等敏感领域需建立明确法规框架 通过提示工程和人类监督层确保数据隐私与行为安全[13] 应用场景实践 - 游戏领域彻底改变NPC行为模式 基于LLM的Agent可拥有独立记忆情感 实现动态行为调整和自然语言交互 提升沉浸感与开发效率[14][15] - 机器人领域实现自然语言指令驱动 通过GPT-4V理解人类演示视频并转化为可执行任务 结合多模态感知实现精细物理操作[17] - 医疗健康领域应用包括智能问诊聊天机器人 连接实时医学数据库进行事实核查 以及慢性病监控与预警系统提升诊疗效率[19][21] 行业影响与验证 - 论文框架已获谷歌 OpenAI和微软等主流厂商实际验证 其核心打法均遵循论文提出的能力栈推进[1][4] - 尽管发表仅半年 该综述已成为AI领域纲领性著作 为碎片化的Agent研究提供系统化框架与发展地图[4][22] - 行业面临多模态深度融合、跨领域通用化及标准化评测体系建立等核心挑战 需突破现有技术局限[22]
大模型增457%!云知声港股财报展现AGI赛道提供技术-场景-业绩路径
搜狐财经· 2025-09-04 03:55
核心财务表现 - 2025年上半年实现营收4.05亿元人民币,同比增长20.2% [1] - 大模型业务收入同比激增457%至近1亿元人民币,成为核心增长引擎 [1] 大模型技术突破 - 山海大模型自2023年5月由BERT架构升级至GPT架构,参数规模达千亿级别 [2] - 实现三大技术突破:支持高效混合推理模式、多模态融合能力、可接入模型上下文协议(MCP) [2] - 技术升级使垂直领域解决方案构建周期缩短40%以上,形成"感知-决策-行动"业务闭环 [2] 业务场景表现 - 日常生活场景收入3.35亿元,占总收入82.7% [4] - 医疗场景收入0.70亿元,占比17.3%,增长质量显著 [4] - 医疗场景落地突出,病历生成及质控产品系列已在多家医疗机构应用 [4] 政策环境支持 - 国务院印发《关于深入实施"人工智能+"行动的意见》,明确2027年人工智能与6大重点领域深度融合目标 [6] - 政策要求新一代智能终端、智能体应用普及率超70%,与公司智能终端和医疗业务高度契合 [6] 技术发展路径 - 未来将持续推动通用大模型底座、专家级大模型与Agent、端侧大模型及芯片优化等技术演进 [8] - 技术研发与政策支持双重驱动有望巩固公司核心竞争力 [8]
理想郎咸朋分享对VLA里语言部分的作用
理想TOP2· 2025-09-04 02:32
文章核心观点 - 语言能力是自动驾驶系统认知理解与决策规划的核心 语言在VLA架构中承担对视觉感知内容的认知理解并形成行动规划和决策 而非仅作为交互界面的文字输出或语音输入[1][2] - VLA架构在L3/L4高阶自动驾驶阶段将展现显著优势 当前辅助驾驶任务简单时与其他方案差异不明显 但在复杂AGI任务中预计将获得碾压性胜利[2] 技术架构解析 - VLA架构由三部分组成 V代表视觉感知 L代表语言能力 A代表动作执行 其中L核心功能是通过人类语言数据学习进行隐式逻辑推理[2] - 语言能力本质是认知框架 语言塑造和限制人类对世界的认知、理解与表达能力 不同语言体系形成差异化认知框架 这是人类与动物的关键区别[1] 技术实现路径 - L语言部分不依赖显式文字推理 而是通过语言数据学习实现隐式逻辑推理 背后核心是长思维链推理过程 文字输出与语音输入仅为可选交互方式[2] - 自动驾驶系统类比人类认知优势 人类视觉不如鹰 行动速度不如猎豹 但凭借语言衍生的认知理解能力成为地球主导物种[2]