Workflow
AGI
icon
搜索文档
阶跃星辰姜大昕:追求AGI的初心不变,要在多模态能力和Agent方向做出差异化
IPO早知道· 2025-05-13 01:55
公司战略与核心观点 - 公司坚持基础大模型研发,追求AGI(通用人工智能)是初心且不会改变 [3] - 公司差异化特点在于多模态能力,目前多个模态性能在业界领先,并积极探索前沿方向 [3] - 公司在应用层面选择差异化路线,与合作伙伴共同发力智能终端Agent,形成从模型到Agent、云侧到端侧的生态体系 [3] - 行业技术发展处于陡峭区间,公司不会放弃主流增长或前进趋势 [3][4] 技术发展趋势 - 基础大模型发展呈现两大趋势:从模仿学习到强化学习、从多模态融合走向多模态理解生成一体化 [6] - 多模态理解生成一体化是重要趋势,尤其在视觉领域,理解与生成由同一模型完成 [11] - 公司已发布理解生成一体化模型Step 1X-Edit,总参数量19B(7B MLLM + 12B DiT),支持11类高频图像编辑任务 [13] - 公司内部正在开发更高级版本,未来几个月将发布更先进技术 [13] 多模态能力布局 - 公司建立Step系列通用大模型矩阵,包括语言模型和多模态模型,多模态细分涵盖图像、视频、语音、音乐等 [8] - 公司是国内少数重视模态全覆盖并坚持原生多模理念的企业,认为多模态是实现AGI的必经之路 [9] - 多模态能力对垂直领域和C端应用必不可少,公司具备全面自研预训练模型能力,构成独特优势 [9] 智能终端Agent战略 - 公司采用"超级模型+超级应用"双轮驱动策略,将智能终端Agent作为重要方向之一 [15] - Agent爆发需要多模态能力和慢思考能力,这两项能力在2024年取得突破性进展 [15] - 公司已与OPPO、吉利、智元机器人等头部企业合作,重点布局手机、汽车、机器人等智能终端 [16] - 公司认为AI时代产品流量增长逻辑不同于传统互联网,智能终端服务C端存在巨大机会 [17] 产品与技术成果 - 图像编辑大模型Step1X-Edit性能达到开源SOTA,具备语义精准解析、身份一致性保持、高精度区域级控制三项关键能力 [13] - 该模型支持文字替换、风格迁移、材质变换、人物修图等11类高频图像编辑任务 [13] - 理解生成一体化的技术路线在公司成立之初就已设定 [14]
对话印奇:节奏比方向重要,智驾冲刺的信号已经响起
晚点Auto· 2025-05-12 14:47
核心观点 - 千里科技董事长印奇认为AI行业的最终赢家不超过4个阵营,强调商业闭环的重要性[3][4] - 从"技术信仰、价值务实"转变为"价值务实、技术信仰",将商业价值置于技术研发之前[16] - AI 1.0到2.0的演进中,软硬结合与终端连接是关键路径,机器人是终极目标但汽车是现阶段最佳载体[7][8] 战略转型 - 从旷视科技到千里科技的转变源于上市受阻和资金压力,选择与吉利生态深度融合[6][12] - 新战略聚焦"AI+车"双轮驱动:终端(摩托车/新能源车)与科技(智驾/智舱)[22] - 差异化定位为开放与国际化的车BU,计划服务3-4家头部车企[23][26] 行业竞争 - 智驾领域决胜点在于数据体系、纵向整合能力和商业客户体系[38] - 预测智驾市场最终将收敛至不超过4个体系阵营,特斯拉和华为已占先机[38] - 订阅模式是智驾可持续的商业路径,硬件收费软件免费不可持续[43] 技术路线 - 端到端数据驱动的大模型是智驾终极方案,但中国当前仍依赖规则堆砌[39] - VLA模型是具身智能方向但尚未成熟,车作为"简单机器人"是更现实的切入点[40][41] - 芯片和核心算法是必须自研的环节,传感器可开放合作[24] 管理理念 - 目标管理和绩效管理是组织效能的核心,探索性业务需特殊激励设计[31] - 研发与营销投入比例从4:1调整为1:1,强化市场牵引作用[29] - 创业公司需经历"蹲苗期"夯实基础,在技术临界点集中资源冲刺[35][36] 商业认知 - 移动互联网的短链条模式不适用于AI等长周期行业,"how"比"what"更重要[33] - 产业周期早期适合垂直整合,规模化阶段开放联盟更高效[23] - 所有不能闭环的辉煌都是阶段性的,必须用第一个闭环支撑更大闭环[21]
晚点对话印奇:AI 1.0 的教训是,所有不能闭环的辉煌都是暂时的
晚点LatePost· 2025-05-12 12:20
公司战略转型 - 千里科技聚焦"AI+车"战略,目标成为汽车智能化头部供应商,延续旷视未实现的软硬结合商业闭环[4] - 公司业务架构为"双轮驱动":终端载体(摩托车/新能源车/机器人)与科技能力(智驾/智舱),现阶段优先发展智驾业务[22] - 差异化竞争策略为开放联盟(整合产业链最优资源)与国际化布局(依托吉利海外生态)[22][23] 行业竞争格局 - 智驾行业决胜关键为数据体系、纵向整合能力(算法-芯片链路)、商业客户联盟三大要素,预计最终存活玩家不超过4家[38][39] - 技术路线分歧:特斯拉代表"黑盒主导"的端到端大模型路线VS华为"白盒+黑盒结合"的规则优化路线,长期看模型化方案更具代际优势[39][40] - 商业模式核心是2B2C订阅制,需消费者直接为智驾功能付费才能形成可持续生态[43] 技术发展路径 - 判断机器人产业爆发需5年整合期,当前优先选择商业化更快的汽车场景[7] - AGI发展必须包含物理层交互,纯虚拟数据无法实现真正通用人工智能[8][9] - VLA模型是具身智能潜在方向,但面临数据获取与Scaling Law方法论等挑战[40][41] 经营管理理念 - 组织价值观从"技术信仰,价值务实"调整为"价值务实,技术信仰",强调商业闭环对技术研发的支撑作用[16][17] - 研发投入结构从3:1(研发:营销)优化至1:1,通过市场牵引提升资源配置效率[29] - 管理核心聚焦目标管理与绩效激励两大基础体系,反对概念创新[31] 创始人认知迭代 - 创业14年经历完整AI周期后,形成"世界连续性"底层世界观,更注重商业本质与执行细节[32][33] - 提出"节奏比方向更重要"的战略方法论:储备期控制ROI,决战期饱和投入[35][36] - 判断智驾冲刺窗口始于2023年理想实现端到端突破,行业格局将在2024-2025年明朗化[36][37]
「阶跃星辰」的一次豪赌
36氪· 2025-05-12 00:27
公司战略与定位 - 阶跃星辰专注于多模态技术研发,认为多模态是实现AGI的必经之路,并将大部分资源投入该领域[4][8] - 公司采取差异化竞争策略,未参与应用投流热潮,仅试水To C应用,保持低调但技术领先的身位[2][3] - 技术路线选择"难上加难"的理解生成一体化原生多模方向,从成立之初即定为主线[5][14] 技术布局与成果 - 成立两年发布22款自研基座模型,其中16款为多模态模型,占比超70%,覆盖文字、语音、图像等六大模态[4] - 多模态技术处于早期探索阶段,类比语言模型相当于GPT-1.0前的Transformer时期,需解决模态融合不降智的难题[5][18] - 重点布局两大技术趋势:预训练模型+强化学习提升推理能力,以及视觉领域理解生成一体化[10][14] - 组建多支技术路线并行团队,采取"并发突破"策略应对技术不确定性[7] 产品与商业化路径 - 2025年将产品"跃问"更名为"阶跃 AI",实现从类ChatGPT产品向Agent能力转型[22] - 选择智能终端Agent为主攻方向,与Oppo、吉利汽车等头部企业合作落地手机、汽车、机器人场景[23][24] - 商业化逻辑强调模型突破先于应用爆发,通过绑定行业头部公司获取场景和数据,暂不直接ToC[20][24] - 认为AI产品流量增长不依赖传统投流模式,以DeepSeek为例验证技术驱动增长路径[19] 行业趋势判断 - 多模态与Agent成为2025年两大关键词,Agent爆发依赖多模态能力和慢思考能力的突破[6][23] - 技术演进路线从单模态到多模态,再到理解生成一体化,最终延伸至AI for Science[9][18] - 视觉领域尚未解决predict next frame难题,因模态复杂度远超语言(图片数据达百万维连续空间)[17] - 行业技术发展仍处陡峭增长期,基础模型研发决定应用上限,应用场景反哺模型迭代[22]
京东将正式布局自动驾驶出租车赛道?子公司申请注册多枚“Joyrobotaxi”商标;新款博越L将于5月13日上市丨汽车交通日报
创业邦· 2025-05-11 10:07
三星供应商Solus Advanced Materials业务重组 - 三星供应链公司Solus Advanced Materials考虑出售OLED材料部门以重组业务结构 [1] - 公司计划集中精力发展主营业务电池箔/铜箔业务 [1] 京东布局自动驾驶出租车赛道 - 京东子公司申请注册多枚"Joyrobotaxi"商标 涵盖运输工具、科学仪器等核心领域 [1] - 业界普遍认为此举标志着京东将正式进入自动驾驶出租车(Robotaxi)市场 [1] 吉利汽车新款博越L上市信息 - 新款吉利博越L将于5月13日上市 定位为紧凑型SUV [1] - 新车预售价区间为10.59-13.29万元 [1] - 预售期间提供升舱礼、精品礼等多项限时权益 [1]
公元:DeepSeek只打开一扇门,大模型远没到终局 | 投资人说
红杉汇· 2025-05-11 05:09
人工智能与具身智能赛道现状 - 当前AI与具身智能赛道处于类似互联网初期的百花齐放阶段,底层技术和垂直细分领域机会众多[5] - 具身智能领域可能处于类似2018年LLM的阶段,尚未出现GPT时刻,但AGI的长期前景被普遍看好[8][9] - 行业变化极快,AI领域"一天相当于人间一年",模型迭代速度远超传统商业模式演进速度[7] DeepSeek的影响 - DeepSeek的R1模型通过开源后训练方法论实现了"技术平权",将全球AI研发重新拉回同一起跑线[6] - 该突破改变了国内大模型行业格局,但预训练与后训练技术仍需双轮发展,行业终局尚未确定[6] - 春节期间的技术突破导致行业认知发生剧烈变化,两个月内从"后训练重要"转向"预训练重要"[6] 投资逻辑变化 - 传统基于DAU/MAU的商业评估模式失效,用户可能因技术突破瞬间转移[7] - 投资人需要快速建立对AGI能力的感知,而非依赖传统商业指标[7] - 具身智能投资的核心逻辑是押注物理世界AGI的实现概率[9] 创业范式转变 - 新时代创业更强调技术颠覆创新而非明确商业化路线[1] - 当前创业者难以清晰描述具体应用场景,更多聚焦技术路线本身[8] - 成功要素转变为对AGI的信念而非传统商业计划[9] 行业参与者特点 - 顶级投资人需保持高度热爱和好奇心以应对快速变化的技术环境[10] - 国内大模型可能形成DeepSeek、千问和豆包三强格局的预测出现[6]
深度|AI教父Hinton:当超级智能觉醒时,人类可能无力掌控
Z Potentials· 2025-05-11 03:41
AI发展速度与超级智能预测 - AI发展速度超出预期 尤其是具备现实世界操作能力的Agent出现 比问答式AI更令人担忧 [3] - 超级智能出现时间预测从5-20年缩短至4-19年 且可能在10年或更短时间内实现 [4][5] - 超级智能可能呈现"聪明助理+糊涂CEO"模式 实际掌控事务但维持人类表面决策权 [6] AI技术应用前景 - 医疗领域AI将显著超越人类医生 能分析数百万病例数据 整合基因组信息 成为顶级家庭医生 [7] - 教育领域AI私教可提升学习效率3-4倍 但可能冲击传统大学体系 [7][8] - 材料科学领域AI可设计更好电池材料 推动大气碳捕获技术 甚至实现室温超导 [9][10] - 客服、法律、会计等程序化职业面临全面替代 仅保留需主观能动性的岗位如调查记者 [12][13] AI社会影响与治理挑战 - AI可能导致大规模失业 加剧贫富分化 削弱民主制度稳定性 [9] - 超级智能存在10%-20%概率接管人类控制权 且具备欺骗和隐藏意图的能力 [15][16] - 模型权重开源如同核原料扩散 仅需百万美元即可微调出危险模型 [26] - 当前监管薄弱 企业游说放宽限制 加州1047号法案等尝试遭遇强烈抵制 [23] 技术演进与行业动态 - 数字系统信息交换效率达万亿比特/秒 比人类交流快数十亿倍 成为主要发展路径 [60] - OpenAI放弃非营利初衷 安全研究优先级下降 导致核心人才流失 [31][32] - Anthropic成为少数专注AI安全的公司 吸引大量OpenAI出走的研究人员 [78][79] 地缘竞争与产业伦理 - 技术遏制策略对中国效果有限 其自主体系终将突破 [39] - AI创作引发版权争议 大规模替代创作者可能摧毁文化产业经济价值 [41][42] - 胚胎筛选技术可能向优生学方向发展 但涉及敏感伦理边界 [50][51] 技术突破与认知转变 - 大语言模型已具备思维链推理能力 可追溯自身判断过程 颠覆传统AI认知 [72][73] - 神经网络证明无需预设结构 仅通过数据学习即可实现复杂能力 [64] - 数字系统与模拟系统的路线选择影响未来能耗与效率 [61][62]
改款梅赛德斯C级轿车路测图曝光;阿维塔12车型20英寸叶式五辐低阻轮毂上架丨汽车交通日报
创业邦· 2025-05-10 10:11
阿维塔12车型轮毂更新 - 阿维塔科技宣布阿维塔12车型20英寸叶式五辐低阻轮毂返场上架 该轮毂在测试中使车辆风阻系数达到0.217Cd [1] 奥迪Q6新增车型上市 - 奥迪为2025款Q6新增"40TFSI quattro纪念版羽林套装7座"版本 搭载2.0T低功率发动机 售价46.76万元 [2] 改款梅赛德斯C级曝光 - 中期改款梅赛德斯C级轿车路测图曝光 确认搭载星形大灯 调整前格栅和保险杠设计 后视镜新增C形转向灯 尾灯采用星形图案强化品牌辨识度 [3] 大众汽车美国召回 - 大众汽车美国将召回89417辆2022-2024款Q5 Quattro和Q5 Sportback Quattro车型 因气缸盖螺钉可能未正确拧紧导致漏油和火灾风险 经销商将免费检查更换螺丝 [5]
9年实现爱因斯坦级AGI?OpenAI科学家Dan Roberts谈强化学习扩展的未来
机器之心· 2025-05-10 03:42
核心观点 - OpenAI研究科学家Dan Roberts预测强化学习将在未来AI模型构建中发挥更大作用,并最终可能创造出能够发现新科学的模型 [2] - 通过扩展强化学习规模,AI模型可能在未来9年内实现AGI(人工通用智能),甚至重现爱因斯坦级别的科学发现 [57][56] 模型性能与扩展 - OpenAI发布的o1和o3模型展示了测试时间扩展的重要性,模型表现随思考时间增加而提升 [6][7][9][12] - o3模型能够在一分钟内完成复杂的物理计算(如量子电动力学问题),而人类专家需要3小时 [14][19][31] - 模型性能与训练量呈正相关,强化学习将成为未来训练的主导方法 [34][37][40] 强化学习的未来方向 - OpenAI计划颠覆传统预训练与强化学习的比例,将强化学习从“樱桃”变为“超大樱桃” [42] - 公司计划筹集5000亿美元用于大规模计算基础设施扩建,以支持强化学习的扩展 [46][48] - 测试时间计算和强化学习训练将成为扩展科学的新方向 [53] AI科学发现的潜力 - 当前AI模型已能重现教科书级计算,但目标是为科学前沿做出贡献 [31] - 提问方式可能是限制AI科学发现的关键因素,需要优化问题设计 [54] - 根据趋势预测,到2034年AI可能具备8年连续计算能力,相当于爱因斯坦发现广义相对论的时间 [56][57]
217亿收购Windsurf,转型“公益公司”,OpenAI更务实了
创业邦· 2025-05-09 10:01
文章核心观点 - OpenAI以30亿美元收购AI编程工具开发商Windsurf,这是公司成立以来规模最大的收购案[3] - 此次收购价格较Windsurf去年12.5亿美元的估值翻倍[6] - OpenAI正重新将AI编程作为战略重点,以应对紧张的现金流和市场竞争压力[7][18][37][38] OpenAI的战略收购与布局 - OpenAI最初计划收购估值达90亿美元的Cursor,但因价格等细节未能达成一致,转而收购市场份额第二的Windsurf[5] - 收购Windsurf旨在获取其超过1000家企业客户和海量真实业务数据,挖掘商业价值[45] - 公司近期开源了轻量级编程Agent Codex CLI,发布不到7小时GitHub Star数超5500[17] AI编程领域竞争格局 - OpenAI早在2021年推出代码生成模型Codex(参数规模120亿)并联合微软推出GitHub Copilot,但后续创新乏力[8][9][12] - 2024年3月,Cognition AI推出全球首个"AI程序员"Devin,但实际应用存在不确定性[12][13] - 2024年8月,Cursor因多行编辑、跨文件上下文补全等功能获得开发者青睐,被评价为碾压式超过GitHub Copilot[15][16] OpenAI的公司发展状况 - 公司2024年亏损达50亿美元,亟需在12个月内筹集更多现金才能存活[37] - 2024年10月公司估值达到1570亿美元[30] - 2025年5月5日,公司宣布放弃完全转为营利性机构的计划,决定采用PBC(公共利益公司)模式[34][35][36] Windsurf的业务特点 - Windsurf专注于企业级市场,注重整个工作流程的自动化,支持直接操作终端、自动安装依赖等功能[42][43] - 产品引入多种新一代AI模型支持,包括DeepSeek-v3、GPT 4.5、Claude 4.5等,用户可下拉菜单选择模型[43] - 自2024年底发布以来,Windsurf用户数破百万、年度经常性收入(ARR)超过1亿美元、企业客户数量超过1000家[45] OpenAI的产品尝试与挑战 - 2024年2月发布Sora技术报告和Demo,但直到2024年底正式发布时未引起太大反响[21] - 2024年3月重建机器人团队,5月计划推出AI搜索产品但最终未能实现[22][24] - 公司投资版图涵盖人形机器人、AI芯片、数据库、办公软件等多个领域,但创新力受到组织架构牵制[24][25]