Workflow
AGI(通用人工智能)
icon
搜索文档
DeepSeek爆火100天:梁文锋「藏锋」
36氪· 2025-05-16 09:21
核心观点 - DeepSeek R1的发布将AI行业焦点从GPT模式转向Reasoner模式,标志着AI发展的新里程碑 [3][9] - 梁文锋的低成本大模型训练策略引发行业震动,挑战英伟达的高端算力芯片需求,导致其股价单日蒸发近6000亿美元 [4][5][6] - DeepSeek的开源策略和性价比路线重构了中美AI发展路径,国内科技大厂纷纷跟进降价并调整战略 [14][15][37][40] 行业影响 - 国内科技大厂加速C端应用布局,腾讯、字节等接入DeepSeek后实现用户增长,腾讯元宝下载量一度登顶 [40][41] - 行业分裂为两条路线:坚持Scaling Law的硅谷企业(如OpenAI融资400亿美元)与追随DeepSeek性价比策略的中国企业 [37][38] - AI六小龙等国内创企受冲击,零一万物放弃AGI转向行业模型,其他公司转向Agent应用或垂直领域 [38][39] 公司动态 - DeepSeek爆红后估值达80亿美元寻求融资,但暂未扩建算力或追逐用户规模,保持独立开源定位 [29][30][32] - 公司技术迭代加速:发布NSA架构挑战Transformer,参数规模从7B扩展到671B,数学和代码模型性能显著提升 [35][36] - 团队押注数学/代码、多模态、自然语言三大方向,创始人梁文锋持续参与技术研发并保持低调作风 [19][34] 产业链反应 - 英伟达H20芯片因DeepSeek需求激增遭美国出口管制,预计损失55亿美元,紧急开发中国特供版 [7][8] - 科技大厂启动"天才少年"计划争夺年轻人才,试图复制DeepSeek的创新模式 [42] - 马化腾、李想等国内大佬公开赞赏梁文锋,硅谷则对其持质疑态度 [23][24]
AI观察|面对“刷分”,大模型测试集到了不得不变的时刻
环球网· 2025-05-12 09:00
AI大模型测试集的现状与挑战 - 行业主流AI大模型已通过图灵测试 达到AGI标准 现有测试集无法准确评估快速迭代的大模型能力 [1] - 谷歌CEO公开庆祝Gemini 2 5 Pro通关经典游戏测试 显示头部企业对新型测试方式的探索 [3] - GPT-4发布后 MMLU测试集成为行业标准 但衍生出MMLU-Pro等变体导致测试集泛滥 [3] 现行测试集的核心问题 - 模型厂商针对特定测试集"刷分"现象严重 训练后成绩虚高 但实际应用表现不佳 [3] - 2024年9月后发布的o1 Sonnet-3 5等主流模型在MMLU测试中均获90-95分 缺乏区分度 [4] - OpenAI开发的FrontierMath测试集在数学领域展现差异化 GPT-4o正确率仅1% 而2025年o3模型达25% [5] 测试集信任危机与行业动向 - OpenAI被曝获取FrontierMath题库权限 测试公正性受质疑 丧失成为主流测试集机会 [5] - 谷歌通过游戏测试等非传统方式验证模型能力 反映头部企业已放弃现有测试体系 [3][4] - Scale AI与CAIS机构正合作开发新测试集 试图建立行业公认的第三方评估标准 [6] 新型测试方案的技术突破 - FrontierMath测试显示o3模型数学能力突飞猛进 正确率超其他模型十余倍 [5] - 游戏通关测试成为验证模型综合能力的新兴手段 谷歌Gemini 2 5 Pro率先实现突破 [3]
21观察丨AI下半场:硬件上山,智能体下山
21世纪经济报道· 2025-05-09 08:46
AI应用落地趋势 - 全球AI产业处于关键分水岭,生成式AI技术快速发展但规模化落地面临瓶颈,包括软件与硬件协同不足、跨场景能力薄弱、隐私安全争议和端侧算力限制 [1] - 混合式AI路线被视为实现AGI的潜力路径,通过终端设备入口结合私有云和公共云混合架构,构建覆盖个人与企业场景的安全AI生态 [1] - 终端设备厂商如苹果和联想正成为AI生态落地的试验田,但仍需解决应用堵点 [1] 超级智能体模式 - "超级智能体"是AI应用的升维,具备跨设备感知、多模态交互和自主任务拆解能力,从被动工具进化为能理解复杂意图、调用生态资源的"认知操作系统" [2] - 该模式瞄准AI应用的"最后一公里",解决端侧算力不足、模型泛化能力有限和隐私安全风险等核心瓶颈 [3] - 联想通过"超级智能体"串联混合生态,在个人场景实现"意图即服务",在企业场景深度融入运营并复用到城市治理层面 [4] 技术支撑与基础设施 - 联想推出"联想推理加速引擎",通过软硬件协同优化使普通PC本地推理能力接近云端模型o1-mini水平 [4] - 万全异构智算平台3.0版本提升AI推理性能5-10倍,降低训练和推理计算开销15%以上,并将推理延时降低3倍以上 [5] - 相变浸没液冷技术将PUE压至1.035,达到业界领先水平 [5] 数据安全与隐私保护 - 数据安全和隐私保护是超级智能体的核心基础,联想通过隐私增强计算推出"深度伪造检测技术"并集成至智能体 [5] AI产业化路径 - AI技术突破与商业落地存在周期错配,当前生成式AI仍处于产业化探索阶段 [5] - 科技巨头形成两种主流模式:OpenAI的纯云端大模型路线和苹果的端侧包围云上路线,联想采用后者并从硬件向全面解决方案反包 [5] - 硬件厂商拥有终端入口与异构算力优势,联想全球激活设备数亿台,为混合式AI提供试验田 [6] 联想AI转型战略 - 联想从硬件厂商向AI服务商转型,以智能体为核心串联所有业务,形成AI终端、基础设施和解决方案的全栈布局 [3][6] - 公司探索端云协同技术细节,搭建智能体生态并创新AI服务商业模式,被视为硬件厂商把握AI机遇的"中国样本" [6] 全球化与业务模式 - 联想通过"OEM+"模式和全球化与本地化结合的业务架构应对关税波动,在全球10个国家建立33家工厂实现快速调整 [7][8] - 端到端集成模式涵盖市场营销、产品设计和生产制造环节,使公司能快速调整策略保持竞争力 [8]
阿里:只当创造者,不做守成人
乱翻书· 2025-05-09 04:41
创始人精神与公司成长 - 增长带来复杂性,复杂性可能阻碍持续增长,创始人精神是解决这一矛盾的关键 [1] - 商业故事包含两条线索:外部竞争表现(市场份额、盈利)和内部组织建设(文化、机制、员工发展) [1] - 市值超千亿美元的公司最需警惕失去创始人精神而非技术或市场地位 [1][4] 阿里巴巴的战略定位 - 公司愿景从2002年延续至今:构建商业基础设施,实现客户"相会、工作、生活在阿里巴巴" [6][8] - 早期通过支付宝、诚信通建立信任体系,后期以云计算延续"水电煤"基础设施定位 [8] - 三大核心业务(电商、移动支付、云计算)均为主动开辟新赛道的结果,非被动防守 [9] AI时代的战略转型 - 2023年战略重心转向"AI驱动",通义千问和阿里云已取得局部突破 [9] - 面临三大挑战:全栈AI基础设施建设、多业务协同、组织效率提升 [9] - AGI(通用人工智能)被列为首要目标,预判AI产业可能影响全球50%GDP构成 [14] 重启创业模式的举措 - 复刻湖畔花园物理空间,强化"从零开始"的创业心态 [4][11] - 通过"核心战役"机制聚焦资源,避免大公司病 [11] - 强调主人翁精神,要求打破路径依赖和组织惯性 [11][12] 未来增长路径 - 十倍增长需通过AI重构业务系统而非优化现有流程 [14] - 云业务从"卖算力"转向"卖AI生产力",开放垂直行业模型定制 [14] - 公司明确"创造者"定位,认为守成心态将导致衰退 [12][15]
开启从设计到多元生态的进化之路 奥雅股份联合创始人李方悦分享IP赋能的创新实践
每日经济新闻· 2025-05-08 12:42
公司发展历程 - 公司成立于1999年,最初专注景观规划设计领域,凭借专业精神在市场中崭露头角[3] - 2021年公司正式上市,标志着从设计企业向轻资产文旅开发运营企业的转型[1] - 目前已形成创新设计、洛嘉儿童、文旅开发运营、AGI与数字艺术等多元化业务布局[1][3] 战略转型与业务布局 - 公司启动战略转型,从单一设计企业成功转型为轻资产文旅开发运营企业[3] - 旗下拥有洛嘉儿童、悦起文化、洛塔智能游乐等7个子品牌,在全国完成4000多个项目[4] - 以深圳为总部,在国内外设立30余家分支机构,拥有超1000位行业精英的国际化团队[4] 核心竞争优势 - 公司构建"双轮驱动+双引擎"发展模式,激活创新设计与亲子文旅两大核心业务协同效能[5] - 推出城市文旅焕新大模型,利用自有算力和行业数据积累为城市更新等场景提供解决方案[5] - 悦起文化公司聚焦IP矩阵孵化与商业化运营,打造"IP+场景+运营"闭环生态[5] 未来发展方向 - 公司进入4.0时代,定位为存量资产增值服务商与亲子文旅品牌运营商[5] - 对标泡泡玛特模式,致力于打造千亿市值生态,开启IP商业化跨界发展之路[5] - 通过"奥雅样本"为文旅产业注入创新活力,分享亲子文旅IP生态破局经验[5] 行业影响力 - 公司联合创始人李方悦将在中国上市公司品牌价值榜发布会上分享品牌赋能经验[1] - 代表作品包括深圳The Silos大筒仓、唐山皮影主题乐园等大型综合性文旅项目[3] - 公司形成辐射全国、连接世界的服务网络,具备国际化服务能力[4]
阶跃星辰姜大昕:多模态目前还没有出现GPT-4时刻
虎嗅· 2025-05-08 11:50
公司概况 - 阶跃星辰由前微软全球副总裁姜大昕于2023年创立,总部位于上海,北京办公室距离微软中国办公地仅504米 [1] - 公司核心管理团队包括CEO姜大昕(战略与技术研发)、首席科学家张祥雨(技术研发)、系统负责人朱亦博(AI基础设施) [1] - 公司员工规模达400余人,其中80%为技术研发人员,采用扁平化管理模式,员工可通过私信直接与CEO沟通 [2] - 2024年12月完成B轮数亿美元融资,是"AI六小虎"中少数坚持预训练路线的公司 [3] 技术战略 - 核心聚焦多模态基础模型研发,坚持"理解生成一体化架构"技术路线,认为这是实现AGI的必经之路 [1][11] - 已建立Step系列通用大模型矩阵,涵盖语言模型和多模态模型,2024年下半年多模态API调用量增长超45倍 [1][11] - 2025年1月发布推理模型Step R1-V-Mini,计划未来三个月推出满血版Step-R1 [14] - 近期将算法团队重组为"生成理解"团队,体现对理解生成一体化架构的重视 [1] 行业趋势判断 - 多模态领域尚未出现"GPT-4时刻",核心瓶颈在于缺乏统一的理解生成一体化架构 [1] - 模型演进路径分为三阶段:模拟世界(模仿训练)→探索世界(强化学习)→归纳世界(自主发现规律) [5][7] - 当前两大技术趋势:1) 将长思维链推理能力融入语言/多模态模型 2) 视觉领域理解生成一体化 [18][19] - 智能体(Agent)发展需要两个条件:多模态能力和慢思考能力,2024年这两方面取得突破性进展 [31] 产品应用 - 主要收入来源:面向品牌客户的ToB服务和面向开发者的API接口业务 [3] - 已推出Step 1X-Edit图片编辑模型,采用初级理解生成一体化技术,未来几个月将发布更先进版本 [30] - 重点布局智能终端Agent生态,与手机、汽车、机器人领域头部企业合作,提供云端Agent开发平台 [34][35] - 实际应用案例包括茶百道/瑞幸门店巡店系统,通过视觉推理实现90%以上的操作规范检测准确率 [17] 竞争格局 - 基础模型领域竞争激烈,过去半年仅OpenAI/Google/Meta/Grok/Anthropic就发布不少于8款新品 [3] - 国内竞争对手包括月之暗面、MiniMax等,但阶跃星辰在多模态覆盖广度和原生多模理念上具有差异化优势 [3][12] - 公司认为当前竞争焦点仍是"追求智能上限",将持续投入强化学习和多模态前沿技术研发 [4][15]
小米开源首个推理大模型 曾说不做OpenAI类大模型,现开出百万元年薪给团队“招兵买马”
每日经济新闻· 2025-05-01 16:08
4月30日,小米开源其首个推理大模型Xiaomi MiMo,同时公开了一个此前未曾公开露面的团队:小米大模型Core团队。根据小米 自己的说法,该模型只是团队的初步尝试。至于为何还是赶了"晚班车",小米方面称,2025年虽看似是大模型逐梦的后半程,不 过还是坚信AGI(通用人工智能)征途仍漫长。 参数方面,根据介绍,小米经强化学习训练形成的MiMo-7B-RL模型,在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,用7B参数规模,得分超过了OpenAI的闭源推理模型o1-mini和阿里Qwen开源推理模型QwQ-32B-Preview。 在这篇推介自家大模型的文章末尾,小米还默默公开了一个简历投递邮箱,为刚成立不久的团队"招兵买马"。 每经记者 杨卉 每经编辑 魏官红 曾说不做OpenAI类大模型的小米变了。 《每日经济新闻》记者注意到,在部分招聘软件上,小米已经上线了大量与大模型相关的招聘信息,如"大模型算法专家""大模型 推理工程师""大模型数据策略工程师"等,其中公布的年薪最高可达128万元。此外,从招聘详情里也能看到小米给大模型落地找 到的一些场景,如智能门 ...
AI浪潮录丨对话刘知远:通往AGI不易,长跑要顶住资本寒冬
贝壳财经· 2025-04-29 01:18
北京AI产业发展现状 - 北京已成为AI大模型领域的战略高地,汇聚了智源研究院、月之暗面、DeepSeek、智谱等人工智能独角兽 [1] - 北京正积极打造"全球开源之都",开源生态已深入汽车、机器人等行业 [1] - 智源研究院发布的"悟道2.0"成为中国第一个万亿大模型 [4] 中国AI技术发展历程 - 2011-2012年科技部973计划项目投入数千万元支持自然语言处理研究,是国内最早的大规模专项支持 [6] - 2013年word2vec方法发布,国内团队立即跟进,与国外领先水平差距约3-4年 [6] - 2018年BERT模型发布,国内团队转向预训练模型研究,同年推出首个知识增强预训练模型ERNIE [7][8] - 2020年GPT-3发布,国内团队训练了CPM(中文预训练模型)第一个版本 [10] - 2024年DeepSeek成功复现OpenAI的o1模型,中美技术差距缩小至半年 [9] 智源研究院的作用 - 采用"投资就是投人"理念,成为顶尖学者的"天使投资人",支持面向未来的科研探索 [11] - 支持机制灵活,2020年拨款数百万元购置10台A100 GPU机器用于大模型训练 [10] - 通过"小同行评议"选拔优秀学者,支持青年科学家3年,理念先进 [11] 企业发展战略 - 面壁智能采取"小而美"的端侧模型战略,避开大厂竞争,从局部优势领域出发 [17][19] - DeepSeek通过算法创新与高效训练克服算力限制,2024年DeepSeek-R1火爆市场 [20] - AI创业者终极目标是奔向AGI,但需要分阶段实现,是一场"持久战" [17][18] 行业竞争格局 - 2023年后国内AI领域明显加速,多个AI"小龙""小虎"涌现,大模型百花齐放 [5][15] - DeepSeek的成功证明中国AI技术已具备国际竞争力,中美差距正在缩小 [5][20] - 行业需要更多耐心,中国可能涌现10个以上类似DeepSeek的企业 [21][22] 技术发展趋势 - AI发展两大主旋律:能效更高(Densing)和能力更强 [20] - 端侧大模型在数据保护、隐私安全方面具有优势,适合汽车座舱等场景 [19] - 未来将通过提高模型能力密度来获得市场竞争力 [20]
李善友:DeepSeek,是国运的AI支点
混沌学园· 2025-04-27 10:16
AI行业发展趋势 - 未来20年将是AI在中国的黄金发展期 [2] - 当前处于AI黎明阶段,技术变革速度达到10倍速 [57] - AGI实现时间预测在2026-2029年间 [52] - 中国正从技术跟随者转变为技术贡献者 [156] OpenAI发展历程 - 2015年成立时定位为非营利实验室,目标是开发安全开源AI [6] - 核心团队包括马斯克、奥特曼和Ilya [7] - 技术演进路径:从Transformer架构到GPT系列模型 [35][39][45] - ChatGPT发布5天用户破百万,2个月破亿成为增长最快应用 [44] - 最新o1模型准确率从GPT的13%跃升至83% [47] - 公司已从开源转向闭源,估值达3000亿美元 [228][230] 关键技术突破 - 1943年McCulloch和Pitts提出MP神经单元模型,奠定神经网络基础 [24][26] - 1986年Hinton提出反向传播算法,成为深度学习核心技术 [30][31] - 2012年AlexNet在ImageNet大赛错误率降至15%,证明深度学习可行性 [33] - 2017年Transformer架构问世,成为智能革命的"内燃机" [35][37] - Scaling Law法则:模型参数、数据量和GPU规模越大性能越强 [41] DeepSeek创新路径 - 2025年1月发布DeepSeek-R1,成为中国AI发展重要里程碑 [61][64] - 采用MLA和MoE架构,训练成本仅557万美元,为同类1/10 [75][81] - R1模型采用GRPO算法实现纯强化学习,公开推理过程 [89][91][98] - 定位为开源AI实验室,专注基础研究而非商业化 [110][118][123] - 团队由本土年轻人才组成,采用涌现式组织模式 [175][179][185] 行业竞争格局 - OpenAI已从挑战者变为行业主导者,商业化导向明显 [204][229] - DeepSeek填补了OpenAI放弃的开源生态位 [272][275] - 中国企业在基础研究领域开始突破传统跟随模式 [125][156][282] - 算力限制和芯片禁运是中国AI发展主要挑战 [71][72][280] 技术创新方向 - 涌现现象是AI发展的核心机制 [27][136] - 大语言模型成为智能时代基础设施 [46][282] - 工程创新在资源受限情况下展现巨大价值 [67][73][97] - 组织交互模式创新对技术突破至关重要 [179][183]
4.25犀牛财经晚报:腾讯音乐拟收购喜马拉雅 传Manus融资7500万美元
犀牛财经· 2025-04-25 10:38
上市公司董监高违反公开承诺案 - 全国首例上市公司董监高未履行公开增持承诺引发的证券侵权纠纷案件宣判 袁某、罗某在无资金准备情况下作出增持承诺 并以过桥资金制作虚假存款证明 构成虚假陈述 [1] - 上海金融法院判令袁某、罗某共同赔偿两名原告投资损失合计783,537.38元 其中刘某某获赔506,130.96元 郑某某获赔277,406.42元 [1] - 金某泰化工尽到基本审查义务 无证据表明其知晓虚假陈述行为 故不承担民事赔偿责任 [2] 科技企业动态 - 蚂蚁集团推出"Plan A"AI人才专项计划 面向全球招募顶尖AI硕博毕业生 首场宣讲会在新加坡ICLR 2025峰会举办 将加强AGI领域研发投入 [2] - 腾讯音乐拟收购喜马拉雅 交易已启动两个月 管理层已签字 但需监管部门批准 喜马拉雅在职人员超2300人 [2] - Manus据传完成7500万美元融资 由Benchmark领投 估值达5亿美元 计划拓展美国、日本和中东市场 [3] 人事变动 - 摩根士丹利任命胡霁光为中国区副主席 将推动中国地区投行业务增长 [3] - 曹慰将出任平安银行信用卡中心总裁 原为招商银行信用卡中心副总经理 [5] 企业运营 - 英特尔将裁撤约2万个工作岗位 占员工总数五分之一 裁员从第二季度开始持续数月 2024年8月已裁员1.5万人 [3] - 猿辅导回应武汉员工猝死事件 称事发时正值倒休假期 未安排加班 已成立专项工作组处理后续事宜 [5] 资本市场动态 - 林文杰以3.90亿元竞得汉富控股持有的全新好4500万股股票 占总股本12.99% 买入价8.67元/股 较市价溢价33.17% [4][5] - 千分一智能启动IPO辅导 为触控书写解决方案供应商 拟A股上市 [6] - 粤芯半导体启动IPO辅导 从事12英寸芯片制造 拟A股上市 [6] 上市公司业绩 - 中国电信一季度营收1345.09亿元 同比持平 净利润88.64亿元 同比增长3.11% [6] - 兴业证券一季度营收27.92亿元 同比增长17.48% 净利润5.16亿元 同比增长57.32% [7] - 金海高科一季度营收2.27亿元 同比增长20.57% 净利润4367.87万元 同比增长132.17% [8] - 东吴证券2024年营收115.34亿元 同比增长2.24% 净利润23.66亿元 同比增长18.19% 拟10派2.37元 [9] - 大商股份2024年营收69.49亿元 同比下降5.20% 净利润5.86亿元 同比增长16.05% 拟10派10元送1股 [10] 市场表现 - 创业板指涨0.59% 沪深两市成交额1.11万亿元 较前日放量45.5亿元 超2800只个股上涨 [11] - 电力板块表现强势 西昌电力等10余股涨停 算力股反弹 拓维信息涨停 统一大市场概念股冲高 [11]