Workflow
大语言模型
icon
搜索文档
突发!字节Seed大语言模型负责人被开除损失数千万
是说芯语· 2025-06-24 02:05
公司人事变动 - Seed大语言模型负责人乔木因违反公司"利益冲突禁止场景"规定被立即辞退并扣除全部年终奖金,其与团队HRBP发展亲密关系且未履行申报流程并提供虚假陈述 [1] - 乔木2014年加入字节跳动,职级推测为4-2或5-1,年薪保守估计1000万元以上,参照同团队负责人周畅"4年5000万"级别待遇 [1] 员工薪酬与期权价值 - 字节跳动2014年期权价格5美元/股,最新回购价达189美元/股,涨幅38倍 [2] - 若乔木2014年获得100万元期权且未提前回购,当前价值约3900万元 [2] - 乔木在字节跳动11年累计总收入保守估计超5亿元人民币,包含薪资与多轮期权收益 [2] AI业务发展 - Seed是豆包大模型团队内部代号,创始人张一鸣自2023年下半年起每月参与一次核心技术团队复盘会,显示高度重视 [2] - Seed1 5-VL多模态大模型已发布,在60个评测基准中38个取得SOTA表现,推理成本显著降低并通过火山引擎开放API [3]
人工智能对社会科学研究影响深远
科技日报· 2025-06-24 02:01
人工智能在社会科学研究中的应用 - 人工智能作为引领科技革命和产业变革的战略性技术,正深刻改变人类生产生活方式,并加速各领域科技创新突破 [1] - 大语言模型等生成式人工智能工具正以前所未有的速度改变社会生活,为社会科学研究提供新工具并丰富研究议题 [1] 人工智能重塑社会科学研究方法 - 大语言模型凭借自然语言与人类行为模拟能力,降低研究成本并拓展方法边界,成为可嵌入式研究辅助系统 [3] - 在文本分析方面,大语言模型在情感识别、立场判断等任务中准确率接近人工编码水平,优于传统关键词匹配方法 [3] - 在合成调查数据方面,大语言模型可模拟受访者生成低成本合成数据,填补传统调查缺失值并提升可控性 [4] - 在模拟人类互动方面,生成式人工智能提供低成本、高可控虚拟实验平台,例如斯坦福大学"虚拟小镇"项目展示集体行动自然生成机制 [5] 人工智能技术应用的挑战 - 大语言模型存在"黑箱"特征,缺乏透明度,对提示词敏感且输出不稳定,影响研究可复制性和可验证性 [6] - 模型持续迭代削弱结果再现性,需同步推进对输出一致性与可靠性的系统研究 [6] 人工智能拓展社会科学研究议题 - 人工智能治理成为公共政策核心议题,涉及制度设计、伦理边界、安全审查等研究 [8] - 人工智能作为通用技术,其部署对国际格局、社会结构、经济发展模式等产生深远影响,例如可能加剧技术弱国对强国的依赖 [9] - 大语言模型应用中暴露的社会偏见(如对低教育群体和发展中国家的系统性偏误)为社会科学提供反思人类潜在偏见的新窗口 [9] 人工智能技术偏误的实证研究 - 主流模型在预测低教育群体和发展中国家时误差显著,国产模型在中国语境表现更优,偏误源于训练语料的结构性失衡 [10] - 人工智能并非中性工具,而是嵌入特定社会语境的技术产物,需从理论层面解构其文化背景 [10]
捷利交易宝(08017)拟折让约14.86%发行8000万股配售股份 净筹约4963万港元
智通财经网· 2025-06-24 01:46
配售协议 - 公司与配售代理订立协议,以每股0.63港元配售8000万股新股,占公告日已发行股份总数的13.33%,占配售完成后经扩大已发行股份总数的11.76% [1] - 配售价较协议日收市价0.74港元折让14.86%,较前五个交易日平均收市价0.726港元折让13.22% [1] 资金用途 - 配售所得款项总额5040万港元,净额约4963万港元,每股净价约0.62港元 [2] - 资金拟用于开发DeepTrade实时交易引擎、TradeSeek人工智能互动系统、升级LiveReport大数据产品及暗盘市场交易系统 [2] 执行安排 - 配售股份将根据一般授权配发及发行,并向上市委员会申请批准上市及买卖 [1][2] - 配售对象为不少于六名独立第三方承配人 [1]
字节“开除” Seed 大模型负责人,因亲密关系踩红线
程序员的那些事· 2025-06-24 00:46
字节跳动廉政通报事件 - 字节跳动Seed大语言模型负责人乔木因未申报利益冲突及虚假陈述被辞退,涉事HRBP程某同时被辞退并扣罚全部年终奖 [1] - 涉事双方存在亲密关系且属于公司禁止的利益冲突场景(上下级关系/共同直属上级/HRBP关系)[1] - 乔木原为字节跳动核心高管,直接向CEO梁汝波汇报,负责豆包大模型团队 [1] 事件背景与调查过程 - 事件源于2025年3月乔木妻子罗某的实名举报,曝光婚内出轨及财产隐瞒证据 [1] - 调查初期两人均否认关系,利用HRBP与业务管理者的密切关系及高管话语权暂时隐瞒 [2] - 后续确凿证据导致谎言败露,公司内部系统已删除两人信息 [1] 公司处理方式 - 处理结果被低调置于廉政通报末条,内部飞书系统显示两人状态均为"已离职" [1] - 通报措辞显示处理是"总要给个交代"的结果,暗示事件发酵已久 [1]
研发费用一降再降、市场份额2.8%,海致科技闯关资本市场
北京商报· 2025-06-23 12:14
公司概况 - 海致科技成立于2013年 专注于大数据收集、整合与管理、数据运算及人工智能应用 先后推出图谱解决方案和智能体[1] - 公司2024年经调整净利润转正 达到1693.2万元人民币[1] - 按2024年营收计 公司在中国产业级AI智能体提供商中排名第五 市场份额2.8% 前三名市场份额分别为22.6%、12.9%和12.8%[1] 财务表现 - 2022-2024年总收入持续增长:3.13亿元→3.76亿元→5.03亿元人民币[2][3] - 毛利率逐年提升:30.9%→35.2%→36.3%[6] - 2022-2023年经调整净亏损:1.43亿元→8370.4万元人民币 2024年实现经调整净利润1693.2万元[6] - 税前亏损状况:2022年亏损1.78亿元 2023年亏损2.72亿元 2024年亏损9459.4万元[2] 业务构成 - Atlas图谱解决方案为营收主要来源 2022-2024年占比:100%→97.6%→82.8%[3] - Atlas智能体业务2023年开始产生营收 890.3万元→8655.3万元 占比从2.4%增至17.2%[4] - 2024年78.9%的智能体客户由图谱解决方案客户转化而来[4] - 智能体客户数量显著增长:2023年2个→2024年19个 其中图谱解决方案客户从1个增至13个[4] 费用结构 - 研发费用持续下降:8694.2万元→7270.6万元→6068.1万元 2024年同比下降16.5%[7] - 销售及营销费用高于研发费用:1.15亿元→8629.2万元→6779.6万元[8] - 销售成本逐年上升:2.16亿元→2.43亿元→3.21亿元[10] - 2024年研发团队556人 研发费用中员工福利支出5225.2万元 销售团队103人 销售费用中员工福利支出4879.6万元[9] 技术优势与竞争地位 - 公司定位为"中国首家通过知识图谱有效减少大模型幻觉的AI企业"[3] - 产品体系包括DMC数据智能平台、Atlas知识图谱平台和高性能图数据库平台AtlasGraph[3] - 2024年中国产业级AI智能体市场前五名公司共占58.1%市场份额[12] 资本结构 - 赎回负债账面金额变动:2022年为0 2023年-4896.9万元 2024年-7609.2万元[12] - 该负债与重组项下向投资者发行的金融工具相关[12] 发展战略 - 未来战略包括增强工程技术能力、扩展解决方案组合、拓展客户群和探索海外市场 推进战略性并购[12] - 公司承认行业竞争异常激烈 需保持技术领先地位[7]
开发出火遍全球的新冠疫情地图的中国留学生,发表最新论文:利用AI大模型预测疫情
生物世界· 2025-06-22 08:17
全球新冠疫情数据可视化地图 - 新冠大流行期间,约翰·霍普金斯大学开发的全球新冠疫情数据可视化地图单日访问量一度高达20亿,成为多国政府及媒体广泛引用的疫情追踪系统 [1] - 该地图由该校两位中国留学生董恩盛、杜鸿儒开发,结合自动化数据采集与人工审核机制实现高可靠性 [1][3] PandemicLLM模型技术突破 - 研究团队开发的多模态大型语言模型PandemicLLM通过融合文本政策、基因组数据、时空流行病学数据,实现疫情实时预测,预测性能显著优于传统模型 [3] - 首创"五级趋势分类法",采用疾控中心认可的住院趋势分类(大幅下降、温和下降、稳定、温和上升、大幅上升),提升决策效率 [8] - 实现"零样本"应对新变种,如BQ.1变种出现时无需重新训练模型,仅需添加特性描述即可提升28.2%预测准确率 [9] 传统模型痛点 - 传统模型存在四大缺陷:无法处理政策文本等非数值数据、新变种响应滞后需重新训练、预测结果可读性差、三分之二模型曾在疫情拐点预测失误 [10] 多模态数据处理 - PandemicLLM通过AI-人类协作提示词设计,将政策文本转化为防控力度变化描述(如"学校从强制关闭转为建议关闭"),基因监测数据解析为病毒特性(如"BQ.1变种传播力比BA.5高40%") [11] - 时空数据转化为排名描述(如"加州老年人口比例全美前五"),时间序列通过GRU神经网络编码关键趋势 [11] 模型测试表现 - 全美50州19个月测试显示:1周预测准确率56%(较传统模型提升20%),3周预测准确率46.4%(误差率降低22%),700亿参数版本准确率达57.1% [17][23] - 当模型对"大幅上升"判断置信度>85%时,实际发生概率达73%(1周)和64%(3周) [18] - 在疫情趋势一致的西部沿海、五大湖区表现最佳,政策多变地区如怀俄明州仍需优化,建议开发区域定制模型 [19] 行业影响 - 该研究开创AI辅助公共卫生决策新范式,未来决策者或可获取"风险趋势解读报告"而非原始数据 [24] - 研究成果发表于Nature Computational Science,论文链接提供完整技术细节 [25]
大模型到底是怎么「思考」的?第一篇系统性综述SAE的文章来了
机器之心· 2025-06-22 05:57
文章核心观点 - 稀疏自编码器是一种新兴的机制可解释性技术,能够将大语言模型内部的黑盒表示分解为一组稀疏且具备明确语义的激活特征,从而揭示模型的“思维”过程 [2][10] - SAE不仅是一个可解释性工具,更可用于控制模型输出、发现模型问题及提升模型安全性,实现了从“看得懂”到“改得动”的跨越 [11][23] - 该技术正受到包括OpenAI、Anthropic、Google DeepMind在内的领先机构的积极研究和推进 [11] SAE的技术框架 - SAE的基本结构包含编码器、解码器和稀疏性损失函数,编码器负责将LLM的高维向量分解为更高维的稀疏特征向量,解码器则尝试重建原始信息 [14] - 存在多种架构变体以改进SAE,例如解决收缩偏差的Gated SAE和通过直接选择Top-K激活来强制稀疏性的TopK SAE [15] SAE的可解释性分析 - SAE支持概念探测,能自动从模型中挖掘具有语义意义的特征,如时间感知、情绪倾向和语法结构 [16] - 通过模型操控功能,可以激活或抑制特定特征,从而定向引导模型输出,实现精细的行为控制 [16] - SAE可用于异常检测与安全分析,帮助识别模型中潜藏的高风险特征单元,发现潜在的偏见或安全隐患 [16] SAE的评估指标与方法 - 对SAE的评估分为结构性评估和功能性评估,结构性评估关注重建准确度和稀疏度等内部构造指标 [17][18] - 功能性评估则检验SAE在理解LLM方面的实际效果,以及所学特征的稳定性和泛化能力 [17][18] SAE在大语言模型中的应用 - SAE的应用案例广泛,涵盖模型操控、行为分析、拒答检测、幻觉控制和情绪操控等多个方面 [19] - 其“解释+操控”的结合使其在LLM可解释性研究中脱颖而出,具备实际操作的潜力 [11][19] SAE与Probing方法的对比 - 与传统Probing方法相比,SAE作为一种新兴的机制可解释性方法,在模型操纵和特征提取方面展现出独特潜力 [20] - 然而,在数据稀缺、类别不平衡等复杂场景下,SAE要提供一致优势仍面临挑战 [20] 当前研究挑战与未来方向 - SAE当前面临的挑战包括语义解释不稳定、特征字典不完整、重构误差不可忽视以及训练计算成本较高 [21] - 未来可能的突破方向包括跨模态扩展、自动解释生成和架构轻量化等 [21]
大模型为何难成为「数学家」?斯坦福等揭示严谨证明中的结构性弱点
机器之心· 2025-06-22 04:26
数学推理与AI研究 - 数学证明需要逻辑闭合和严谨推理过程,不等式问题是检验模型推理能力的理想对象[1] - 当前形式化数学系统如Lean、Coq要求极高精度,难以规模化应用于中学到奥数级别的不等式问题[1] - 大语言模型在非形式化推理方面表现出色,能给出看似合理的答案并模仿人类初期思维方式[1] IneqMath创新方法 - 研究团队提出将不等式证明拆解为"界限估计"和"关系预测"两个子任务[2][7] - 构建首个奥林匹克级不等式证明基准数据集IneqMath,包含1,252道训练题目和200道测试题目[11][12] - 数据集覆盖83种定理和29个定理类别,测试集由IMO奖牌得主设计并经数学家审核[12] 评估框架 - 开发LLM-as-Judge框架,包含五种自动评审器评估模型推理严谨性[20] - 评审器系统在与人工标注对齐的任务上达到F1=0.93的表现[24] - 框架可判断模型是"碰巧答对"还是每个推理节点都正确[23] 研究发现 - 存在Soundness Gap现象:模型最终答案准确率与推理严谨性差距显著[27] - Grok 3 mini最终答案准确率71.5%,但逐步评审后骤降至6.0%[29] - 模型规模增大能提升猜测准确率,但对推理严谨性提升有限[30] - 增加推理token数仅带来轻微提升,很快进入饱和状态[32] 改进策略 - 自我批判提升策略为Gemini 2.5 Pro带来约5%的准确率提升[42] - 定理提示策略使Gemini 2.5 Pro准确率提升约10%[42] - 研究团队设立动态更新的排行榜推动模型在严谨数学推理上的进步[36] 研究团队 - 项目由斯坦福大学、麻省理工学院和加州大学伯克利分校的研究者联合完成[44] - 负责人Pan Lu是斯坦福大学博士后研究员,研究方向包括大语言模型和数学发现[45] - 合作者包括MIT博士生Alex Gu和斯坦福大学博士生Jikai Jin[46][47]
广联达(002410) - 002410广联达投资者关系管理信息20250621
2025-06-21 13:35
分组1:产业AI要素与公司优势 - 做好产业AI的三个关键要素为高质量数据、高价值场景、高可靠模型 [2] - 广联达在产业AI上的优势包括有自研大模型AecGPT、内置工程建设知识库、更懂图纸解析、领域知识回答更优、建筑工作流编排更优 [2] 分组2:AI价值场景落地 - 公司将建筑行业大模型与工程软件深度融合,提供智能化设计、交易、施工、运维、企业等系列应用产品及解决方案 [2] - AI场景落地方向为设计一体化、成本精细化、施工精细化 [2] 分组3:高价值AI应用特点 - 高价值AI应用应能从头到尾闭环交付 [4] - 其价值能被明确度量,如AI智能评标在海南使市场主体参与投标数量提升约10倍,节约财政资金约45.6亿元,平均中标下浮率为8% [5] - 能在过程中持续学习和优化 [5] 分组4:AI智能评标商业化落地 - AI产品商业化落地与技术成熟阶段相关,2024年交易阶段AI产品落地多,后续项目建设施工阶段AI应用价值将更凸显 [5][6] - AI智能评标通过减少人为干预保障公平公正,提升效率,破除地域限制,带来新增需求 [6] 分组5:未来高价值AI场景突破 - 技术维度上,多模态大模型突破后可带动施工现场安全管理需求场景,满足政府和企业对安全管理的需求 [6] - 市场维度上,新清单激发行业数据管理需求,AI自动建库可提高建库效率,产品已进入验证阶段,后续将规模化推广 [7]
车企造人,急不来
虎嗅APP· 2025-06-19 14:42
车企布局机器人赛道现状 - 半年前机器人概念成为车企估值翻倍催化剂,特斯拉发布视频后超十家车企跟进布局[1] - 小鹏、小米、广汽已推出产品,理想计划进场,蔚来处于调研阶段,赛力斯/长安/比亚迪组建近200人团队[1] - 上汽、北汽、奔驰通过投资方式参与,行业普遍将机器人视为新增长点[1][3] 车企跨界机器人的底层逻辑 - 硬件复用:自动驾驶摄像头/激光雷达等可直接迁移[2] - 软件迁移:自动驾驶算法和数据闭环能力可复用[2] - 资源共享:汽车制造/销售网络为机器人提供应用场景[2] - 市场潜力:中国人形机器人规模预计从2024年27.6亿元增至2029年750亿元,2030年出货量或达35万台[2] 技术实现难点 硬件瓶颈 - 人形机器人硬件标准化程度不足20%,关键部件如电机/灵巧手/传感器存在技术路线争议[7][10] - 特斯拉Optimus通过定制化调优实现基础动作能力,国内小米等企业正投入灵巧手研发[10] - 工业场景要求机器人具备1.8米操作高度,目前仅优必选等少数企业达标[19] 软件与数据挑战 - 机器人需处理三维空间多模态数据,力觉/触觉传感器增加数据采集复杂度[12] - 行业缺乏统一数据获取范式,特斯拉/Google采用摇操采集耗资千万美元[14] - 验证scaling law需1000万条数据,当前企业采集量不足100万条[15] 工业场景落地困境 - 总装线非标任务(搬运/质检/线束整理)超出当前机器人能力范围[17] - 机器人搬运效率仅为工人50%,优化后仍需2分钟完成工人1分钟的工作[19] - 成本劣势明显:特斯拉Optimus成本43.4万元,优必选售价50-60万元,远高于比亚迪18万元/年用工成本[20] - 实际应用滞后:特斯拉仅几十台参与搬运,Figure在宝马工厂仅2台非生产时段训练[22][23] 行业真实进展 - 上海车展车企多展示机器人作为"车模",未实现工厂应用[4] - 特斯拉/优必选等头部企业仍处实训阶段,优必选计划2024年交付数百台[22] - 行业普遍存在宣传与实际差距,多数企业停留在PPT阶段[5][23]