大模型

搜索文档
山东将奖补垂直领域行业大模型和语料库
大众日报· 2025-09-15 01:04
人工智能产业规模 - 山东人工智能产业上半年产值突破650亿元 约占全国9% [1] 政府资金支持政策 - 省级统筹3000万元资金奖励优秀垂直领域行业大模型和高质量语料库 [1] - 2025年起每年奖补30个大模型项目 三年形成100个优秀垂直领域行业大模型 [1] - 大模型项目经评审可获得最高不超过100万元一次性奖补 [1] - 语料库项目每年遴选不超过20个 采取揭榜挂帅方式 [2] - 语料库项目最高可获得150万元奖补(揭榜成功75万元+验收优秀75万元) [2] - 验收不合格项目将被收回全部奖补资金 [2] 技术发展重点 - 山东重点发展垂直领域专用大模型培育与赋能应用 [1] - 大模型需通过第三方专业评测并落地应用 服务于科技/产业/政务/民生等领域 [1] - 语料库由海量文本/代码/图像构成 是模型训练的基础 [2] - 青岛国实"海悟"大模型基于4000多万高质量海洋专业语料训练 [2] 产业生态建设 - 算法相当于整车设计与控制系统 算力相当于发动机 数据语料相当于燃料 [3] - 山东已在算力/语料/大模型等重要领域分别出台财政奖补措施 [3]
王兴兴:机器人最大的问题还是AI模型?大模型怎么不够用了?
36氪· 2025-09-15 00:21
核心观点 - 机器人硬件已足够支撑1-2年使用 但AI大模型在多模态融合和实际控制应用方面能力不足 阻碍了机器人智能水平提升 [4] - 大模型虽在语言和视频单模态表现良好 但结合语言与图像的跨模态理解仍是难点 导致无法有效驱动硬件执行复杂任务 [4] - AI在信息处理领域表现优异 但在物理世界"干活"领域仍处于早期发展阶段 尚未迎来爆发性增长 [4] 机器人硬件与AI模型发展差异 - 机器人硬件近年来显著进步 传感器和执行器使机器人具备环境感知和运动控制能力 已完全满足当前应用需求 [10] - 硬件进步未转化为智能提升 因大模型思维方式与人类存在巨大差异 缺乏直觉经验和本质理解能力 [11] - 人类凭本能完成的任务 如物体用途识别和场景氛围理解 大模型需要大量标注数据和长时间训练才能实现 [11] 大模型应用局限性 - 仅能替代基础性重复性工作 如客服问答内容创作和工业自动化 但无法处理多步骤推理和跨领域知识整合 [11] - 处理家庭服务场景时表现力不从心 例如"找昨天快递"任务需要综合理解时间物品空间位置并具备视觉搜索能力 [12] - 目前处于工具化阶段而非智能体阶段 能力边界清晰 难以应对真实世界的模糊性与不确定性 [12] 多模态融合挑战 - 纯语言模型或纯视频模型效果非常好 但语言与图像结合仍是较大难点 影响机器人硬件效能发挥 [4] - 模型控制灵巧手等精密操作存在挑战 没有很好方法将硬件能力充分利用 [4] - 对隐喻双关语和文化背景表达理解不足 在人类语言微妙之处处理方面仍有很大差距 [8] 具身智能发展现状 - 工具化机器人可完成特定场景操作如搬运清扫 但距真正人类式工作仍有巨大困难 [14] - 需要具备生活常识情感理解和社交沟通能力 目前表演性动作与实际家务劳动需求差距巨大 [14] - 构建符合实际工作需求的大脑需要大量模型训练和实践积累 目前仍处于漫长发展道路 [14] 大模型进化方向 - 简单低质量增加参数规模意义不大 虽提升性能但带来训练成本高昂和推理速度慢等问题 [15] - 需优化训练方法和算法 提高训练效率和质量 以更少数据和计算资源获得更好性能 [15] - 加强大模型与机器人硬件深度融合 通过传感器数据实时反馈实现软硬件协同优化 [15]
蚂蚁开源2025外滩大会发布大模型全景图,AI开发现三大趋势:工具、路线与生态分化
搜狐财经· 2025-09-14 15:25
在2025 Inclusion·外滩大会AI开源见解论坛上,蚂蚁开源与Inclusion AI联合发布了《全球大模型开源开发生态全景与趋势报告》2.0版本。该报告基于GitHub 全平台项目分析,结合OpenRank算法筛选排名,收录了22个技术领域的114个高关注度开源项目,涵盖AI Agent与AI Infra两大方向。蚂蚁开源技术委员会副 主席王旭在论坛上指出,报告通过数据驱动的方式,客观呈现了全球AI开源生态的真实状况,既为行业提供参考,也彰显了中国在AI开源领域的活跃度。 报告指出,随着大模型能力提升,程序员的工作模式或将发生转变。未来,重复性工作可能更多由AI工具完成,开发者将更聚焦创意设计和复杂问题解 决。这一趋势可能重塑软件开发行业的分工模式,全球开发者对"AI助手"的需求持续攀升。 论坛上同步发布的2025大模型发展时间线全景图,梳理了当年1月至今国内外主流厂商的大模型发布动态,涵盖开放参数模型与闭源模型,并标注了模型参 数、模态等关键信息。该全景图为开发者和社区理解厂商竞争态势提供了直观参考。 报告还指出,当前大模型发展呈现几大关键方向:中美开源与闭源路线分化明显;模型参数在MoE架构下趋 ...
方舟健客(06086.HK)近期价格有所上升 发布杏石大模型作为其五项旗舰应用的基石
格隆汇· 2025-09-14 12:13
公司股价表现 - 公司股份于2025年9月12日在联交所价格有所上升 [1] 战略合作与业务发展 - 公司发布专有"杏石"大模型作为五项旗舰应用(AI用药助手、AI健康管家、AI医生助手、AI学术助手及AI搜索)的基石 [1] - 与信达生物制药达成战略合作 整合H2H数字健康生态系统与信达体重管理疗法管线 [1] - 初步利用杏石大模型为信达的玛仕度肽提供个性化数字维护及依从性支持 [1] - 与浙江大塚制药展开战略合作 结合AI技术优势与大塚创新药组合开发全方位数字解决方案 [1] - 合作内容包括药物支援服务、针对性病患外展项目及健康教育计划 [1] 信息披露声明 - 董事会确认新闻稿资料不构成内幕消息 [2] - 董事会不知悉股份交易价格上升之任何理由 [2]
方舟健客:H2H 大会消息非内幕消息 不知股价上涨原因
智通财经· 2025-09-14 12:11
公司股价表现 - 公司股份于2025年9月12日在联交所价格出现上升 [1] 战略合作与技术创新 - 公司发布专有"杏石"大模型 赋能五项旗舰AI应用(AI用药助手、AI健康管家、AI医生助手、AI学术助手及AI搜索) 提供临床诊断支援和个性化慢病管理服务 [1] - 与信达生物制药达成战略合作 整合H2H数字健康生态系统与信达体重管理疗法管线 通过杏石大模型为玛仕度肽提供个性化数字维护及依从性支持 瞄准中国快速增长的体重管理市场 [1] - 与浙江大冢制药有限公司展开战略合作 结合AI技术优势与创新药组合 共同开发覆盖药物支援服务、病患外展项目及健康教育计划的全方位数字解决方案 [1] 信息披露声明 - 董事会确认第十届H2H医疗服务生态大会相关新闻稿内容不构成内幕消息 [2] - 公司未发现导致股价上升的具体理由或需披露的内幕信息 [2]
方舟健客(06086):H2H 大会消息非内幕消息 不知股价上涨原因
智通财经网· 2025-09-14 12:06
公司股价表现 - 公司股份于2025年9月12日在联交所价格出现上升 [1] 战略合作与业务发展 - 公司发布专有"杏石"大模型作为五项旗舰应用的基石 包括AI用药助手、AI健康管家、AI医生助手、AI学术助手及AI搜索 赋能临床诊断支援和个性化慢病管理 [1] - 与信达生物制药达成战略合作 整合H2H数字健康生态系统与信达体重管理疗法管线 利用杏石大模型为玛仕度肽提供个性化数字维护及依从性支持 瞄准中国快速增长的体重管理市场 [1] - 与浙江大冢制药展开战略合作 结合AI技术优势与大冢创新药组合 共同开发覆盖药物支援服务、病患外展项目及健康教育计划的全方位数字解决方案 [1] 信息披露声明 - 董事会确认新闻稿资料不构成上市规则第13.09(2)条或证券及期货条例第XIVA部规定的内幕消息 [2] - 董事会不知悉股份交易价格上升的任何具体理由 或需要披露以避免虚假市场的任何内幕消息 [2]
招聘几位大佬,打算共创平台(世界模型/模型部署)
自动驾驶之心· 2025-09-14 03:44
业务拓展计划 - 公司计划在国内外招募10名业务合伙人[2] - 合伙人将负责自动驾驶相关课程研发、论文辅导业务开发及硬件研发[2] 技术研究方向 - 重点关注大模型/多模态大模型、扩散模型、VLA、端到端自动驾驶技术[3] - 涉及具身交互、联合预测、SLAM及3D目标检测领域[3] - 布局世界模型、闭环仿真3DGS、大模型部署与量化感知推理等前沿方向[3] 人才招募标准 - 要求应聘者来自QS200以内高校且具有硕士及以上学历[4] - 优先考虑拥有顶会论文发表记录的候选人[4] 合伙人待遇 - 提供自动驾驶行业资源共享包括求职、读博及出国留学推荐[5] - 设置丰厚的现金激励机制[5] - 开放创业项目合作与推荐机会[5]
科技周报|小红书被网信办处罚;滴滴称去年订单平均抽成14%
第一财经· 2025-09-14 03:34
平台经济监管动态 - 小红书因热搜榜单管理不善被网信部门约谈并处罚 公司成立整改专项工作小组推进热搜榜单生态治理 [1][3] - 滴滴公布2024年所有订单平均抽成比例为14% 平台称大部分资金用于司乘补贴及系统维护等各项费用 [2] 家电行业渠道变革 - 格力电器推进渠道扁平化改革 网批系统从"盛世"系列公司转入"恒信"系列公司 弱化代理环节强化零售 [4] - 渠道变革将原有核心代理商支撑模式转变为线上线下融合的新零售模式 上市公司逐步收回代理商环节利润 [4] 人工智能与机器人投资 - 阿里云首次投资人形机器人企业 领投具身智能公司自变量机器人近10亿元A+轮融资 [5] - 自变量机器人今年完成两轮融资 先后获得美团战略投资部和阿里云领投 互联网大厂资本持续看好具身智能赛道 [5] - 百度智能云与AR眼镜供应商谷东智能签署三年合作备忘录 将千帆大模型平台接入AR眼镜终端设备 [6][7] 机器人行业资本化进程 - 乐聚机器人完成股份制改造并更名 业内多家企业筹备IPO 大部分瞄准港交所 [8] - 人形机器人第一股临近 资本市场窗口期加速逼近 仅北京上海就有至少三家企业筹备上市 [8] 科技巨头动态 - 甲骨文股价单日飙升36% 市值增长2440亿美元至9220亿美元 创1992年以来最佳表现 [9] - 甲骨文创始人拉里·埃里森净资产单日暴增1000亿美元 一度超越马斯克成为全球首富 [9] - 公司云服务订单额达4550亿美元 同比增长359% 受人工智能需求推动 [9] 消费电子新品发布 - 苹果推出史上最薄iPhone Air 厚度5.6毫米重量165克 配备6.5英寸屏幕和A19 Pro芯片 [10] - 新机采用eSIM技术无需实体SIM卡 内部设计重构增加电池空间 定位中端市场填补产品线空白 [10]
大模型碰到真难题了,测了500道,o3 Pro仅通过15%
机器之心· 2025-09-14 03:07
研究背景与动机 - 现有大模型基准测试面临"难度-真实性"矛盾 考试类基准人为设置难度但实际价值有限 而基于真实用户交互的基准偏向简单高频问题[1] - 斯坦福大学等机构研究者探索在未解决问题上评估模型能力的新方式[2] UQ数据集构建 - 数据集包含500道未解决问题 涵盖计算机理论 数学 科幻 历史等主题 用于考察模型推理 事实准确性和浏览能力[3] - 问题来源Stack Exchange社区 经过三轮筛选:从300万原始问题中 基于规则筛选至33,916个(1.13%) 基于大语言模型筛选至7,685个(0.26%) 最终人工审核得到500题(0.02%)[10] - 数据集以科学类问题为主(395题) 其次为技术类(52题) 生活艺术类(35题)和文化娱乐类(16题)[7][11] - 问题被解决后会移除并替换为新未解决问题 保持数据集动态更新[12] 验证方法创新 - 开发UQ-Validators复合验证策略 利用生成器-验证器能力差距构建无真值验证系统[6] - 采用多模型验证流程:能力递增模型(o3-mini→o4-mini→o3)回答问题 然后相互验证答案[15] - 验证准确率提升速度快于答题准确率 模型能力越强验证优势越明显[16] 模型性能评估 - 表现最佳模型为OpenAI的o3 Pro 在500题中通过75题(15.0%) 其中4题被确认为正确解答[5][7] - Google的Gemini 2.5 Pro通过25题(5.0%) 其中3题正确 DeepSeek R1通过11题(2.2%) 其中1题正确[7] - Anthropic的Claude Opus 4通过7题(1.4%) Claude 3.7 Sonnet通过6题(1.2%) 均无正确解答[7] - 复合验证策略显著提升验证准确率 Claude 3.7 Sonnet准确率从21.6%提升至73.2% 精度从13.26%提升至20%[21] 验证偏见发现 - 所有模型在评估自身或同系模型时都出现过度乐观现象 预测性能远高于实际性能[24] - Gemini明显偏向自身 Claude对所有模型都过度乐观 OpenAI模型对同门模型评价过高[28] - 模型能力递增(o3-mini→o3)可降低但未消除偏见 复合验证器能显著削弱自我偏见与过度乐观[25][26] - 更强答案生成模型不一定是更强验证模型 o3作为答案模型弱于Gemini 2.5 Pro但作为验证模型更强[27] 平台与社区建设 - 建立UQ-Platform开放平台 让专家共同验证问题与答案 实现持续异步社区驱动评估[6] - 人类评审与验证器一致率达92-100% 理由链准确性达76-100% 验证器能为人类评审提供有效支持[23]
214亿!这位90后AI天才,太炸
混沌学园· 2025-09-13 11:57
公司发展历程 - 月之暗面由杨植麟于2023年3月创立 专注AGI领域 公司名称灵感来源于平克·弗洛伊德乐队专辑《The Dark Side of the Moon》[36][37][38] - 2023年10月推出AI助手Kimi 支持20万字长文本输入 超越当时OpenAI GPT-4的2.5万字容量[39] - 2024年2月完成超10亿美元融资 创国内AI大模型单轮融资纪录 估值达30亿美元(约214亿人民币)[7][39] - 2024年3月将Kimi上下文窗口扩展至200万字 月访问量超2000万 公司估值涨至33亿美元[41][42] - 2025年7月11日开源发布新一代大模型Kimi K2 为全球首个万亿参数、320亿激活的MoE模型[63] 技术突破与行业地位 - Kimi K2发布24小时内GitStar数破1.8万 在LMSYS匿名评测中位列总榜第四 超越DeepSeek-R1[63][64] - 技术成果被Google PaLM和Meta LLaMA等主流产品采用 论文引用量超22000次[32] - 2024年与财新传媒合作强化财经问答 近期布局AI医疗领域 加强医学专业搜索质量[62] - 团队规模始终控制在200人以内 采用垂直领域聚焦策略[53][61] 创始人背景 - 杨植麟1992年出生 为清华大学计算机系特等奖学金获得者 发表论文20余篇[22][27][29] - 博士期间与Yoshua Bengio合作发布HotpotQA数据集 并以第一作者身份发表Transformer-XL和XLNet论文[32] - 曾以全国青少年信息学联赛广东一等奖保送清华 高三以667分成为汕头理科状元[18] 行业竞争格局 - 2024年初DeepSeek崛起改变行业格局 月之暗面市场占有率下滑 暂停To C投放[45][46] - 国内AI领域形成"六小龙"竞争态势 字节、阿里等巨头纷纷入场[45] - 2025年《新财富》创富榜显示梁文锋以1846.2亿元持股市值位列第十 杨植麟以93.9亿元身家排名第366[5][6] 融资与估值 - 创立初期获红杉中国、真格基金等投资 融资2亿美元[39] - 美团、阿里、腾讯、小红书等企业参与投资[42] - 2024年3-8月广告投放达1.4亿元 单月最高投放近5000万元[52] 产品数据表现 - Kimi月活跃用户从400万增长至1282万 稳居行业第二[53] - DeepSeek R1上线一个月下载量破亿[57] - 2024年5月公司估值达30亿美元(约214亿人民币)[7]