大语言模型

搜索文档
美团发布高效推理模型,部分任务性能接近GPT5
新浪科技· 2025-09-22 06:10
模型性能特点 - 新模型保持龙猫模型一贯"快"的特点 [1] - 在逻辑、数学、代码、智能体等多个领域的推理任务中达到全球开源模型最先进水平(SOTA) [1] - 部分任务性能接近闭源模型GPT5-Thinking [1] 技术能力突破 - 增强智能体自主调用工具的能力 [1] - 扩展形式化定理证明能力 [1] - 成为国内首个同时具备"深度思考+工具调用"与"非形式化+形式化"推理能力相结合的大语言模型 [1] 应用领域优势 - 在高复杂度的任务(如数学、代码、智能体任务)处理上具备显著优势 [1] 开源与发布信息 - 已在HuggingFace、Github全面开源 [1] - 在官网可体验 [1]
001234盘中上演“天地板”!OpenAI大动作,融资客大手笔加仓这些业绩有望持续高增长股
证券时报· 2025-09-22 04:27
消费电子行业动态 - 9-10月是消费电子板块新品密集发布期 产业链进入量产高峰 [1][4] - 消费电子板块具备补涨空间 多家公司早盘涨停包括立讯精密 和而泰 国光电器 [3] - AI行情从云侧逐步切向端侧 带来端侧设备 算力芯片 通信模组等广泛机会 [4] - OpenAI与中国果链龙头企业立讯精密达成战略合作 共同开发革命性AI设备 [3] - OpenAI与歌尔股份接触 设备设计成口袋大小 具备上下文感知能力并深度配合大语言模型运行 [3] 市场表现与资金流向 - 年内13只消费电子概念股股价翻倍 芯原股份上涨229.96% 工业富联上涨213.47% [5] - 9月以来超30家消费电子概念股获机构调研 澜起科技 深南电路 领益智造调研家数超百家 [5] - 澜起科技获231家机构调研 第二季度营业收入 互连类芯片销售收入 归母净利润均创单季度历史新高 [5] - 9月以来超半数概念股获融资客加仓 寒武纪-U 立讯精密 东山精密等8股融资净买入额超10亿元 [6] - 13只获融资客加仓超3亿元的概念股 机构预测2025年和2026年净利润增长率持续超30% [6] 个股与板块表现 - 半导体芯片股延续强势 德明利 万润科技封板 算力概念股活跃 机器人板块继续走强 [1] - 黄金股走势活跃 湖南白银涨超8% 中金黄金一度涨超7% [1] - 旅游 影视 光伏设备 锂矿等板块领跌 [1] - 泰慕士早盘炸板后直线跳水跌停 上演天地板 早盘收盘跌3.24% 成交总额5.43亿元 换手率15.9% [1][2] - 公司股票交易价格连续2个交易日涨幅偏离值累计超20% 属于异常波动 控股股东签署股份转让协议导致控制权拟发生变更 [1] 公司业务与前景 - 东山精密表示AI算力需求增长将提升PCB产品层数和单价 行业需求与产品价值均呈上升趋势 [5] - 公司凭借Multek技术壁垒与提前布局产能优势 在市场竞争中占据有利地位 [5] - 澜起科技DDR5内存接口芯片渗透率较2024年大幅提升 受益于AI产业趋势推动 [5]
Gemini 数据好过chatgpt
小熊跑的快· 2025-09-21 11:30
Gemini和Cla ude 还在冲! 如上图,chatgpt 日活走平了! - Standard_NV18ads_A10_v5 Standard_NV36adms_A10_v5 - Standard_NV12ads_A10_v5 = - Standard_NV36ads_A10_v5 -Standard_NV6ads_A10_v5 Standard_NV72ads_A10_v5 2.5 2 1.5 1 0.5 0 s and and and the state of the start of the state of the state 1 2 8 2 8 2 all of the 如上图azure云 A10 价格最近还在上 租赁价格 如上图AWS A10租赁价格 还比较好。 ...
中国公司全球化周报|DeepSeek-R1成为全球首个经过同行评审的主流大语言模型/曼格纳与小鹏汽车达成整车组装合约
36氪· 2025-09-21 06:54
公司动态 - DeepSeek团队论文登上《自然》封面 披露更多模型训练细节并回应蒸馏质疑 成为全球首个经过同行评审的主流大语言模型[2] - 阿里团队上线全球首个AI Agent交易市场MuleRun 面向所有用户开放 同时发布全球AI Agent Creator支持计划[2] - 曼格纳国际与小鹏汽车就欧洲市场达成整车组装合约 计划2025年第三季度启动生产 系曼格纳首次为中国汽车制造商提供整车组装项目[2] - 吉利银河星舰7 EM-i登陆澳大利亚市场 系吉利在澳洲推出的第二款智能电动车 品牌销量环比增速超50% 已建立47家经销商门店覆盖全境[3] - 文远知行与Grab合作在新加坡推出自动驾驶汽车服务 初期涵盖11辆汽车 小马智行同期宣布与康福德高合作在榜鹅地区推出自动驾驶服务[3] - 滴滴旗下99在巴西追加20亿雷亚尔(约26亿元人民币)投资外卖平台99Food 计划年底前覆盖15座城市 2026年1月再新增20个城市[4] - 美团旗下Keeta在科威特启动运营 系中东第三站 沙特地区已覆盖20多个城市并成为最受欢迎外卖平台之一[4] - TikTok Shop东南亚平台将自2025年9月15日起加强内容原创性审核 对非原创内容实施冻结佣金及取消流量扶持等措施[4] 跨境支付与金融合作 - 沙特央行与蚂蚁国际签署协议 预计2026年在沙特全国支付系统开通Alipay+跨境支付服务[5] 资源开发与制造业 - 紫金矿业阿根廷3Q锂盐湖年产2万吨碳酸锂项目正式投产[6] 投融资活动 - 医鹭久歌完成数千万元人民币B轮融资 由永丰县母基金和梅花创投联合投资 计划未来十年在100个国家建立200个海外仓并派驻超5000名海外人员[6] - 恩瑞恺诺完成逾2亿元人民币A轮融资 由深创投、横琴创投及松禾资本领投 资金用于推进核心管线临床试验及国际化布局[6] - 青昀新材完成数亿元人民币C轮融资 由元禾璞华领投 资金用于新一代鲲纶超材料研发及全球化产能扩张[7] - 坚蛋运动完成数千万元人民币B轮融资 由上海宥世基金和动潮投资共同投资 资金用于智能化升级及海外市场开拓 目前门店超400家覆盖60多个城市[7] 政策监管 - 泰国贸易竞争委员会推进数字电商平台新监管指南 重点禁止低于成本定价及强制使用指定物流等行为 预计2025年10月前颁布[7] 媒体服务 - KrASIA英文媒体服务面向中国出海企业 读者中60%为东南亚核心国家商业人群 通过彭博终端等平台提升企业全球品牌[8] 行业社群 - 36氪出海学习交流群已吸引超17,000位出海人加入 提供每日跨境资讯及交流活动[9]
谷歌Gemini IMO和ICPC夺金功臣之一被xAI挖走,马斯克直呼:起飞
机器之心· 2025-09-21 05:26
行业人才流动趋势 - 特斯拉Optimus AI团队负责人Ashish Kumar被Meta挖走 [2] - 谷歌DeepMind资深研究科学家Dustin Tran被xAI挖走 [2][5] - 马斯克在社交媒体公开祝贺新成员加入并用火箭符号表示"起飞啦" [3] 核心人才背景与贡献 - Dustin Tran在谷歌DeepMind工作近9年 离职前担任资深首席研究员 [5] - 是谷歌Gemini-0801共同创造者 该模型是谷歌首个在LMSYS登顶的模型 [5] - 作为Gemini 2.5系列模型评测专家 在WebDev Arena和HLE等榜单取得第一名 [5] - 参与Gemini 1/1.5/2/2.5核心开发 涵盖强化学习、评测与数据等基础环节 [5] - 主导Gemini后训练评测 在100天内完成追赶并成功发布 带领团队登顶LMArena并保持一年多 [7] - 参与Gemini推理突破性创新 在IMO与ICPC中夺得金牌 [7] 技术发展历程 - 从LaMDA模型进化到通过RLHF生成长篇有内容回答的聊天机器人 [9] - 通过长链思维训练和全新环境推动推理与深度思考能力 [9] - 初期外界舆论普遍不看好 认为谷歌会因搜索历史包袱和组织政治而失败 [9] - 最终Gemini在用户偏好上稳定占据第一并引领科学突破 [10] 行业竞争格局 - OpenAI曾通过抢先宣布消息方式抢占AI舆论周期 [10] - 目前认为OpenAI的想法储备已经见底 [10] - xAI认为算力、数据及约100位聪明勤奋人员足以训练前沿大语言模型 [12] - xAI人均芯片拥有量超过谷歌 即将投入10万块GB200与30万块芯片 [12] - Grok 4在强化学习和后训练规模化方面做出最大押注 [12] 技术性能表现 - Grok 4 Fast在LMArena排名第8 而Gemini 2.5 Flash仅排第18 [12] - 在AIME等核心推理评测中表现与Grok 4相当 但成本降低15倍 [12] - 根据评测数据 Grok-4-fast得分为1421分 Grok-4-0709得分为1420分 [13] - 模型排名显示OpenAI的gpt-4.5-preview以1441分位居榜首 [13]
70名员工,估值70亿
虎嗅APP· 2025-09-21 04:39
投中网 . 投中网是领先的创新经济信息服务平台,拥有立体化传播矩阵,为创新经济人群提供深入、独到的智识 和洞见,在私募股权投资行业和创新商业领域拥有权威影响力。官网:www.chinaventure.com.cn 以下文章来源于投中网 ,作者黎曼 本文来自微信公众号: 投中网 (ID:China-Venture) ,作者:黎曼,题图来自:AI生成 巨头对顶尖AI人才的极度渴求,促使AI圈内频频发生重金挖人的戏码。 就在过去没多久的7月,硅谷又发生一起AI人才价格创新高的案例。Meta以超过2亿美元将AI奇才庞 若鸣从苹果挖走。这一数字刷新了高管转会的新纪录。有人算过,这个价格远超足球巨星C罗巅峰时 期1.2亿欧元年薪的数字,甚至是苹果CEO库克2024年7460万美元年薪的近乎3倍。 除了"买"下奇才,科技巨头还掀起了巨额"收购AI初创公司创始人"热潮。 2024年3月,估值300亿元的Inflection AI的创始团队加入微软。 2024年6月,亚马逊挖走Adept的核心人才。 2024年9月,亚马逊从机器人AI系统初创公司Covariant挖走了三名联合创始人及约25%的员工。 2024年8月,谷歌开出 ...
重磅!DeepSeek 梁文锋论文登上《自然》封面,正面回应蒸馏质疑
程序员的那些事· 2025-09-20 01:10
9 月 18 日,由 DeepSeek 团队共同完成、梁文锋担任通讯作者的 DeepSeek-R1 推理模型研究论文,登上了国际权威期刊《自然(Nature)》的封面。 与今年 1 月发布的 DeepSeek-R1 的初版论文相比,本次论文披露了更多模型训练的细节,并正面回应了模型发布之初的蒸馏质疑。 DeepSeek-R1 是全球首个经过同行评审的主流大语言模型。目前几乎所有主流的大模型都还没有经过独立同行评审,这一空白"终于被 DeepSeek 打 破"。 在《自然》封面的推荐介绍中,是这样写的: "如果训练出的大模型能够规划解决问题所需的步骤,那么它们往往能够更好地解决问题。这种『推理』与人类处理更复杂问题的方式类似,但这对人工 智能有极大挑战,需要人工干预来添加标签和注释。在本周的期刊中,DeepSeek 的研究人员揭示了他们如何能够在极少的人工输入下训练一个模型,并 使其进行推理。 DeepSeek-R1 模型采用强化学习进行训练。在这种学习中,模型正确解答数学问题时会获得高分奖励,答错则会受到惩罚。结果,它学会了推理——逐 步解决问题并揭示这些步骤——更有可能得出正确答案。这使得 DeepSeek ...
DeepSeek团队梁文锋论文登上《自然》封面
证券时报网· 2025-09-19 04:46
人民财讯9月19日电,近日,由DeepSeek团队共同完成、梁文锋担任通讯作者的DeepSeek-R1推理模型 研究论文,登上了国际权威期刊《自然(Nature)》第645期的封面。论文研究表明,大语言模型(LLM)的 推理能力可通过纯强化学习来提升,从而减少增强性能所需的人类输入工作量。并提出,大语言模型 (LLMs)不必依赖人工示例或复杂指令,也能通过试错式强化学习,自主学会生成推理过程。且AI还会 自发进行"自省",被认为是人工智能(AI)探索人类之外思维路径的重要迹象。 ...
GPT-4o学习“波多野结衣”的次数,比“您好”还多2.6倍
猿大侠· 2025-09-19 04:11
GPT-5出世后,GPT-4o一度 被网友亲切地称为"赛博白月光"。 然而没想到在它的知识体系里,对日本女优"波多野结衣"的熟悉程度,竟然比 "您好" 还要高。 最近,在预印本网站Arxiv上的这篇新论文,引爆了整个AI圈。 来自清华大学和南洋理工大学的几位研究者发现: 我们天天在用的大语言模型,比如 ChatGPT, 都 被某些神秘的东方文字"污染"了。 论文中把这些污染数据定义为"污染中文词元 ", 简称PoC Tokens。 在GPT的长中文词元(超过两个汉字)中,超过23%属于色情或赌博等灰色内容。 这说明,GPT的中文词汇表被严重污染了,这些内容像病毒一样寄生在AI的词汇库深处。 | (▶) | tmp = "" | 1 | count = 0 | 2 | | --- | --- | --- | --- | --- | | for i in sorted(chinese_list, key=lambda x: -len(x[1])): | 3 | ব | if count == 7: | | | print(tmp) | 5 | tmp = "" | б | | | 7 | count = 0 | ...
中国服务业企业500强发布,华为公布AI芯片发展路线 | 财经日日评
吴晓波频道· 2025-09-19 00:30
商务合作▲点击图片 美联储如期降息25个基点 |点评| 我国免签政策不断优化,效果立竿见影,直接体现为入境外国人数的快速增长。在当前内需仍待提振的经济环境下,大量国际游客涌 入,带动航空、住宿、餐饮等服务业产业发展,对刺激消费、激发市场活力有着重要作用。不过,短期内国际游客激增,也给城市管理与服务 能力带来挑战。国内各地可以抓住这一契机,补齐短板,促进整个服务产业链的提升。 免签政策优化,同样降低了国际商务往来的门槛,为我国吸引外资、留住人才打开了窗口,境外投资者、技术人才与国内企业合作将更加便 捷。逆全球化思潮下,我国主动推进免签"扩容",也是向世界传递高水平开放的积极信号。 2025中国服务业企业500强发布 美东时间9月17日周三,美联储在货币政策委员会FOMC会后宣布,联邦基金利率的目标区间从4.25%至4.5%降至4.00%至4.25%,降幅25个基 点。这是美联储今年开年以来九个月内首次决定降息。联储自去年9月到12月连续三次会议降息,本周再度行动后,本轮宽松周期的合计降息降 幅达125个基点。 本次降息决议只有一名FOMC投票委员——特朗普"钦点"的理事米兰反对(主张降息50基点),至少目前看来 ...