Workflow
大语言模型
icon
搜索文档
001234盘中上演“天地板”!OpenAI大动作,融资客大手笔加仓这些业绩有望持续高增长股
证券时报· 2025-09-22 04:27
消费电子行业动态 - 9-10月是消费电子板块新品密集发布期 产业链进入量产高峰 [1][4] - 消费电子板块具备补涨空间 多家公司早盘涨停包括立讯精密 和而泰 国光电器 [3] - AI行情从云侧逐步切向端侧 带来端侧设备 算力芯片 通信模组等广泛机会 [4] - OpenAI与中国果链龙头企业立讯精密达成战略合作 共同开发革命性AI设备 [3] - OpenAI与歌尔股份接触 设备设计成口袋大小 具备上下文感知能力并深度配合大语言模型运行 [3] 市场表现与资金流向 - 年内13只消费电子概念股股价翻倍 芯原股份上涨229.96% 工业富联上涨213.47% [5] - 9月以来超30家消费电子概念股获机构调研 澜起科技 深南电路 领益智造调研家数超百家 [5] - 澜起科技获231家机构调研 第二季度营业收入 互连类芯片销售收入 归母净利润均创单季度历史新高 [5] - 9月以来超半数概念股获融资客加仓 寒武纪-U 立讯精密 东山精密等8股融资净买入额超10亿元 [6] - 13只获融资客加仓超3亿元的概念股 机构预测2025年和2026年净利润增长率持续超30% [6] 个股与板块表现 - 半导体芯片股延续强势 德明利 万润科技封板 算力概念股活跃 机器人板块继续走强 [1] - 黄金股走势活跃 湖南白银涨超8% 中金黄金一度涨超7% [1] - 旅游 影视 光伏设备 锂矿等板块领跌 [1] - 泰慕士早盘炸板后直线跳水跌停 上演天地板 早盘收盘跌3.24% 成交总额5.43亿元 换手率15.9% [1][2] - 公司股票交易价格连续2个交易日涨幅偏离值累计超20% 属于异常波动 控股股东签署股份转让协议导致控制权拟发生变更 [1] 公司业务与前景 - 东山精密表示AI算力需求增长将提升PCB产品层数和单价 行业需求与产品价值均呈上升趋势 [5] - 公司凭借Multek技术壁垒与提前布局产能优势 在市场竞争中占据有利地位 [5] - 澜起科技DDR5内存接口芯片渗透率较2024年大幅提升 受益于AI产业趋势推动 [5]
Gemini 数据好过chatgpt
小熊跑的快· 2025-09-21 11:30
Gemini和Cla ude 还在冲! 如上图,chatgpt 日活走平了! - Standard_NV18ads_A10_v5 Standard_NV36adms_A10_v5 - Standard_NV12ads_A10_v5 = - Standard_NV36ads_A10_v5 -Standard_NV6ads_A10_v5 Standard_NV72ads_A10_v5 2.5 2 1.5 1 0.5 0 s and and and the state of the start of the state of the state 1 2 8 2 8 2 all of the 如上图azure云 A10 价格最近还在上 租赁价格 如上图AWS A10租赁价格 还比较好。 ...
中国公司全球化周报|DeepSeek-R1成为全球首个经过同行评审的主流大语言模型/曼格纳与小鹏汽车达成整车组装合约
36氪· 2025-09-21 06:54
公司动态 - DeepSeek团队论文登上《自然》封面 披露更多模型训练细节并回应蒸馏质疑 成为全球首个经过同行评审的主流大语言模型[2] - 阿里团队上线全球首个AI Agent交易市场MuleRun 面向所有用户开放 同时发布全球AI Agent Creator支持计划[2] - 曼格纳国际与小鹏汽车就欧洲市场达成整车组装合约 计划2025年第三季度启动生产 系曼格纳首次为中国汽车制造商提供整车组装项目[2] - 吉利银河星舰7 EM-i登陆澳大利亚市场 系吉利在澳洲推出的第二款智能电动车 品牌销量环比增速超50% 已建立47家经销商门店覆盖全境[3] - 文远知行与Grab合作在新加坡推出自动驾驶汽车服务 初期涵盖11辆汽车 小马智行同期宣布与康福德高合作在榜鹅地区推出自动驾驶服务[3] - 滴滴旗下99在巴西追加20亿雷亚尔(约26亿元人民币)投资外卖平台99Food 计划年底前覆盖15座城市 2026年1月再新增20个城市[4] - 美团旗下Keeta在科威特启动运营 系中东第三站 沙特地区已覆盖20多个城市并成为最受欢迎外卖平台之一[4] - TikTok Shop东南亚平台将自2025年9月15日起加强内容原创性审核 对非原创内容实施冻结佣金及取消流量扶持等措施[4] 跨境支付与金融合作 - 沙特央行与蚂蚁国际签署协议 预计2026年在沙特全国支付系统开通Alipay+跨境支付服务[5] 资源开发与制造业 - 紫金矿业阿根廷3Q锂盐湖年产2万吨碳酸锂项目正式投产[6] 投融资活动 - 医鹭久歌完成数千万元人民币B轮融资 由永丰县母基金和梅花创投联合投资 计划未来十年在100个国家建立200个海外仓并派驻超5000名海外人员[6] - 恩瑞恺诺完成逾2亿元人民币A轮融资 由深创投、横琴创投及松禾资本领投 资金用于推进核心管线临床试验及国际化布局[6] - 青昀新材完成数亿元人民币C轮融资 由元禾璞华领投 资金用于新一代鲲纶超材料研发及全球化产能扩张[7] - 坚蛋运动完成数千万元人民币B轮融资 由上海宥世基金和动潮投资共同投资 资金用于智能化升级及海外市场开拓 目前门店超400家覆盖60多个城市[7] 政策监管 - 泰国贸易竞争委员会推进数字电商平台新监管指南 重点禁止低于成本定价及强制使用指定物流等行为 预计2025年10月前颁布[7] 媒体服务 - KrASIA英文媒体服务面向中国出海企业 读者中60%为东南亚核心国家商业人群 通过彭博终端等平台提升企业全球品牌[8] 行业社群 - 36氪出海学习交流群已吸引超17,000位出海人加入 提供每日跨境资讯及交流活动[9]
谷歌Gemini IMO和ICPC夺金功臣之一被xAI挖走,马斯克直呼:起飞
机器之心· 2025-09-21 05:26
行业人才流动趋势 - 特斯拉Optimus AI团队负责人Ashish Kumar被Meta挖走 [2] - 谷歌DeepMind资深研究科学家Dustin Tran被xAI挖走 [2][5] - 马斯克在社交媒体公开祝贺新成员加入并用火箭符号表示"起飞啦" [3] 核心人才背景与贡献 - Dustin Tran在谷歌DeepMind工作近9年 离职前担任资深首席研究员 [5] - 是谷歌Gemini-0801共同创造者 该模型是谷歌首个在LMSYS登顶的模型 [5] - 作为Gemini 2.5系列模型评测专家 在WebDev Arena和HLE等榜单取得第一名 [5] - 参与Gemini 1/1.5/2/2.5核心开发 涵盖强化学习、评测与数据等基础环节 [5] - 主导Gemini后训练评测 在100天内完成追赶并成功发布 带领团队登顶LMArena并保持一年多 [7] - 参与Gemini推理突破性创新 在IMO与ICPC中夺得金牌 [7] 技术发展历程 - 从LaMDA模型进化到通过RLHF生成长篇有内容回答的聊天机器人 [9] - 通过长链思维训练和全新环境推动推理与深度思考能力 [9] - 初期外界舆论普遍不看好 认为谷歌会因搜索历史包袱和组织政治而失败 [9] - 最终Gemini在用户偏好上稳定占据第一并引领科学突破 [10] 行业竞争格局 - OpenAI曾通过抢先宣布消息方式抢占AI舆论周期 [10] - 目前认为OpenAI的想法储备已经见底 [10] - xAI认为算力、数据及约100位聪明勤奋人员足以训练前沿大语言模型 [12] - xAI人均芯片拥有量超过谷歌 即将投入10万块GB200与30万块芯片 [12] - Grok 4在强化学习和后训练规模化方面做出最大押注 [12] 技术性能表现 - Grok 4 Fast在LMArena排名第8 而Gemini 2.5 Flash仅排第18 [12] - 在AIME等核心推理评测中表现与Grok 4相当 但成本降低15倍 [12] - 根据评测数据 Grok-4-fast得分为1421分 Grok-4-0709得分为1420分 [13] - 模型排名显示OpenAI的gpt-4.5-preview以1441分位居榜首 [13]
70名员工,估值70亿
虎嗅APP· 2025-09-21 04:39
文章核心观点 - 科技巨头通过巨额资金系统性收编AI初创公司顶尖人才,以消除竞争威胁并增强自身实力[4][5][14][15] - 创始团队被挖走后,CharacterAI由剩余员工接管并成功实现业务转型与收入增长,但最终仍因高昂运营成本等因素面临出售或融资选择[8][16][17][22] AI人才争夺态势 - Meta以超过2亿美元(约合14.2亿元人民币)挖走苹果AI奇才庞若鸣,价格刷新高管转会纪录,相当于苹果CEO库克年薪近3倍[4] - 2024年3月微软收编估值300亿元Inflection AI创始团队,6月亚马逊挖走Adept核心人才,9月亚马逊从Covariant挖走三名联合创始人及约25%员工[6][7][8] - 谷歌于2024年8月以27亿美元(约195.75亿元人民币)挖走CharacterAI创始人及团队,并获得模型非独家许可[8][10] CharacterAI创始人被挖事件分析 - 创始人Noam Shazeer和Daniel De Freitas原为谷歌AI研究员,其中Shazeer是Transformer架构联合发明人,二人因不满谷歌保守策略而创业[12] - 谷歌通过"技术授权+人才引进"模式规避反垄断审查,既消除潜在竞争对手,又增强自身技术实力[10][11][14] - 创始人选择回归谷歌主因包括初创公司难以承担每月数千万美元云服务成本,且回归后可获得无限资金支持并实现个人财富增值(如Shazeer个人获利超1亿美元)[14] 员工接管后的运营与业绩 - 约70名员工在创始人离开后接管公司,任命总法律顾问为临时CEO,并放弃自研模型转向专注消费端产品以降低成本[16][17] - 公司推出社交信息流功能并承接品牌广告业务,月活用户超过2000万人,通过9.99美元月订阅费实现商业化[17][18] - 预计2025年底年化收入达5000万美元(约3.6亿元人民币),高于此前3000万美元,谷歌支付的授权费为运营提供资金缓冲[18] - 2025年6月聘请Meta前高管Karandeep Anand为新CEO,战略从AGI梦想转向AI娱乐领域[19] 公司当前挑战与未来选择 - 即便改用开源模型,每月运营成本仍高达数百万美元,同时面临两起诉讼及多州监管调查,可能影响产品形态与用户增长[21][22] - 赛道竞争激烈,Meta等巨头推出类似服务,Chai等竞争对手以更少内容限制吸引用户[21] - 公司正考虑以超过10亿美元(合人民币71亿元)估值出售或融资数亿美元,出售可能吸引希望加强AI娱乐业务的大型科技公司[8][22]
重磅!DeepSeek 梁文锋论文登上《自然》封面,正面回应蒸馏质疑
程序员的那些事· 2025-09-20 01:10
模型技术突破与行业地位 - DeepSeek-R1是全球首个经过同行评审的主流大语言模型,打破了主流大模型尚未经过独立同行评审的空白[4] - 模型采用强化学习进行训练,通过正确解答数学问题获得高分奖励、答错受惩罚的方式,学会了逐步解决问题的推理能力[5] - 该技术使模型能够自我验证和自我反思,在给出新问题答案前检查性能,从而提高了在编程和研究生水平科学问题上的表现[5] 学术认可与技术创新 - 研究成果获得《自然》封面推荐,被描述为在极少人工输入下训练出能进行推理的模型[5] - 模型训练方法解决了人工智能需要大量人工干预添加标签和注释的极大挑战[5] - 与今年1月发布的初版论文相比,本次论文披露了更多模型训练细节并回应了模型发布之初的蒸馏质疑[4]
DeepSeek团队梁文锋论文登上《自然》封面
证券时报网· 2025-09-19 04:46
公司研究 - DeepSeek团队共同完成的DeepSeek-R1推理模型研究论文登上国际权威期刊《自然》第645期的封面[1] - 梁文锋担任该论文的通讯作者[1] 行业研究 - 研究表明大语言模型的推理能力可通过纯强化学习来提升 从而减少增强性能所需的人类输入工作量[1] - 大语言模型不必依赖人工示例或复杂指令 也能通过试错式强化学习自主学会生成推理过程[1] - 人工智能会自发进行"自省" 被认为是探索人类之外思维路径的重要迹象[1]
GPT-4o学习“波多野结衣”的次数,比“您好”还多2.6倍
猿大侠· 2025-09-19 04:11
大语言模型训练数据污染问题 - 研究发现以ChatGPT为代表的大语言模型被某些神秘的东方文字“污染”,其中日本AV女优波多野结衣的名字是污染数据里最引人瞩目的例子[4] - 论文将这些污染数据定义为“污染中文词元”,在GPT的长中文词元中超过23%属于色情或赌博等灰色内容[6][7] - 这些污染内容像病毒一样寄生在AI的词汇库深处,导致模型中文词汇表被严重污染[8] 污染数据对模型性能的具体影响 - 污染词元的存在会让AI突然开始胡言乱语、答非所问,成为模型知识体系的一部分隐患[9][10] - 在GPT-4o训练数据中,与波多野结衣相关的内容占比可能高达0.5%,该词出现频率是日常问候语“你好”的2.6倍[10] - 此类无营养的营销内容被模型吸收后容易引发幻觉问题,如DeepSeek模型曾莫名其妙写道歉信和编造发布日期[13] 行业训练数据面临的挑战 - 污染中文词元的广泛存在反映了当前用于大语言模型训练的中文网络语料面临严峻挑战[13] - 该问题凸显了人工智能行业在数据清洗和语料质量控制方面存在重大改进空间[13]
中国服务业企业500强发布,华为公布AI芯片发展路线 | 财经日日评
吴晓波频道· 2025-09-19 00:30
美联储货币政策 - 美联储宣布降息25个基点,将联邦基金利率目标区间从4.25%-4.5%降至4.00%-4.25% [2] - 本轮宽松周期合计降息幅度已达125个基点 [2] - 美联储承认就业增长放缓且失业率略有攀升,通胀有所上升但仍略高企,本次降息被视为提振经济的预防式降息 [2] - 美联储内部对利率路径规划分歧加剧,淡化年内连续降息的激进预期,未来将更依赖月度数据做决策 [3] 中国入境消费与服务业 - 前8月免签入境外国人达1589万人次,占入境外国人62.1%,同比大幅上升52.1% [4] - 中国已对47国实施单方面免签、与29国全面互免签证、对55国实施240小时过境免签,政策优化旨在吸引境外人员入境消费 [4] - 2025中国服务业企业500强营业收入总规模达51.1万亿元,平均营业收入首次突破千亿元大关至1022.2亿元 [6] - 服务业500强人均营业收入和人均净利润分别增长至328.1万元和21.5万元,互联网及信息技术服务等现代新兴服务业入围数量达184家 [6] - 服务业企业在中国企业500强中营收占比接近四成,未来有望带动更多经济增长 [7] 人工智能与芯片产业 - 华为公布昇腾AI芯片三年路线图,计划2026年Q1推出采用自研HBM的昇腾950PR,至2028年Q4共推出四款芯片 [8] - 华为昇腾芯片为专用NPU,因代工受限无法采用最先进制程,转而强调多卡联动以堆叠算力 [8] - 阿里、百度等国内企业加速AI芯片自研以降低对英伟达依赖,但国产软件生态追赶速度相对较慢 [9] - DeepSeek团队关于DeepSeek-R1推理模型的论文登上《自然》封面,该模型是全球首个经同行评审的主流大语言模型 [10] - DeepSeek采用强化学习而非人类示例开发推理步骤,为AI训练提供了更廉价高效的新范式 [10] 中国企业海外市场拓展 - 滴滴旗下99公司宣布对其巴西外卖平台99Food追加20亿雷亚尔(约合26亿元人民币)投资,计划到2026年6月全面落实 [12] - 美团计划5年内投入10亿美元将其外卖服务Keeta引入巴西,与滴滴因"二选一"等问题多次在法院交锋 [12] - 巴西外卖市场形成本土巨头iFood与两家中国企业的三方竞争格局 [12] 数字资产监管与金融市场 - 美国证券交易委员会通过规则变更提案,将数字币ETF审批时间从240天以上缩短至最多75天,为各类加密货币现货ETF铺平道路 [14] - 新规则反映出特朗普政府对数字资产更友好的监管态度,旨在促进创新并重塑美国在数字资产ETF领域的竞争优势 [14] - 中国A股市场三大指数冲高回落,沪指跌1.15%报3831.66点,沪深两市成交额3.135万亿元,较上一交易日放量7584亿元,创年内第三 [16] - 市场对美联储转向宽松的预期落空,金融、消费板块调整,芯片产业链逆势上涨 [16]
远程银行的“跨越山海”与咫尺服务
证券日报· 2025-09-18 16:22
银行业AI与远程银行战略地位转变 - 多家银行的AI业务已从“试试看”转为“必须做”,整体战略布局被重构 [1] - 远程银行从成本中心转变为新的服务核心、营销中心和价值创造中心 [1] - 远程银行被提升至与线下网点同等重要的战略层级,成为银行全面数字化转型的重要支点 [1] 远程银行的演进与业务范围扩展 - 远程银行从“电话银行+在线客服”的1.0时代,进阶至“移动银行+初级AI”的2.0时代,目前正迈向“AI原生银行+大模型智能体”的3.0时代 [2] - 截至2024年末,已有37家银行客服中心更名为远程银行中心,占比44%,较2023年提升4个百分点 [2] - 远程银行业务范围大幅扩展,涵盖办理信用卡、申请贷款、购买理财产品甚至开户等传统需“亲临柜台”的业务 [3] AI技术应用深化与价值认知转变 - AI应用从智能客服等单点场景,扩展至全行级、多场景、系统化的AI智能体部署,覆盖营销、风控、投顾、理赔等核心业务 [2] - AI的价值认知已从“可选工具”转变为“核心基础设施”,发展趋势是从“功能叠加”走向“业务重构” [3] - 2024年银行业客服中心与远程银行智能服务占比提升至59.41%,机器人问题识别率与解决率分别达96.19%和92.59% [4] 远程银行的效能与客户服务提升 - 发展远程银行有助于整合多渠道数据,构建统一客户画像,支持精准营销与个性化服务 [4] - 远程银行是推动银行从“交易处理型”机构向“价值运营型”机构转变的关键路径 [7] - 银行建设远程银行的核心诉求是为客户提供便捷、高效、个性化的金融服务 [8] 具体银行实践案例 - 上海银行AI手机银行可通过分析用户资产负债、现金流、风险偏好等信息,从数百款理财产品中快速筛选推荐 [3] - 交通银行手机银行“财富规划”工具融合专家经验和智能算法,为客户提供“一户一策”的大类资产配置功能 [7] - 上海银行AI手机银行显现三大效能提升:业务办理转化率提升、线上问题解决率显著提高、普惠性与安全性双重强化 [6] 远程银行的战略意义与角色进化 - 远程银行已从机构端“手和脚”的延伸,进化为驱动业务流程再造、组织变革和体验升级的核心引擎“大脑” [9] - 一个远程银行中心能无缝服务全国乃至全球客户,对区域性银行突破地域限制具有战略意义 [9] - 远程银行的主要目标是替代线下网点的简单业务,核心特征是“以客户体验为中心”和“数据驱动” [9] 银行对AI能力构建的诉求 - 银行首先关注技术服务客户的能力及产生的业务实效,技术的安全性与合规性 [7] - 银行希望最终能构建和掌控自己的AI能力,实现自主可控,而非完全依赖外部 [7] - 银行希望构建清晰的技术实施路线图和方法论,而非零散的技术点 [7]