Workflow
开源大模型
icon
搜索文档
阿里千问:与ChatGPT展开全面竞争
中国新闻网· 2025-11-17 06:36
公司战略与产品发布 - 阿里巴巴于11月17日正式发布面向人工智能C端市场的“千问”App公测版本,标志着公司全面进军AI to C领域 [1] - “千问”项目被公司核心高管视为“AI时代的未来之战”,旨在借助Qwen系列模型的开源优势与国际影响力赢得关键竞争 [1] - 千问App集成全球性能排名第一的开源模型Qwen3,提供免费服务并与各类生活场景生态结合,直接与ChatGPT竞争 [1] - 千问App同时提供网页版和PC版本,其国际版也将在近期上线,以争夺全球用户 [2] - 公司的战略目标是利用最先进的模型,将千问App打造成一个“会聊天、能办事的个人AI助手”,并使其成为未来AI生活的核心入口 [2] 技术实力与基础设施投入 - 公司今年2月已宣布投入3800亿元人民币用于AI基础设施建设,并计划在2032年将云数据中心能耗规模扩大十倍 [1] - 自2023年全面开源以来,阿里Qwen模型已超越Llama、Deepseek等竞争者,成为全球性能最强劲、应用范围最广的开源大模型 [1] - Qwen系列模型的全球累计下载量已突破6亿次,近期发布的旗舰级模型Qwen3-Max性能已跻身全球前三,超越GPT5和Claude Opus 4 [1] - Qwen系列模型已占据全球开源模型市场的大部分份额,并呈现持续增长之势,已成为硅谷的基石,获得如Airbnb和英伟达CEO的公开肯定 [2] 产品功能与生态整合 - 公司认为AI发展已进入“辅助人”的Agentic AI时代,大力布局C端市场的时机已经成熟 [2] - 除了智能对话功能,“能办事”的能力被确定为千问App的重要战略发力方向 [2] - 公司正计划将地图、外卖、订票、办公、学习、购物、健康等各类生活服务场景接入千问App,以赋予其更强大、更全面的任务处理能力 [3] - 千问App已展现出能够落地的办事能力,例如用户只需一句指令,便能在几秒钟内完成一份研究报告并制作成几十页的精美PPT [3]
月之暗面:登顶全球“K2”背后的北京AI攀登者
新京报· 2025-11-14 13:12
公司战略调整与产品发布 - 2025年7月,公司将新一代开源大模型命名为“K2”,该模型发布后登顶全球开源模型榜单并获得国际关注[1] - 面对2025年初用户增长失速(月活从高峰期的数千万跌至5月的1408万)和市场竞争加剧的困境,公司做出关键决策:停止大规模投流,回归基础技术研发[3] - 2025年9月,公司更新K2的0905版本以提升编程能力,并于11月6日推出并开源K2 Thinking[1] - 2025年9月,公司在海内外上线全栈智能体助手OK Computer,专注于完成复杂的调度工作[6] 技术突破与行业认可 - K2模型是全球首个万亿参数、320亿激活的MoE架构模型,其发布在硅谷圈引起轰动[4] - 著名投资人查马斯·帕里哈皮蒂亚在播客中表示将大量工作负载转到Kimi K2,原因是其性能强且比OpenAI和Anthropic便宜太多[5] - 公司坚持自主研发通用基座模型的战略,认为每一次技术突破带来的新挑战会驱动知识和技术的无限进步[5] 商业化探索 - 公司首次开启订阅付费计划,设置49元/月、99元/月、199元/月三档套餐,打包“深度研究”与“OK Computer”等功能并附赠API兑换券[7] - 2025年10月24日,公司上线Kimi For Coding包月套餐,基于K2旗舰模型帮助个人开发者无需顾虑token消耗[7] - 公司通过开源K2的策略积累开发者生态势能,以较低营销成本对抗竞争对手并推广“生产力工作流”叙事[8] 行业背景与定位 - 公司的发展历程折射出北京在全球AI产业浪潮中正扮演着越来越重要的角色,其所在地北京市海淀区正在成为比肩硅谷的全球AI创新中心[1][9] - 公司的开源策略与北京“建设开源之都”的理念相契合,K2继承了DeepSeek-V3的架构并在此基础上创新,体现了北京AI产业生态的技术传承与创新结合[9] - 当其他AI创业公司转向垂直领域或To B市场时,公司依然坚守通用人工智能的道路,这种坚持让北京在全球AI产业竞争中保持独特优势[9][10]
游戏ETF(516010)昨日资金净流入近6000万元,行业需求与新品节奏受关注
每日经济新闻· 2025-11-14 03:22
开源大模型发展路径 - 看好今年成为中国开源大模型爆发及应用格局重塑之年,发展路径分为公有云价值重塑、平台企业大模型赋能及C端场景落地三步推进 [1] 游戏板块基本面与机会 - 游戏板块基本面维持强劲,估值水平较低,重点关注新品上线及IP衍生商业化 [1] - 动漫游戏指数聚焦文化创意产业,涵盖动漫、游戏及相关产业链领域,反映中国动漫游戏行业发展趋势 [1] AI领域技术进展 - AI领域持续进展,多模态及推理方向边际创新频出,例如Kimi-k2模型支持长文本处理及工具调用 [1] IP衍生方向动态 - IP衍生方向渠道拓展加速,与热门影视IP合作深化 [1] 传媒行业整体展望 - 传媒行业在AI赋能、内容供给改善及政策催化下具备结构性机会 [1]
Kimi杨植麟称“训练成本很难量化”,仍将坚持开源策略
第一财经· 2025-11-11 12:04
公司战略与产品发布 - 月之暗面Kimi公司近半年持续投入开源模型研发与更新,并于11月6日发布最新开源思考模型Kimi K2 Thinking [3][6] - 公司未来很长一段时间内将坚持开源策略,重点推进Kimi K2 Thinking模型的应用与优化 [6][8] - 公司在优先发展文本模型的前提下兼顾多模态模型推进,避开与OpenAI等头部厂商在AI浏览器等具体赛道的直接竞争 [8] - 公司尝试通过架构创新、开源策略与成本控制建立差异化优势 [8] 模型训练成本与性能 - 有消息称Kimi K2 Thinking模型的训练成本为460万美元,低于DeepSeek V3模型的560万美元和OpenAI GPT-3的数十亿美元 [3][6] - 公司CEO杨植麟回应称460万美元并非官方数字,由于大部分投入花在研究与实验上,训练成本很难量化 [4][6] - 针对模型推理长度过长、榜单成绩与实际体验不符的质疑,公司表示现阶段优先考虑绝对性能,token效率将在后续改善 [4][7] - 榜单高分与实测的脱节问题预计在模型通用能力补齐后被逐渐消解 [4][7] 行业竞争与市场表现 - 最新一周OpenRouter模型调用榜单前二十名中,中国开源模型产品占据五席,包括MiniMax M2、DeepSeek V3、GLM4.6、DeepSeek V3.1、DeepSeek V3.2 Exp [4][7] - Kimi模型因OpenRouter平台接口问题,目前只能以API形式被使用 [4][7] 技术资源与基础设施 - 公司团队使用携带InfiniBand网络互连技术的H800 GPU芯片支持持续的模型更新与庞大训练量 [4][7] - 公司承认所使用的GPU性能比不上美国的高端卡,数量也处于劣势,但强调每张卡都被用到了极致 [4][7]
Kimi杨植麟称“训练成本很难量化” 仍将坚持开源策略
第一财经· 2025-11-11 10:45
公司战略与模型进展 - 月之暗面Kimi公司CEO杨植麟回应称,媒体报道的Kimi K2 Thinking模型460万美元训练成本并非官方数字,因大部分投入用于研究与实验,实际成本难以量化[2] - 公司近期发布了最新版本的开源思考模型Kimi K2 Thinking,并计划长期坚持开源策略,重点推进该模型的应用与优化[2][5] - 针对用户关于模型推理长度过长、榜单成绩与实际体验不符的质疑,公司表示现阶段优先考虑模型绝对性能,token效率及榜单与实测脱节问题将在后续迭代中改善[2] - 公司战略为在优先发展文本模型的前提下兼顾多模态模型推进,避开与OpenAI等头部厂商在AI浏览器等具体赛道的直接竞争,尝试通过架构创新、开源策略与成本控制建立差异化优势[5] 行业竞争与市场地位 - 在国际模型调用平台OpenRouter的最新一周榜单前二十名中,中国开源模型产品占据五席,包括MiniMax M2、DeepSeek V3、GLM4.6、DeepSeek V3.1、DeepSeek V3.2 Exp[3] - 月之暗面Kimi因OpenRouter平台接口问题,目前仅能以API形式被使用,未进入该调用榜单[3] - 全球模型调用量排名显示,调用量最高的模型为x-ai的Grok Code Fast 1,达1.36T tokens,中国模型中排名最靠前的为DeepSeek V3 0324,位列第11位[5] 技术基础设施与成本 - Kimi团队在模型训练中使用的芯片是携带InfiniBand网络互连技术的H800 GPU,其性能虽不及美国高端芯片且数量处于劣势,但团队强调将每张卡的性能用到了极致[3] - 行业训练成本对比显示,媒体报道的Kimi K2 Thinking模型460万美元训练成本低于DeepSeek V3模型的560万美元,远低于OpenAI GPT-3模型的数十亿美元[2]
Kimi-k2thinking模型发布;关注年末AI、IP边际催化:传媒行业周观察(20251103-20251107)
华创证券· 2025-11-10 07:51
报告行业投资评级 - 行业投资评级:推荐(维持)[1] 报告核心观点 - 看好年末AI、IP边际催化,认为当下传媒板块需要锐度和配置并重[6] - 看好今年成为中国开源大模型的爆发及应用格局重塑之年,发展路径分为三步:公有云价值重塑、有平台用户场景的公司获大模型赋能、C端场景落地[6] - 持续看好科技板块的引领作用及互联网权重资产的配置价值[6] - 看好11-12月进口片小旺季带动电影大盘环比加速,并关注剧集新规细则进展[6] 上周市场表现回顾 - 上周传媒(申万)指数整体上涨0.16%,同期沪深300指数上涨0.82%,板块跑输沪深300指数0.66%,在申万各行业中排名第18位[9][12] - 个股方面,中国电影(上涨26.76%)、恒大高新(上涨14.4%)、吉视传媒(上涨14.32%)领涨;若羽臣(下跌10.83%)、芒果超媒(下跌7.08%)、昆仑万维(下跌6.88%)领跌[10] - 港股互联网科技板块,百度集团-SW(上涨5.78%)、小鹏汽车-W(上涨4.24%)、美的集团(上涨2.56%)领涨;舜宇光学科技(下跌8.91%)、商汤-W(下跌8.86%)、东方甄选(下跌7.31%)领跌[11][15] 游戏市场表现 - 根据七麦数据,2025年11月1日至7日iOS游戏畅销榜中,腾讯系产品《王者荣耀》、《三角洲行动》、《无尽冬日》表现稳定前列,网易《梦幻西游》、米哈游《崩坏:星穹铁道》排名靠前[16][18] - 新游方面,《终极角逐》(腾讯)预计11月18日公测,《火山的女儿:再度重逢》(心动网络)预计11月19日公测,《明日方舟:终末地》开启全面测试[19][20] 电影市场表现 - 截至2025年11月7日,2025年电影大盘票房(不含服务费)为403.13亿元,观影人次10.61亿人,相比2019年同期(票房533.26亿元,人次15.41亿人),票房恢复约76%,观影人次恢复约69%[21][23] - 11月3日至7日(周一到周五)票房0.88亿元(不含服务费),观影人次259万人,平均票价33.8元[25] - 周票房TOP5影片为《即兴谋杀》(1405万元,占比16.0%)、《浪浪人生》(1257万元,占比14.3%)、《铁血战士:杀戮之地》(1242万元,占比14.2%)等[28][29] - 待上映重点影片包括《鬼灭之刃:无限城篇》(11月14日,想看67.02万人)、《惊天魔盗团3》(11月14日,想看30.90万人)等,看好进口片带动电影大盘回暖[30][31] 行业重要新闻 - 月之暗面发布Kimi-k2 thinking模型,支持多轮工具调用和256k上下文长度,API输出速度提升至每秒60-100 Token[33] - 视频生成初创公司Video Rebirth完成5000万美元融资(约合人民币3.56亿元),计划12月推出"Bach"模型,重心转向专业创作领域[34][35] - 2025年世界互联网大会"互联网之光"博览会在乌镇开幕,主题为"AI共生、智启未来",54个国家和地区670家企业机构参展[36] 重点公司公告 - ST华通公告申请撤销其他风险警示,若经深交所审核通过将摘帽[6][37][38] - 大麦娱乐预计中期归母净利润不低于5亿元,去年同期为3.37亿元,主要因阿里鱼业务表现优异[39] - 阜博集团第三季度收入超8亿港元,创季度新高,同比增长27%,中国区业务增长22%,美国区增长33%[40][41]
陶冬:买芯片成为维稳股价刚需,科技企业闭眼砸钱“续命”
第一财经· 2025-11-10 03:49
金融市场动态 - 上周金融市场最拥挤的两个交易同时崩塌,美股"七姐妹"股价急跌且虚拟货币被抛售,比特币跌破十万美元关口[1] - 资金忧虑市场流动性短缺和美国政府停摆影响扩大,但纽约联储主席喊话稳住了市场情绪,美元指数上100后回软,美债变化不大,能源和大宗商品全军尽墨[1] - 美国科技公司遭遇4月以来最大抛售,AI巨企市值跌掉接近1万亿美元,流动性收紧和就业市场疲弱是原因之一[1] AI行业投资与担忧 - 四大科技巨企第三季度狂撒1120亿美元用作AI投资,引发市场对AI公司巨额投资可持续性的担忧[1] - OpenAI高管暗示政府不会坐视不理,加深了资金对AI投资可持续性的疑虑[1] - OpenAI销售约130亿美元,可动用现金30亿至50亿美元,却签下1.3万亿美元订单合约,被视作不可持续的烧钱游戏[2] - 科技巨企的烧钱源头从自有现金转向发债筹资,引发债市担心[2] AI商业模式与风险 - AI大模型如何套现仍是未知数,目前的AI路径能否走到最后是悬念[2] - 买芯片成为维持股价的必需,而非关注芯片有效使用或AI生态获利,资本市场奖励有AI梦的公司[2] - 美国AI公司走资本市场路径且多为闭源操作,一旦遇到开源大模型挑战,其盈利模式可能面临挑战[2] 市场前景与焦点 - 尽管股市短期动荡,中期资金预计回流,因低利率预期下银行储蓄和401K资金持续进入股市,但估值偏高导致市场大起大落[3] - 若市场动荡冲击金融稳定,白宫和美联储可能采取行动支持股市[3] - 本周市场焦点包括英国第三季度GDP数据、工党政府补充预算案,以及美国国会政府预算拨款谈判进展[3]
国产模型新盛况!王座易主:Kimi K2 Thinking开源超闭源
机器之心· 2025-11-07 04:26
模型发布与市场反响 - 月之暗面开源发布新一代大模型Kimi K2 Thinking,引发全网广泛讨论[2] - 模型发布不到半天,官方推文阅读量达到170万,高热度导致服务器多次出现算力不足情况[10][19] - 该事件被行业专家称为又一次“DeepSeek时刻”,可能成为国产大模型发展的拐点[6][10] 模型性能与基准测试 - 模型在多项基准测试中表现达到SOTA水平,性能超越GPT-5、Claude Sonnet 4.5等先进闭源模型[3][5] - 在超难基准人类终极考试上,Kimi K2 Thinking取得44.9分,其Heavy版本分数可进一步提升至51%,超过Grok4、GPT-5、Claude 4.5等模型[11] - 模型在自主网络浏览能力、对抗性搜索推理、Agentic搜索、Agentic编程、写作和综合推理能力方面均有全面提升[10] 技术架构与成本优势 - 模型总参数量高达1万亿,其中激活参数为320亿,是迄今为止最大的开放权重模型之一[32] - 采用INT4权重量化技术,使生成速度提升约2倍,实现高性能低成本推理[13][32] - API定价具有显著优势,输入价格为百万token 0.15美元(缓存命中)/0.6美元(缓存未命中),输出为百万token 2.5美元,比GPT-5低一个数量级[15] - 解决同样问题时,准确率比Claude 4.5 Sonnet更高,成本仅为其六分之一[16] - 模型训练成本为460万美元[34] 核心功能特点 - 具备持续多轮“一边搜索一边思考”的能力,这是目前DeepSeek不具备的特色功能[13] - 作为首个推理模型,可执行200-300次连续工具调用,在数百个步骤中进行连贯推理[32] - 采用Agent驱动模式,基于多轮强化学习范式,模型行为根据与外界交互的反馈持续更新[38][39] 实际应用测试表现 - 在前端可视化测试中,使用p5.js创建动画效果惊艳且运行丝滑,而GPT-5在相同测试中直接罢工[22][23] - 在著名的“鹈鹕骑车”SVG测试中表现不佳[24][25] - 写作能力出色,能精准模仿林黛玉和王熙凤的风格创作吐槽文章[26][27][28] - 综合推理能力强,对复杂逻辑题能快速反应,推理过程严谨无误[29][30] 行业影响与开源策略 - 知名AI基准测试机构认为该模型位置可放在GPT-5之前,可能促使AI社区设计新基准[42][46] - 模型采用修改后的MIT许可证,授予完整商业和衍生权利,是目前授权最宽松的前沿模型之一[47] - 许可证附加条款要求月活跃用户超1亿或月收入超2000万美元的应用需在界面标注“Kimi K2”[48]
Cursor“自研”模型套壳国产开源?网友:毕竟好用又便宜
量子位· 2025-11-02 04:23
事件概述 - 美国顶流AI编程应用Cursor和Windsurf发布的新模型,被网友发现其背后基础模型可能为中国公司智谱的GLM以及深度求索的DeepSeek [1][3][6] - 事件引发广泛关注,网友评论认为中国大模型技术已经达到领先水平 [2][19][20] Cursor新模型细节 - Cursor发布其首个编程智能体模型Composer-1,专为低延迟代理式编码打造,多数任务能在30秒内完成 [8][9] - 模型被发现会推理过程中使用中文,且与DeepSeek使用相同的分词器 [4][15] Windsurf新模型细节 - Windsurf新模型SWE-1.5与芯片厂商Cerebras合作,速度达每秒950个token,是Claude Haiku 4.5的6倍,Sonnet 4.5的13倍 [11] - 模型被直接套话自曝为由智谱开发的GLM [17] 中国开源模型行业地位 - 中国开源模型在各种开源性能榜单上占据TOP5甚至TOP10,下载量表现突出,如Qwen3是HuggingFace上最高下载量模型之一 [21] - 中国开源模型具备物美价廉的特点,成为全球初创公司的理性选择 [24][26][30] - 对于初创公司,从零开始训练模型需花费数百万至数千万美元,不符合商业逻辑 [29]
中国工程院院士倪光南:中国已成为全球开源大模型创新引领者
新浪财经· 2025-11-01 01:52
开源在AI时代的作用 - 开源在AI时代发挥更大作用 [1] - 中国企业在开源方面起引领作用 [1] - 中国已成为全球开源大模型的创新引领者 [1] 中国开源大模型的全球影响力 - 美国开发者采用的开源大模型中80%来自中国 [3] - 中国开源大模型秉承开源普惠价值观并全面开放走向全球 [3] - 中国开源大模型汇聚全球开发者智慧以促进AI创新发展 [3]