Workflow
Kimi K2
icon
搜索文档
实测Kimi全新Agent模型「OK Computer」,很OK
量子位· 2025-09-27 01:30
产品发布 - Kimi发布全新Agent模型OK Computer 依托Kimi K2技术平台 [1][4] - 模型具备网页制作、PPT生成、数据处理等多项功能 可处理100万行数据并生成交互式仪表板 [4][30] 功能特性 - 设计类任务支持网页自动生成与Python编程 根据单句提示词自主完成模块设计与实现 [9][10][14] - 生成类任务整合文本、图像及音频生成能力 支持儿童故事绘本创作与文艺风格PPT制作 [19][20][22] - 分析类任务实现长文档检索与大数据处理 自动完成数据搜集、分析及可视化呈现 [28][29][30] 技术实现 - 采用像素风界面设计 提供简洁直观的用户交互体验 [7] - 任务执行过程自主生成Todo清单 实时标记进度状态(x表示完成 -表示进行中) [16] - 支持静态部署与动态资源调用 自动完成网页搜索和素材生成等预处理操作 [17] 性能表现 - 网页生成功能实现按钮跳转、等级分类、对比可视化等复杂交互设计 [12] - PPT输出文件支持后期人工编辑 具备完整可修改性 [24][26] - 数据分析模块自动构建评估维度 无需人工设定分析框架 [31]
短短几分钟,AI轻松通过了CFA三级考试
华尔街见闻· 2025-09-25 04:09
最新研究显示, 多个AI模型已能在几分钟内通过享有盛誉的CFA三级考试,而人类通常需要数年时间和约1000小时学习才能完成。 AI模型全面突破CFA三级考试壁垒 两年前的研究曾发现,AI模型能够通过CFA一级和二级考试,但在三级考试的论述题环节遭遇重大障碍。 最新研究证实,AI技术的快速发展已经克服了这一关键瓶颈。 纽约大学斯特恩商学院和AI财富管理平台GoodFin的研究人员测试了23个大型语言模型,发现包括 o4-mini、Gemini 2.5 Pro和Claude Opus在内的前沿推理 模型能够成功通过CFA三级模拟考试。 | PROVIDER | Model 1↓ | Overall ↓ | MCQ | ESSAY (1) | Reasoning | Context 11 | | --- | --- | --- | --- | --- | --- | --- | | G | Gemini 2.5 Pro | 2.10 | 77% | 3.19 | V | 1048576 | | G | 04-mini | 2.10 | 68% | 3.28 | V | 200000 | | Al | Claude ...
别只顾着追赶 OpenAI,成为估值 1830 亿美元的 Anthropic 也不错
投资实习所· 2025-09-23 05:47
OpenAI 最新一轮融资让其估值达到了 3000 亿美金,而 Anthropic 同样达到了 1830 亿美金,可以说都挺疯狂的。 成为 Anthropic 不比追赶 OpenAI 容易 上周,OpenAI 和 Anthropic 分别发布了一份 人们如何使用其 AI 的报告 ,两个报告有一点给我印象非常深:使用 ChatGPT 的用户行为中非工作消息的 比例越来越大,已经占到了差不多 73%; 而使用 Claude 的用户行为中则几乎都与工作相关,AI 更多被当作工具/助手/协作者,特别是与编程以及增强人类能力这块。 两家走出了非常具有自己特色的路径:OpenAI 的发展一直延续了综合能力的提升,在推理和多模态各方面全面发展。而 Anthropic 则以代码和工具使用 能力为特色,逐步形成适合真实世界软件工程任务的口碑和标签。 Anthropic 的发力和快速突破点是 Coding 和 Agent 能力,目前它是 Agentic Coding 这个领域的主导,自己推出的 Claude Code 也成为 Agentic Coding 里增长最快的产品,6 个月时间 ARR 达到 4 亿美金,Claude 4 ...
Grok: xAI引领Agent加速落地:计算机行业深度研究报告
华创证券· 2025-09-23 03:41
报告行业投资评级 - 计算机行业评级为"推荐(维持)" [3] 报告核心观点 - Grok系列模型由xAI公司开发 通过快速迭代实现多模态与智能体能力突破 最新版本Grok-4在学术测试和多场景应用中建立技术壁垒 [6][8][29] - 海外大模型(OpenAI GPT-5、Google Gemini 2.5 Pro、Anthropic Claude 4)与国产模型(Kimi K2、DeepSeek-V3.1、阿里Qwen3)形成多极竞争格局 国产模型以成本效率优势(如Kimi K2输入成本仅为GPT-4.1的1/3)实现性能追平 [6][8][73] - AI Agent商业化落地加速 推动企业级服务与行业场景应用需求增长 涵盖办公、编程、金融、教育、医疗等细分领域 [6][8][83] 模型技术迭代与性能 Grok系列演进 - Grok-1(2024年3月):开源MoE架构 3140亿参数 在HumanEval编码测试达63.2% MMLU任务达73% 优于ChatGPT-3.5 [13][14][15] - Grok-1.5V(2024年4月):新增图像理解功能 在Mathvista测试准确率52.8% TextVQA达78.1% [17][18] - Grok-2(2024年8月):整合实时检索与图像生成 在MATH测试追平GPT-4o DocVQA测试领先同期模型 [19][21] - Grok-3(2025年2月):参数规模2.7万亿 引入Think分步推理和DeepSearch联网检索 在AIME、GPQA测试超越GPT-4o等旗舰模型 [20][24][25] - Grok-4(2025年7月):上下文窗口256K tokens 计算资源投入较Grok-2增加100倍 在HLE测试以44.4%准确率刷新纪录 在AIME、SAT、GRE测试超越GPT-4o等模型 [29][30][35] 海外大模型进展 - OpenAI GPT-5:在SWE-bench Verified测试达74.9% Aider Polyglot测试达88% [59][61] - Anthropic Claude 4:在SWE-bench Verified测试中Claude Sonnet 4达80.2% Claude Opus 4达79.4% 超越GPT-4.1和Gemini 2.5 Pro [64][66] - Google Gemini 2.5 Pro:在LiveCodeBench测试达74.2% Aider Polyglot达82.2% 多模态与推理能力领先 [68][71] 国产模型突破 - Kimi K2:在SWE-bench Multilingual和Tau2测试接近Claude 4 输入成本仅为GPT-4.1的1/3 [73][77] - DeepSeek-V3.1:通过Post-Training优化增强Agent能力 工具调用效率提升 [6][74][76] - 阿里Qwen3 Coder:编码基准测试媲美Claude Sonnet 4 中文语义任务保持优势 [79][80] 算力与生态布局 - xAI计划五年内实现5000万块H100等效算力规模 支撑Grok系列迭代 [30][50][53] - 国产模型累计备案服务439款 登记应用233款 商业化进程加速 [6][73] 投资应用方向 企业级服务 - 办公:金山办公、合合信息、福昕软件、三六零 [6][84] - 编程:卓易信息、普元信息 [6][84] - ERP:金蝶国际、用友网络 [6][84] - 多模态:万兴科技、美图公司、虹软科技、当虹科技 [6][84] 行业场景 - 金融:大智慧、同花顺、恒生电子、京北方、宇信科技 [6][84] - 教育:科大讯飞、视源股份、新开普、佳发教育 [6][84] - 医疗:阿里健康、卫宁健康、讯飞医疗科技 [6][84] - 工业:华大九天、中控技术、中望软件、索辰科技 [6][84] [6][8][83][84]
新旧动能转换期,科技产业仍将是政策重点支持的领域
每日经济新闻· 2025-09-16 07:24
从全球科技周期来看,我们正处在AI引领的新一轮科技浪潮中,AI正加速渗透至经济和社会的各个层 面。从国内经济发展阶段来看,我国正处在新旧动能转换期,通过科技创新引领新质生产力发展,是推 动产业结构升级的关键,科技产业仍将是政策重点支持的领域。 港股通科技ETF基金(159101)支持T+0交易,不占用QDII额度,投资者可依据自身需求灵活运用配置 策略:长期投资者可将其作为成长型资产的核心持仓,结合红利低波品种构建"哑铃策略";趋势投资者 可借助科技板块的高弹性捕捉阶段行情;定投投资者则可在估值低位区间分批布局,平滑风险、提升投 资体验。 降息带来的市场流动性宽松,有将利于国际资本流向风险偏好更高的资产,港股等新兴市场有望承接外 溢的海外流动性。而外资偏好代表中国新经济动力的科技互联网板块,以及依托于国家信用体系的大金 融板块。港股科技板块目前估值处于历史相对低估区间,并且囊括了中国AI核心资产,对于外资的吸 引力或不断提升。 海内外多个重大模型和智能体产品发布,国产模型Kimi K2发布引起轰动,继续刷新开源(300109)大 模型能力上限,被海外誉为"又一个DeepSeek时刻";阿里推出Qwen 3 C ...
美联储9月降息箭在弦上,布局科技主线行情
搜狐财经· 2025-09-16 02:08
美联储利率决议与市场预期 - 美联储9月降息25个基点的概率为92% 降息50个基点的概率为8% [1] - 降息周期开启后全球流动性边际改善有望外溢至港股 [1] - 高成长和高弹性的港股科技板块或率先受益 [1] 港股科技板块基本面改善 - 阿里巴巴最新一季云收入和资本开支均超市场预期 [1] - 带动港股科技互联网板块从"外卖内卷"叙事回归AI叙事 [1] - 有利于板块估值修复 [1] 港股AI产业链优势 - 港股汇聚国产AI核心资产 涵盖算力、模型、软件应用和硬件终端全产业链龙头企业 [1] - 成为中国资产重估的先锋 [1] - 在后续AI加速渗透中持续受益 [1] AI技术进展与行业景气度 - 三季度海内外发布多个重大模型和智能体产品 [1] - 国产模型Kimi K2发布刷新开源大模型能力上限 被海外誉为"又一个DeepSeek时刻" [1] - 阿里推出Qwen 3 Coder 最强开源代码模型对标Claude Code [1] - xAI发布Grok4模型 OpenAI发布ChatGPT Agent 基座模型和Agent应用双线并进 [1] - AI Agent加速落地叠加美股和港股科技股龙头财报披露 有望继续提振市场情绪维持高景气度 [1] 港股科技投资工具 - 科技全产业链可通过港股通科技ETF基金(159101)投资 [2] - 互联网龙头可通过恒生互联网ETF(513330)投资 [2]
214亿!这位90后AI天才,太炸
混沌学园· 2025-09-13 11:57
公司发展历程 - 月之暗面由杨植麟于2023年3月创立 专注AGI领域 公司名称灵感来源于平克·弗洛伊德乐队专辑《The Dark Side of the Moon》[36][37][38] - 2023年10月推出AI助手Kimi 支持20万字长文本输入 超越当时OpenAI GPT-4的2.5万字容量[39] - 2024年2月完成超10亿美元融资 创国内AI大模型单轮融资纪录 估值达30亿美元(约214亿人民币)[7][39] - 2024年3月将Kimi上下文窗口扩展至200万字 月访问量超2000万 公司估值涨至33亿美元[41][42] - 2025年7月11日开源发布新一代大模型Kimi K2 为全球首个万亿参数、320亿激活的MoE模型[63] 技术突破与行业地位 - Kimi K2发布24小时内GitStar数破1.8万 在LMSYS匿名评测中位列总榜第四 超越DeepSeek-R1[63][64] - 技术成果被Google PaLM和Meta LLaMA等主流产品采用 论文引用量超22000次[32] - 2024年与财新传媒合作强化财经问答 近期布局AI医疗领域 加强医学专业搜索质量[62] - 团队规模始终控制在200人以内 采用垂直领域聚焦策略[53][61] 创始人背景 - 杨植麟1992年出生 为清华大学计算机系特等奖学金获得者 发表论文20余篇[22][27][29] - 博士期间与Yoshua Bengio合作发布HotpotQA数据集 并以第一作者身份发表Transformer-XL和XLNet论文[32] - 曾以全国青少年信息学联赛广东一等奖保送清华 高三以667分成为汕头理科状元[18] 行业竞争格局 - 2024年初DeepSeek崛起改变行业格局 月之暗面市场占有率下滑 暂停To C投放[45][46] - 国内AI领域形成"六小龙"竞争态势 字节、阿里等巨头纷纷入场[45] - 2025年《新财富》创富榜显示梁文锋以1846.2亿元持股市值位列第十 杨植麟以93.9亿元身家排名第366[5][6] 融资与估值 - 创立初期获红杉中国、真格基金等投资 融资2亿美元[39] - 美团、阿里、腾讯、小红书等企业参与投资[42] - 2024年3-8月广告投放达1.4亿元 单月最高投放近5000万元[52] 产品数据表现 - Kimi月活跃用户从400万增长至1282万 稳居行业第二[53] - DeepSeek R1上线一个月下载量破亿[57] - 2024年5月公司估值达30亿美元(约214亿人民币)[7]
Kimi开源又放大招!20秒更新万亿参数的中间件来了
量子位· 2025-09-11 05:19
技术突破 - Kimi K2推出checkpoint-engine中间件 实现万亿参数模型权重更新进入"秒更时代" [1][6] - 该中间件可在约20秒内完成在数千个GPU上对1万亿参数的更新操作 [7] - 支持两种更新模式:一次性将更新完的权重从一个节点同时发送给所有节点 以及点对点动态更新 [2] 性能表现 - 在8×H800 TP8配置下 GatherMetas耗时0.17秒 Update(Broadcast)耗时3.94秒 [2] - 在16×H20 TP16配置下 GatherMetas耗时1.44秒 Update(Broadcast)耗时12.22秒 [2] - 在256×H20 TP16配置下 GatherMetas耗时1.40秒 Update(Broadcast)耗时13.88秒 [2] 系统架构 - 采用混合共置架构 训练引擎和推理引擎部署在同一组工作节点上 [8] - 每个引擎都针对高吞吐量进行深度优化 通过资源释放和调配实现高效协同 [9][10] - 使用参数逐条更新的流水线方式 将内存占用降至最低 [19] 技术创新 - 采用三阶段流水线:H2D阶段将权重分片异步复制到缓冲区 广播阶段将分片复制到IPC缓冲区并广播到所有GPU 重载阶段推理引擎从另一个IPC缓冲区加载参数 [20] - 选择将完整参数集广播到整个集群 简化系统设计并降低对训练和推理引擎的侵入性 [24][25] - 通过牺牲微小开销实现训练引擎与推理引擎的完全解耦 大大简化维护和测试流程 [26] 系统优化 - 优化启动时间 让每个训练工作节点选择性地从磁盘读取参数并广播至对等节点 确保所有节点只需集体读取一次检查点 [28][29] - 在启动阶段复用检查点引擎 集体从磁盘读取检查点后更新未初始化的推理引擎状态 [31][32] - 系统可抵御单点故障 某个推理副本可独立重启而无需与其他副本通信 [33]
游戏行业增长动能充足,游戏ETF(159869)打开低位布局通道
搜狐财经· 2025-09-11 02:06
游戏板块市场表现 - 游戏ETF(159869)早盘低开后震荡下挫 现跌至2%附近并持续打开低位布局通道 [1] - 游戏ETF(159869)连续三日获得资金净流入 累计吸金达2.47亿元 [1] 腾讯AI技术突破 - 腾讯混元游戏发布全新2.0版本 新增游戏图生视频/自定义模型训练/角色一键精修功能 [1] - 大幅提升游戏2D生图模型能力 图生视频和文生图模型在游戏场景达到行业SOTA水平 [1] - 升级解决游戏美术设计中动态内容生成/风格定制化/细节优化等痛点 提升设计师效率 [1] AI技术发展态势 - 全球正处于AI引领的新科技浪潮 AI加速渗透经济和社会各层面 [1] - 三季度海内外发布多个重大模型:国产Kimi K2刷新开源能力上限 阿里Qwen 3 Coder对标Claude Code [2] - 海外xAI发布Grok4模型 OpenAI推出ChatGPT Agent 基座模型与Agent应用双线推进 [2] 行业前景与投资机会 - 游戏需求持续旺盛 重点游戏流水爬升且后续储备充足 行业保持高景气度 [2] - 游戏板块具备AI/内容/商业化模式变革多重催化 游戏ETF(159869)跟踪中证动漫游戏指数 [2] - AI Agent加速落地叠加美股港股科技龙头财报披露 有望持续提振市场情绪 [2]
AI驱动科技主线行情,港股汇聚国产AI核心资产
每日经济新闻· 2025-09-11 01:53
AI科技发展趋势 - AI正引领新一轮全球科技浪潮并加速渗透至经济和社会各个层面[1] - 三季度海内外发布多个重大模型和智能体产品包括国产Kimi K2模型和阿里Qwen 3 Coder以及海外xAI的Grok4和OpenAI的ChatGPT Agent[1] - 各类AI Agent加速落地叠加美股和港股科技股龙头财报披露有望维持科技板块高景气度[1] 中国科技产业定位 - 中国处于新旧动能转换期通过科技创新引领新质生产力发展推动产业结构升级[1] - 科技产业是政策重点支持领域[1] - 港股科技汇聚国产AI核心资产涵盖算力、模型、软件应用和硬件终端全产业链龙头企业[1] 港股科技投资机遇 - 港股科技成为中国资产重估先锋并有望在AI加速渗透中持续受益[1] - 国产模型Kimi K2发布刷新开源大模型能力上限被海外誉为"又一个DeepSeek时刻"[1] - 阿里Qwen 3 Coder成为最强开源代码模型对标Claude Code[1] 相关ETF产品 - 科技全产业链可通过港股通科技ETF基金(159101)布局[1] - 互联网龙头聚焦可通过恒生互联网ETF(513330)投资[1]