Gemma3

搜索文档
计算机ETF(512720)涨超1.6%,国产大模型技术突破或催化算力需求
每日经济新闻· 2025-08-11 03:56
计算机ETF表现 - 8月11日计算机ETF(512720)涨幅超过1 6% [1] - 该ETF跟踪CS计算机指数(930651) 覆盖沪深市场计算机硬件 软件及服务领域的上市公司证券 [1] - CS计算机指数具有高成长性和波动性特征 反映计算机相关上市公司的整体表现 [1] Kimi K2模型技术突破 - Kimi K2模型以320亿激活参数实现万亿级规模扩展 采用自研MuonClip优化器突破训练稳定性瓶颈 [1] - 在代码 数学 工具调用三大核心赛道全面超越Gemma3和Llama4等国际开源模型 跻身大模型竞技场总榜TOP5 [1] - 通过ACEBench启发的智能体数据合成技术覆盖数千种工具场景 显著提升任务泛化能力 [1] - 可自主生成复杂前端代码并精准拆解指令为结构化序列 [1] 商业化与应用前景 - 开源策略将降低AI Agent开发成本 推动应用层创新爆发 [1] - B端企业级API与C端多模态Kimi-VL形成全栈产品矩阵 验证长文本 视觉交互等场景落地潜力 [1] - 同等性能下 Kimi K2推理成本优势明显 有望加速智能体从概念验证向商业化盈利过渡 [1] 相关基金产品 - 无股票账户的投资者可关注国泰中证计算机主题ETF联接A(160224)和国泰中证计算机主题ETF联接C(010210) [2]
OpenAI将启动5000万美元基金,支持非营利组织和社区组织;Kimi K2登顶全球开源模型冠军丨AIGC日报
创业邦· 2025-07-20 01:15
Manus联合创始人总结经验教训 - Manus联合创始人季逸超发布技术解析长文 复盘公司从年初爆火至今的开发思路与教训 [1] - 公司近期被曝裁员、清空国内多平台账号等消息 [1] 中国开源模型全球领先 - 全球开源模型排行榜中 Kimi K2、DeepSeek R1、Qwen3等3个中国模型排名前三 [2] - Kimi K2成为全球最强开源模型 领先谷歌Gemma3和Meta旗下Llama4 [2] - 榜单由数千位开发者通过动态盲测进行投票 [2] OpenAI启动5000万美元基金 - OpenAI宣布启动5000万美元初始基金 支持非营利组织和社区组织 [3] - 基金将用于教育、经济机遇、社区组织和医疗保健等领域 扩大AI影响力并促进创新 [3] - 公司还将支持社区主导的研究和创新 利用AI促进公共福祉 [3] Perplexity挑战谷歌移动市场地位 - Perplexity正与移动设备制造商洽谈 希望在智能手机上预装Comet AI移动浏览器 [4] - 公司CEO表示说服OEM将默认浏览器从Chrome改为Comet并不容易 [4] - 强调了移动平台上用户惯性带来的挑战 [4]
首创像素空间推理,7B模型领先GPT-4o,让VLM能像人类一样「眼脑并用」
量子位· 2025-06-09 09:27
视觉语言模型(VLM)技术突破 - 视觉语言模型正经历从「感知」到「认知」的关键跃迁,实现多模态交互的全新可能 [1][2] - 传统VLM依赖文本token间接翻译视觉信息,导致在高清图像微小物体、视频动态细节等场景中表现不足 [2] - 研究团队提出「像素空间推理」范式,将推理战场从文本空间拓展到像素空间,实现原生视觉操作 [2][3] 像素空间推理的核心优势 - 模型可自主触发视觉变焦、时空标记等原生操作,在像素矩阵上直接完成闭环推理,避免信息衰减 [6] - 视觉主导推理机制使模型能捕捉传统方法难以处理的空间关系与动态细节,如具身视觉导航、复杂视频理解等场景 [6] - 打破文本对视觉语义的「翻译牢笼」,实现与人类视觉认知同构的推理能力 [7] 学习陷阱与激励机制 - 指令微调模型面临「认知惰性」挑战,表现为负面反馈循环和路径依赖惯性 [8] - 研究团队设计内在好奇心激励配合外在正确性激励的强化学习方案,鼓励模型练习视觉操作 [9][10] - 通过像素推理率约束和操作效率约束,在探索与计算成本间找到平衡 [10][11] 性能表现与行业影响 - 基于Qwen2.5-VL-7B构建的Pixel-Reasoner在四大视觉推理基准测试中表现优异:V* Bench 84.3%准确率,超越GPT-4o和Gemini-2.5-Pro [13][15] - 在TallyQA-Complex、InfographicsVQA、MVBench等测试中均实现显著性能提升,展现「小模型大能力」特性 [19][20] - 像素空间推理为VLM开启「第二思维通道」,推动多模态模型真正理解世界复杂性 [21]
三星芯片,大搞AI
半导体芯闻· 2025-05-09 11:08
三星电子DS部门AI战略调整 - 公司DS部门近期宣布将内部AI运营模式改为"开放的多模型环境",打破此前以自主技术构建的封闭式AI系统"DS Assistant"为主的策略 [1] - 该调整旨在将AI应用扩展到半导体设计和开发领域,以提升工作效率 [1] - 继上月引入Meta模型后,本月新增谷歌"Gemma3"和微软"Phi-4"模型,形成包含不同参数版本的开源模型组合 [1][2] 外部AI模型应用细节 - 公司采用轻量级小型语言模型(sLM)作为内部AI主要架构 [1] - 根据不同工作场景灵活调用模型:处理数字数据时优先使用Phi-4,分析图像信息时采用Gemma3 [2] - 对Meta的Llama4评估显示其在语言混合问题改进、知识推理及代码生成等任务中表现优异 [2] 技术路线演变背景 - 2023年3月曾短暂允许使用ChatGPT,但因半导体数据泄露风险在三周内叫停 [2] - 同年12月推出自研DS Assistant解决安全问题,但封闭架构导致外部数据利用受限 [2] - 内部反馈指出需要整合外部AI以增强半导体设计等核心业务竞争力 [2] 数据安全实施方案 - 所有外部AI模型均采用内部部署(On-premise)方式运行,通过在工作场所安装数据服务器避免信息外泄 [3] - 公司表示将按工作类型持续评估并引入有助于效率提升的开源模型 [3]