Jamba Reasoning 3B

搜索文档
腾讯研究院AI速递 20251010
腾讯研究院· 2025-10-09 16:01
生成式AI模型发布与进展 - 谷歌DeepMind发布Gemini 2 5 Computer Use模型 使AI能直接控制浏览器执行点击 滚动和输入等操作 在相关基准测试中性能达到SOTA水平 使用效率高于竞品 [1] - 马斯克旗下xAI推出视频生成模型Imagine v0 9并向所有用户免费开放 视频生成时间不到20秒 能生成6秒左右视频 支持语音优先界面 [2] - 蚂蚁集团发布并开源万亿参数通用语言大模型Ling-1T 总参数达1T但推理时仅激活约50B参数 在编程与数学推理基准测试中表现亮眼 LiveCodeBench得分最高 数学相关评测双双突破74分 [3] - 腾讯推出混元图像3 0 具备更丰富的细节和更细腻的画质 支持生成表情包组图 四格漫画 图文设计等多种创作风格 [4] - 以色列AI21 Labs开源30亿参数轻量推理模型Jamba Reasoning 3B 采用混合SSM-Transformer架构 支持256K上下文窗口 效率比竞品提升2-5倍 在M3 MacBook Pro上每秒生成40个token [5][6] 前沿科技与材料科学 - 2025年诺贝尔化学奖授予三位科学家 表彰他们在金属有机框架材料发展方面的贡献 该材料能从水中分离PFAS 捕获二氧化碳 从沙漠空气中采集水分 [7] 行业战略与愿景 - OpenAI的愿景是构建垂直整合AGI帝国 由个人AI订阅服务 超大规模基础设施和前沿研究实验室三大支柱构成 预测未来2年内AI将在科学发现领域扮演关键角色 [7] - 具身智能公司Figure获得10亿美元C轮融资 估值达390亿美元 专家指出部署能力是行业卡脖子环节 预计家庭场景大规模部署至少需7-12年 [8] 开发工具与资源 - 谷歌资深工程主管发布《智能体设计模式》一书 系统总结AI Agent开发领域的21个关键设计模式 全书400多页 提供详实代码示例 [9][11]
手机能跑的3B推理模型开源,比Qwen 3-4B还快,超长上下文不降速
36氪· 2025-10-09 10:48
以色列创企开源3B模型,性能碾压谷歌Gemma 3-4B。 Jamba Reasoning 3B在人类最后测试等测评中超Qwen 3-4B等模型 其将Jamba Reasoning 3B的优势总结为三点: 1、智能性能不下降:由于采用了混合SSM-Transformer架构,Jamba Reasoning 3B比纯Transformer模型更高效。 大多数基于Transformer的模型在上下文长度超过32K个token时性能会显著下降,而Jamba Reasoning 3B能够处理更长的上下文长度,包括高达100万个 token。这使得它在高级智能体系统或多模态应用中非常有用,因为长上下文理解对输出质量至关重要。 智东西10月9日报道,昨日,以色列AI创企AI21 Labs开源轻量级推理模型Jamba Reasoning 3B。该模型有30亿个参数,可在包括手机、电脑在内的多种 设备端运行,性能超过Qwen3-4B、Gemma 3-4B等业界顶尖模型。 Jamba Reasoning 3B开源截图 Hugging Face地址: http://huggingface.co/ai21labs/AI21-Jam ...