Jamba Reasoning 3B

搜索文档

腾讯研究院AI速递 20251010

腾讯研究院· 2025-10-09 16:01

生成式AI模型发布与进展 - 谷歌DeepMind发布Gemini 2 5 Computer Use模型使AI能直接控制浏览器执行点击滚动和输入等操作在相关基准测试中性能达到SOTA水平使用效率高于竞品 [1] - 马斯克旗下xAI推出视频生成模型Imagine v0 9并向所有用户免费开放视频生成时间不到20秒能生成6秒左右视频支持语音优先界面 [2] - 蚂蚁集团发布并开源万亿参数通用语言大模型Ling-1T 总参数达1T但推理时仅激活约50B参数在编程与数学推理基准测试中表现亮眼 LiveCodeBench得分最高数学相关评测双双突破74分 [3] - 腾讯推出混元图像3 0 具备更丰富的细节和更细腻的画质支持生成表情包组图四格漫画图文设计等多种创作风格 [4] - 以色列AI21 Labs开源30亿参数轻量推理模型Jamba Reasoning 3B 采用混合SSM-Transformer架构支持256K上下文窗口效率比竞品提升2-5倍在M3 MacBook Pro上每秒生成40个token [5][6] 前沿科技与材料科学 - 2025年诺贝尔化学奖授予三位科学家表彰他们在金属有机框架材料发展方面的贡献该材料能从水中分离PFAS 捕获二氧化碳从沙漠空气中采集水分 [7] 行业战略与愿景 - OpenAI的愿景是构建垂直整合AGI帝国由个人AI订阅服务超大规模基础设施和前沿研究实验室三大支柱构成预测未来2年内AI将在科学发现领域扮演关键角色 [7] - 具身智能公司Figure获得10亿美元C轮融资估值达390亿美元专家指出部署能力是行业卡脖子环节预计家庭场景大规模部署至少需7-12年 [8] 开发工具与资源 - 谷歌资深工程主管发布《智能体设计模式》一书系统总结AI Agent开发领域的21个关键设计模式全书400多页提供详实代码示例 [9][11]

生成式AI

AGI

金属有机框架（MOF）材料

Artificial Intelligence

Artificial Intelligence

Imagine v0.9

Ling-1T

手机能跑的3B推理模型开源，比Qwen 3-4B还快，超长上下文不降速

36氪· 2025-10-09 10:48

以色列创企开源3B模型，性能碾压谷歌Gemma 3-4B。 Jamba Reasoning 3B在人类最后测试等测评中超Qwen 3-4B等模型其将Jamba Reasoning 3B的优势总结为三点： 1、智能性能不下降：由于采用了混合SSM-Transformer架构，Jamba Reasoning 3B比纯Transformer模型更高效。大多数基于Transformer的模型在上下文长度超过32K个token时性能会显著下降，而Jamba Reasoning 3B能够处理更长的上下文长度，包括高达100万个 token。这使得它在高级智能体系统或多模态应用中非常有用，因为长上下文理解对输出质量至关重要。智东西10月9日报道，昨日，以色列AI创企AI21 Labs开源轻量级推理模型Jamba Reasoning 3B。该模型有30亿个参数，可在包括手机、电脑在内的多种设备端运行，性能超过Qwen3-4B、Gemma 3-4B等业界顶尖模型。 Jamba Reasoning 3B开源截图 Hugging Face地址： http://huggingface.co/ai21labs/AI21-Jam ...

Artificial Intelligence

Device-side Lightweight Model

Artificial Intelligence

Jamba Reasoning 3B

Qwen3-4B

Gemma 3-4B

Artificial Intelligence

Device-side Lightweight Model

Artificial Intelligence

Jamba Reasoning 3B

Qwen3-4B

Gemma 3-4B