手机能跑的3B推理模型开源，比Qwen 3-4B还快，超长上下文不降速

以色列创企开源3B模型，性能碾压谷歌Gemma 3-4B。 Jamba Reasoning 3B在人类最后测试等测评中超Qwen 3-4B等模型其将Jamba Reasoning 3B的优势总结为三点： 1、智能性能不下降：由于采用了混合SSM-Transformer架构，Jamba Reasoning 3B比纯Transformer模型更高效。大多数基于Transformer的模型在上下文长度超过32K个token时性能会显著下降，而Jamba Reasoning 3B能够处理更长的上下文长度，包括高达100万个 token。这使得它在高级智能体系统或多模态应用中非常有用，因为长上下文理解对输出质量至关重要。智东西10月9日报道，昨日，以色列AI创企AI21 Labs开源轻量级推理模型Jamba Reasoning 3B。该模型有30亿个参数，可在包括手机、电脑在内的多种设备端运行，性能超过Qwen3-4B、Gemma 3-4B等业界顶尖模型。 Jamba Reasoning 3B开源截图 Hugging Face地址： http://huggingface.co/ai21labs/AI21-Jam ...