手机能跑的3B推理模型开源,比Qwen 3-4B还快,超长上下文不降速
36氪·2025-10-09 10:48
以色列创企开源3B模型,性能碾压谷歌Gemma 3-4B。 Jamba Reasoning 3B在人类最后测试等测评中超Qwen 3-4B等模型 其将Jamba Reasoning 3B的优势总结为三点: 1、智能性能不下降:由于采用了混合SSM-Transformer架构,Jamba Reasoning 3B比纯Transformer模型更高效。 大多数基于Transformer的模型在上下文长度超过32K个token时性能会显著下降,而Jamba Reasoning 3B能够处理更长的上下文长度,包括高达100万个 token。这使得它在高级智能体系统或多模态应用中非常有用,因为长上下文理解对输出质量至关重要。 智东西10月9日报道,昨日,以色列AI创企AI21 Labs开源轻量级推理模型Jamba Reasoning 3B。该模型有30亿个参数,可在包括手机、电脑在内的多种 设备端运行,性能超过Qwen3-4B、Gemma 3-4B等业界顶尖模型。 Jamba Reasoning 3B开源截图 Hugging Face地址: http://huggingface.co/ai21labs/AI21-Jam ...