Workflow
Spatial Reasoning
icon
搜索文档
阿里千问视觉模型登顶全球空间推理榜,超越Gemini3和GPT5.1
新浪科技· 2025-11-26 07:24
技术成就 - 阿里千问的视觉理解模型Qwen3-VL和Qwen2-VL在空间推理基准测试SpatialBench最新榜单中位列头两名,超越Gemini 3、GPT-5.1、Claude Sonnet 4.5等国际顶尖模型[1] - Qwen3-VL-235B和Qwen2.5-VL-72B分别获得13.5分和12.9分,领先于Gemini 3.0 Pro Preview的9.6分和GPT-5.1的7.5分[1] - 行业专家评价其识别、多目标接地和空间关系理解能力非常出色,是迄今为止见过最好的视觉语言模型[4][6] 行业现状 - AI大模型的整体表现距离人类仍有差距,人类基准线约为80分左右,可专业处理电路分析、CAD工程和分子生物学等复杂空间推理任务[1] - 目前大模型还无法完全自动化完成此类复杂空间推理工作[1]