量子位
搜索文档
明天!量子位的这件大事就要来了|MEET2026
量子位· 2025-12-09 05:39
大会核心信息 - MEET2026智能未来大会将于2025年12月10日在北京金茂万丽酒店举办 [24][37][39][56] - 大会主题为“共生无界,智启未来”,关注AI技术如何穿透产业、学科与场景边界 [39] - 大会将发布《2025年度AI十大趋势报告》与《2025人工智能年度榜单》 [35][39][54] 嘉宾阵容与背景 - 大会累计邀请近三十位重量级嘉宾,覆盖学术界、产业界与前沿创业一线 [17] - 学术界嘉宾包括清华大学张亚勤院士、孙茂松教授、智源研究院王仲远院长、交大高金朱宁教授等 [1][17] - 产业界阵容覆盖芯片、云、模型到终端的全栈力量,包括百度、小米、商汤、中关村科金、高通、亚马逊云科技、谷歌云、昆仑万维、潞晨科技、PPIO等代表性企业 [1][21] - 参会的新生力量企业包括卓世科技、太初元碁、RockAI、自变量机器人、光轮智能、云徙科技、灵心巧手等 [28] 核心议题与议程亮点 - 大会议题涵盖大语言模型、多模态、具身智能、自动驾驶、云计算及具体应用等AI主流方向 [3] - 设置“重磅GenAI对话”与“前沿Agent圆桌”两场高浓度对话,探讨真问题 [5][7] - GenAI Talk由文远知行创始人兼CEO韩旭对话量子位总编辑李根,探讨GenAI赋能自动驾驶及Robotaxi大规模商业化落地 [8][11][12] - Agent圆桌主题为“距离AI Agent革新千行百业还有多久”,汇聚小宿科技、联汇科技、蚂蚁百宝箱的平台方、技术方与应用方嘉宾,探讨Agent技术架构与应用落地 [13][16][50] - 上午议程包括人工智能+趋势、AI打造超级智能体、AI从数字世界迈向物理世界、混合AI、Agentic AI未来已来等主题演讲 [41] - 下午议程涵盖多模态与智能体、AI基础设施、AI操作系统层、大模型赋能千行百业、国产算力生态、硬件觉醒、物理世界基础模型、具身智能平台等主题演讲与圆桌讨论 [45][48][50] 大会影响力与参与价值 - MEET系列大会是业界最具代表性的年度智能商业峰会之一,每年获数千万媒体曝光,吸引千位线下观众与超300万名在线观众 [36] - 参会观众质量极高,不乏企业管理层等高精尖人才,是绝佳的交流机会 [31] - 嘉宾阵容构成从理论、平台、应用到终端的完整AI落地拼图,专注解决现实问题而非空谈AGI [33] - 通过一线实践者的分享,有望找到AI从炒作走向产生实际影响的真实路径 [34]
论文自动变漫画PPT!Nano Banana同款用秘塔免费生成,还有一对一语音讲解
量子位· 2025-12-09 05:39
核心观点 - 国产AI应用“秘塔AI搜索”推出对标海外Nano Banana 2的“漫画式课件生成”功能,通过将复杂资料(如学术论文、行业报告)自动转化为图文并茂、带语音讲解的PPT,显著提升了知识获取与学习的效率,并坚持免费、零门槛的普惠模式 [1][2][3][4][11][48][58] 产品功能与体验 - 核心功能是“学点啥”模块,可将上传的文档、链接或关键词搜索的内容,自动生成逻辑清晰、带语音讲解的PPT课件 [12][14][15][20] - 支持近20种画面风格(如像素风)和多种讲解风格供用户选择 [5][18][36] - 生成过程全自动,用户上传素材并设定偏好后,约五分钟即可获得结果,课件支持自动播放与语音讲解,如同上课 [20][22] - 课件具备交互性,用户可点击PPT中的陌生词汇获取名词解释 [25] - 除单篇文档解析外,还支持通过“知识库”功能一次性上传并解析多个文件(包括音视频),并生成总结与PPT [29][30][31][34] - 在常规搜索结果页面,也可直接点击“生成幻灯片”将冗长文字转化为PPT [40][41] - 功能应用场景广泛,不仅用于学习,也可用于快速梳理热点事件(如人物关系) [43][44] 市场定位与差异化 - 与市面上侧重精美模板和演示的AI PPT工具不同,该产品将重心转向“对内输入”,专注于辅助用户自主学习与消化复杂信息 [53][54][55] - 产品定位从“办公耗材”转变为辅助用户理解信息的“外挂大脑”,将制作PPT从负担转化为获取知识的捷径 [56][57] - 该功能延续了公司产品线的一贯逻辑,即通过免费AI工具(如AI搜索、DeepResearch)降低信息获取门槛,致力于让用户从“搜得到”、“研究深”到“看得懂” [58] 商业模式与用户价值 - 功能完全免费开放,无需内测申请或排队,零门槛使用 [8][48] - 官方每日提供100积分(相当于100页PPT),免费额度足以覆盖绝大多数用户日常高频的学习与阅读需求 [49][51] - 上传文档会消耗额外积分,但实测将一篇《自然》(Nature)论文转为PPT后,每日积分仍有剩余 [50] - 公司旨在利用科技手段抹平信息鸿沟,使AI带来的效率提升普惠于每一个人 [58][59]
量子位编辑作者招聘
量子位· 2025-12-09 05:39
编辑部 发自 凹非寺 量子位 | 公众号 QbitAI AI热潮还在汹涌,但如果你还不知道如何参与……那为什么不来 量子位 呢? 我们是一家以 追踪AI新进展 为核心的内容平台,经过8年积累,目前拥有顶流影响力,广泛且备受认可的产业资源,以及时代风口的最佳观 测和学习生态位。 目前,我们有 三大方向 岗位招聘,希望你是 (或者能成为) 这三个方向的内容专家: 岗位均为全职,工作地点:北京中关村。 岗位面向: 加入我们,你可以获得: 以下是岗位详情: 所有岗位不同能力层级职位均在开放,欢迎结合个人履历和经验申请。 AI产业方向 岗位职责: AI产业方向 :关注基建层创新,包含芯片、AI Infra、云计算; AI财经方向 :关注AI领域创投和财报,跟踪产业链资本动向; AI产品方向 :关注AI在应用和硬件终端方向的进展。 社招:覆盖编辑、主笔、主编各个层级,按能力匹配岗位; 校招:应届毕业生,接受实习且可转正。 站在AI浪潮之巅 :第一时间接触和了解AI领域最新技术和产品,构建完整的AI认知体系。 玩转AI新工具 :将各种AI新技术、新工具应用于工作,提升工作效率和创造力。 打造个人影响力 :通过撰写独家原创内 ...
准确率腰斩!大模型视觉能力一出日常生活就「失灵」
量子位· 2025-12-09 01:21
研究背景与核心问题 - 当前大多数第一人称视频问答基准集中于日常生活活动,忽略了真实世界应用中的巨大领域差异[3] - 现有多模态大语言模型在真实专业场景中面临泛化瓶颈,例如在外科、工业、极限运动与动物视角等场景下表现不佳[1] - 研究核心在于评估模型在视觉风格和语义内容上与日常家务大相径庭的专业领域中的表现,即应对领域差异的能力[7][8] EgoCross基准概述 - 该研究首次提出跨域第一视角视频问答基准EgoCross,填补了该领域的评估空白[3] - 基准覆盖手术、工业、极限运动、动物视角四个高价值专业领域[3] - 数据集包含957个高质量问答对,覆盖识别、定位、预测和计数四类核心任务下的15种子任务[11][12] - 每个问答对同时提供开放式和选择式两种评测格式[3][12] 模型评估关键发现 - 评测了8款主流多模态大语言模型,包括GPT-4.1、Gemini 2.5 Pro等闭源模型,以及Qwen2.5-VL、VideoLLaMA3等开源模型[12] - 模型在跨域场景中表现不佳:表现最好的模型在闭卷格式下准确率低于55%,在开卷格式下低于35%[12] - 领域差距显著:模型在日常活动基准上的准确率为73.58%,但在EgoCross跨域场景中骤降至43.14%[13] - 专业领域挑战不均:工业和极限运动领域对模型最具挑战性,动物视角相对容易[13] - 任务类型影响显著:预测类任务比基础识别任务性能下降更严重[18] - 通用大模型表现优于专用模型:Gemini 2.5 Pro等通用模型优于专门针对第一人称视频训练的模型,表明当前领域适应方法存在局限[13][18] 模型性能数据详述 - 在手术领域,GPT-4.1闭卷准确率为57.24%,开卷为39.58%;Gemini 2.5 Pro闭卷为61.48%,开卷为42.40%[13] - 在工业领域,GPT-4.1闭卷准确率为45.71%,开卷为12.24%;Gemini 2.5 Pro闭卷为37.55%,开卷为24.49%[13] - 在极限运动领域,GPT-4.1闭卷准确率为43.09%,开卷为20.33%;Gemini 2.5 Pro闭卷为43.90%,开卷为21.54%[13] - 在动物视角领域,GPT-4.1闭卷准确率为64.48%,开卷为34.43%;Gemini 2.5 Pro闭卷为68.85%,开卷为49.18%[13] - 开源模型Qwen2.5-VL-7B总体闭卷准确率为44.82%,开卷为20.41%[13] 改进方法探索与效果 - 研究探索了提示学习、监督微调和强化学习三种改进方法[12] - 提示学习通过在推理阶段加入领域特定提示,不改动模型参数,挖掘模型已有能力[15] - 监督微调在目标领域少量数据上全参数微调,在工业领域使性能相对基线提升接近20个百分点[15] - 强化学习方法基于GRPO框架,对模型策略进行优化,在四个领域上平均带来约22个百分点的闭卷准确率提升,效果最显著[12][15] - 具体数据:以Qwen2.5-VL-7B为基座,强化学习方法使其在手术、工业、极限运动、动物视角领域的平均准确率从44.82%提升至60.12%[14] 研究价值与影响 - 该研究系统揭示了现有多模态大语言模型在跨域第一人称视频理解上的短板[4] - 研究验证了微调、强化学习等方法的改进潜力,为未来构建更具泛化能力的模型提供了方向[4][12] - 所有数据集、代码已全部开源,该项研究已入选AAAI 2026[5]
梁文锋,Nature全球年度十大科学人物!
量子位· 2025-12-09 01:21
梁文锋与DeepSeek入选《自然》年度人物 - 权威科学期刊《自然》公布2025年度十大科学人物榜单,DeepSeek创始人梁文锋因模型对AI领域的重要贡献与变革性影响成功当选[1][3] - 《自然》给予梁文锋的形容词为“Tech disruptor”(科技颠覆者),并提及他金融从业者的身份[4] - 梁文锋为人低调,拒绝了《自然》的采访请求,其模型开放程度与其个人神秘程度形成对比[5] DeepSeek的技术与行业影响 - DeepSeek模型凭借出色的“性价比”策略,将模型成本降至行业难以置信的水平,并提升了国产大模型在全球社区的技术声量[8][9] - DeepSeek的出现证明,大模型不一定要堆数据、堆参数、堆服务器,也能达到一线水准的能力[10] - DeepSeek近期发布并开源了V3.2系列模型,在Agent评测中达到了当前开源模型的最高水平[11][12] 梁文锋的个人背景与职业历程 - 梁文锋1985年出生于广东湛江,17岁以“高考状元”成绩考入浙江大学电子信息工程专业,后攻读同专业研究生,师从项志宇教授研究机器视觉[14][16] - 2008年毕业后投身量化投资创业,其团队在2010年沪深300股指期货推出后乘势发展,自营资金很快超过5亿元[17] - 2015年,梁文锋与校友共同创立幻方量化,一年后推出首个AI模型,使用GPU进行深度学习生成交易仓位[18] - 2021年,幻方量化成为国内首家突破千亿规模的量化私募,被称为国内量化私募“四大天王”之一[19] - 2023年5月,瞄准通用人工智能,幻方量化成立独立新组织“深度求索”,即DeepSeek[21] 另一位中国入选者杜梦然 - 中国科学院深海科学与工程研究所研究员杜梦然同样入选《自然》2025年度十大科学人物,其形容词为“Deep diver”(深潜者)[6][22][23] - 2024年,杜梦然团队在日本东北部的千岛—堪察加海沟底部,使用载人潜水器“奋斗者号”发现了地球上已知最深的基于化学合成的生命群落,挑战了现有深海极端生命和碳循环模型[25] - 杜梦然1987年出生于安徽亳州,拥有中国海洋大学学士学位、硕士学位,后赴美国Texas A & M University攻读博士学位[28][29][31] - 她曾跟随载人潜水器“蛟龙”号、“深海勇士”号、“奋斗者”号下潜20余次,研究成果发表在《Science》等顶级期刊[33] 《自然》年度其他入选者概览 - Susan Monarez:美国疾病控制与预防中心前主任,因坚守科学底线被解职,引发对科学独立性与公共卫生政策的反思[35] - Achal Agrawal:印度自由数据科学家,通过揭露学术不端推动印度国家院校排名体系将论文撤稿纳入考核指标[36] - Tony Tyson:薇拉·鲁宾天文台的构想者与推动者,该望远镜将以前所未有的规模透视暗物质与宇宙演化[37] - Precious Matsoso:成功引导世界卫生组织近200个成员国就首份《全球大流行病条约》草案达成一致[38] - Sarah Tabrizi:亨廷顿病研究领军人物,其团队在基因疗法临床试验中取得了延缓疾病进程的关键证据[39] - Luciano Moreira:在巴西建造全球最大“蚊子工厂”,通过释放携带沃尔巴克氏体的蚊子有效降低登革热发病率[40] - Yifat Merbl:从蛋白酶体中发现一个由数千种潜在抗菌肽构成的全新免疫防御系统,颠覆了免疫机制认知[41] - KJ Muldoon:身患超罕见病,在六个月大时接受了首例高度个性化的CRISPR基因编辑疗法,标志着基因医学迈向“一人一药”的精准时代[42]
看完最新国产AI写的公众号文章,我慌了!
量子位· 2025-12-08 12:00
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 只需静候几分钟,AI就水灵灵地把完整的微信公众号科普文章给呈现了出来,来感受一下这个feel (上下滑动浏览) : 这一次,AI真的是快要砸掉我的饭碗了。 因为如果你现在想根据 NeurIPS 2025 的最佳论文写一篇 公众号文章 ,只需要把它丢给AI并且附上一句话: 帮我解读这篇论文,并写一个 图文并茂 的微信公众号推送来介绍这篇文章。 不得不说啊,这个AI从标题开始就真的把最最最重要的关键信息 "NeurIPS 2025最佳论文" 精准抓了出来。 并且 "Gates一下" ,更是把名词动词化,是有点语言编辑功底在身上的。 回头细看这个AI处理的过程。 首先,它会根据这篇论文的内容,先处理文字的部分,将文章分为了引言、核心问题、破局之道、实验结果、深入分析、结论与展望这六大部 分,是符合一篇论文解读文章的逻辑。 然后AI会把论文中要引用的图片和表格进行适当的裁剪和标注,并插进文章里面,还会在图片下方附上图注: 一气呵成,真的是 "文字+图片+排版" 一气呵成。 那么这到底是何许AI是也? 不卖关子,它就是 智谱 最新升级的新一代视觉推理模型—— GLM ...
100万亿Token揭示今年AI趋势!硅谷的这份报告火了
量子位· 2025-12-08 11:36
文章核心观点 - 基于对OpenRouter平台超过100万亿Token使用数据的实证分析,揭示了2025年AI行业的发展趋势,核心结论包括开源与闭源模型关系转变为互补、中国开源模型力量崛起、模型功能向推理与执行系统演进、编程与角色扮演成为主要应用场景以及用户留存呈现“水晶鞋效应”等[1][8][12] 开源与闭源模型格局演变 - 开源模型不再是闭源模型的廉价替代品,两者关系已演变为互补,开发者常同时使用两类模型[9][10] - 开源模型使用量稳步增长,预计到2025年底将占据约三分之一的Token用量[10][12] - 开源模型市场从高度集中走向多元化,早期DeepSeek V3和R1曾占一半以上用量,但预计到2025年底,没有单一模型能持续占比超25%,市场将由5~7个模型均分[16][17][18] - 中型模型(参数在150亿到700亿之间)更受市场青睐,小模型正在失宠,市场分化为强大的中型模型类别或整合到最强大的单个大型模型上[20][21] 中国开源模型崛起 - 中国开源模型成为增长主要引擎,其每周Token使用量占比从2024年底的1.2%最高激增至30%,平均占比为13%,与其他地区开源模型平均13.7%的份额相当[12][13] - 中国模型如DeepSeek、MiniMax、Kimi K2等在开源领域受到青睐,其中DeepSeek在角色扮演和闲聊领域有极高粘性,超过三分之二的流量用于此[1][16][50] - 在编程领域,中国模型如MiniMax已成为快速崛起的新秀,近几周取得显著增长[48] 模型功能与使用范式转变 - 语言模型正从对话系统升级为推理与执行系统,使用推理功能的Token用量从年初可忽略不计增长至超过50%[22] - 模型调用工具的功能使用占比上升,从年初集中于少数模型发展到更多模型支持,缺乏可靠工具的模型有落后风险[29][30][31][33] - 用户任务复杂度提升,从生成短文转向解决难题,如分析完整文档或代码库[35] - 用户平均每次提示词长度增加约4倍,模型完成任务所需Token用量增加近3倍,反映出工作负载更依赖上下文且推理消耗更多[36][39] - AI正从聊天机器人转变为能独立规划步骤、调用工具并完成复杂目标的自动智能体(Agent)[42][43] 主要应用场景与模型偏好 - 编程和角色扮演是AI模型最主要的使用方式[12][44] - 编程查询的Token用量从年初的11%上涨至最近的超过50%,增长最为稳定[45] - 在编程领域,Claude系列长期占据主导地位,大部分时间占比超过60%,但其份额在2025年11月首次跌破60%[47] - OpenAI在编程领域的市场份额从2025年7月的约2%增长至近几周的约8%,谷歌份额稳定在约15%[47][48] - 在角色扮演领域,开源模型中其使用量占比高达52%,中国与西方开源模型在该领域平分秋色[50] 用户行为与留存特征 - 用户留存呈现“水晶鞋效应”,即新模型发布时若能完美解决特定用户痛点,便能锁定一批高粘性用户,即使后续有更好模型也难以被替换[12][67] - 例如,Claude 4 Sonnet和Gemini 2.5 Pro发布5个月后用户留存率仍保持40%高位[67] - 该效应窗口期很短,仅在模型被视为“最前沿”时有效,一旦竞品能力赶超则难以吸引新用户[69][70] - 用户留存模式可分为:成功锁定(如Claude、GPT-4o Mini)、从未合脚(如Gemini 2.0 Flash)、回旋镖效应(用户离开后因性价比或特定能力又回归,如DeepSeek)[74] 市场与区域动态 - AI不再是硅谷独角戏,亚洲地区付费使用量占比从13%翻倍至31%[71] - 北美仍是最大市场,但份额已不足50%[80] - 英语以82%的份额占据绝对主导,简体中文以近5%的份额位居第二[80] 其他关键发现 - 模型价格下降对使用量的影响有限,价格下降10%仅带来0.5%-0.7%的使用量增长[80] - 存在“杰文斯悖论”现象,即模型降价且好用后,用户会在更多场景更频繁地调用,导致总Token用量飙升,总支出可能并未降低[75][76] - 报告数据主要反映开发者与服务端API调用行为,未涵盖通过App或Web直接访问的流量,且平台定价策略可能影响数据代表性[76]
小冰之父李笛智能体创业,公司取名Nextie!陆奇是股东
量子位· 2025-12-08 10:53
新公司“明日新程”的创立与定位 - 前小冰公司CEO李笛于2025年12月7日陆奇“奇绩创坛路演日”上,以压轴身份公开其全新创业公司“明日新程”,英文名Nextie,寓意“下一程”[1][2][6][7] - 新公司核心团队由小冰公司核心初创团队构成,包括联合创始人曾敏、大模型与算法负责人王文斓等,目前团队规模约30人[4][44][45][46] - 公司正计划启动一轮千万美元级别融资,陆奇旗下的奇绩创坛是股东之一,但尚未完成正式对接[5][8] 核心技术理念:群体智能与认知模型 - 新公司的技术方向是“群体智能”,旨在教会AI什么是“认知”,以解决个人、组织及大模型普遍存在的认知盲区[11][12] - 技术路径不追求单个模型预训练最大化,而是让一群各有所长、拥有独特视角和认知方法的AI智能体(Agent)对同一问题进行辩论与思维碰撞,综合不同认知进行研判,以逼近更合理的答案[12][13] - 该理念与当前以Manus为代表的去中心化智能体路径不同,更侧重于中心化能力展现,组合不同领域的专家智能体以提供生产力[14][15] - 公司整理了1800年至2020年跨越220年的人类论文,试图构建群体智能演化史,为技术路线提供参考[18] 内测产品“团子”与初步成果 - 公司理念已在内测产品“团子”上得到具象化,该产品有两种运行模式:“官方姐妹团”侧重生活化场景与情感问题,“官方研究团”聚焦课题研究、学术检索与行业洞察[21][22] - 产品推理机制不依靠“思维链”,而是直接展现不同AI智能体间的相互博弈与投票,例如在“姐妹团”模式下,系统会筛选出3名最匹配的AI发起辩论,最终由40位AI“姐妹”投票后总结输出结果[24][27] - 李笛表示,基于群体智能与认知模型的多智能体框架,在内测阶段的大部分案例中,其表现显著优于任何单一大模型或智能体产品,并已取得SOTA成果[30][31] - 公司将成绩归功于群体智能框架下AI之间的对抗学习[32] 商业模式与产品规划 - 商业模式明确不会按Token收费,更倾向于按照任务结果本身定价,原因是不同任务语境中单个Token所承载的信息密度和价值差异极大[33][34][35] - 技术内测已基本完成,产品预计将于明年1月7日正式上线[36] 创始团队背景与关联 - 李笛是小冰公司的创始人与核心灵魂人物,曾主导微软小冰AI聊天机器人从0到1的发起与发展,并于2020年小冰从微软分拆后出任CEO[47][48][49][50] - 2025年5月,小冰公司完成工商信息变更,李笛不再担任公司法人,但仍为第二大股东,法人代表变更为前首席架构师周力,公司董事长为沈向洋[39][40][41][42][43] - 除李笛外,核心团队成员曾敏是小冰联合创始人、前微软首席研发总监,负责小冰开放域对话系统;王文斓是小冰大模型与算法负责人,曾任职于英特尔和虎牙[51][52][53][56][57] - 在当日的奇绩创坛路演中,53个创业项目里有三个来自李笛带出来的团队,李笛可能扮演类似驻场企业家的角色[58][60]
机器人集体到香港户外极限挑战,狗比人强
量子位· 2025-12-08 06:07
赛事概况与核心赛制 - 第五届ATEC科技精英赛线下赛于12月6-7日在香港中文大学举办,是全球首个聚焦实景极端环境的人工智能与机器人赛事[8][26] - 比赛设置垃圾分拣、自主浇花、定向越野和吊桥穿越四个真实世界挑战,旨在全面考察机器人从基础操作到跨地形移动的综合能力[10][13][14] - 比赛规则强调鼓励自主、限制干预,遥操作越少,自主完成越多,得分越高[16] - 浙江大学Wongtsai赛队凭借在机器人全自主智能方面的卓越表现,摘得15万美元冠军大奖[5][25] 参赛队伍表现与策略 - 参赛队伍普遍采取先遥操保底、再自主冲高分的策略,并在具体项目上临场发挥,奇招尽出[17] - 冠亚军队伍Wongtsai和IRMV在垃圾分拣任务中完全依靠自主模块通关,稳稳拿下无遥操的额外加分[23] - 上海交通大学IRMV赛队在吊桥任务中略过拉绳搭桥环节,让机器狗跳过50厘米的空隙[21] - 为应对挑战,选手们进行了临时改装,例如给机器人安装“大脚板”和“雪橇”以防止足部卡在吊桥缝隙中[18] 机器人形态性能对比 - 四足机器人(机器狗)在所有任务中的表现均明显优于双足(人形)机器人[27] - 人形机器人在定向越野项目中因重心高、触点少,在复杂地形如陡梯、碎石路上表现吃力[29] - 在需要稳定抓取和精细操作的任务中,人形机器人因结构复杂、控制链条长,定位或手部调节稍有偏差就难以完成有效抓取[30][31] - 四足机器人表现稳定,既能在浇花、分拣等任务中用背部夹爪完成任务,又在户外越野和吊桥穿越中展现统治级表现[36] 技术挑战与行业洞察 - 户外环境给机器人感知带来巨大挑战,光照、风、阴影等细微环境变化的扰动会累积成误差,影响任务成功率[37][40] - 在垃圾分拣任务中,透明的塑料瓶在室外因反光及背景等因素,导致机器人经常识别失败[39] - 环境扰动如风吹动物体,会迫使机器人的affordance估计必须实时更新[41][42] - 在信号弱的野外,机器人更依赖自身IMU、激光雷达与本地推理能力,难度增加[45] 当前技术短板与未来方向 - 规划层面暴露出机器人普遍缺乏多步骤关联推理和环境改造能力,例如在吊桥任务中难以自主完成“拉绳搭桥”的连续动作[46] - 操作层面普遍存在上半身操作与下半身移动解耦的架构问题,缺少统一的全身运动与操作控制框架[50][51] - 当前许多前沿VLA模型主要聚焦上半身操作,对“移动-操作”的端到端整合支持仍十分有限[55] - 未来重要突破方向是能同时统一移动与操作、实现全身自主控制的端到端机器人模型[56][57] 赛事意义与行业价值 - 比赛暴露了在实验室环境中不易看到的问题,为行业提供了更接近真实应用场景的测评体系[26][58] - 赛事旨在通过极限挑战,推动机器人技术从演示可行走向应用可靠[60] - 赛事设计理念是让机器人在真实碰撞中暴露弱点,因为只有“真问题”才能牵引出真实的技术进步[61] - 比赛的意义在于让整个行业看清机器人离“走进世界”还有多远,以及未来应该补课的方向[59]
量子位编辑作者招聘
量子位· 2025-12-08 06:07
公司概况与市场地位 - 公司是一家以追踪AI新进展为核心的内容平台,经过8年积累,拥有顶流影响力和广泛且备受认可的产业资源[1] - 截至2025年,公司在微信公众号拥有超240万订阅用户,全网用户超700万,日均阅读量200万+[12] - 在新榜和清博等第三方数据平台,公司已是AI以及前沿科技行业TOP1新媒体[12] 招聘岗位与方向 - 公司开放三大方向岗位招聘:AI产业方向、AI财经方向、AI产品方向[2][6] - 岗位面向社招和校招,社招覆盖编辑、主笔、主编各个层级,校招面向应届毕业生,接受实习且可转正[4][6] - 所有岗位不同能力层级职位均在开放,工作地点位于北京中关村[2][4] 岗位职责详情 - **AI产业方向**:关注基建层创新,包含芯片、AI Infra、云计算;跟进该领域新进展及核心玩家动态;解读前沿论文、开源社区及技术大会报告;参与核心采访,对话产业专家并撰写案例[5][6][7] - **AI财经方向**:关注AI领域创投和财报,跟踪产业链资本动向;产出创投融资、招股书财报解析、公司战略分析等稿件;访谈对话投资人、创业者、产业分析人士[6][9] - **AI产品方向**:关注AI在应用和硬件终端方向的进展;撰写AI应用产品深度评测、跟踪多终端新品发布;对话访谈AI应用创业者、产品专家、终端技术专家[6][10] 任职要求 - **AI产业方向**:对芯片、GPU、NPU、服务器、模型训练架构、云计算等有基本理解;熟悉AI行业供应链与生态;能把复杂技术内容结构化表达;有技术背景、理工或CS/EE方向优先[8][11] - **AI财经方向**:对数据敏感,对财报、股权结构、战略规划感兴趣;逻辑结构强,对商业叙事敏感;热爱对话采访,社交型人格[9][11] - **AI产品方向**:对智能硬件、AI终端趋势敏锐,重度AI产品体验人士;熟悉各大终端厂商业态、体验方法论;有强逻辑、体验表达和结构化能力[10][11] 员工福利与发展 - 员工可第一时间接触AI领域最新技术和产品,构建完整的AI认知体系[6] - 员工可将各种AI新技术、新工具应用于工作,提升效率和创造力[6] - 员工通过撰写独家原创内容,可建立个人知名度,成为AI领域意见领袖[6] - 员工可与AI领域大咖零距离接触,参与重要科技活动,拓展行业人脉[6] - 应届新人会由主编级编辑出任mentor,提供一对一指导[6] - 团队氛围扁平、简单、开放、多劳多得能者上位[6] - 提供行业TOP薪资待遇,五险一金、餐补、项目绩效、商务绩效、加班补助等福利[6] 应聘方式 - 应聘者需将个人简历发送至指定邮箱,邮件主题需注明应聘方向及姓名[11] - 随简历需附上科技行业代表作品,或能展现个人写作水平和风格的作品[11]