多模态大模型

搜索文档
自动驾驶之心开学季活动来了(超级折扣卡/课程/硬件/论文辅导福利放送)
自动驾驶之心· 2025-09-02 09:57
日月更替,斗转星移。又到了金秋九月的开学季,校园里涌动的青春朝气与实验室里闪烁的代码光标遥相呼应。还记得十年前自己新学期踏进大学校园,看到无 人小巴的震撼,也是那个时候第一次接触到了自动驾驶,现在想想就是那个时候埋下了投身自驾的种子。 从16年开始,自动驾驶踏上了飞速发展的列车,整个世 界都处于人工智能爆发的前夕,有些人因为自身的努力或幸运站在了潮头之上,激昂和困惑交织在每个人的心头。 自动驾驶十年沉浮 这十年,自动驾驶从最开始的瞒珊学步,ImageNet图像分类,到COCO目标检测、分割、跟踪,进化到nuScenes 3D世界感知,再到BEV大一统整个感知模块(3D 检测/OCC/在线地图),又到今天的端到端、VLA。自动驾驶就像一个婴儿一样,终于快长大了。 未来又会是哪个方向呢?VLA和WA会是终局么?L4自动驾驶 还是具身智能抑或虚拟现实? 可能是,也可能不是。但科技总归是朝着智能化的大趋势大踏步前进,保持跟进与学习是重中之重。 自动驾驶的十年征程堪称一部浓缩的产业进化史,十年前我很难想象人工智能会到今天的高度。2015年百度无人车在雾霾中完成城市道路测试时,行业曾天真地 以为 L4 时代近在咫尺。无数 ...
业务合伙人招募来啦!模型部署/VLA/端到端方向~
自动驾驶之心· 2025-09-02 03:14
业务拓展计划 - 公司计划在国内外招募10名业务合伙人[2] - 合伙人将负责自动驾驶课程研发、论文辅导业务开发及硬件研发[2] 技术研究方向 - 重点招募方向包括大模型/多模态大模型、扩散模型、VLA、端到端自动驾驶[3] - 涵盖具身交互、联合预测、SLAM、3D目标检测等前沿技术领域[3] - 世界模型、闭环仿真3DGS、大模型部署与量化感知推理等方向也在招募范围内[3] 人才资质要求 - 要求应聘者来自QS200以内高校且具有硕士及以上学历[4] - 拥有顶级会议论文发表经历者将获得优先考虑[4] 合伙人待遇 - 提供自动驾驶行业资源共享包括求职、读博及出国留学推荐[5] - 设置丰厚的现金激励方案[5] - 提供创业项目合作与推荐机会[5]
4000人的自动驾驶社区,开学季招生了!!!
自动驾驶之心· 2025-09-02 03:14
社区定位与规模 - 社区定位为综合类自动驾驶技术交流平台,集视频、图文、学习路线、问答与求职交流于一体,已吸引超过4000名成员,目标在未来2年内达到近万人规模[3] - 社区成员主要来自头部自动驾驶公司、具身智能公司、互联网企业、Top高校实验室及传统机器人公司,形成工业界与学术界互补的生态结构[1] - 社区覆盖近40个前沿技术方向,包括多模态大模型、VLM、VLA、闭环仿真、世界模型、端到端自动驾驶等主流方法论[1][3] 技术资源体系 - 汇总近40+技术路线、近60+自动驾驶数据集、行业主流仿真平台及开源项目,涵盖感知、规划控制、仿真等核心领域[12][23][24][25] - 提供超过100场专业技术直播分享,内容涉及VLA、3D检测、扩散模型等前沿课题,并邀请学术界与工业界专家参与[52] - 整理完备的学习资料库,包括数学基础、计算机视觉、深度学习、编程、经典书籍与课程课件,适配从入门到进阶的学习需求[7][24] 就业与产业链接 - 与近300家机构及自动驾驶公司建立内推合作机制,提供岗位推荐与简历直推服务,覆盖蔚小理、华为、大疆、英伟达等头部企业[8][12][59] - 定期开展行业趋势讨论,聚焦技术走向与量产痛点,并提供企业前景分析、跳槽建议及博士研究方向指导[4][16][57] - 构建求职交流板块,涵盖岗位开放信息、内推渠道及产业机会挖掘,强化社区与产业实践的连接[8][16][59] 内容服务特色 - 提供快速技术答疑服务,针对端到端入门、VLA学习路线、多传感器融合就业前景等实用问题提供解决方案[3][4][16] - 独家梳理自动驾驶100问系列专题,包括TensorRT部署、毫米波雷达融合、车道线检测等工程实践关键问题[7] - 打造多维度学习路径,如感知学习路线、仿真学习路线、规划控制学习路线等,系统性降低学习检索成本[12][13]
事关AI芯片,阿里发声
财联社· 2025-09-02 00:34
阿里云算力与芯片采购情况 - 有消息称阿里云通义千问大模型面临算力缺口 阿里紧急追加寒武纪思元370芯片订单至15万片[2] - 阿里云回应表示采购寒武纪15万片GPU消息不实 但确认一云多芯支持国产供应链[3] - 阿里CEO提及AI开发支出可能因供应链波动 公司有后备方案和多元化供应链储备 3800亿资本开支将按计划完成[3] 国产AI芯片市场格局 - 国产AI芯片主要参与者包括寒武纪 华为 海光信息 壁仞 沐曦 燧原股份 摩尔线程等厂商[4] - 2024年中国加速芯片市场规模超过270万张 GPU卡占据70%市场份额[4] - 中国本土AI芯片品牌出货量超过82万张 华为昇腾占据大部分份额 百度昆仑芯 天数 寒武纪 沐曦 燧原等出货量数万张不等[4] 阿里自研芯片进展 - 阿里2018年成立平头哥半导体公司 已推出玄铁系列RISC-V处理器 含光系列AI芯片 倚天系列通用服务器CPU 企业级SSD主控芯片镇岳510[6] - 自研CPU倚天710和AI推理芯片含光800已在阿里云规模化部署[6] - 有报道称阿里新款AI芯片正在测试中 服务于AI推理任务 与英伟达兼容 转由国内企业代工 但官方未回应[6] - 知情人士表示网上信息不准确 相关芯片仍处于保密状态[7] 互联网企业芯片布局 - 百度昆仑芯超节点8月全面启用并接入百度公有云 3万卡集群今年正式点亮 支持千亿参数大模型全量训练和百亿参数模型精调[8] - 腾讯推出三款自研芯片:AI推理芯片紫霄 视频转码芯片沧海 智能网卡芯片玄灵 曾与AMD合作推出星星海智慧木系GA01 GPU卡[8] - 字节自研芯片涉及视频编解码和云端推理加速应用场景[8] - 互联网企业支持国产芯片并建立自给自足供应链对AI生态发展重要 阿里2021年提出一云多芯战略 飞天系统兼容X86 ARM RISC-V等架构[8] 行业发展趋势与挑战 - AI大模型从单模态向多模态发展 应用增多导致算力爆发性增长 算力供不应求[8] - 相比英伟达 国产AI芯片系统生态仍不够完善[8] - 业内专家表示国产芯片需以性能提升和生态构建的双重策略应对全球算力产业链挑战[9]
DeepSeek、GPT-5都在尝试的快慢思考切换,有了更智能版本,还是多模态
机器之心· 2025-09-01 06:46
研究背景与问题 - 当前业界顶尖大模型面临"过度思考"难题,采用始终开启的详细推理模式,无论问题简单与否[3] - 现有解决方案如DeepSeek-V3.1需要用户手动介入快慢思考切换,GPT-5依赖庞大高成本的专家路由机制,距离真正智能思考仍有距离[3] - 这些方案或将判断压力转移给用户,或受限于复杂系统架构和高昂部署成本[3] 技术突破 - 腾讯混元团队与中科院自动化所合作研发R-4B多模态大模型,通过自适应思考(auto-thinking)机制实现智能思维模式切换[5] - 模型采用4.82B参数规模,基于Qwen3-4B语言模型和SigLip-400M视觉模型[11] - 在OpenCompass多模态学术榜单20B以内规模模型中性能排名第一,平均得分75.5[10][11] - 超越多个更大规模模型,包括InternVL3-14B(15.1B参数,得分75.2)和Kimi-VL-A3B-Thinking-2506(16.48B参数,得分74.3)[7][11] 核心创新 - 采用双模退火(bi-mode annealing)训练策略,使模型同时掌握思考与非思考能力[16] - 开发双模策略优化(BPO)强化学习算法,仅依赖基于规则的奖励信号,无需精心设计的奖励函数或特定数据[18] - 通过混合双模rollout机制,强制模型在训练中同时探索思考模式和非思考模式轨迹,避免单一模式偏好[18] - 模型能自动判别问题复杂度:简单问题直接响应,复杂任务自动切换到深度思考模式[21] 性能表现 - 在多项基准测试中表现卓越:MMMUval得分68.1,MMStar得分73.1,MMBenchV1.1-ENdev得分84.9[25] - 在推理效率方面实现提升,简单任务下无需消耗更多Token[25] - 在OpenCompass多模态推理榜单开源模型中位列第一,得分57.6[12] - 超越GPT-5-nano-20250807(60.7分)和Gemini-2.0-Pro(56.6分)等商业模型[12] 应用前景 - 适用于日常问答分析,自动切换简单查询和复杂推理模式,提升自动化处理效率[27] - 在科学研究中可解析科学图表的多步关系,精准解读数据[29] - 支持边缘设备部署,凭借较少参数和自适应思考降低延迟和能耗,适用于即时问答系统[29] - 消费级显卡即可运行,支持笔记本电脑、智能座舱、智能家居等低功耗场景[12] 技术影响 - 解决了多模态大模型的思考困境,在小尺寸模型上探索了自适应思考的可行性[33] - 在AI计算与推理成本飙升的背景下,提供轻量化、智能化设计解决方案[33] - 模型已全面开源,支持vLLM高效推理,下载量已突破10,000次[12][34]
海天瑞声: 海天瑞声2025年半年度报告
证券之星· 2025-08-29 10:25
核心观点 - 公司2025年上半年营业收入1.57亿元,同比增长69.54%,主要受益于全球AI技术快速发展和商业化落地,三大业务板块全面增长 [4] - 归属于上市公司股东的净利润380.46万元,同比增长813.65%,扣除非经常性损益的净利润98.35万元,实现扭亏为盈 [4][5] - 经营活动现金流量净额为-3,375.12万元,同比下降315.29%,主要因海外业务采购支出增加及年终奖支付影响 [4][5] 行业发展趋势 - 全球AI产业迎来历史性发展拐点,IDC预计2028年全球AI IT总投资规模达8,159亿美元,年复合增长率32.9% [7] - 中国AI产业保持32.1%年均复合增长率,2029年市场规模突破1万亿元 [7] - 训练数据成为AI发展关键驱动因素,Cognilytica预计2027年全球训练数据市场规模达220亿美元,年复合增长率32% [8] - 中国人工智能基础数据服务市场规模2024年为58亿元,2028年达170亿元,年复合增长率30.84% [8] - 多模态大模型成为发展趋势,推动跨模态数据需求显著上升 [13] - 大模型发展从"规模驱动"转向"推理驱动",高质量思维链(CoT)数据成为提升复杂推理能力的关键 [14] - 行业应用从通用向垂直领域深化,专业数据需求提升 [16] - 具身智能兴起带来物理世界交互数据需求,当前存在巨大供需缺口 [17] - 数据安全合规要求持续提升,《数据安全法》《个人信息保护法》等法规密集落地 [18] 公司业务表现 - 智能语音、计算机视觉、自然语言处理三大业务板块全面增长 [4] - 海外业务收入7,351.14万元,同比增长68.24%,东南亚数据交付基地进入稳定运营阶段 [33] - 境内业务收入8,318.45万元,同比增长70.70% [34] - 客户累计数量超过1,100家,覆盖科技互联网、社交、IoT、智能驾驶、大模型等领域主流企业 [20][23] - 拥有成品训练数据集近1,800个,覆盖41种语言/方言 [20][35] 技术研发实力 - 已取得41项专利授权(39项发明专利) [20] - 拥有181项计算机软件著作权 [20] - 具备ISO27001信息安全体系认证、ISO27701隐私信息管理体系认证等资质 [20] - 在语音语言学基础研究方面有深厚积累,覆盖多语种、多音色、音素集等能力 [19] 战略布局进展 - 与成都、长沙、保定等地政府成立合资公司,参与数据标注基地建设 [36] - 与内蒙古呼和浩特签署战略合作协议,聚焦当地特色产业共建高质量数据集 [36] - 正拓展与上海、广州、宜宾等十余地的战略合作,完善全国业务布局 [36] - 强化北美、欧洲及日韩销售团队,深化本地化服务能力 [33] - 通过参与CVPR、ACL、Tech-AD等全球顶级AI学术会议提升技术品牌影响力 [33] 产品服务矩阵 - 提供标准化产品、定制化服务、应用服务全覆盖的解决方案 [22] - 训练数据涵盖智能语音、计算机视觉、自然语言三大核心领域 [23] - 应用于人机交互、智能家居、智能驾驶、智慧金融等22种创新应用场景 [20][23] - 开放数据处理工具集及平台,提供公有云访问、私有化部署及SaaS化服务 [28]
A股,8月收官!“宁王”重回300元
中国证券报· 2025-08-29 09:16
市场整体表现 - 上证指数收盘上涨0.37%,深证成指上涨0.99%,创业板指上涨2.23% [1] - 市场成交额超2.83万亿元,连续第6个交易日突破2.5万亿元 [1] - 8月累计涨幅:上证指数7.97%,深证成指15.32%,创业板指24.13% [1] - 8月市场热点主要集中在算力和芯片方向 [1] 宁德时代及锂电产业链 - 宁德时代股价盘中最高涨超14%,收盘涨10.37%至306.18元/股,成交额超234亿元 [3][4] - 2025年上半年营业收入1788.86亿元,同比增长7.27%;归母净利润304.85亿元,同比增长33.33% [6] - 中期分红方案为每10股派发10.07元(含税),现金分红总额44.11亿元 [6] - 钠电池量产进度与麒麟电池40%市占率形成技术护城河 [6] - 动力电池及储能电池市场领先,受益新能源汽车渗透率上升及全球能源转型 [6] - 电池板块冲高,先导智能、杭可科技"20CM"涨停 [3] 芯片及算力板块 - 芯片股表现分化:捷邦科技"20CM"涨停,淳中科技、华胜天成跌停 [3][7] - 寒武纪收盘跌6.01%至1492.49元/股,仍高于贵州茅台收盘价1480元/股 [3] - 寒武纪8月28日收盘价较7月28日上涨133.86%,显著高于同业及主要指数涨幅 [8] - 公司预计2025年全年营业收入50亿元至70亿元 [9] - 未有新产品发布计划,近期传播的新产品信息为不实信息 [9] - AI应用及多模态大模型升级带动算力需求增长,国产算力芯片与模型适配加速 [9] 其他板块表现 - 消费板块活跃,白酒概念领涨,会稽山、友阿股份涨停 [3] - 工业富联尾盘涨停,总市值1.07万亿元,成交额超173亿元 [3] - 保险、美容护理、旅游酒店等板块涨幅居前;半导体、教育、文化传媒等板块跌幅居前 [3]
中欧AI领域合作大有可为
证券时报· 2025-08-28 23:05
全球AI竞争格局 - 中国与欧盟是全球AI领域两大主要竞争者 中国以创新发展和场景拓展为导向 欧盟侧重标准规则和垂直应用 [1] - 欧盟计划投资300亿欧元建设AI基础设施 包括13个区域性AI工厂网络和千兆瓦级超级数据中心 [1] - 中国算力能力全球占比达15% 仅次于美国 通过"西电东送"和绿电资源解决能源供给瓶颈 [2] 欧盟AI发展挑战 - 面临能源供给严重不足问题 每个千兆瓦级数据中心需约1吉瓦电力 相当于中型城市用电需求 [1] - 电网设计未考虑高密度集中式负载 增量电网与发电能力建设周期长达5-10年 [1] - 300亿欧元投资资金筹措存在困难 需解决统一财政政策缺失和私人资本参与积极性问题 [1] 中国AI发展优势 - 中央与地方财政联袂发力 通过专项基金和产业园区形成与企业创新行为的集约联动 [2] - 通用芯片与专业芯片的自主设计与制造能力正在加速赶超 仅高端AI芯片制造仍存瓶颈 [2] - 成为全球最活跃的AI场景应用市场 在多模态大模型与具身智能两个方向呈群体性突破之势 [3] 中欧AI合作机会 - 技术层面可建立开源白名单和AI专利池 商业层面可共创国家级实验室和专业研究机构 [3] - 可通过联邦学习、差分隐私等技术实现跨国协作 在不泄露原始数据前提下共享成果 [3] - 加大算力资源采购并给予税率政策支持 帮助欧盟摆脱对美国算力的绝对依赖 [3] AI治理体系差异 - 欧盟颁布全球首部全面监管AI法规《人工智能法案》 采取最严格监管强度 [4] - 美国通过《AI行动计划》加大"去监管"节奏 以技术主权输出达到规则主权输出 [4] - 中国确立技术主权与灵活治理相结合方向 发布《国际人工智能开源合作倡议》 [4] 中欧治理合作基础 - 在"风险分级""人类控制"等原则存在充分共识 可设立技术委员会和合作路线图 [5] - 可组建联合专家工作组指导初级局部合作试点 设立谈判机制管控合作摩擦 [5] - 通过对标欧盟监管标准评估中国规则 利用技术转让换取欧盟市场准入 [6]
具身智能之心技术交流群成立了!
具身智能之心· 2025-08-28 08:36
具身智能技术社群成立 - 行业成立具身智能之心技术交流群 重点关注视觉语言导航 视觉语言动作 遥操作 扩散策略 强化学习 仿真到现实迁移 多模态大模型 运动控制 目标导航 建图定位等技术方向[1] - 行业社群面向机构及学校研究人员开放 需通过指定联系方式备注机构名称 个人姓名及研究方向完成入群申请[2][3]
自动驾驶之心业务合伙人招募来啦!模型部署/VLA/端到端方向~
自动驾驶之心· 2025-08-28 08:17
业务拓展计划 - 公司计划在国内外招募10名业务合伙人[2] - 合伙人将负责自动驾驶相关课程研发、论文辅导业务开发及硬件研发[2] 技术研究方向 - 重点招募方向包括大模型/多模态大模型、扩散模型、VLA、端到端自动驾驶[3] - 涵盖具身交互、联合预测、SLAM及3D目标检测领域专家[3] - 需要世界模型、闭环仿真3DGS、大模型部署与量化感知推理等专业人才[3] 人才资质要求 - 要求应聘者来自QS200以内高校且具有硕士及以上学历[4] - 优先考虑拥有顶会论文发表记录的候选人[4] 合作激励机制 - 提供自动驾驶行业资源共享包括求职、读博及出国留学推荐[5] - 设立丰厚的现金激励方案[5] - 开放创业项目合作与推荐机会[5]