多模态大模型
搜索文档
七牛智能升5% 公司专注多模态大模型 上半年AI相关收入已达1.84亿元
智通财经· 2025-11-25 03:28
股价表现 - 股价上涨5%,报0.63港元 [1] 公司核心优势与业务战略 - 核心优势在于一体化MPaaS技术,拥有音视频技术、低代码平台、AI能力等关键技术 [1] - AIGC技术融入后,公司将专注多模态大模型,结合场景化开发赋能APaaS业务 [1] - 公司预计将加快海外业务拓展,提升国际市场占有率 [1] AI业务发展 - 上半年AI相关收入达1.84亿元,占总收入22.2% [1] - AI收入主要来源于AI推理服务和算力资源租赁 [1] - 平台开发者群体数量超169万,新增注册量持续增长 [1] - AI应用开发的推理算力需求攀升,AI相关用户快速增至15000人 [1]
港股异动 | 七牛智能(02567)升5% 公司专注多模态大模型 上半年AI相关收入已达1.84亿元
智通财经网· 2025-11-25 02:48
股价表现 - 七牛智能股价上涨5%,报0.63港元 [1] 核心业务与技术优势 - 公司核心优势在于一体化MPaaS技术,拥有音视频技术、低代码平台、AI能力等关键技术 [1] - AIGC技术融入后,公司将专注多模态大模型,结合场景化开发赋能APaaS业务 [1] 财务与运营数据 - 2025年上半年AI相关收入达1.84亿元,占总收入的22.2% [1] - AI收入主要来源于AI推理服务和算力资源租赁 [1] - 截至2025年8月,平台开发者数量超169万,新增注册量持续增长 [1] - AI应用开发的推理算力需求攀升,AI相关用户快速增至15000人 [1] 发展战略 - 公司预计将加快海外业务拓展,提升国际市场占有率 [1]
大模型技术学习过程梳理:Agent、RAG、通用大模型等......
自动驾驶之心· 2025-11-23 02:04
社区定位与目标用户 - 社区旨在为大模型技术领域的学习者提供交流平台,解决其在学术、应用和工程上遇到的问题 [5] - 目标用户包括从刚入门的研究生到已有基础希望进一步提升的学习者,社区内容设计可帮助小白快速入门,并支持进阶者系统性学习 [2][6] - 社区已构建包含技术路线分享、直播、问答、求职、赛事等多版块的闭环生态,致力于培养行业人才并提供展示机会 [3] 社区资源与合作伙伴 - 社区嘉宾团队正在快速扩张,已邀请来自上海交通大学、清华大学、北京大学、上海人工智能实验室、香港科技大学、香港大学等顶尖高校及科研机构的专家 [5][67] - 工业界合作伙伴涵盖阿里通义千问、美团LongCat、深度求索DeepSeek、字节豆包、百度文心一言、月之暗面Kimi等头部公司 [5][67] - 社区内部已汇聚40多位学术界和工业界专家,未来计划打造为大模型前沿技术聚集地 [67] 核心技术路线覆盖 - 社区提供全面的大模型全栈学习路线图,核心领域包括RAG(检索增强生成)、AI Agent和多模态大模型 [5][6][12] - RAG技术路线细分为Graph RAG、Knowledge-Oriented RAG、多模态RAG、Reasoning RAG等子领域,并提供BenchMark、综述及开源仓库等资源 [13][19][21][22][24][26] - AI Agent技术路线涵盖前沿综述、Agent评测、强化学习、多模态Agent、Agent通讯、基座Agent汇总、自进化Agent及Multi-Agent等方向 [28][30][33][35][37][39][40][42][44] 多模态与模型优化技术 - 多模态大模型训练内容包含多模态大模型(MLLM)、视觉语言模型(VLM)、大模型微调、强化学习与RLHF、MoE(混合专家模型)等关键技术点 [46][49][51][52][53][54] - 模型部署方面提供大模型量化、推理及部署的详细技术路线,满足学习者部署自有模型的需求 [60][61][62][64] - 扩展技术领域包括VLM的提示适配器学习、LLM在3D世界中的应用以及科学大语言模型学习路线图 [55][56][58] 社区服务与未来规划 - 社区福利包括第一时间掌握学术进展与工业应用、与行业专家交流工作求职问题、获得岗位推荐及产业投资与项目对接机会 [10] - 未来计划通过不定期邀请国内外顶尖学术界和工业界专家进行直播分享,并允许内容反复观看 [66] - 社区将持续分享独家岗位招聘信息,赋能成员职业发展 [67]
基于Qwen3-VL的自动驾驶场景实测
自动驾驶之心· 2025-11-22 02:01
模型核心能力 - 在自动驾驶场景的实测中展现出稳健的基础感知能力和令人惊喜的开放式推理与动态场景理解能力,具备"老司机"潜质 [2] - 能够精准理解道路结构、交通参与者、天气状况、交通标志等场景信息 [85] - 具备深度的空间推理能力,可判断车辆相对位置、运动状态及车道关系 [85] - 展现出动态行为预测能力,能分析车辆意图并评估风险等级 [85] - 在多帧时序理解方面表现突出,能基于连续图像推断速度变化和交通流演变过程 [85] 技术测试维度 - 测试涵盖场景理解、空间推理、行为判断、风险预测等多个维度 [2] - 在场景理解任务中,模型能准确描述图片内容、判断天气状况、识别道路类型及交通参与者 [7][9][10][11][15][17][18] - 在空间推理任务中,模型可识别距离自车最近的车辆、判断前方车辆移动状态及旁边车辆的变道意图 [21][22] - 模型能够回答关于前方车辆数量、位置、自车所在车道及车道线数量等具体空间问题 [25] - 在行为决策方面,模型能基于当前情况给出加速、减速或保持速度的建议 [28] 安全与风险评估 - 模型在判断中多次强调"安全第一",体现出良好的驾驶伦理观和安全意识 [85] - 能够识别图中最大的潜在危险并进行说明 [29] - 具备按危险程度对交通参与者进行排序的能力,例如将右侧对向行驶的白色面包车列为最高风险 [38][42] - 能合理判断超车行为的安全性,在夜间、对向来车、能见度低等条件下强烈不建议超车 [48][49][50] - 可以模拟突发情况下的场景演变,如车辆突然爆胎后可能引发的连锁反应 [75][77][79] 行业应用前景 - 此次测试表明通用视觉语言模型在垂直领域落地具有更多可能性 [2] - 基于通用大模型的自动驾驶系统未来或可通过"常识推理+多模态理解"的方式实现更高效、更泛化的驾驶决策 [86] - 模型未经过专门的自动驾驶指令微调却能对复杂交通场景做出合理判断,显示出强大的基础能力 [2][86] - 尽管在极端复杂场景下的反应一致性等细节仍需优化,但模型已展现出更加智能、更具理解力的自动驾驶未来图景 [86]
中信证券:看好MRO头部企业利润迎来进一步释放
新浪财经· 2025-11-21 00:21
行业前景与规模 - 中国MRO工业品采购数字化率持续提升,行业规模仍有大幅提升空间 [1] - 海外成熟市场代表性厂商在度过成长期后,年营收增速能多年维持10%-20%区间 [1] - 行业竞争格局相对分散,中国MRO行业有望长期共存至少两家年营收百亿级别的公司 [1] 技术驱动与公司发展 - 全球多模态大模型持续进化背景下,中国市场的数字化和智能化进程将同步进行 [1] - 数字化和智能化进程将驱动代表性公司进一步降本增效,实现长足利润释放 [1]
从投稿来看,具身方向的论文已经出现了堆积.......
具身智能之心· 2025-11-18 10:00
研究领域与方向选择 - 具身智能研究活跃方向包括视觉语言导航、视觉语言行动、强化学习以及真实到仿真再到真实的循环方法 [1] - 人形机器人研究热点集中在强化学习与真实仿真循环方法 若实验室具备相关机器人本体可优先考虑这些方向 [1] - 机械臂本体适合开展视觉语言行动、视觉语言行动结合强化学习以及扩散策略的研究 其中视觉语言行动方向普遍对计算资源要求较高 [1] - 四足机器人平台非常适合强化学习研究 但该领域创新点已相对有限 因已有较多研究工作完成 [2] - 移动操作是结合视觉语言导航与视觉语言行动的潜在优秀研究方向 [3] 研究挑战与资源考量 - 新入行研究者面临方向选择困惑 例如在强化学习与视觉语言行动之间 或传统SLAM与视觉语言导航之间难以抉择 [1] - 研究方向选择需考虑计算资源需求差异 某些方向需要较大算力而有些则不需要 充足算力是快速产出实验结果的必备条件 [1] - 研究者需根据预算选择适合的机器人本体 预算不足时可考虑采用仿真方案替代 [1] - 优秀研究想法的产生对新研究者而言充满挑战 往往需要经历多次试错 [3] 专业服务与支持 - 提供从CCF-A到CCF-C级别会议 以及SCI一区到四区期刊的论文辅导服务 覆盖毕业论文和博士申请支持 [3] - 辅导团队由来自国内外名校博士及头部企业研究员组成 具备ICML、ICLR、CoRL、ICRA、NeurIPS、CVPR等顶级会议投稿与审稿经验 [3] - 服务提供全流程闭环辅导 涵盖选题创新点挖掘、实验设计、代码调试、论文写作到投稿策略 [4] - 辅导结合工业界与学术界双重视角 不仅关注论文发表 更注重研究成果的落地应用价值 [5]
AI+消费机器人「灵宇宙」顾嘉唯:两波红利造就新机会,好的AI产品一定要「主动」
IPO早知道· 2025-11-18 03:22
融资与公司战略 - 公司于近期完成2亿元PreA轮系列融资,投资方包括上海国际集团旗下国方创新、国泰海通、广发信德、滴滴出行、拉卡拉旗下考拉基金、润建股份等,老股东超额追投 [7] - 融资资金将主要用于产品技术研发、海内外市场拓展、LingOS操作系统与多模态AI交互技术投入,以及构建“硬件+软件+服务”一体化商业模型 [7] - 公司选定“做真正的家庭机器人和随身AI终端”的路径,旨在享受多模态大模型能力溢出和具身智能技术红利溢出两波红利 [7][11] - 公司借鉴特斯拉FSD模式,搭建数据闭环路径,构建清晰的胜率与赔率逻辑以吸引资本 [12] 产品与技术优势 - 产品矩阵包括面向0-8岁儿童的绘本阅读机器人Luka卢卡和便携式AI学伴硬件“灵宇宙小方机”,分别主打“读万卷书”和“行万里路” [9] - 核心技术壁垒为LingOS操作系统和数据飞轮,支持多模态感知、主动交互和跨设备协同,并通过终端收集儿童交互数据构建稀缺的“具身智能”训练库 [9] - 护城河体现在AI终端的容器属性,可实现持续升级,核心优势为大模型时代带来的个性化“关系算法”和从Luka积累的几十亿数据能力 [15][16] - 交互设计强调AI主动解决问题,而非用户主动指令,通过视觉主动交互等能力提升体验,使语音交互“润物无声” [17][18] 市场表现与用户洞察 - “灵宇宙小方机”上市即登顶618期间AI玩具及玩具总榜双榜第一,双十一期间在京东天猫等多平台名列前茅,京东AI玩具“品牌累计榜单”和“SKU累计榜单”双榜第一,销售额同比618增长超230% [10] - 目标用户为有极强购买力的高净值人群,对AI能力、产品作为社交货币的颜值有要求,且几乎不受低价冲击 [14] - 产品定位为“家长买的时候是学习机,孩子用的时候是游戏机”,核心满足家长“解放自己和学以所得”及孩子“陪伴、寓教于乐”的需求 [13] 市场拓展与未来规划 - 产品已覆盖全球18个国家60多个城市,海外市场潜力巨大,尤其海外华人家庭对产品需求强烈 [23][25] - 出海策略依托大模型消除语言边界,通过软件升级适配不同国家,无需重新开发硬件单品,渠道上结合代理商模式与线上电商经验复制 [24][26][27] - 未来产品规划具备“破圈”潜力,从0-15岁儿童扩展到15-30岁年轻群体、30-50岁家庭带娃及60-100岁养老等年龄段,品牌内核“灵”指向数字永生和探索未知 [20][21] - 公司探索人机交互终局为“不可见”的穿戴设备,认为AR眼镜赛道存在被大厂挤压的风险,更看好独立计算终端的发展路径 [22]
从“技术力”到“增长力” 海康威视推进AI规模化落地
证券时报· 2025-11-17 16:58
AI技术机遇与公司定位 - AI对智能物联领域的影响被公司形容为一场可媲美模拟转数字、标清转高清的技术机遇 [1] - 公司基于多年AI投入,正将AI的"技术力"加速转化为新一轮成长周期的"增长力" [1] - 公司是智能物联领域的代表性企业,业务范围已从安防拓展至为千行百业提供场景数字化服务 [6] AI在生产制造中的应用 - 公司桐庐生产基地是浙江省首批"未来工厂",作为AI产品的"试验田",智能制造的实践探索已遍地开花 [1] - 通过应用自研的移动机器人集群、工业相机等技术和产品,工厂已构建起高度智能化的生产体系 [2] - 利用大模型技术实时识别生产线作业动作,系统可对少拿、错放等情况即时预警 [2] - 自研X-Ray缺陷检测设备搭载观澜大模型,对PCBA的缺陷检测效率大幅提升80% [2] - 大模型充当"产线质检员",监测螺丝漏打、风扇装反等装配问题,检测准确率高达99%以上 [2] AI产品战略与行业解决方案 - 公司绝大部分产品线已结合AI技术推出AI产品,通过"蛋炒饭"模式将多维感知产品与AI深度融合以响应不同行业场景化需求 [3] - 现有在售硬件产品型号有30000多种,AI并非独立存在,而是融入产品以提升解决场景问题的能力,并成为产品创新的引擎 [4] - 联合国家能源集团推出的融合光谱煤质快速分析仪,结合煤质分析大模型,覆盖300多万条历史煤种范围99%以上,将检测周期从至少8小时缩短至实时在线检测 [3] - 该煤质分析产品已在20多家煤炭相关企业落地应用 [3] 研发投入与技术积累 - 近5年公司研发费用率均超过10%,累计投入研发费用477.02亿元 [6] - 2025年前三季度,公司研发费用已达到87.38亿元 [6] - 公司已建立多级研发体系,在国内外设立多个本地研发中心 [6] - 公司已先后推出数百款大模型产品,实现了对云、域和边的全面覆盖 [6] 多模态大模型技术进展 - 公司将多模态大模型作为重点发力方向,构建了视觉、音频、光纤、X光、毫米波等物联感知大模型体系 [7] - 多模态大模型大幅提升感知智能上限,在复杂环境目标识别任务中实现检出率和检准率的大幅提升 [7] - 毫米波大模型使违禁品漏检下降86%,X光大模型在违禁品识别应用中漏检下降75%,光纤听诊大模型使误报相对降低72% [7] - "文搜"系列产品实现自然语言和视频图像的跨模态信息检索,大幅提升安防录像查找效率,应用于寻回走失人员、检索违法行为等公共安全场景 [7] AI在工业与各行业的落地 - AI大模型在工业领域的规模化落地是公司具有显著优势的方向,公司具备丰富的感知能力与深厚的行业经验 [9] - 公司已在石化煤炭、钢铁有色、机械装备、电子电器等行业广泛落地场景数字化应用 [10] - 例如,在中孚实业应用低延时高温高亮相机,解决超1200℃磷生铁水浇筑的远程操控难题,消除人工安全风险 [10] - 公司对内将AI应用到内部编程、智能客服等领域,对外采取双向延伸策略,推动终端级和工厂级场景的AI应用覆盖 [10] 财务表现与股东回报 - 自2010年上市以来,公司净利累计约为1380亿元,派发的现金红利累计约685亿元 [6]
宇树科技王兴兴:AI技术将赋予机器人真正“理解世界”的能力
证券日报网· 2025-11-16 12:49
行业发展趋势 - 下一个十年机器人发展将进入"生长与绽放"阶段,从"能运动"走向"能做事",从"行业工具"迈向"生活伙伴"[1] - AI技术特别是多模态大模型与机器人的深度融合将赋予机器人真正"理解世界"的能力,使其更加敏锐和能干[1] - 场景应用将推动机器人真正"融入生活",具体体现在工业协作、养老护理和家庭服务三大领域[1] 具体应用场景 - 工业机器人将在生产线上与工人并肩协作,通过简单指令自主完成物料搬运和精密组装,将人从重复劳动中解放[1] - 社区养老服务站将出现小型护理机器人,可为独居老人提供血压测量、用药提醒和陪伴聊天服务,弥补养老护理人员缺口[1] - 家用机器人将进入普通家庭客厅,承担打扫、看护和辅助学习等任务,成为家庭的"全能帮手"[1] 产业链与生态建设 - 机器人在更复杂开放环境中可靠运行对产业链协同能力提出更高要求[2] - 行业需要携手共建生态"朋友圈",与开源社区紧密合作以加速技术成果共享并降低全行业创新成本[2] - 需与全球伙伴共同建立健全机器人伦理与安全标准,确保技术向善发展,推动人类文明迈上新台阶[2]
王兴兴:下一个十年,是机器人迈向“生活伙伴”的十年
新浪科技· 2025-11-16 02:01
行业展望 - 下一个十年将是机器人从“能运动”走向“能做事”,从“行业工具”迈向“生活伙伴”的十年 [1] - 未来十年人工智能技术将赋予机器人真正“理解世界”的能力 [1] - 伴随多模态大模型与机器人的深度融合,机器人将更加敏锐和能干 [1] 公司技术进展 - 公司研发的人形机器人已经能够完成绝大部分工作动作 [1] - 公司技术涵盖离线预学习和实时模仿复刻 [1]