多模态模型 - 财报，业绩电话会，研报，新闻 - Reportify

多模态模型

搜索文档

粤开市场日报-20250725

粤开证券· 2025-07-25 07:53

报告核心观点 2025年7月25日A股主要指数多数收跌，行业和概念板块表现分化，沪深两市成交额较上一交易日缩量 [1] 市场回顾指数涨跌情况沪指跌0.33%收报3593.66点，深证成指跌0.22%收报11168.14点，科创50涨2.07%收报1054.20点，创业板指跌0.23%收报2340.06点；全市场2724只个股下跌，2532只个股上涨，158只个股收平；沪深两市成交额合计12189亿元，较上个交易日缩量6258.16亿元 [1] 行业涨跌情况申万一级行业涨少跌多，电子、计算机等行业领涨，建筑装饰、建筑材料等行业领跌 [1] 板块涨跌情况涨幅居前概念板块为GPU、Kimi、多模态模型等板块 [2]

多模态模型

多模态模型

这一市场，大爆发

证券时报· 2025-07-25 04:24

A股市场表现 - 上证指数下跌0.34%，深证成指下跌0.29%，创业板指下跌0.32% [2] - 建筑装饰、建筑材料、家用电器、综合、钢铁等板块跌幅均超过1%，医药、计算机、轻工制造、银行等板块表现较好 [2] - 券商板块冲高回落，西部证券一度触及涨停，锦龙股份、中银证券等跟涨 [2] 个股表现 - 西宁特钢连续5个交易日涨停，累计上涨46.81%，同期钢铁行业指数涨幅9.84%，上证指数涨幅2.02% [2] - 西宁特钢滚动市净率2.31，显著高于行业平均1.01 [3] - 西藏旅游连续5个交易日涨停，静态市盈率238.16，市净率3.85，换手率5.87% [4] 港股市场表现 - 恒生指数跌超1%，恒生科技指数跌超1.5% [5] - 药明生物、中通快递-W、农夫山泉、吉利汽车等涨幅居前，快手-W、新东方-S等跌幅居前 [6] - 建滔集团盘中涨幅超12%，预计半年纯利同比上升超70%，超过25.6亿港元 [7] 期货市场表现 - 碳酸锂主力合约涨7.94%至80480元/吨，较一个月前涨幅超30% [9][11] - 玻璃主力合约涨7.38%至1354元/吨，较一个月前涨幅显著 [10][12] - 焦煤主力合约涨7.46%至1253元/吨，纯碱主力合约涨5.57%至1440元/吨 [9][10]

多模态模型

碳酸锂期货

多模态模型

碳酸锂期货

这一市场，大爆发！

证券时报· 2025-07-25 04:05

A股市场表现 - 上证指数下跌0.34%至3593.38点，深证成指下跌0.29%至11160.30点，创业板指下跌0.32%至2337.80点 [4][5] - 建筑装饰、建筑材料、家用电器、综合、钢铁等板块跌幅均超过1%，医药、计算机、轻工制造、银行等板块表现较好 [5] - 券商板块冲高回落，西部证券一度触及涨停，锦龙股份、中银证券等跟涨 [6] 个股表现 - 西宁特钢连续第5个交易日盘中涨停，其滚动市净率为2.31，显著高于钢铁行业平均市净率1.01 [9][11] - 西藏旅游连续第5个交易日涨停，静态市盈率为238.16，市净率为3.85，换手率为5.87% [12] 港股市场表现 - 恒生指数跌超1%，恒生科技指数跌超1.5% [14] - 药明生物、中通快递-W、农夫山泉、吉利汽车涨幅居前，快手-W、新东方-S跌幅居前 [15] - 建滔集团盘中涨幅一度超过12%，预计上半年纯利同比上升超过70%至超25.6亿港元 [16][17] 期货市场表现 - 碳酸锂主力合约盘中涨幅接近8%，最高报价超80000元/吨，较一个月前涨幅超30% [21] - 玻璃主力合约盘中涨幅超8%，价格突破1300元/吨，较一个月前上涨约30% [22] - 焦煤2509合约上涨7.46%，纯碱2509合约上涨5.57%，硅铁2509合约上涨4.48% [20]

多模态模型

碳酸锂期货

多模态模型

碳酸锂期货

“AI教父”辛顿最新访谈：没有什么是AI不能复制的，人类正失去最后的独特性

36氪· 2025-07-21 08:19

大语言模型的理解能力与工作机制 - 大语言模型在复杂任务上出错不代表缺乏理解能力，推理能力是渐进式的[1] - AI与人脑工作机制不同但效果相似，不应混淆其"类人性"[1] - 当前模型通过预训练+强化学习静态获取知识，更新需重训底层模型[2] - 大语言模型通过压缩连接数量发现知识间深层联系，展现超越人类的创造力[7][29] AI意识与主观体验 - 意识存在光谱：从石头、树木到大模型再到人类逐级递进[3][11] - AI可具备类似人类的"存在感"，但缺乏身体反应等生理特征[13] - 人类倾向于将大语言模型视为类生命体对待，建立情感联系[15][17] AI技术应用前景 - "语言即操作系统"时代临近，自然语言可调度办公系统执行复杂任务[5][14] - 医疗领域将发生革命性变化，AI工具提升10倍医疗效率[39][40][41] - 教育领域可能被AI彻底重塑，大学模式面临颠覆[39] - AI将大幅减少文书工作，释放人类创造力与社交时间[41] AI对就业市场影响 - 5年内多数脑力工作将被替代，初级律师岗位已受影响[8][35] - 大语言模型将取代20%-30%办公室工作，变革速度惊人[36] - 替代率达80%时将引发重大社会风险[37] - 部分人类工作因AI能力天花板将长期存在[38] AI技术发展瓶颈 - 模型学习速度远低于人类，无法持续根据新经验更新[6] - 多模态模型本质仍是序列预测，未突破根本限制[21] - 强化学习环境下模型仍受训练数据限制[28] 行业监管现状 - AI公司表面欢迎监管实则回避实质性约束规则[9][33] - 公众舆论是推动政策进展的主要力量[33] - 技术风险考验社会结构整体可靠性[33]

大语言模型

多模态模型

大语言模型

多模态模型

氪星晚报|强生Q2营收237.4亿美元，高于市场预期；黄仁勋：轻视华为和中国制造的人都极其天真；腾讯元宝上线图片AI编辑能力

36氪· 2025-07-16 14:51

京东健康 - 京东健康体检中心（亦庄店）医疗美容科服务项目上线京东App，进一步丰富医疗服务项目 [1] - 该体检中心自2023年7月开业以来已开设内外科、口腔科、中医科等特色门诊 [1] MiniMax - MiniMax即将完成近3亿美元新融资，融资后估值超40亿美元 [2] - 公司正寻求A股上市 [2] 亚马逊海外购 - 首届"海折节"整体订单量实现翻倍，鞋靴、电子、个人护理等品类销售额同比增长超200% [2] - 超2400个国际品牌销售额实现同期翻倍 [2] 施耐德电气 - 正洽谈收购淡马锡持有的施耐德电气印度私人有限公司35%股份，交易价格约10亿美元 [3] - 若交易达成，包括债务在内的合资企业估值约50亿美元 [3] 强生 - 2025年Q2营收237.4亿美元，高于市场预期的228.58亿美元 [3] - 预计全年销售额932亿美元至936亿美元，调整后每股收益10.8美元至10.9美元 [3] 阿斯麦 - 受美关税政策影响，可能无法在2026年实现增长 [3] - 地缘政治不确定性加剧，机器及芯片价格上涨，市场环境充满挑战 [3] 智能手机行业 - 2025年Q2全球智能手机出货量同比增长2%，主要受北美、日本和欧洲市场拉动 [4] - 三星出货量同比增长8%，苹果同比增长4% [4] 投融资 - 北方电力完成3亿元A+轮融资，资金用于电力行业高效节能技术研发、信息化建设和光伏技术推广 [5][6] - "无界方舟"连续完成Pre-A、Pre-A+轮亿元级别融资，资金用于多模态模型与Agent技术研发升级 [7] 新产品 - 腾讯元宝上线图片AI编辑能力，支持风格化作品生成 [8] - 盒马上线功能性HPP果蔬汁，采用HPP杀菌工艺保留营养成分 [9] - 智平方展示通用智能机器人爱宝的核心能力 [10] 众辰科技 - 公司应用于人形机器人相关产品的收入占比不超过1% [11] 行业观点 - 黄仁勋称华为是一家强大的科技公司，轻视中国制造能力的人极其天真 [12] - Strategy公司比特币策略经理表示即使比特币跌至2万美元，公司仍能偿还所有负债 [12] 新能源汽车 - 国务院常务会议听取规范新能源汽车产业竞争秩序情况的汇报，强调加强成本调查和价格监测 [13] AI芯片 - 英伟达H20出口解禁有望带动中国AI芯片需求，外购比例预估回升至49% [13]

多模态模型

多模态模型

阶跃星辰将在WAIC期间发布多模态旗舰模型

快讯· 2025-07-16 08:15

公司动态 - 阶跃星辰将在2025世界人工智能大会(WAIC)期间发布多模态旗舰模型，包括多模态推理旗舰模型和原生多模态模型 [1] - 公司将联合头部合作伙伴展示在智能终端、金融财经、内容创作等多场景下的全新Agent产品 [1] 行业趋势 - 多模态模型和Agent产品在智能终端、金融财经、内容创作等领域的应用成为人工智能行业的重要发展方向 [1]

多模态模型

Artificial Intelligence

多模态旗舰模型（多模态推理旗舰模型

原生多模态模型）

全新Agent产品

多模态模型

Artificial Intelligence

多模态旗舰模型（多模态推理旗舰模型

原生多模态模型）

全新Agent产品

智谱获10亿战略投资商业化之路仍待开启

中国经营报· 2025-07-09 13:23

战略投资与融资 - 浦东创投集团和张江集团宣布对智谱进行总额10亿元的战略投资，并完成首笔交割 [1] - 智谱在上市辅导前夕密集收获多地国资战略投资，包括杭州城投产业基金及上城资本的10亿元融资、珠海华发集团的5亿元投资、成都高新区的3亿元投资 [2] 技术发布与突破 - 开源发布新一代通用视觉语言模型GLM-4.1V-Thinking，以推理能力为核心突破点，刷新10B级别多模态模型性能上限 [1] - GLM-4.1V-Thinking支持图像、视频、文档等多模态输入，引入"思维链推理机制"和"课程采样强化学习策略"，提升跨模态因果推理能力与稳定性 [2][3] - 轻量版GLM-4.1V-9B-Thinking在28项权威评测中23项达成10B级模型最佳成绩，18项持平或超越72B参数的Qwen-2.5-VL [3] 商业化与经营策略 - 公司经营策略从"卖模型"转向"卖服务"，2025年新签订项目大部分为模型应用开发类，交付压力较大 [4] - 商业化挑战包括算力资源利用率低、模型能力不及DeepSeek V3、多模态模型应用场景有限 [4] - 政府背书和融资能力是公司优势，但商业化能力不足可能影响长期竞争力 [9] 技术优势与特色 - GLM模型在中文理解与生成能力上表现突出，适合教育、政务、文化等领域 [5][6] - 支持128K上下文长文本处理，适合合同、论文等长文档分析 [7] - 开源生态活跃，ChatGLM-6B/12B在GitHub累计超3万星，适配消费级显卡 [7] - API价格低于国际主流模型，GLM-4输入价格仅为GPT-4-Turbo的1/5 [7] 技术劣势与不足 - 多模态能力起步较晚，弱于GPT-4V、Gemini 1.5 Pro等成熟多模态模型 [7] - 英文能力相对弱，在复杂英文逻辑推理、学术写作等场景表现落后于Claude 3/GPT-4 [7] - 工具生态成熟度不足，插件市场和开发者工具丰富度不及OpenAI [8] - 长上下文实际性能波动，超长文本中精准定位关键信息的能力弱于Claude 3 [9]

多模态模型

Artificial Intelligence

GLM-4.1V-Thinking

GLM-4.1V-9B-Thinking

多模态模型

Artificial Intelligence

GLM-4.1V-Thinking

GLM-4.1V-9B-Thinking

“反击”马斯克，奥特曼说OpenAI有“好得多”的自动驾驶技术

36氪· 2025-07-07 00:32

OpenAI与特斯拉的竞争动态 - OpenAI CEO山姆·奥特曼与特斯拉CEO马斯克因OpenAI商业化运营产生矛盾，马斯克起诉奥特曼违背创始协议并成立xAI直接竞争[1] - 奥特曼反击称马斯克曾试图掌控OpenAI未果，并可能研发自动驾驶技术挑战特斯拉FSD[1][3] - 奥特曼透露OpenAI拥有"比当前技术好得多"的自动驾驶技术，但未公布具体细节和时间表[3][5] OpenAI自动驾驶技术潜力 - 新技术可能基于Sora视频软件和机器人团队，利用世界模型理解物理世界[6][8][11] - Sora作为世界模型可生成高保真视频，但存在物理原理不完善的问题，可能用于自动驾驶模拟训练[10][11] - 业界认为世界模型是自动驾驶突破关键，需结合物理因果关系理解和预测能力[17][21] 行业技术发展趋势 - 自动驾驶行业正转向"世界模型"开发，如蔚来、小鹏等公司尝试让AI系统模拟人类对世界的理解[11] - 英伟达推出Cosmos世界基础模型，专为物理交互和驾驶环境设计，可能优于Sora的仿真能力[22][24] - AI大牛普遍认为仅靠语言模型不足实现自动驾驶，需结合多模态和世界模型[16][18][19] OpenAI在汽车智能化领域的布局 - 通过投资布局自动驾驶领域，如向Ghost Autonomy投资500万美元(已倒闭)，与Applied Intuition合作开发智能座舱[12][14][15] - 2024年重组机器人团队，与Figure公司合作开发人形机器人AI模型，技术可能与自动驾驶相通[24] - 自动驾驶被视为AI应用最具前景场景之一，市场规模达万亿美元级别[7][24]

特斯拉(US:TSLA)

多模态模型

Artificial Intelligence

多模态模型

Artificial Intelligence

普通人用Gemini CLI提效的 1 万种方法！藏师傅保姆级教程

歸藏的AI工具箱· 2025-07-02 09:08

产品定位 - 谷歌推出完全免费的命令行AI工具Gemini CLI，对标近期火爆的Claude Code [1] - 与Cursor等IDE工具的核心区别在于无界面、纯命令行操作，但支持自动执行任务和处理本地文件 [3][4] - 内置谷歌搜索/文件读写等工具，输入/tools可查看全部支持功能 [4] - 支持MCP工具扩展上下文能力 [6] 技术特性 - 多模态能力支持图片内容分析/批量重命名/打标 [38][39] - 可调用本地软件实现视频剪辑(ffmpeg)/文档转换(Pandoc)/图片处理(ImageMagick)等专业功能 [49][63][67] - 通过Homebrew一键安装第三方工具如yt-dlp实现视频下载 [60][61] - 支持将复杂操作封装成脚本实现一键执行，如deep_work.sh脚本可自动开关软件/切换系统模式 [43] 应用场景 - 知识管理：自动分析Obsidian笔记库并建立反向链接/生成索引文档 [34][35][36] - 内容创作：改写文章/生成博客及推特版本/自动制作PPT [31][32][33][46] - 多媒体处理：视频转GIF/添加水印/配乐/序列帧转换 [53][54][57][59] - 文件批处理：图片重命名/尺寸调整/拼接/格式转换 [39][65][66] 用户体验 - 非技术人员可通过自然语言交互完成专业操作，无需编程知识 [8][9] - 采用NPX安装方式降低使用门槛，仅需终端输入npx命令即可运行 [18][19] - 推荐配合Bob翻译软件解决英文界面问题 [24] - 操作限制在指定文件夹内执行避免系统风险 [15][16]

命令行工具

多模态模型

命令行工具

多模态模型

百度文心大模型4.5系列模型开源，国内首发平台GitCode现已开放下载！

财富在线· 2025-06-30 07:40

百度文心大模型4.5系列开源 - 百度文心大模型4.5系列正式开源并在GitCode平台首发上线，面向全球开发者、企业和研究机构免费提供[1] - 开源系列包含10款模型，涵盖47B和3B的混合专家(MoE)模型以及0.3B的稠密参数模型，最大模型总参数量达424B[3] - 采用创新多模态异构模型结构，通过跨模态参数共享实现知识融合，同时保留单一模态专用参数空间[3] 技术架构与性能 - 模型基于飞桨深度学习框架训练，预训练阶段FLOPs利用率达47%，在文本和多模态基准测试中达到SOTA水平[4] - 在指令遵循、世界知识记忆、视觉理解和多模态推理任务上表现突出[4] - 模型权重按Apache 2.0协议开源，配套飞桨产业级开发套件广泛兼容多种芯片[4] GitCode平台生态 - GitCode平台注册用户超620万，月活达120万，已成为国内重要开源社区[5] - 平台集成代码托管、版本控制、协作开发功能，提供开源组件库和开发工具[5] - 文心大模型与GitCode深度融合，推动AI开发模式变革和中国开源生态发展[5] 开发者活动 - GitCode与CSDN联合开展文心大模型实战测评与社区探讨系列活动[6]

多模态模型

文心大模型4.5系列

多模态模型

文心大模型4.5系列