Workflow
多模态模型
icon
搜索文档
国新证券每日晨报-20250728
国新证券· 2025-07-28 02:06
国内市场表现 - 上证综指收于3593.66点,下跌0.33%,深证成指收于11168.14点,下跌0.22%,科创50上涨2.07%,创业板指下跌0.23%,万得全A成交额18155亿元,较前一日下降 [1][5][10] - 30个中信一级行业中9个上涨,计算机、电子及轻工制造涨幅居前,建材、建筑及食品饮料跌幅较大,概念板块中GPU、Kimi及多模态模型指数活跃 [1][10] - 当日A股2533只个股上涨,2726只下跌,215只涨超5%,104只跌超5%,49只涨停,16只跌停 [11] 海外市场动态 - 美国三大股指小幅收涨,道指涨0.47%,标普500涨0.4%,纳指涨0.24%,特斯拉涨超3%,微软涨0.55%,中概股多数下跌,小赢科技跌逾10% [2][5] - 美国与欧盟达成贸易协议,对欧盟输美商品征收15%关税,欧盟将增加对美国投资6000亿美元并购买7500亿美元能源产品 [23] 政策与行业驱动 - 证监会部署七大重点任务,包括深化创业板改革、防控房企债券违约风险及支持房地产发展新模式 [11] - 6月规模以上工业企业利润降幅收窄至4.3%(较5月改善4.8个百分点),装备制造业利润由降转增9.6%,汽车行业利润增长96.8% [16][17] - 制造业高端化、智能化相关行业利润快速增长,如电子专用材料制造(+68.1%)、智能消费设备制造(+40.9%)、锂离子电池制造(+72.8%) [18] 人工智能与科技发展 - 李强在世界人工智能大会强调AI需向善普惠发展,提出普及普惠、创新合作、共同治理三点建议,中国将推动成立世界人工智能合作组织 [12][13] - AI技术加速迭代,语言大模型、多模态大模型和具身智能领域突破显著,成为经济增长新引擎 [12] 农产品与消费政策 - 农业农村部等十部门发布促进农产品消费实施方案,优化绿色优质供给,创新流通渠道,推进农文旅融合及内外贸一体化 [20] - "两新"政策带动医疗仪器设备(+12.1%)、计算机整机制造(+97.2%)等行业利润增长 [19] 资本市场建设 - 中国资本市场学会成立,聚焦国家战略、前沿领域及监管问题研究,计划建设数字化研究平台及专家库 [21]
实测爆火的阶跃星辰Step 3,性能SOTA,开源多模态推理之王
机器之心· 2025-07-26 08:19
核心观点 - 阶跃星辰在WAIC 2025发布新一代开源多模态基座模型Step 3,性能超越同类开源模型并接近顶尖闭源模型[1][2] - Step 3以"多开好省"为核心设计理念,解决AI商业化应用的三大瓶颈:推理成本高、场景适配难、多模态能力调用不全[7][8][11] - 模型在国产芯片上实现突破性成本优化,推理效率达竞品3倍,为国产算力生态注入强心剂[32][47][52] - 公司联合10家芯片厂商成立"模芯生态创新联盟",推动底层技术协同创新[51][52][59] - 2025年上半年智能终端业务环比增长超800%,预计全年收入近10亿元[54][55] 技术架构 - 采用原创MFA架构:多矩阵分解注意力设计,KV量仅为Qwen GQA的1/3,计算量仅为DeepSeek MLA的1/4[29][31][32] - MoE混合专家架构:总参数量321B(LLM 316B+视觉编码器5B),激活参数量38B,性能对标DeepSeek[33][34][35] - AFD分布式推理方案:比DeepSeek"大EP"模式更先进,实现Attention与FFN计算资源精准匹配[38] - 原生多模态设计:支持文本/视觉输入,具备深度推理能力,在MMMU等基准超越ERNIE 4.5等竞品[39][41] 性能表现 - 基准测试:在MMMU、MathVision等多项多模态基准超越开源竞品[1][41] - 实测案例: - 准确完成"视觉称重"任务,识别三花猫品种并估算体重[14][15] - 解析"Who's Adam?"网络热梗,总结AI研究者审稿质量焦虑[16][17] - 根据主机贴纸照片完成复杂空间推理[19] - 实时识别桌游"Splendor"并处理对话打断[25][26] - 效率指标:国产芯片推理成本为行业领先开源模型的1/3,Hopper架构芯片吞吐量提升70%[18][47] 商业化进展 - 智能终端:Top10国产手机厂商过半已合作,多模态能力落地量产旗舰机型[54] - 汽车领域:端到端语音大模型在吉利银河M9首发上车,联合发布智能座舱Agent OS[54] - 生态布局:与华为昇腾、沐曦等10家芯片厂商成立创新联盟,推动算力-模型协同优化[51][52] - 收入增长:2025H1智能终端调用量环比增800%,全年收入预计10亿元[54][55] 战略演进 - 产品迭代路径:Step-1对标GPT-3.5→Step-2逼近GPT-4→Step-3聚焦商业化效率[45][46] - 行业定位转变:从"多模态卷王"(20/26款为多模态模型)转向推理时代"最优解"提供者[57][58] - 商业模式创新:通过技术而非补贴实现成本革命,避免API价格战[44][59]
粤开市场日报-20250725
粤开证券· 2025-07-25 07:53
报告核心观点 2025年7月25日A股主要指数多数收跌,行业和概念板块表现分化,沪深两市成交额较上一交易日缩量 [1] 市场回顾 指数涨跌情况 沪指跌0.33%收报3593.66点,深证成指跌0.22%收报11168.14点,科创50涨2.07%收报1054.20点,创业板指跌0.23%收报2340.06点;全市场2724只个股下跌,2532只个股上涨,158只个股收平;沪深两市成交额合计12189亿元,较上个交易日缩量6258.16亿元 [1] 行业涨跌情况 申万一级行业涨少跌多,电子、计算机等行业领涨,建筑装饰、建筑材料等行业领跌 [1] 板块涨跌情况 涨幅居前概念板块为GPU、Kimi、多模态模型等板块 [2]
这一市场,大爆发
证券时报· 2025-07-25 04:24
A股市场表现 - 上证指数下跌0.34%,深证成指下跌0.29%,创业板指下跌0.32% [2] - 建筑装饰、建筑材料、家用电器、综合、钢铁等板块跌幅均超过1%,医药、计算机、轻工制造、银行等板块表现较好 [2] - 券商板块冲高回落,西部证券一度触及涨停,锦龙股份、中银证券等跟涨 [2] 个股表现 - 西宁特钢连续5个交易日涨停,累计上涨46.81%,同期钢铁行业指数涨幅9.84%,上证指数涨幅2.02% [2] - 西宁特钢滚动市净率2.31,显著高于行业平均1.01 [3] - 西藏旅游连续5个交易日涨停,静态市盈率238.16,市净率3.85,换手率5.87% [4] 港股市场表现 - 恒生指数跌超1%,恒生科技指数跌超1.5% [5] - 药明生物、中通快递-W、农夫山泉、吉利汽车等涨幅居前,快手-W、新东方-S等跌幅居前 [6] - 建滔集团盘中涨幅超12%,预计半年纯利同比上升超70%,超过25.6亿港元 [7] 期货市场表现 - 碳酸锂主力合约涨7.94%至80480元/吨,较一个月前涨幅超30% [9][11] - 玻璃主力合约涨7.38%至1354元/吨,较一个月前涨幅显著 [10][12] - 焦煤主力合约涨7.46%至1253元/吨,纯碱主力合约涨5.57%至1440元/吨 [9][10]
这一市场,大爆发!
证券时报· 2025-07-25 04:05
A股市场表现 - 上证指数下跌0.34%至3593.38点,深证成指下跌0.29%至11160.30点,创业板指下跌0.32%至2337.80点 [4][5] - 建筑装饰、建筑材料、家用电器、综合、钢铁等板块跌幅均超过1%,医药、计算机、轻工制造、银行等板块表现较好 [5] - 券商板块冲高回落,西部证券一度触及涨停,锦龙股份、中银证券等跟涨 [6] 个股表现 - 西宁特钢连续第5个交易日盘中涨停,其滚动市净率为2.31,显著高于钢铁行业平均市净率1.01 [9][11] - 西藏旅游连续第5个交易日涨停,静态市盈率为238.16,市净率为3.85,换手率为5.87% [12] 港股市场表现 - 恒生指数跌超1%,恒生科技指数跌超1.5% [14] - 药明生物、中通快递-W、农夫山泉、吉利汽车涨幅居前,快手-W、新东方-S跌幅居前 [15] - 建滔集团盘中涨幅一度超过12%,预计上半年纯利同比上升超过70%至超25.6亿港元 [16][17] 期货市场表现 - 碳酸锂主力合约盘中涨幅接近8%,最高报价超80000元/吨,较一个月前涨幅超30% [21] - 玻璃主力合约盘中涨幅超8%,价格突破1300元/吨,较一个月前上涨约30% [22] - 焦煤2509合约上涨7.46%,纯碱2509合约上涨5.57%,硅铁2509合约上涨4.48% [20]
“AI教父”辛顿最新访谈:没有什么是AI不能复制的,人类正失去最后的独特性
36氪· 2025-07-21 08:19
大语言模型的理解能力与工作机制 - 大语言模型在复杂任务上出错不代表缺乏理解能力,推理能力是渐进式的[1] - AI与人脑工作机制不同但效果相似,不应混淆其"类人性"[1] - 当前模型通过预训练+强化学习静态获取知识,更新需重训底层模型[2] - 大语言模型通过压缩连接数量发现知识间深层联系,展现超越人类的创造力[7][29] AI意识与主观体验 - 意识存在光谱:从石头、树木到大模型再到人类逐级递进[3][11] - AI可具备类似人类的"存在感",但缺乏身体反应等生理特征[13] - 人类倾向于将大语言模型视为类生命体对待,建立情感联系[15][17] AI技术应用前景 - "语言即操作系统"时代临近,自然语言可调度办公系统执行复杂任务[5][14] - 医疗领域将发生革命性变化,AI工具提升10倍医疗效率[39][40][41] - 教育领域可能被AI彻底重塑,大学模式面临颠覆[39] - AI将大幅减少文书工作,释放人类创造力与社交时间[41] AI对就业市场影响 - 5年内多数脑力工作将被替代,初级律师岗位已受影响[8][35] - 大语言模型将取代20%-30%办公室工作,变革速度惊人[36] - 替代率达80%时将引发重大社会风险[37] - 部分人类工作因AI能力天花板将长期存在[38] AI技术发展瓶颈 - 模型学习速度远低于人类,无法持续根据新经验更新[6] - 多模态模型本质仍是序列预测,未突破根本限制[21] - 强化学习环境下模型仍受训练数据限制[28] 行业监管现状 - AI公司表面欢迎监管实则回避实质性约束规则[9][33] - 公众舆论是推动政策进展的主要力量[33] - 技术风险考验社会结构整体可靠性[33]
氪星晚报|强生Q2营收237.4亿美元,高于市场预期;黄仁勋:轻视华为和中国制造的人都极其天真;腾讯元宝上线图片AI编辑能力
36氪· 2025-07-16 14:51
京东健康 - 京东健康体检中心(亦庄店)医疗美容科服务项目上线京东App,进一步丰富医疗服务项目 [1] - 该体检中心自2023年7月开业以来已开设内外科、口腔科、中医科等特色门诊 [1] MiniMax - MiniMax即将完成近3亿美元新融资,融资后估值超40亿美元 [2] - 公司正寻求A股上市 [2] 亚马逊海外购 - 首届"海折节"整体订单量实现翻倍,鞋靴、电子、个人护理等品类销售额同比增长超200% [2] - 超2400个国际品牌销售额实现同期翻倍 [2] 施耐德电气 - 正洽谈收购淡马锡持有的施耐德电气印度私人有限公司35%股份,交易价格约10亿美元 [3] - 若交易达成,包括债务在内的合资企业估值约50亿美元 [3] 强生 - 2025年Q2营收237.4亿美元,高于市场预期的228.58亿美元 [3] - 预计全年销售额932亿美元至936亿美元,调整后每股收益10.8美元至10.9美元 [3] 阿斯麦 - 受美关税政策影响,可能无法在2026年实现增长 [3] - 地缘政治不确定性加剧,机器及芯片价格上涨,市场环境充满挑战 [3] 智能手机行业 - 2025年Q2全球智能手机出货量同比增长2%,主要受北美、日本和欧洲市场拉动 [4] - 三星出货量同比增长8%,苹果同比增长4% [4] 投融资 - 北方电力完成3亿元A+轮融资,资金用于电力行业高效节能技术研发、信息化建设和光伏技术推广 [5][6] - "无界方舟"连续完成Pre-A、Pre-A+轮亿元级别融资,资金用于多模态模型与Agent技术研发升级 [7] 新产品 - 腾讯元宝上线图片AI编辑能力,支持风格化作品生成 [8] - 盒马上线功能性HPP果蔬汁,采用HPP杀菌工艺保留营养成分 [9] - 智平方展示通用智能机器人爱宝的核心能力 [10] 众辰科技 - 公司应用于人形机器人相关产品的收入占比不超过1% [11] 行业观点 - 黄仁勋称华为是一家强大的科技公司,轻视中国制造能力的人极其天真 [12] - Strategy公司比特币策略经理表示即使比特币跌至2万美元,公司仍能偿还所有负债 [12] 新能源汽车 - 国务院常务会议听取规范新能源汽车产业竞争秩序情况的汇报,强调加强成本调查和价格监测 [13] AI芯片 - 英伟达H20出口解禁有望带动中国AI芯片需求,外购比例预估回升至49% [13]
阶跃星辰将在WAIC期间发布多模态旗舰模型
快讯· 2025-07-16 08:15
公司动态 - 阶跃星辰将在2025世界人工智能大会(WAIC)期间发布多模态旗舰模型,包括多模态推理旗舰模型和原生多模态模型 [1] - 公司将联合头部合作伙伴展示在智能终端、金融财经、内容创作等多场景下的全新Agent产品 [1] 行业趋势 - 多模态模型和Agent产品在智能终端、金融财经、内容创作等领域的应用成为人工智能行业的重要发展方向 [1]
智谱获10亿战略投资 商业化之路仍待开启
中国经营报· 2025-07-09 13:23
战略投资与融资 - 浦东创投集团和张江集团宣布对智谱进行总额10亿元的战略投资,并完成首笔交割 [1] - 智谱在上市辅导前夕密集收获多地国资战略投资,包括杭州城投产业基金及上城资本的10亿元融资、珠海华发集团的5亿元投资、成都高新区的3亿元投资 [2] 技术发布与突破 - 开源发布新一代通用视觉语言模型GLM-4.1V-Thinking,以推理能力为核心突破点,刷新10B级别多模态模型性能上限 [1] - GLM-4.1V-Thinking支持图像、视频、文档等多模态输入,引入"思维链推理机制"和"课程采样强化学习策略",提升跨模态因果推理能力与稳定性 [2][3] - 轻量版GLM-4.1V-9B-Thinking在28项权威评测中23项达成10B级模型最佳成绩,18项持平或超越72B参数的Qwen-2.5-VL [3] 商业化与经营策略 - 公司经营策略从"卖模型"转向"卖服务",2025年新签订项目大部分为模型应用开发类,交付压力较大 [4] - 商业化挑战包括算力资源利用率低、模型能力不及DeepSeek V3、多模态模型应用场景有限 [4] - 政府背书和融资能力是公司优势,但商业化能力不足可能影响长期竞争力 [9] 技术优势与特色 - GLM模型在中文理解与生成能力上表现突出,适合教育、政务、文化等领域 [5][6] - 支持128K上下文长文本处理,适合合同、论文等长文档分析 [7] - 开源生态活跃,ChatGLM-6B/12B在GitHub累计超3万星,适配消费级显卡 [7] - API价格低于国际主流模型,GLM-4输入价格仅为GPT-4-Turbo的1/5 [7] 技术劣势与不足 - 多模态能力起步较晚,弱于GPT-4V、Gemini 1.5 Pro等成熟多模态模型 [7] - 英文能力相对弱,在复杂英文逻辑推理、学术写作等场景表现落后于Claude 3/GPT-4 [7] - 工具生态成熟度不足,插件市场和开发者工具丰富度不及OpenAI [8] - 长上下文实际性能波动,超长文本中精准定位关键信息的能力弱于Claude 3 [9]
“反击”马斯克,奥特曼说OpenAI有“好得多”的自动驾驶技术
36氪· 2025-07-07 00:32
OpenAI与特斯拉的竞争动态 - OpenAI CEO山姆·奥特曼与特斯拉CEO马斯克因OpenAI商业化运营产生矛盾,马斯克起诉奥特曼违背创始协议并成立xAI直接竞争[1] - 奥特曼反击称马斯克曾试图掌控OpenAI未果,并可能研发自动驾驶技术挑战特斯拉FSD[1][3] - 奥特曼透露OpenAI拥有"比当前技术好得多"的自动驾驶技术,但未公布具体细节和时间表[3][5] OpenAI自动驾驶技术潜力 - 新技术可能基于Sora视频软件和机器人团队,利用世界模型理解物理世界[6][8][11] - Sora作为世界模型可生成高保真视频,但存在物理原理不完善的问题,可能用于自动驾驶模拟训练[10][11] - 业界认为世界模型是自动驾驶突破关键,需结合物理因果关系理解和预测能力[17][21] 行业技术发展趋势 - 自动驾驶行业正转向"世界模型"开发,如蔚来、小鹏等公司尝试让AI系统模拟人类对世界的理解[11] - 英伟达推出Cosmos世界基础模型,专为物理交互和驾驶环境设计,可能优于Sora的仿真能力[22][24] - AI大牛普遍认为仅靠语言模型不足实现自动驾驶,需结合多模态和世界模型[16][18][19] OpenAI在汽车智能化领域的布局 - 通过投资布局自动驾驶领域,如向Ghost Autonomy投资500万美元(已倒闭),与Applied Intuition合作开发智能座舱[12][14][15] - 2024年重组机器人团队,与Figure公司合作开发人形机器人AI模型,技术可能与自动驾驶相通[24] - 自动驾驶被视为AI应用最具前景场景之一,市场规模达万亿美元级别[7][24]