阿里Qwen

搜索文档
资金动向 | 北水抛售港股逾40亿港元,加仓阿里巴巴、中芯国际
格隆汇· 2025-09-23 11:42
南下资金流向 - 9月23日南下资金净卖出港股40.69亿港元 [1] - 净买入前五为阿里巴巴-W 16.73亿港元、中芯国际5.02亿港元、康方生物2.19亿港元、大众公用1.9亿港元、晶泰控股1.58亿港元 [1] - 净卖出前五为盈富基金32.71亿港元、恒生中国企业9.93亿港元、泡泡玛特3.74亿港元、华虹半导体2.33亿港元、腾讯控股2.22亿港元 [1] 阿里巴巴资金动向 - 南下资金连续23日净买入阿里巴巴累计达621.1489亿港元 [2] - 阿里Qwen团队宣布将发布6项新产品包括1个产品、2个开源模型和3个API接口 [3] - 高德宣布为全国餐饮商家免除一年入驻年费并提供流量补贴、专属客服等支持服务 [3] 中芯国际评级与前景 - 高盛将中芯国际H股目标价从73.1港元上调至83.5港元 [3] - 中国AI芯片需求增长受云服务商资本支出增加和AI终端应用推动 [3] - 维持2025-2027年盈利预测不变 2028-2029年每股收益预测分别上调1%和2% [3] 大众公用业绩与投资 - 公司参股深创投 深创投持有宇树科技股份 [4] - 2025年中期净利润3.33亿元同比增长172.62% 经营现金流净额7.61亿元同比增长160.29% [4] - 按权益法确认深创投投资收益1.18亿元 深创投持有中微公司、华大九天、商汤科技等硬科技项目 [4] 腾讯控股资本运作 - 9月23日回购86.7万股股份耗资5.5亿港元 [4] - 发行总额90亿元票据包括2030年到期20亿元2.1%票据、2035年到期60亿元2.5%票据、2055年到期10亿元3.1%票据 [4]
揭秘小鹏自动驾驶「基座模型」和 「VLA大模型」
自动驾驶之心· 2025-09-17 23:33
小鹏自动驾驶技术方法论 - 提出自动驾驶软件3.0时代概念 即"AI模型即软件" 整个软件栈由端到端AI模型构成 基于以数据为中心的方法迭代[6] - 公司处于将整个自动驾驶软件栈构建为端到端AI模型驾驶汽车的阶段[8] - 基于规模定律(scaling law) 利用每天从数十万辆真实世界车辆收集的大量数据训练大型视觉模型作为"工厂"[8] 基础模型与部署架构 - 通过大数据构建基础模型 无需依赖三维空间先验知识和空间问题 类似世界模型概念[8] - 通过深度裁剪 量化 蒸馏将基础模型压缩为更小版本 部署到车端硬件[8] - 在云端构建VLA(视觉语言动作)基础模型 通过蒸馏剪枝和微调训练部署到车端[32] 内外循环训练机制 - 内循环为每个模型创建训练流 扩展数据后进行再训练和监督微调(SFT) 持续提升模型性能[9] - 外循环通过数十万辆车作为现实世界数据采样器 持续采样数据 根据返回数据持续训练(协同训练)[11] - 重复内外循环过程直至性能达到L4级自动驾驶 公司目标2026年实现L4级智驾车型量产[11][13] VLA模型训练方法 - 采用阿里Qwen作为原始VLM模型 使用公司整理的驾驶数据进行预训练和对齐[15] - 预训练数据分类包括静态交通元素 动态交通参与者 点对点轨迹数据 占用网络 交通信号灯和交通流信息[18] - 基于Chain-of-Thought思维链进行四步推理:提供基本驾驶知识 CoT SFT 强化学习CoT 考虑延迟的CoT SFT[22][23] 模型优化与安全强化 - 监督微调(SFT)建模为"指令遵循"任务 使用筛选的好数据专门训练导航 舒适刹车等专用指令[27] - 后期训练(post-training)采用强化学习解决长尾案例 建立奖励模型确保行动一致性[29] - 强化学习设计三重奖励机制:安全(避免碰撞) 效率(避免卡壳) 合规(遵守交通规则)[30] 行业竞争核心要素 - 底层算法和架构相通 行业差距取决于高质量数据 大算力以及算法产品化和工程落地能力[32] - VLA概念需要基础成熟的LLM作为底座 针对性训练交通驾驶行为[32] - 基础模型蒸馏上车思路可加速开发并快速部署到不同算力平台 但前提需要大算力和高质量数据[32]
从GPT-5到DeepSeek V3.1,顶尖AI大模型的新方向出现了!
华尔街见闻· 2025-08-31 02:26
行业发展趋势 - AI行业的发展重点正从追求更高性能转向更聪明和更经济 通过混合推理和自适应计算实现算力节省 [1] - 混合推理模式成为行业共识 各大模型厂商采用不同路径但目标一致 让模型根据问题复杂度自动选择合适的计算资源配置 [1][3] - 顶尖玩家包括Anthropic的Claude系列 Google的Gemini系列 以及国内的阿里Qwen 快手KwaiCoder 字节豆包和智谱GLM等都在探索混合推理方案 [4] 技术突破与创新 - 美团开源的龙猫大模型(LongCat-Flash)采用创新的零计算专家机制 智能识别输入内容中的非关键部分 如常见词语和标点符号 交由特殊专家处理直接返回输入 实现惊人算力节省 [1] - OpenAI的GPT-5采用路由器机制 根据问题复杂程度自动选择合适模型处理 简单问题交给轻量级模型 复杂任务调用高算力模型 [3] - DeepSeek的V3.1版本推出单模型双模式架构 将对话和推理能力合并到单一模型中 开发者和用户可通过特定标记或按钮在思考与非思考模式间切换 [4] 成本与效率挑战 - AI应用成本快速上升 尽管单个token价格在下降 但完成复杂任务所需的token数量以前所未有的速度增长 复杂代码编写或法律文件分析任务可能消耗数十万甚至上百万个token [2] - 成本压力已传导至应用层公司 生产力软件公司Notion的利润率因此下降约10个百分点 AI编程辅助工具初创公司如Cursor和Replit不得不调整定价策略 [2] - 人类认知贪婪导致99%的需求转向SOTA模型 而最强模型价格始终差不多 形成最智能模型竞赛演变成最昂贵模型竞赛的局面 [2] 性能与成本平衡 - OpenAI内部评测显示GPT-5使用思考模式能以比前代模型少50-80%的输出token完成任务 达到相同或更好效果 [4] - DeepSeek思考模式在消耗减少25-50% token的情况下 达到与前代模型相当的答案质量 为企业提供高性价比开源选择 [4] - 混合推理的下一个前沿将是更智能的自我调节 让AI模型精准自我评估任务难度 在无人干预情况下以最低计算代价在最恰当时机启动深度思考 [4]
【计算机】GPT-5商业化潜力释放,AI应用生态持续繁荣——AI行业跟踪报告第62期(施鑫展/白玥)
光大证券研究· 2025-08-17 00:05
GPT-5商业化潜力 - GPT-5更强调实用性和生产力 而非一味追求底层技术突破 预计凭借能力提升 更高性价比 更低幻觉率 更好占领用户心智并提升用户粘性 转化为更大收入规模 [4] - OpenAI思路启发全球AI开发者 在基础模型能力足够强大且迭代放缓时 将模型落地到各类场景进行产品化变现的重要性提升 [4] 国内AI产品全球竞争力 - 7月AI网站全球TOP100总访问量126.89亿 其中国产AI产品访问量13.34亿 占比10% [5] - 全球前100 AI产品中国产数量达25个 占比25% [5] - 三款国产出海AI产品ARR超千万美元:美图AirBrush-AI智能修图3765万美元 作业帮PolyBuzz 2027万美元 YouCam美妆相机1594万美元 可灵海外版KLING AI ARR达918万美元 [5] 国内大模型B端应用趋势 - 7月大模型中标项目574个 金额13.35亿元 其中应用类项目数量占比59% [6] - DeepSeek 阿里Qwen等开源模型性能提升并免费开放 推动AI应用在B端落地 [6] - 中标项目行业分布:教科排名第一 政务 通信 能源 金融位列2-5名 [6] - 大模型厂商中标数量排序:科大讯飞 火山引擎 智谱 阿里云 腾讯云 百度 [6]
国联民生证券:传媒互联网业2025年继续关注AI应用、IP衍生品两大投资主线
智通财经网· 2025-07-23 02:25
核心观点 - 维持传媒互联网行业强于大市评级 2025年重点关注AI应用加速落地及IP衍生品高速发展两大投资主线 [1] AI应用发展 - 2025年AI模型及应用维持高速迭代 模型层面OpenAI o3验证推理能力提升曲线陡峭 谷歌Veo3加速多模态能力进展 国产DeepSeek、阿里Qwen、快手可灵与海外头部模型差距持续缩小 [2] - Agent成为全球共识 处理复杂问题能力边界持续拓宽 MCP等Infra层基建完善推动生态扩张 通用领域OpenAI、Anthropic、谷歌凭借模型即Agent维持领先 垂直领域涌现独角兽 [2] - 国内Manus后涌现多款Agent产品 多个大厂蓄势待发 可灵、美图等垂类应用商业价值持续释放 重点关注搜索、陪伴、教育、短剧、游戏、玩具等原生AI应用方向 [2] - AI应用将影响营销、电商、教育、影视、游戏等行业 提升效率并创造增量 同时关注AI玩具等硬件端机会 [1] IP衍生品发展 - 2025年精神消费崛起 IP衍生品板块持续扩容 国内企业对IP更强掌控及运营能力持续拓展收入空间 [2] - 国产IP引领文化出海 泡泡玛特旗下IP Labubu全球破圈 5月TikTok商店GMV破亿且增速持续提升 布鲁可、卡游通过布局海外IP、渠道、玩法等形式积极出海 [2] - 行业转型并购与资本化加速 老牌供应链企业启梦玩具、超级元气工厂加速转型品类及IP运营 新兴潮玩品牌量子之歌收购Letsvan、52TOYS港股交表 [2] - 优质国产IP通过拓展线上内容及线下实体衍生品提升影响力 打开商业化空间 [1]
Kimi还能找到月之亮面吗?
36氪· 2025-06-25 08:08
行业竞争格局演变 - 行业焦点从Kimi的长文本能力转向多模态生成(视频/代码)和Agent应用[1] - 大厂入场导致竞争加剧:字节豆包依托抖音生态实现流量垄断 单月投流预算达1.24亿[9] - 技术护城河被侵蚀:DeepSeek开源长文本模型 豆包整合视频库 Kimi仍依赖单一文本交互[12] Kimi发展历程分析 - 早期技术优势:2023年率先实现20万至200万字长文本处理 形成非对称竞争力[2][3] - 资本追捧因素:技术稀缺性+创始人学术光环(CMU博士/苹果谷歌导师)+资本防御性布局焦虑[3][4] - 估值逻辑:参照OpenAI 860亿美元估值 阿里8亿美元投资占股36%[4] 战略失误与运营问题 - 投流失控:单月最高投放2.2亿 日均烧钱700万 投流费用占比达70%[7][30] - 用户质量失衡:DAU从50.83万飙升至589.7万但高知用户流失 品牌调性受损[8][11] - 技术空心化:资源向流量倾斜 延误多模态和视频理解等关键技术升级[11] 潜在突围方向 - 提升价值密度:优化Kimi Researcher的交互逻辑 实现"打断+追问"深度研究功能[15][16] - 深耕垂直场景:医疗病历分析/法律条款审查等B端需求 配套完整开发者工具链[18][19] - 聚焦核心用户:服务数千万效率工作者 建立内容质量而非数量的竞争优势[22][23] 行业启示 - 战略定力关键:识别主要矛盾(真实付费需求) 避免被资本和流量带偏节奏[25][26] - 商业化前置:产品开发需同步规划变现路径 可持续增长率公式揭示投流占比应<30%[29][30] - 护城河本质:客户付款凭证比融资头条更重要 技术信仰需通过商业闭环验证[31]
超越DeepSeek,中国开源“集团军”重塑全球AI生态
观察者网· 2025-04-27 12:57
中国开源大模型生态发展 - 中国开源大模型形成集团化作战优势,DeepSeek和阿里Qwen等基础模型提升技术上限,中小企业基于其开发垂直模型加速迭代[1] - 昆仑万维推出Skywork-OR1系列模型,性能超越阿里QwQ-32B并开源数据集和训练代码,实现"真开源"[4] - 阿里云通义千问、阶跃星辰、智谱等企业密集开源多模态模型,百度宣布6月30日完全开源文心大模型[5] 中美AI开源策略对比 - 美国AI企业以闭源为主(OpenAI、Anthropic),Meta开源Llama但附加商业限制条款[6][7] - 中国通过政策推动开源生态,2017年《新一代人工智能发展规划》和2021年"十四五"规划明确支持开源[8] - 北京国资联合智谱成立3亿元Z基金支持全球AI开源项目[9] 开源技术商业化路径 - 智谱通过开源吸引开发者生态,向B/G端提供付费定制解决方案,其开源模型累计下载量达4000万次[16][17] - DeepSeek采用"免费基础API+高性能付费API"模式,定价每百万输入Token1元[17] - 阿里通过开源模型绑定云计算基础设施,形成场景闭环变现[17] 开源模型产业应用案例 - 工业领域:宝钢、中煤科工等企业利用开源模型实现生产优化,故障停机时间降低30%[13] - 公益领域:华为昇腾开源三江源物种识别模型,助力雪豹保护效率提升[14] - 海外市场:DeepSeek模型被印尼Ruangguru用于教育优化,阿里Qwen接入新加坡Atlas客服系统[6] 开源生态理论支撑 - 开源模式符合《大教堂与集市》提出的"集市"开发理论,通过群体协作加速创新[15] - 哈佛研究显示开源投入产出比达1:2000,中国正复制这一成功模式[16] - 中国开源战略推动全球AI从"单极霸权"转向"多极共生"[1][18]