Workflow
豆包1.5·深度思考模型
icon
搜索文档
全网都在等梁文锋
凤凰网财经· 2025-04-29 12:39
中美科技巨头AI模型竞争 - 4月中旬OpenAI发布GPT-4.1 o3、o4 mini系列模型 [3] - 谷歌同期推出Gemini 2.5 Flash Preview混合推理模型 [3] - 豆包发布1.5·深度思考模型,多模态能力显著提升 [3] - 阿里下一代大模型Qwen3预计本月发布 [3] DeepSeek R2模型发布传闻 - Hugging Face CEO发布神秘动态暗示DeepSeek R2即将发布 [4][7] - 传闻称R2模型拥有1.2万亿参数,活跃参数780亿,采用混合MoE架构 [12] - 成本比GPT-4o低97.3%(输入0.07美元/百万次,输出0.27美元/百万次) [12] - 使用5.2PB训练数据,C-Eval2.0测试得分89.7%,COCO视觉测试92.4% [12] - 公司对传闻不予置评,但知情人士称真实性较低 [14] DeepSeek技术迭代与市场影响 - 公司保持季度重大更新节奏:2024年9月V2.5,12月V3,2025年3月V3-0324 [14] - V3-0324版本在基准测试中超越Google Gemini 2.0 Pro等顶尖模型 [17] - R2预计提升代码生成和多语种推理能力 [17] - 3月发布的V3-0324采用6850亿参数MoE架构,代码能力显著增强 [20] 国产芯片与AI发展 - 美国对英伟达H20芯片禁令促使华为昇腾910C、寒武纪MLUarch04等国产芯片加速发展 [21] - 公司已与部分国产芯片头部企业展开合作 [26] - 创始人梁文锋表示真正挑战是高端芯片出口禁令而非资金 [22] - 公司曾推出针对英伟达H卡的算力优化方案 [21] 公司战略与行业定位 - 创始人梁文锋致力于探索通用人工智能(AGI)本质 [18][20] - 公司早期主要依托自有资金,排除有退出顾虑的投资机构 [20] - 创始人认为技术实力比产品黏性更重要,可通过技术优势获取用户 [20] - 公司目标是通过技术创新改变全球AI格局而非仅服务用户 [20]
AI模型迭代潮涌,港股通科技ETF(513860)高开高走涨超1%
搜狐财经· 2025-04-25 02:49
指数表现 - 中证港股通科技指数上涨0.32% 成分股中高伟电子涨4.75% 晶泰控股涨3.67% 联想集团涨3.51% 零跑汽车涨3.38% 信义光能涨3.10% [1] - 港股通科技ETF上涨1.03% 报0.69元 近1周累计上涨5.44% 涨幅排名可比基金第1位 [1] - 近3年净值上涨42.61% 在指数股票型基金中排名40/1729 位居前2.31% [6] 流动性指标 - 港股通科技ETF盘中换手率3.09% 成交额5209.36万元 [1] - 近1周日均成交额1.99亿元 [1] - 最新融资净买入额460.19万元 融资余额1756.08万元 [6] 规模与资金流向 - 基金规模达16.58亿元 创近1年新高 规模排名可比基金第2位 [3] - 基金份额达24.59亿份 创近1年新高 份额排名可比基金第2位 [4] - 最新资金净流入2.02亿元 [5] 产品特性 - 管理费率0.50% 托管费率0.10% 为可比基金中最低费率 [9] - 今年以来跟踪误差0.200% 在可比基金中跟踪精度最高 [9] - 场外联接基金包括A类021464和C类021465 [13] 估值水平 - 跟踪指数最新市盈率22.71倍 处于近1年12.22%分位 估值低于近1年87.78%的时间 [9] - 前十大权重股合计占比71.87% 包括小米集团(12.41%) 阿里巴巴(11.59%) 比亚迪(10.85%) 腾讯(9.34%) 美团(7.11%)等 [9][11] 行业动态 - AI模型持续迭代升级 腾讯微信集成元宝AI功能 OpenAI发布GPT-4.1 火山引擎发布豆包1.5模型 谷歌发布Gemini2.5Flash模型 [1] - 云厂商商业模式向API token销售转变 从本地部署转向云端部署 AI Agent将取代人工成本 带来更高需求空间 [2] - 券商建议增加港股互联网板块配置 推荐AI领先布局的互联网龙头公司 [2] 绩效表现 - 自成立以来最高单月回报26.48% 最长连涨月数3个月 最长连涨涨幅42.80% 上涨月份平均收益率10.00% [6] - 近1年夏普比率1.77 [7] - 今年以来相对基准回撤1.43% 为可比基金中最小回撤 [8]
【数字经济周报】美国限制英伟达H20 GPU、AMDMI308等AI芯片对华出口-20250421
国泰海通证券· 2025-04-21 14:37
报告行业投资评级 未提及 报告的核心观点 报告聚焦2025年4月12 - 18日数字经济领域科技产业动态,涵盖融资、上市、二级市场表现及各板块动态,反映行业发展态势与潜在投资机会 [2] 根据相关目录分别进行总结 一周资本市场概览 - 上周科技产业融资概况:2025年4月12 - 18日,国内外科技产业14起融资事件均在国内,先进制造、人工智能、VR/AR行业融资事件数位列前三 [2][9] - 一周科技产业上市、过会情况:宏工科技、Everbright Digital、肯特催化、信凯科技、正力新能分别在深交所创业板、纳斯达克、上交所主板、深交所主板、港交所挂牌上市 [12][13][16][17][19] - 一周科技产业招股书递交情况:“博雷顿”通过港交所上市聆讯拟港股挂牌,“滴普科技”和“钧达股份”递交招股书拟港股挂牌 [21][23][24] - 一周科技产业二级市场涨跌幅、换手率、估值水平跟踪:上证指数上涨1.19%,深证成指、创业板指下跌;半导体等指数跌幅为0.77% - 1.15%;半导体、人工智能指数换手率较高;半导体等指数PE估值环比下跌,人工智能指数PB估值环比上涨 [4][28][30][33] 半导体板块动态 - 英特尔接近出售Altera芯片部门51%股份,银湖资本87.5亿美元接盘,是英特尔剥离非核心业务举措 [35][36] - 美国限制英伟达H20 GPU、AMD MI308等AI芯片对华出口,英伟达或损失55亿美元,AMD或受8亿美元财务冲击 [38][39] - AMD公布首款2nm芯片核心复合芯片(CCD),用于第六代EPYC "Venice"处理器 [39][40] 汽车电子板块动态 - 安森美取消69亿美元收购Allegro计划,战略布局暂时搁浅 [41][42] - 亿咖通科技单芯片“舱行泊一体”通过实车验证,可降本20%,还将推高阶方案 [42][43] - 上汽与华为联合发布新品牌“SAIC尚界”,采用华为智选车模式,开启智能出行新篇章 [43][44][46] AI板块动态 - OpenAI发布o3/o4 - mini,擅长编码和视觉推理,开源Codex CLI,效率和成本控制表现优 [46][47] - 谷歌发布海豚大模型DolphinGemma,可初步理解海豚语言,能参与跨物种交流 [47][48][49] - 豆包1.5·深度思考模型上线,多项测试表现优,具备“边想边搜”和视觉理解能力 [50][51] - 书生·万象3.0升级发布,多模态基础能力全面提升,拓展多方面多模态能力 [51][52] 元宇宙板块动态 - 华为发布新款智能眼镜2钛空圆框光学镜,支持翻译、头部控制等功能 [52][53][55] - 李未可科技与中国移动合作推出定制化AI智能音频眼镜,提供全方位AI服务 [55][56] - 秋果计划科技Wigain XR眼镜亮相香港国际创科展,视场角53度创纪录,有多项技术亮点 [56][57]
豆包1.5深度思考模型发布:暴砍参数量,能看图思考,数学编程超DeepSeek-R1
36氪· 2025-04-17 08:54
文章核心观点 火山引擎发布豆包1.5·深度思考模型,在性能、能力和应用场景上有显著提升,同时升级了相关模型,其新能力或成推理模型升级重要方向,同日还发布了其他解决方案和套件 [1][3][21] 分组1:豆包1.5·深度思考模型发布及基础情况 - 火山引擎发布豆包1.5·深度思考模型,采用MoE架构,总参数量200B,激活参数20B,在多项基准测试达或接近全球第一梯队水平 [1] - 截至2025年3月底,豆包大模型日均tokens调用量超12.7万亿,是2024年12月的3倍,是一年前的106倍,2024年火山引擎以46.4%市场份额居中国公有云大模型调用量市场第一 [3] 分组2:豆包1.5·深度思考模型能力特点 - 较小参数量和激活参数量使其训练和推理成本低,高并发场景延迟仅20毫秒 [4] - 具备“边想边搜”能力,豆包App基于此模型定向训练,如推荐露营装备时可拆解需求、规划信息并补充搜索 [4] - 具备视觉理解能力,能基于文字、图像信息思考,如给出预算内点餐推荐 [6] - 模型团队优化数据处理策略,融合可验证与创意性数据,采用创新双轨奖励机制优化算法 [7] 分组3:豆包1.5·深度思考模型测试表现 - 在AIME 2024、2025数学测试中得分与OpenAI o3 - mini - high基本打平,Beyond AIME测试有明显差距 [8] - 在GPQA Diamond测试集得分为77.3,与OpenAI o1、o3 - mini - high仅有微小差距 [10] - 在Code Forces和SWE - bench编程基准测试接近或超越DeepSeek - R1 [10] - 在ARC - AGI测试得分39.9分,大幅超过OpenAI o1和o3 - mini - high [10] - 在创意写作等非推理任务展示泛化能力,能胜任更广泛复杂场景 [10] 分组4:相关模型升级情况 - 豆包·文生图模型3.0能实现更好文字排版、实拍级图像生成和2K高清图片生成,应用于多场景,在Artificial Analysis竞技场排名全球第一梯队 [11][13][15] - 豆包·视觉理解模型新版本视觉定位能力强,支持多种定位方式,应用于多场景,视频理解能力大幅提升,结合向量搜索可对视频语义搜索 [17][20] 分组5:其他发布内容及行业趋势 - 推理模型成国内厂商角逐重要方向,豆包1.5·深度思考模型新能力或成下一轮升级重要方向 [21] - 火山引擎同日发布OS Agent解决方案、GUI Agent大模型(豆包1.5·UI - TARS)和AI云原生·ServingKit推理套件 [21]