Workflow
VeOmni
icon
搜索文档
AI动态汇总:智元推出机器人世界模型平台genieenvesioner,智谱上线GLM-4.5a视觉推理模型
中邮证券· 2025-08-25 11:47
根据提供的研报内容,这是一份关于AI行业动态的周报,主要汇总了多家科技公司在人工智能领域的最新技术发布和产品动态。经过全面审阅,**该报告未涉及任何量化模型或量化因子的构建、测试与分析内容**。报告的核心是AI技术进展的行业资讯,而非金融工程领域的量化投资研究。 因此,**本次任务无法提取并总结任何量化模型或量化因子的相关信息**。报告内容聚焦于AI模型的技术架构、性能对比和应用场景,与量化投资中的因子挖掘、模型回测等主题无关。
字节突然开源Seed-OSS,512K上下文碾压主流4倍长度!推理能力刷新纪录
量子位· 2025-08-21 02:36
模型发布概况 - 字节跳动开源360亿参数大模型Seed-OSS-36B 采用Apache-2.0协议 支持免费学术研究与商业部署 [1][4] - 模型命名呼应OpenAI的GPT-OSS系列 基于内部技术专为开源社区打造 未直接开源商业模型豆包(Doubao) [3][4] 核心技术特性 - 原生支持512K上下文窗口 是主流开源模型DeepSeek V3.1(128K)的4倍 预训练阶段直接构建非后期插值实现 [5][6][7] - 引入思考预算(Thinking Budget)机制 通过设定token数量(建议512整数倍)控制模型思考深度 适应简单任务快速响应或复杂任务深度推理 [9][10][12] - 采用成熟架构设计:360亿参数稠密模型(非MoE) 64层网络 隐藏层维度5120 词汇表155K 集成RoPE/GQA/RMSNorm/SwiGLU技术 [13] 性能表现 - 知识理解:MMLU-Pro达65.1分(超越Qwen2.5-32B-Base的58.5分) TriviaQA获82.1分 [16] - 推理能力:BBH基准87.7分刷新开源记录 数学能力GSM8K达90.8分 MATH达81.7分 [17] - 代码能力:HumanEval得分76.8 MBPP达80.6 指令微调版在AIME24数学竞赛获91.7分仅次于OpenAI OSS-20B [18][19] - 训练效率:仅用12T token达成性能 低于同规模模型15T+数据量 [20] 团队技术布局 - Seed团队成立于2023年 定位"打造最先进AI基础模型" 覆盖大语言模型/多模态/AI基础设施领域 [21] - 已开源项目包括:8B代码生成模型Seed-Coder(自主管理训练数据) 多模态模型BAGEL(处理文本/图像/视频) 实验性语言模型Seed Diffusion(离散状态扩散技术) 训练框架VeOmni(PyTorch原生全模态分布式) 同声传译模型Seed LiveInterpret(低延迟音色复刻) [22][23][24][25] 生态影响 - 模型发布于Hugging Face与GitHub平台 强化国产开源基座模型阵营 [4][26] - 提供含合成指令数据(高性能)与无合成数据(高纯净度)双版本 满足研究社区差异化需求 [14]
【AI产业跟踪】百川开源医疗大模型Baichuan~M2
国泰海通证券· 2025-08-19 09:42
报告行业投资评级 未提及 报告的核心观点 报告对AI产业最新趋势进行跟踪,涵盖行业动态、应用资讯、大模型资讯及科技前沿等方面,展示AI领域多项进展与突破 [2][9] 根据相关目录分别进行总结 AI行业动态 - 腾讯二季度AI盈利初显,二季度收入1845亿元,同比增长15%,归母净利润556亿元,同比增长17%,上半年总营收3645.26亿元,同比增长14%,净利润1034.49亿元,同比增长16%,AI技术成核心业务重要驱动力 [9] AI应用资讯 - 商汤与铁一院联合打造的“国铁价值工程多模态大模型应用平台”落地,提供知识检索等五大功能,28000条问答准确率超90%,知识库覆盖420GB数据、20万份历史项目资料 [10] AI大模型资讯 - 上海交大发布原生类脑大模型BriLLM,摆脱传统Transformer架构,参数量压缩近90%,架构支持多模态扩展,项目获500万元资助 [11] - 港大联合多机构开源计算机使用智能体框架OpenCUA,旗舰模型OpenCUA - 32B在OSWorld - Verified基准上成功率达34.8%,超越GPT - 40 [12] - 字节跳动开源全模态训练框架VeOmni,可将工程开发时间从数周缩短至几天,工程耗时压缩90%以上,GitHub Star数超500 [13][14] - 智谱发布GLM - 4.5V多模态模型,参数规模106B,在42个公开视觉多模态任务中41项取得SOTA成绩,具备多种理解和处理能力 [15] - 阿里达摩院开源Rynn系列模型,解决具身智能开发中数据、模型与机器人适配难题 [16] - 百川发布开源医疗推理大模型Baichuan - M2 - 32B,在OpenAI HealthBench评测中表现优,支持单卡部署,兼顾医疗推理与通用能力 [17] 科技前沿 - 首个支持8Bit Rollout的开源强化学习方案FlashRL发布,可将速度提升1.7倍,团队还推出Flash - LLM - RL包 [19] - 我国研制出首台杂交授粉机器人“吉儿”,能降低育种成本、缩短周期、提升效率,有望推动大豆杂交育种 [22] - 清华大学与上海人工智能实验室联合发布蛋白质基座模型AMix - 1,具备四大超能力,可生成新蛋白并优化性能 [18]
TMT行业周报(8月第3周):国内晶圆厂代工厂2025Q2业绩超预期-20250818
世纪证券· 2025-08-18 01:29
行业投资评级 - 报告对TMT行业维持积极观点,重点关注半导体代工及AI算力产业链 [3] 核心观点 - 国内晶圆代工厂2025Q2业绩超预期:中芯国际营收22.09亿美元(环比-1.7%超指引-4~-6%),毛利率20.4%(超指引18-20%);华虹半导体营收5.66亿美元(环比+4.6%达指引上沿),毛利率10.9%(超指引7-9%)[3] - 行业需求端修复明确:2025Q2高稼动率由模拟芯片驱动,2025Q3功率半导体需求有望复苏,代工价格或迎新一轮涨价[3] - 建议关注三大细分领域:模拟芯片、功率半导体、半导体设备及材料[3] 市场表现 板块涨跌幅 - TMT板块周涨幅:通信(+7.66%)、电子(+7.02%)、计算机(+5.38%)、传媒(+1.00%),均跑赢沪深300(+2.37%)[3] - 领涨子行业:通信网络设备及器件(+12.40%)、被动元件(+12.32%)、数字芯片设计(+10.18%)[3][11] - 个股涨幅前三:*ST汇科(+53.56%)、上海合晶(+45.36%)、吉视传媒(+45.19%)[13][14] 行业动态 半导体制造 - 中芯国际2025Q3指引:营收环比+5~7%,毛利率18-20%;华虹半导体预计营收6.2-6.4亿美元,毛利率10-12%[3] - 三星研发415mm×510mm尺寸SoP先进封装技术,争夺超大规模芯片订单[23] - SK海力士预测2030年前AI内存市场年增30%[23] AI产业进展 - 大模型商用加速:2024年中国公有云大模型调用量达114.2万亿Tokens,下半年日均Tokens消耗量增近10倍[18] - 算力需求激增:鸿海AI服务器收入Q2同比+60%,Q3预计同比+170%;全球服务器CPU出货量Q2同比+22%[21][22] - 政策支持:国家数据局披露截至6月底高质量数据集交易额近40亿元,5G基站达455万个[19][21] 重点公司公告 - 芯联集成:AI服务器电源管理芯片实现量产[24] - 生益电子:H1净利润同比+452%[24] - 腾讯控股:Q2资本开支229亿元投向AI业务[25] - 臻镭科技:H1净利润同比+1007%[25] - 寒武纪:澄清大量载板订单传闻不实[24]
可灵 AI 技术部换将;宇树机器人“撞人逃逸”上热搜;邓紫棋自曝投资 AI 公司获 10 倍收益 | AI周报
AI前线· 2025-08-17 05:33
人形机器人运动会 - 宇树H1人形机器人以6分34秒40的成绩夺得1500米田径赛冠军,成为世界人形机器人运动会首金[3] - 天工机器人在1500米和400米两个项目中两次输给宇树机器人,天工CTO表示会向宇树学习打造更全面的机器人[3] - 宇树H1在比赛中以3.8米/秒速度领跑时突然偏离赛道撞向工作人员,但未停下继续比赛,引发"机器人肇事逃逸"热议[4][5] - 宇树CEO解释事故原因为人类操作员交接疏忽,并承认遥控操作策略"比较废同事"[5] - 星动纪元旗下人形机器人星动L7在跳高项目中以95.641厘米获得冠军[7] 人工智能与科技公司动态 - DeepSeek母公司幻方量化市场总监李橙因与券商员工合谋套取返佣1.18亿元被查[8] - DeepSeek-R2模型8月内无发布计划,公司近期重点是对现有产品进行迭代优化[9][10] - OpenAI员工寻求按5000亿美元估值出售约60亿美元股票,交易处于初期阶段[15] - 苹果秘密推进两大AI项目Linwood和Glenwood,旨在全面升级Siri并考虑引入第三方AI技术[27] - 马斯克透露X公司员工从8000人缩减至1200人,裁员比例达85%[26] 芯片与硬件 - 中国互联网大厂采购英伟达H20芯片需向监管机构说明理由,部分公司计划减少订单[20] - 特朗普政府正与英特尔商洽参股事宜,以帮助其扩大本土芯片制造业务[24][25] - 寒武纪一季度营收11.11亿元同比增长4230.22%,净利润3.55亿元实现扭亏为盈[21][22] - 苹果Vision Pro升级版将使用M5芯片,iPad mini下一代产品将配备A19 Pro芯片[28] AI技术与产品 - 国家数据局数据显示中国日均Token消耗量从1千亿增至30万亿,1年半增长300多倍[30] - Anthropic为Claude推出"学习模式",采用苏格拉底式辅导功能[32] - 智元推出行业首个机器人世界模型开源平台Genie Envisioner,整合未来帧预测与策略学习[36] - Mistral AI发布Medium 3.1模型,提升核心推理和编码能力并引入多模态支持[35] - 字节跳动开源全模态PyTorch原生训练框架VeOmni,可大幅降低工程开发时间[34] 其他科技新闻 - 阿里国际站Accio Agent在海外爆火,被称为全球首个会做生意的AI Agent[31] - 影石创新就董事长在团建活动中撒钱行为致歉,称将加强内部管理规范[23] - 传阿里"扫地僧"蔡景现离职,其为淘宝第一个程序员并曾主导构建淘宝交易系统[17][18] - 邓紫棋透露2019年投资AI公司已获10倍收益,投资产品为具有思考能力的AGI[19]