星辰系列大模型 - 财报，业绩电话会，研报，新闻

星辰系列大模型

搜索文档

量子位· 2025-09-26 02:08

公司数据资源 - 拥有超过10万亿tokens的通用大模型语料数据及覆盖14个关键行业的专业数据集总存储量达350TB [1] - 数据经过精心标注和优化包含多模态内容可直接用于行业应用 [3] - 高质量数据集通过采集加工等处理流程能直接用于AI模型开发训练提升模型性能 [4] 技术平台架构 - 星辰MaaS平台作为核心构建"数据-模型-服务"完整闭环包含四大核心组件 [7] - 数据工具链覆盖"采-存-算-管"链路支持文本图片音视频等多类型数据统一接入与处理 [18] - 模型工具链覆盖"标-训-推-评"链路支持40多种标注任务通过AI预标注使效率提升5倍以上 [18] - 智能体作为执行中枢灵活调度资源并自主完成复杂任务实现决策智能化与行为自动化 [7] 模型体系与能力 - 建立"三全"星辰大模型体系：全模态全尺寸全国产 [8] - 成功研发万亿参数大模型采用全国产万卡集群和国产深度学习框架训练 [9] - 语音大模型精准识别60种方言语义大模型参数规模庞大视觉模型鉴伪技术达国际领先水平 [39] - 完成中央网信办"境内深度合成服务算法备案"和"生成式人工智能服务"双备案 [39] 行业应用案例 - 在纺织行业实现AI验布瑕疵检测准确率从50%提升至95%以上生产效率提升50% [9] - 服务物流集团纳管超500P国产化算力卡构建多个物流行业高质量数据集 [29] - 在医疗领域与北京三甲医院合作构建医疗质量管理数据集推动医院运行管理智能化升级 [36] - 在农业领域为雄安新区打造"雄小农"应用帮助当地农民实现超过15%的增收 [37] - 在政务服务领域基于1200万条工单记录建成520万条高质量语料支撑25个智能应用场景 [38] 生态建设与产业赋能 - 支撑成都沈阳等多个国家级数据标注基地建设扮演产业生态规划者产能运营者和新职业培育者角色 [34] - 在成都联合打造"蓉数公园・新津数据要素服务站" 引入数十家标注企业及教研机构 [34] - 建立培训认证体系规模化培养数据标注师 AI训练师等数字化人才 [35] - 形成"政府引导+央企主导+生态协同"可复制模式构建完整生态链 [35] 战略定位与发展愿景 - 基于国家战略市场需求运营商优势禀赋和使命责任四个层面重仓投入数据基础设施建设 [14] - 承载成为国家战略科技力量和领先的通用人工智能服务提供商的愿景 [42] - 持续发力技术领先应用普惠生态开放和人才培养四大方向 [43] - 日增数据量达1.6PB 基础数据集超10万亿tokens 服务超10亿公众客户和上千万政企客户 [16]