合作主体与项目概述 - 乌克兰领先的数字运营商Kyivstar与乌克兰数字转型部下属的WINWIN AI卓越中心选择谷歌的Gemma作为训练乌克兰大型语言模型的基础模型[1] - Kyivstar是乌克兰政府开发国家LLM的战略合作伙伴和运营领导方,该公司将人工智能解决方案整合进其长期技术转型战略[2] - 乌克兰国家LLM将成为构建数字化AI驱动的公共和商业服务的基础,旨在提升服务质量和组织效率[2] 技术选型与核心优势 - 选择Gemma是因为其在性能与资源使用之间提供了最佳平衡,并支持高质量训练,该模型支持超过140种语言(包括乌克兰语),上下文窗口高达128,000个token,并具备多模态能力[3] - 模型的关键优势包括:性能与资源的最优平衡、强大的多语言支持、多模态能力(可处理文本和图像)、先进的tokenizer、多种模型尺寸可选、以及作为现有乌克兰LLM(如MamayLM和Lapa LLM)基础模型已被验证的成功经验[7] 模型定制与开发计划 - 主要开发任务是在现成的开源模型基础上,使用独特的乌克兰语数据对其进行进一步训练,选型时重点关注模型对乌克兰语文本的现有处理能力以及在额外训练过程中的可控性,以最小化语言和伦理风险[4] - 具体计划包括:改进乌克兰语tokenizer以提升模型性能、减少乌语文本生成错误并优化计算成本;在专家正在收集的独特乌克兰语文本上进一步训练模型;创建基准测试以针对未来应用对模型进行微调[6] 公司背景与战略投资 - Kyivstar集团是一家在纳斯达克上市的控股公司,运营着乌克兰领先的数字运营商JSC Kyivstar,该公司是首家在美国证券交易所交易的乌克兰公司[5] - 截至2025年9月30日,JSC Kyivstar拥有超过2250万移动客户和超过120万家庭互联网固定线路客户,提供4G、大数据、云解决方案、网络安全服务、数字电视等多种服务[9] - 公司与VEON计划在2023年至2027年间向乌克兰投资10亿美元,用于基础设施和技术开发方面的社会投资、慈善捐赠和战略收购[8][9]
Kyivstar, Ministry of Digital Transformation of Ukraine Select Google's Gemma as Base Model for Training National LLM
Globenewswire·2025-12-01 10:00