合作项目与核心模型 - 乌克兰领先的数字运营商Kyivstar与乌克兰数字转型部下属的WINWIN AI卓越中心选择谷歌的Gemma作为训练大型语言模型的基础模型[1] - Kyivstar是乌克兰政府开发国家LLM的战略合作伙伴和运营主导方,该公司将人工智能解决方案整合进其长期技术转型战略[2] - 选定的Gemma模型将针对乌克兰语进行适配,其关键优势包括支持超过140种语言(含乌克兰语)、高达128,000个token的上下文窗口、多模态能力以及灵活的架构[3] 模型选择依据与优势 - 选择Gemma模型是基于其在性能与资源使用之间的最佳平衡,以及高质量的训练效果[3] - 该模型已被证明是MamayLM、Lapa LLM等现有乌克兰LLM以及保加利亚语现代LLM INSAIT BgGPT的成功基础模型[6] - 模型的其他优势包括多语言支持、多模态性(可处理文本和图像)、先进的tokenizer以及多种模型尺寸可供灵活选择[6] 项目实施计划 - 项目计划改进乌克兰语tokenizer以提升模型性能、减少乌克兰语文本生成错误并优化计算成本[5] - 项目将进一步在专家正在收集的独特乌克兰语文本上对模型进行训练,并创建基准测试以针对未来应用微调模型[5] - 开发的主要任务是在现成的开源模型基础上,使用独特数据进行进一步训练,以最小化语言和伦理风险[4] 公司背景与投资 - Kyivstar集团是一家在纳斯达克上市的控股公司,运营着乌克兰领先的数字运营商JSC Kyivstar,是首家在美国交易所上市的乌克兰公司[5][7] - 截至2025年9月30日,JSC Kyivstar拥有超过2250万移动客户和超过120万家庭互联网固定线路客户[8] - 公司与VEON计划在2023年至2027年间向乌克兰投资10亿美元,用于基础设施和技术开发方面的社会投资、慈善捐赠和战略收购[8] - 在过去三年中,公司已分配超过34亿乌克兰格里夫纳用于支持国防部队、用户以及社会项目的实施[9] 政府数字转型目标 - 乌克兰数字转型部是领导国家数字革命的关键国家机构,旨在为公民和企业构建最便利的国家[11] - 在六年内,乌克兰在数字公共服务发展方面的全球排名从第102位上升至第5位[11] - 该部的旗舰产品是Diia(“智能手机中的国家”),这是一个包含150多项公共服务的门户网站以及一个拥有33种数字证件和65项以上服务的应用程序[12]
Kyivstar, Ministry of Digital Transformation of Ukraine Select Google’s Gemma as Base Model for Training National LLM
Globenewswire·2025-12-01 10:00