开源技术
搜索文档
翻译界的ChatGPT时刻,Meta发布新模型,几段示例学会冷门新语言
36氪· 2025-11-11 12:12
技术突破与性能表现 - 发布的Omnilingual ASR系统能自动识别转录1600多种语言,创造了语音识别覆盖语言数量的新纪录,其中包括500种此前从未被任何AI系统转录过的语言 [1][2][5] - 系统识别性能领先,在测试的1600多种语言中,有78%的语种其字符错误率低于10%;对于训练语料超过10小时的语种,该比例达到95%;即使在训练语料极少的低资源语言中,仍有36%实现了字符错误率低于10%的效果 [7][8] - 模型支持从约3亿参数的轻量级版本到高达70亿参数的强力版本,训练使用了超过430万小时的语音音频,涵盖1239种语言的素材,是有史以来最大规模、多样性最高的语音训练语料之一 [16][18] 核心创新与可扩展性 - 系统引入了零样本的上下文学习机制,用户可通过提供少量音频和文本示例,在推理过程中即时让模型学会一种新语言,无需大规模语料收集和专业训练 [10] - 凭借少样本学习能力,该系统的潜在语言覆盖能力理论上可以扩展到超过5400种语言,几乎涵盖所有有文字记录的人类语言,实现了从静态封闭到动态自适应的范式转变 [10] - 模型架构采用自监督预训练的wav2vec 2.0语音编码器,并结合传统CTC解码和融入Transformer的大模型文本解码器,后者赋予了模型强大的上下文学习能力 [16] 开源策略与社区合作 - 公司选择将整套多语种ASR系统在GitHub上完全开源,采用Apache 2.0许可发布模型和代码,可供免费使用、修改和商用 [11] - 同步释放了一个巨大的多语言语音数据集——Omnilingual ASR语料库,包含350种语料稀缺语言的转录语音数据,所有数据以CC-BY协议开放提供 [13][14] - 开发过程与全球语言组织和社区合作,如Mozilla基金会的Common Voice项目、非洲的Lanfrica/NaijaVoices等机构,采用社区共创模式收集大量语音样本 [14][15]
全国首个省级开源社区正式落地三年内建成孵化超50个项目
新华日报· 2025-10-21 23:02
开源社区建设进展 - 全国首个省级开源社区“开放原子紫金专区”正式落地苏州并进入规模化、系统化推进阶段 [1] - 社区已汇聚40余家龙头企业、顶尖高校及科研机构,并正在孵化15个具有高成长性的开源项目 [2] - 社区突破传统以开发者为核心的模式,联动企业、政府、高校、园区、金融等多元力量协同共建 [1] 发展规划与目标 - 发布紫金专区三年进阶发展规划(2025-2027年),目标在三年内建成基础设施,孵化超过50个项目,吸引万名开发者 [1] - 总体目标是打造“立足江苏、辐射长三角、服务全国”的开源技术创新策源地与产业生态高地 [2] - 下一步将加大对开源平台、项目、社区的扶持力度,推动开源教育融入高校人才培养体系 [2] 产业基础与合作 - 选择落地苏州吴中区是基于其扎实的产业基础,包括赛迪研究院、信通院、哈工大苏研院等大院大所和华为(苏州)开发者创新中心等产业平台 [2] - 当天紫金专区与RISC-V开源芯片产业创新中心、哈工大苏州研究院达成战略合作 [2] - 吴中区正持续推动江苏省信创先导区、江苏省级软件名园“一区一园”建设 [2] 行业背景与驱动力 - 全球软件产业正加速向开源化、平台化、生态化演进,开源技术成为驱动数字经济发展的核心动能 [1] - 当前软件产业存在关键技术受制、生态协同不足等问题,紫金专区项目于今年7月启动以应对挑战 [1]
Jim Keller:AI芯片很简单
半导体行业观察· 2025-10-20 01:47
开源技术对AI芯片开发的影响 - 借助开源技术,人工智能芯片的开发将变得更容易、更便宜 [2] - 开源芯片成本更低,结构更易于访问 [2] - 硬件和软件的开源是重要趋势,Tenstorrent公司计划开源自己的AI软件堆栈 [4] AI芯片的技术前景与市场需求 - 人工智能处理器实际上比人们想象的要简单,开发AI处理器并不需要1000亿美元 [2] - AI模型非常好且在不断改进,尚未接近极限,未来五年市场需求将非常大 [2] - AI发展迅速,推理和训练、语言和图像之间的界限将变得模糊并来回切换 [5] RISC-V架构的未来发展 - 在未来5到10年内,RISC-V将接管所有数据中心,尤其适用于科学计算和高性能计算 [4] - 超级计算领域被RISC-V统治的速度可能会更快 [4] - RISC-V是蓬勃发展的开源指令集架构 [3] Tenstorrent公司的业务战略 - Tenstorrent开发了从AI处理器到通用处理器的开源技术,并将AI编译器开源 [2] - 公司将Tensix AI加速器核心IP和Ascalon CPU核心IP授权给LG电子,用于嵌入式边缘计算 [4] - 公司业务处于探索模式,规模尚小,但乐于与聪明人交流并考虑开源硬件访问 [5] 行业政策与竞争环境 - 某些国家对芯片行业的限制从长远来看不会奏效,因为许多技术已经真正开放 [2] - 限制一个地区会迫使该地区自行发展并迎头赶上 [3] - 边缘AI市场的替代IP产品过于集中且编程难度大 [5]
转变您管理与分析风险的方式:风险分析实验室
Refinitiv路孚特· 2025-09-29 06:03
产品核心定位 - 推出Risk Analytics Lab新平台,将开源风险引擎的灵活性与SaaS模式的高效简便相结合[1] - 该解决方案专为风险管理专业人士打造,旨在提供更智能、快速、协作的风险管理方式[1] - 平台基于云架构运行,使用户能根据需求动态扩展计算资源[3] 核心功能与技术优势 - 用户可在熟悉的Python界面中编写自定义风险分析脚本,并立即访问交易后解决方案的关键数据存储[1] - 支撑平台的开源风险引擎具备完全透明性与可配置性,每一行代码可供审阅,默认配置可根据需求扩展或调整[1] - 集成市场数据以及预配置的引导和工作流程,用户可即时执行风险计算,无需冗长设置流程[1] - 采用随机过程与标准算法对结构性衍生品进行精准定价,应用American Monte Carlo与格点法于路径依赖型产品[7] - 模型内置AAD功能,可快速计算复杂产品的交易级敏感度,利用并行计算与云分布式处理应对大规模计算负载[7] - 支持GPU并行化以提升性能,适用于大规模蒙特卡洛模拟任务,用于估算CVA、DVA等xVA组件[7] 应用场景与价值主张 - 使企业无需等待完整交易集成即可立即运行分析,生成有意义的结果,从第一天起就展现价值[1][3] - 平台提供免费使用选项,帮助风险管理人员消除或大幅降低成本,使其成为企业更具可行性的投资选择[2][4] - 可作为Basel III与IFRS 13报告的技术基础,支持监管标准计算用于基准测试与合规审查[7][12] - 开源模型库提供透明的估值与模拟模型实现,是理想的挑战引擎选择,支持自动化模型回测[12] - 利用交易后解决方案的市场数据库与历史数据,提供清洗后的定价数据用于模型校准与历史数据分析[12]
开放原子大赛AI系列赛路演宣讲成功举办,共探开源AI创新未来
搜狐财经· 2025-09-27 12:00
大赛概况与核心宗旨 - 第三届开放原子大赛正式启动,旨在通过开源模式征集并解决产业发展和科研创新中的技术难题,推广开源技术并发现人才 [1] - 大赛自2023年创办以来已成功举办两届,累计发布100个赛项,吸引超过8万人报名,覆盖1000多所院校,发放奖金总额超过2700万元 [3] - 过往获奖成果价值显著,例如将压裂优化设计软件计算速度提升10倍以上,每年为万余口油井节约数千万元成本,以及将代码编译通过率从11.9%大幅提升至87.5% [3] 第三届大赛重点领域与赛制 - 本届大赛聚焦于基础软件、工业软件和人工智能等关键领域,计划发布约50个赛项 [3] - 大赛面向全球无门槛开放,个人、团队、企业、高校均可免费报名,并提供官方证书、高额奖金,并与华为、腾讯、浪潮、vivo等知名企业联动,开放实习与面试绿色通道 [3] - 上海路演宣讲活动采用线上线下结合形式,吸引了100余名IT企业技术团队、高校师生及科研人员现场参与 [1] 主要参与企业及AI系列赛项 - 百度推出“文心开源创新系列赛”,涵盖多模态开发与AI+硬件挑战,基于其ERNIE 4.5系列开源模型,鼓励在媒体娱乐、智慧教育等场景的应用创新 [4] - 华为发起两项赛题,一项聚焦于利用昇腾310 NPU突破遥感及医疗影像的存储传输瓶颈,要求压缩速率超过95Mpix/s,另一项支持零代码和低代码开发以吸引行业应用创新 [4] - 人形机器人(上海)有限公司带来基于OpenLoong开源社区的机器人仿真运动控制及足球赛等赛项,推动具身智能技术落地 [4] - openKylin社区与麒麟软件联合推出4道赛题,总奖金达100万元,聚焦于端侧资源有限场景下的大模型推理优化和多智能体交互技术开发 [3] 对开发者与行业的支持 - 大赛组委会为参赛者提供全周期服务,包括搭建专属交流社群,并提供技术文档、开发工具和硬件支持 [5] - 具体支持措施包括为特定赛题申请硬件支持、提供树莓派和Jetson Nano等开发板的借用与采购报销服务,以及开放Mujoco仿真环境和机器人模型文件 [5] - 行业专家在路演活动中进行主题分享,展示了openKylin在端侧大模型量化优化等领域的技术突破,以及文心大模型在多模态场景的应用潜力 [5]
联合国“开放共创·可持续发展大会”落地杭州 GOSIM,携全球专家共探 AI 如何拯救世界
AI科技大本营· 2025-08-26 09:10
大会概况 - 开放共创·可持续发展大会将于2025年9月13日在中国杭州举办,与GOSIM HANGZHOU 2025同期举行 [1] - 大会核心目标是探索人工智能与开源技术协同创新,共同应对贫困、饥饿、健康、教育、气候变化等全球性挑战 [1] - 大会汇聚联合国、顶尖学术机构、全球科技巨头及开源社区的杰出领袖与专家,促进跨学科跨文化协作 [1] 联合国可持续发展目标 - 联合国可持续发展目标(SDGs)包含17个相互关联的目标,是《2030年可持续发展议程》的核心内容 [5] - 人工智能和开源技术被联合国视为加速实现可持续发展目标的关键驱动力 [7] - 联合国强调投资开源软件、开放数据、开放AI模型、开放标准和开放内容是实现SDGs的基石 [7] 分论坛设置 - 开放数据分论坛聚焦开放数据在推进SDGs中的实际应用与潜力 [13] - 开放政策分论坛重点探讨政策、流程和治理机制的定义 [21] - 开放科学分论坛探讨利用透明、协作和可及性原则加速SDGs实现 [32] - 未来人工智能分论坛探讨在SDGs背景下AI系统的设计、部署和治理 [39] 重要嘉宾阵容 - 开幕主旨演讲嘉宾包括北京大学教授黄铁军和联合国首席人工智能官Mehdi Snene [10][11] - Mehdi Snene曾指导耗资10亿欧元的"人类大脑计划",推动神经形态计算和大脑模拟发展 [12] - 分论坛主持包括北京智源人工智能研究院副院长林咏华、Generative AI Commons联合主席Anni Lai等 [14][22][33] 预期成果与行动 - 大会将建立开放贡献框架,为参与符合SDGs的开源项目提供清晰路径 [46] - 发起开放数据倡议,促进开放数据获取和使用以实现基于证据的创新 [47] - 目标是在2026年纽约联合国总部举行的联合国OSPOS for Good大会上提交进展报告 [47] 大会规模与影响力 - 预计汇聚1500+全球一线开源开发者,100+海内外资深专家 [50] - 包含100+优质技术分享,5大技术论坛,12场主题Workshop [50] - 设有4场Hackathon创新竞赛和1场GOSIM AI for Humanity Spotlight特别活动 [50]
麦当劳回应招募退休人员:此前就有,提供合规报酬和保险|首席资讯日报
首席商业评论· 2025-08-13 14:06
华为开源计划 - 华为计划2025年9月正式开源UCM技术,首发于魔擎社区,后续将贡献给主流推理引擎社区及共享架构存储厂商[2] 三星先进封装技术 - 三星研发415mm×510mm面板级SoP封装技术,采用RDL重布线层替代PCB基板和硅中介层,以争夺超大规模芯片集成订单[3] 福特汽车召回事件 - 福特因后车轴轮毂螺栓疲劳断裂风险,在美召回103,174辆2023-2025款F-150车型[4] 京东竞争策略 - 京东CEO许冉明确拒绝参与"恶性内卷"价格战,认为补贴大战无创新且破坏市场秩序,违反《反不正当竞争法》[5] 美光业务调整 - 美光全球停止移动NAND产品开发(含UFS5),主因市场疲软及增长放缓,但将继续支持SSD、汽车NAND及移动DRAM业务[6] 电影市场动态 - 电影《奇遇》上映5天总票房突破7000万元[7] 麦当劳用工政策 - 麦当劳中国回应退休返聘属常规灵活用工,强调依法提供报酬、商业保险及合规福利[8] 抖音电商治理 - 抖音电商2025年处置2.4万侵权达人账号,主要涉及AI仿冒他人形象及盗用内容进行带货[9] 银河娱乐业绩 - 银河娱乐2025年上半年净收益232亿港元(同比+8%),股东应占溢利52亿港元(同比+19%),中期股息每股0.70港元[10] 坦克500预售 - 全新坦克500智享版预售36万元起,搭载Coffee Pilot Ultra智能驾驶系统,预售2小时订单达7,289单[11] 小米汽车交付策略 - 小米汽车要求部分高风险用户提前结清尾款,分析称此举或为清理黄牛订单以提升交付效率[12] 人事动态 - 前荣耀CEO赵明否认加盟智界汽车,强调目前处于休整阶段[13]
华为计划于2025年9月正式开源UCM
证券时报网· 2025-08-12 06:57
公司战略 - 华为计划于2025年9月正式开源UCM [1] - 开源UCM将在魔擎社区首发 [1] - 后续逐步贡献给业界主流推理引擎社区 [1] 行业合作 - 将UCM共享给业内所有Share Everything存储厂商 [1] - 与生态伙伴共享UCM技术 [1]
2025 CCF中国开源大会在沪举办
中国经济网· 2025-08-04 06:32
大会概况 - 2025CCF中国开源大会在上海举办 主题为"蓄势引领、众行致远" [1] - 大会聚焦开源操作系统、开源芯片、开源大模型、开源具身智能等关键方向 [1] - 由中国计算机学会主办 上海交通大学和CCF开源发展技术委员会承办 [1] 开源发展战略 - 开源是全球科技创新重要路径 推动开放发展与共同发展 [2] - 大学需打破学科与学校边界 构建跨学科跨组织大协作机制 [2] - 强化人才与科技成果供给 为创新驱动发展提供源头活水 [2] - 上海交大与华为建立"目标共识、人事共通、任务共担、成果共享"合作新范式 [2] - 上海交大国内率先成立开源鸿蒙技术俱乐部 将开源鸿蒙融入课程体系 [2] 技术前沿趋势 - AI正经历从"模型中心"向"数据中心"范式转变 [3] - 需构建高质量高效率数据基础设施降低人工智能落地门槛 [3] - 大模型技术为处理器自动设计、基础软件智能优化提供新机遇 [3] - 大模型技术有望重塑开源芯片生态构建模式与产业格局 [3] - 大模型推理服务面临系统层面挑战 需完善数据获取至推理全生命周期 [2] 开源生态建设 - 开源在人工智能领域扮演关键角色 推动模型代码向平台生态发展 [3] - 上海人工智能实验室推出书生大模型开源体系 [3] - 系统研究在支撑智能时代工作负载中具有核心地位 [2]
从分钟级到秒级的运维管理,开源是企业降本增效的最佳路径么?丨ToB产业观察
钛媒体APP· 2025-08-01 05:46
开源与闭源技术模式对比 - 开源模式能让企业更好地掌控技术并进行个性化创新 同时确保核心数据资产安全 如富国银行部署Meta的Llama 2满足金融合规要求[3] - 闭源模式存在高昂授权费 技术黑箱和厂商锁定风险 自研系统需巨额投入使中小型企业望而却步[4] - DeepSeek问世后开源声音占主导 其推理成本仅为OpenAI o1模型的1/30 但数学推理和代码生成能力达同等水平[7] 企业开源实践案例 - 中国信保通过SUSE Rancher容器平台将运维响应从分钟级降至秒级 图形化操作降低工作难度[2] - 德国FIS集团采用SUSE开源AI平台构建SAP智能解决方案 实现全链路可视化并满足欧盟GDPR合规[5] - 皓康医疗采用SUSE AI运行医学影像分析 推出的Endoseek平台使医生报告解读时间缩短50%以上[5] - IBM基于Llama 2开发AskHR系统服务28.5万名员工 营销AI工具将跨国活动部署周期从月级缩至72小时[6] - 日本CyberAgent用戴尔开源工具开发OpenCALM模型 某汽车厂商借此将缺陷识别准确率提升至99.2% 开发成本仅为闭源方案1/5[6] 开源技术优势 - 通过开源社区群智协作形成技术普惠-知识共享-商业反哺的正循环[3] - 欧洲开发者基于DeepSeek-R1两周开发出法律文书生成工具 成本较闭源方案降低90%[7] - 开源为企业提供高度可扩展的AI基础架构 能轻松增加新用例或扩展内部应用[6] 开源安全挑战 - 2024年84%代码库存在已知漏洞 48%含高风险漏洞 开源AI漏洞事件年增长超650%[9] - SUSE统计显示57%企业担忧隐私数据安全 55%关注AI驱动网络攻击 仅7%认为无安全风险[9] - Kubernetes等平台依赖大量第三方组件 对运维团队经验不足的企业构成管理难题[8] 风险应对方案 - FIS集团通过SUSE AI实现全链路可视化 风控响应速度提升300%[9] - SUSE推出AI护栏技术 满足多国合规要求 监督大模型原则性问题 实时监控防数据投毒[10] - 企业需培养熟悉开源技术的IT团队 以问题导向寻找技术落地场景 而非盲目追风[8] 市场发展前景 - IDC预测亚太地区AI和GenAI投资到2028年达1750亿美元 年复合增长率33.6%[4] - 开源市场竞争焦点除性能与价格外 安全可控可视化成为重要发展方向[9] - 开源公司与用户需持续交流 产品仅是开始 后续服务成为软件公司核心竞争力[9]