Workflow
Modular Design
icon
搜索文档
五年,终于等来Transformers v5
机器之心· 2025-12-02 06:47
产品发布与市场地位 - Transformers v5 发布首个候选版本 v5.0.0rc0,标志着从 v4 到 v5 长达五年的技术周期跨越 [1][2] - 该库日下载量从2020年11月v4发布时的2万次激增至如今的超过300万次,总安装量突破12亿次 [2] - 支持的模型架构从最初的40个扩展至超过400个,社区贡献的模型权重超过75万个 [2] 核心战略方向 - v5版本将PyTorch确立为唯一核心后端,聚焦于四大维度进化:极致的简洁性、从微调迈向预训练、与高性能推理引擎的互操作性、将量化提升为核心功能 [2] - 在人工智能领域,公司将“重塑”视为保持长盛不衰的关键,需要不断演进以保持其相关性 [2] 简洁性与标准化 - 团队首要关注点是简洁性,旨在实现更广泛的标准化、更强的通用性和更全面的生态支持 [3][4] - 大力推进模块化设计,使维护更简单、集成速度更快,并促进社区协作 [6] - 引入抽象层如AttentionInterface来简化通用辅助函数的管理 [8] 模型集成与工具 - 目标是收录所有最新模型架构,成为模型定义的唯一可信来源,过去5年平均每周新增1-3个新模型 [4] - 构建工具通过机器学习识别新模型与现有架构的代码相似度,并致力于自动化模型转换流程以减少手动工作 [9][10] - 对建模文件和标注相关文件进行大规模重构,使建模代码只保留核心部分 [11] 训练能力扩展 - v5版本加大了对大规模预训练和完整训练的支持,重新设计了模型初始化方式并加入对优化算子的支持 [15][16] - 已与torchtitan、megatron、nanotron等工具实现更广泛的兼容 [16] - 继续与Python生态系统中的微调工具紧密合作,并与JAX生态中的工具兼容 [17] 推理优化 - v5优化推理方向,包括专用内核、更干净的默认设置、新的API,以及优化对推理引擎的支持 [18][19] - 定位并非取代vLLM、SGLang等专业推理引擎,而是实现与这些引擎的兼容 [21] - 与ONNXRuntime、llama.cpp和MLX密切合作,确保良好的互操作性,并推动设备端直接运行 [23][24] 量化技术 - 量化被提升为核心能力之一,确保与主要功能完全兼容,并为训练与推理提供可靠的量化框架 [25][27] - 许多SOTA模型如今以低精度格式发布,如8-bit和4-bit [25]
Cemtrex’s Vicon NEXT Camera Wins Multiple Industry Awards, Signaling Commercial Momentum and Category Leadership
Globenewswire· 2025-06-26 13:05
文章核心观点 - Vicon Industries的下一代监控解决方案NEXT Modular Sensor System获多个行业奖项,标志着Vicon战略转型取得早期进展,使其在市场中占据领先地位 [1][5] 产品情况 - NEXT于今年早些时候推出,结合模块化、快速安装和人工智能威慑功能,满足现代安全买家不断变化的需求 [2] - NEXT已获得多个奖项,包括ESX视频监控类创新奖和最佳展示亚军、Campus Security Today的安全校园奖、iF设计奖 [2][3][4] 战略意义 - NEXT的成功是Vicon转型的重大转折点,使其拥有符合商业、市政和教育客户需求的差异化平台 [5] - Cemtrex因NEXT的商业推广加速平台运营收入增长,Vicon凭借模块化设计和人工智能威慑的先发优势,有望在机构升级旧基础设施时占据重要市场份额 [6] 市场反馈 - ESX评委的奖项表明集成商视NEXT为必备解决方案 [8] - 教育领域的认可证实Vicon有能力在高紧迫性、采购标准高的市场中获胜 [8] - 全球设计认可强化Vicon在竞争激烈领域的高端定位 [8] 公司信息 - Cemtrex是多元化科技公司,运营安全和工业部门,安全部门由Vicon Industries领导,工业部门通过Advanced Industrial Services提供服务 [8][9]
初创公司,要颠覆芯片设计
半导体行业观察· 2025-05-16 01:31
Cognichip公司融资与ACI技术 - Cognichip近日成立并完成3300万美元融资,正在开发名为"人工智能芯片智能"(ACI)的基础AI模型,旨在减少芯片设计过程中的人工工作量[1] - ACI技术预计可将处理器设计项目成本降低高达75%,同时能发现微调芯片性能和效率的机会[1] - 该模型需要数年时间达到"终极性能",但会提前为芯片设计师带来实际效益[1] - 公司CEO Faraj Aalaei拥有丰富行业经验,曾在富士通网络通信和Centillium Communications等公司任职[25] 半导体行业现状与挑战 - 全球半导体器件年销量接近1万亿件,相当于人均拥有超过100块芯片[3] - 行业面临严重人才危机,预计到2030年需要新增超过100万名技术工人[4] - 美国仅20%毕业生拥有STEM学位,其中仅1%为电子工程专业,而中国近40%学生拥有STEM学位[7] - 德国约三分之一的半导体从业人员将在未来十年内退休[7] - 芯片研发投入巨大,博通去年研发支出超90亿美元,行业平均将52%的EBIT用于研发[9] 芯片设计与制造瓶颈 - 高端处理器晶体管数量从奔腾4的4200万增至苹果M3的200亿,设计复杂度呈指数级增长[9] - 芯片上市时间(TTM)长达数年,研发复合年增长率12%高于EBIT的10%增速[9] - 五家公司占据全球80%以上芯片供应,新建晶圆厂十年总拥有成本达350-430亿美元[12] - 全球半导体行业年研发投入超过1000亿美元,每代芯片开发成本持续攀升[12] 行业变革方向与解决方案 - 采用并行开发模式和模块化设计可缩短产品上市时间[21] - 3D芯片堆叠和chiplet技术可提高良率并降低成本[22] - 需要建立类似软件操作系统的标准化硬件设计平台[22] - 生成式AI为行业带来变革机遇,可打破现有创新瓶颈[23] ACI技术的潜在影响 - ACI目标是将芯片生产时间缩短50%,降低设计门槛[25] - 技术团队汇聚了来自苹果、谷歌、亚马逊等公司的AI和芯片专家[28] - 该技术可能使小型公司能够开发专用芯片,促进行业多元化[29] - ACI并非渐进式改进,而是旨在为行业设定新目标并带来重大变革[32] - 最终目标是让工程师专注于创造力,而AI处理繁琐的设计工作[41]