Workflow
4小时喜提专属 ChatGPT、卡帕西又整活,自曝Agent帮倒忙、手搓八千行代码,网友:跑完就当上机器学习工程师
36氪·2025-10-14 12:52

"这是我写过的最精神错乱的作品之一。"刚刚,特斯拉前 AI 总监、OpenAI 创始成员 Andrej Karpathy(安德烈·卡帕西)发布了 自己最新的开源项目,一个名为 nanochat 的存储库。截止当前,该项目已在 GitHub 破了 7.9kStar! GitHub 仓库:https://github.com/karpathy/nanochat 据介绍,和卡帕西之前那个只包含预训练功能的类似仓库 nanoGPT 不同,nanochat 是一个极简的、从零构建的全流程训练 / 推 理工具链,可用于搭建简易版 ChatGPT 复现模型,且整个代码库仅一个文件,依赖项极少。 花半天用 100 美元训练的模型, 打败了 GPT-2 "100 美元能买到的最好的 ChatGPT",卡帕西在公告中这样形容 nanochat。通过 nanochat,你只需启动一台云 GPU 服务器,运 行一个脚本,最快 4 小时后,就能在类 ChatGPT 的网页界面上与你自己训练的大语言模型(LLM)对话。 具体来说,该项目可实现以下功能: 据卡帕西介绍,即便成本低至约 100 美元(在 8 卡 H100 节点上训练约 4 ...