AI科技大本营

搜索文档
报名倒计时!一键 GET 2025 全球机器学习技术大会参会指南
AI科技大本营· 2025-09-28 10:59
这里既有前沿方法论,也有一线落地经验,为科研、技术与产业搭建真正的交流平台。 2025 全球机器学习技术大会·北京站全日程与参会指南正式发布,邀你现场见证 AI 的最新落地成果与无限潜能。 最新全日程来了 在 10 月 16 日上午, 主会场将迎来重量级技术嘉宾分享。OpenAI 研究科学家,GPT-5、GPT-4 和 Transformer 共同创始人 Lukasz Kaiser、 奇点智能研究院院长、 CSDN 高级副总裁李建忠、 小米集团 AI 实验室主任、 NLP 首席科学家王斌、面壁智能副总裁贾超将联袂出席,他们将围绕 大模型技术思考与 AI 产业范式、推理模型突破等前沿议题的深度解读,共同描绘智能时代的未来图景。 10 月 16-17 日,由 CSDN 与奇点智能研究院联合举办的 2025 全球机器学习技术大会将在北京威斯汀酒店召开,大会云集 AI 技术奠基者、学术领军 者、顶会顶刊作者、一线科技产品技术实战派、开源先锋组成的超 50 位重磅嘉宾,他们将以独特的视角,解读智能体工程、AI 赋能软件研发、多模 态大模型等前沿议题。 2025 全球机器学习技术大会将聚焦以下十二大专题,全面呈现当前最具 ...
从模型到生态:2025 全球机器学习技术大会「开源模型与框架」专题前瞻
AI科技大本营· 2025-09-26 05:49
开源没? 每当新模型或新技术亮相时,总会有人第一时间抛出这个问题。 2025 年,AI 世界正处在一道分界线上:一边是不断壮大的开源阵营,一边是紧锁的闭源堡垒。最 新斯坦福《AI 指数》报告显示,开源与闭源模型的性能差距已从常见的 8% 缩小到 1.7%,开源正 迎头追上。 2025 全球机器学习技术大会特设立「开源模型与框架」专题,诚邀那些最懂底层构件的开源创作者 与实践者带来第一手的实践与思考:他们如何筑起这座未来的基石,又如何让更多人参与进来,共同 完善这场宏大的工程。 他们分别是 每个人的背后,都是一个具体的开源项目——从移动端大语言模型推理,到强化学习框架、RAG 新 范式,再到高效推理服务和投机采样训练工具。他们的工作,就是让这些"砖石"真正落到开发者手 中,让开源不再只是概念,而是可以触碰、可落地的力量。 陈海泉 字节跳动工程师、verl项目核心贡献者 阿里淘天集团技术专家、MNN团队架构师王召德 字节跳动工程师、verl项目核心贡献者陈海泉 Dify资深架构师姜勇 vLLM核心维护者游凯超 SGLang核心开发者、新加坡南洋理工大学在读博士李升桂 开源模型与框架 0 王召德 阿里淘天集团技术专 ...
CSDN 创始人蒋涛:中国开源十年突围路、模型大战阿里反超 Meta,数据解析全球开源 AI 新进展
AI科技大本营· 2025-09-25 03:33
全球开源生态发展格局 - 全球开发者总量突破1.5亿,GitHub活跃开源开发者达2280万,美国为核心力量,中国活跃开发者超400万,总开发者1200万,规模全球第二[11] - 高影响力开发者美国310人居全球第一,中国从2016年3人跃升至2025年94人,增长超30倍,跻身全球第二梯队[1][16] - 开源项目数超4亿代码仓,活跃仓数从2016年193万增至2025年近600万,增长超3倍,AI大模型、云基础设施、前端与交互技术、编程语言与开发工具为四大技术驱动力[16] 区域与国家贡献分析 - 印度和中国增长显著,印度十年达6倍增长,中国达3倍增长,巴西作为拉美代表增幅超5倍[12] - 美国在OpenRank贡献度2021年达峰值后逐年下降,中国贡献度十年大幅上升,其余国家稳步增长[12] - 美国在影响力格局持续领先,德国稳居欧洲第一,中国、印度快速上升,巴西与日本体现区域共同发展[12] 企业开源影响力 - 全球企业OpenRank排行榜TOP100中,美国企业65家居首,中国企业16家次之,华为全球第二,阿里巴巴TOP8[19] - 微软以OpenRank 87234.62居首,华为61039.42次之,谷歌31402.94第三[20] - 中国企业开源进展快速,华为、阿里巴巴等在高影响力企业中表现突出[19] 技术领域影响力 - AI与大模型以OpenRank 535,299居技术影响力榜首,远超云基础设施333,165和前端与交互式314,618[21] - 编程语言与开发291,487、应用与解决方案218,783、区块链与Web3 167,408分列第四至第六[21] - 数据库系统129,806、RISC-V与硬件112,327、大数据与数据工程111,791进入前十技术领域[21] 开源项目影响力 - OpenHarmony以OpenRank 40192.24居全球开源项目影响力第一,中国9个项目进入TOP100[21][22] - Azure22155.91、.NET14479.13、NixOS13148.25分列第二至第四[22] - 中国开源从使用走向贡献,项目影响力显著提升[21] 大模型技术体系开源影响力 - 大模型开源影响力榜单涵盖数据、模型、系统、评测四维度,Meta、阿里巴巴、谷歌位列模型榜前三[2][29] - 模型下载量向量模型占41.7%,语言模型31%,多模态模型18.3%,UKP Lab下载量最高[31] - 阿里巴巴千问系列下载量2025年6月后飞速增长,超越Meta,DeepSeek保持稳定[31] 数据与系统生态 - 数据榜单Ai2、上海人工智能实验室、谷歌前三,智源综合性数据开放突出[37][40] - 语言数据集1-4月为下载主力,纯视觉数据集比例快速下降,具身数据集增势显著[43] - 系统榜单智源贡献突出,Meta和谷歌紧随其后,百度、阿里、华为、上海人工智能实验室进入TOP10[45] 评测与综合影响力 - 评测榜单上海人工智能实验室、Hugging Face、智源前三,中国学术机构投入大[50][52] - 综合榜单Meta第一,谷歌第二,智源第三,智源在多芯片支持的系统维度优势显著[55] - 大模型生态美国贡献比例37.41%,中国18.72%,位居前两位[60]
为什么40%的智能体项目难逃废弃?8位一线专家教你构建高质量、鲁棒的AI Agent
AI科技大本营· 2025-09-24 08:46
说实话,当 下聊 AI、聊大模型,很难错过智能体这个话题。这一年,众多企业都在智能体上反复实践,有些企业已尝到了其带来的甜头,而有些企业 且还在摸爬滚打阶段。 麦肯锡在对 50 个真实项目的调研中发现,企业在开发智能体时往往会掉进几个相似的陷阱:要么过于依赖单点 Demo,却难以支撑大规模应用;要么 急于追求炫酷功能,却忽视了背后的工程与治理。Gartner 甚至预测,到 2027 年,超过 40% 的 Agentic AI 项目将被废弃,原因就在于成本、价值 和工程化落地没有平衡好。 在 2025 全球机器学习技术大会上,我们特别设立「智能体工程与实践」专题,汇聚国内外顶尖学者与企业一线实践者,呈现从理论创新到产业应用的 全景视角,助您告别踩坑,直击智能体落地的核心痛点。 官网:https://ml-summit.org/ 智能体工程与实践 亮点抢先看 在本次专题中,来自国内外的顶尖研究者与一线实践者,将围绕智能体在大模型时代的工程方法、落地经验与技术路线选择展开深度探讨。 我们邀请到了一批重磅嘉宾,包括前 OpenAI 研究员、清华大学交叉信息院助理教授吴翼、通义实验室算法科学家、通义 DeepResea ...
最受欢迎的开源大模型推理框架 vLLM、SGLang 是如何炼成的?
AI科技大本营· 2025-09-24 02:01
文章核心观点 - 大语言模型推理阶段是决定模型实用性和广泛采用的关键 需要高效处理延迟、吞吐量和成本约束[2][3] - vLLM和SGLang作为领先的开源推理引擎项目 通过创新内存管理技术和优化调度设计显著提升推理性能[4][8][12] - 两个项目均起源于学术研究 现已发展为社区驱动的开源标杆 获得业界广泛采用和投资机构支持[7][16][31][34] 项目技术特性 - vLLM采用PagedAttention算法 借鉴操作系统分页缓存管理技术 实现精细化内存管理 官方测试显示比Hugging Face Transformers后端提升30倍吞吐量[8][9] - SGLang以RadixAttention为核心 重用过往请求的KVCache 在前缀匹配时大幅减少Prefill阶段计算量 即使关闭RadixAttention仍保持优秀性能[12] - 两者均支持Continuous Batching、Chunked Prefill、Speculative Decoding等先进特性 在功能算法层面日趋同质化[29] 社区发展数据 - vLLM于2023年6月开源 截至2025年8月获56,045星标 9,578分叉 1,465贡献者 12,393名社区参与者[15] - SGLang于2024年1月发布 同期获17,095星标 2,697分叉 638贡献者 2,754名社区参与者 规模不及vLLM五分之一[13][15] - 两项目中国开发者占比显著 vLLM达33% SGLang高达52% 社区活跃度高但待处理issue均超2000条[9][13][37] 学术与产业关联 - 项目核心发起人Woosuk Kwon(vLLM)和Lianmin Zheng(SGLang)均来自加州大学伯克利分校 师从Spark和Ray创建者Ion Stoica[16] - vLLM贡献主力来自Red Hat SGLang贡献主力来自xAI、Skywork、Oracle和LinkedIn 194名开发者在两项目间交叉贡献[18][19][20] - OpenAI工程师comaniac在vLLM提交77个代码请求 在SGLang提交17个请求 2024年3月后活跃度降低引发行业猜测[20] 性能演进历程 - vLLM在2024年9月发布v0.6.0 通过CPU调度优化实现2.7倍性能提升和5倍延迟下降 但架构复杂性导致增长放缓[23][25] - 2025年1月vLLM推出V1重构版本 结合DeepSeek V3/R1发布 与SGLang同步进入第二轮爆发式增长[21][25] - 性能竞争白热化后 双方转向强调可复现方法和真实工作负载端到端指标 鼓励第三方独立评测[26] 生态合作与投资 - a16z的Open Source AI Grant基金在2023年8月资助vLLM核心开发者 2024年6月第三批名单资助SGLang开发者[31][33] - 真格基金2024年7月向vLLM提供捐赠 Linux基金会将vLLM纳入PyTorch基金会 2025年3月SGLang加入PyTorch生态系统[40] - 两项目已成为Google、Meta、Microsoft、字节跳动、阿里巴巴、腾讯等顶尖科技公司首选推理方案[34]
从Transformer到GPT-5,听听OpenAI科学家 Lukasz 的“大模型第一性思考”
AI科技大本营· 2025-09-23 02:11
以下文章来源于CSDN ,作者CSDN CSDN . 成就一亿技术人 2017 年,一篇标题看似简单、甚至有些狂妄的论文在线上出现:《Attention Is All You Need》。 在当时的 AI 研究界,这是一个石破天惊的宣言。它提议彻底抛弃被奉为圭臬的循环神经网络(RNN),只用一种名 为"注意力"的机制来处理语言。最初,许多人对此持怀疑态度。然而,这篇仅 15 页的论文很快就点燃了一场燎原之 火。它所提出的 Transformer 架构,以摧枯拉朽之势,重塑了人工智能的版图。今天,从驱动你手机输入的预测文 本,到生成惊艳图像的 DALL-E,再到改变世界的 ChatGPT,其底层的心跳,都源于那篇论文。 截至发文,其在 Google Scholar 上的引用次数高达 197159 次。 | TITLE | CITED BY | YEAR | | --- | --- | --- | | Attention is all you need | 197159 | 2017 | | A Vaswani, N Shazeer, N Parmar, J Uszkoreit, L Jones, AN Gome ...
AI Coding 的下半场,何去何从?
AI科技大本营· 2025-09-22 09:17
AI Coding 演化进行时。 作者 | 董超 责编 | Echo Tang 出品丨AI 科技大本营(ID:rgznai100) 过去三年里,AI 编码从"补一句代码"跃迁为"承包一次变更"。Coding 可能是第一个找到所谓 PMF 的方向…如今 AI Coding 已经进入下半场,Coding 到底是 AGI 的子集还是新路径,我们一起略窥一二。 三年演进:范式落地 → 开源上位 → 执行力为王 2023:范式落地,"可执行代理"苗头已现 如果要给 2023 下一个极简注解,那就是:范式被大型平台坐实,开源在边缘地带萌芽。前者不难理解——Copilot 与 ChatGPT 把"人写—AI 辅"的协 作方式带进了日常;后者更值得留心:初创公司和个人开发者开始探索"不仅会说,还要能做"。我们能在当年的两个方向上嗅到这种味道: 它们还不是"产业级代理",却清晰地为次年的开源 Code Agent 热身:从"能聊代码"迈向"能动手"。 2024:Coding Agent 上位,社区百花齐放 来到 2024,Coding Agent 从舞台边侧走到中央,形成两股彼此强化的潮流。 第一股:可执行的 Coding A ...
谷歌与OpenAI同获ICPC 2025金牌!GPT-5满分夺冠,Gemini攻破人类队伍都没解出的难题
AI科技大本营· 2025-09-19 10:36
GPT-5 和 Gemini 2.5 Deep Think 作为参赛模型,受 ICPC 官方规则与组织监督,参与了与人类选手相同的解题环节。虽然它们并非与学生团队直接同 场竞技,却交出了惊艳答卷: ● GPT-5 拿下满分,12 道题全解,相当于"金牌"水准。 ● Gemini 2.5 Deep Think 在 677 分钟内解出 12 题中的 10 题 ,也达到金牌级别。 根据谷歌的说法,这样的成绩放在人类排名里将是全球第二。 整理 | 郑丽媛 出品 | CSDN(ID:CSDNnews) 在过去几十年里,国际大学生程序设计竞赛(ICPC)一直被视为 计算机 程序设计 领域的"奥林匹克"。然而今 年 ,赛场上的风头却被两位"非人类"选手 抢走——OpenAI 的 GPT-5 和 Google DeepMind 的 Gemini 2.5 DeepThink。 要知道,本届 ICPC 的人类金牌队伍来自圣彼得堡国立大学、东京大学、北京交通大学和清华大学。 可 即便是这些顶尖学府的强 队,也没有任何一支 做到全对(最好成绩是 11/12)。换句话 说, 这是 AI 第一次在这类算法竞赛中实现了"超车" 。 ICP ...
从中国“霸榜”到全球开源,AI的新思考!GOSIM HANGZHOU 2025圆满收官
AI科技大本营· 2025-09-16 10:33
开源与AI技术发展 - 开源推动AI技术落地 包括具身智能走出实验室 新操作系统重写 AI应用渗透各行各业 互联网焕发活力[1] - 具身智能面临高质量训练数据缺乏 跨芯片适配与低时延计算难题 评测体系尚在起步阶段等共性挑战[8] - 大模型重塑信息世界 具身智能让AI融入现实 需解决算法 硬件 模型到实际应用场景的技术难题[12] 全球协作与生态建设 - 大会汇聚全球200余位开源与AI技术领袖 国际机构代表 产业先锋 超过1500名一线开源开发者[1] - 联合国 PyTorch基金会 CNCF基金会 Eclipse基金会 SpeakLeash基金会等国际组织深度参与 分享治理理念与技术标准[3] - 华为首席开源联络官指出 全球开源社区共同支撑大模型 产业算力 数千万开发者和Agent融合 建设软件AI超级工厂[7] 技术前沿与创新应用 - Rust语言十周年 RustGlobal与RustChinaConf首次同台亮相 近60位一线Rust技术专家分享工具链优化 操作系统实验 高性能网络等话题[15] - 智能体互联网论坛讨论可信机制 去中心化标识符 MCP与A2A协议等前沿议题 分享智能体互操作性 协议标准化与数据安全最新实践[13] - 端侧AI推理工作坊聚焦技术突破与未来趋势 嵌入式Rust与AI工作坊提供端侧智能与系统级开发实践路径[18][20] 开发者互动与实践 - 大会设计14场Workshop 涵盖昇腾计算与高性能推理 Flutter跨平台应用 仓颉编程语言 端侧AI推理等核心技术[17][18] - 4场黑客松围绕超级智能体 Code Alert Adora机器人 Adora LeRobot等主题 开发者组队敲代码 从构思到原型验证创意[22][23] - SGLang开源推理引擎举办中国首场Workshop 开发者与阿里云 科大讯飞 美团 华为昇腾 英伟达 字节跳动等企业专家深入交流[20] 产业应用与跨界融合 - 应用与智能体论坛分享AI应用前沿经验 呈现大模型在提升生产力方面的最新成果[14] - 下一代AI论坛汇集技术专家 艺术家与设计师 探讨教育 艺术 游戏和开源生态等领域的创新应用与变革潜力[14] - AI for Humanity Spotlight活动聚焦教育公平 心理健康 文化表达 无障碍设计等领域 收到200多份投稿 79个作品入围 6个获最受欢迎奖[24] 企业参与与技术支持 - NVIDIA 华为 谷歌 Hugging Face 字节跳动 OpenCV.org 智源研究院 宇树科技 蚂蚁集团 红帽 奇点智能研究院等产业力量展现技术与生态联动[3] - 企业参访活动走进阿里巴巴 宇树科技等中国AI科技企业 了解人工智能 智能制造 数字经济等领域的技术研发成果与产业应用实践[27] - 华为专家分享昇腾CANN底层优化 大模型训练推理性能提升 大模型能力密度提升等核心技术[17]
对话吴穹:软件开发的终局,是我们将迎来自己的“黑灯工厂”
AI科技大本营· 2025-09-15 00:50
软件工程方法论本土化 - 西方敏捷方法论在中国出现水土不服 因国内企业文化偏管控型 强调令行禁止的确定性 而西方崇尚试错和自组织[6][12] - 需将敏捷核心思想与本土实践结合 基于第一性原理重新设计适合中国土壤的农具 而非照搬最佳实践[7][14][15] - 华为在落地IPD时做了管理变革和创新 体现本土化必要性[13] - 推出Adapt方法论框架和《敏稳兼顾:数字化研发管理实战》著作 总结规模化敏捷本土落地经验[15] AI对软件工程的冲击 - AI工具存在悖论:对员工是摸魚神器 对老板却是提效神器 两者本质矛盾[9][35] - 生产力变革触及生产关系根基 需解决员工为何使用AI为公司创造价值而非提前下班的管理问题[9][35] - 私域知识质量差是AI应用短板 大多数软件开发项目有独特金融软件或电商系统实现方式等私域知识[18] - 上下文缺失是AI发挥作用的重要阻碍 老系统缺乏历史信息或历史上下文[18][20] - AI在代码补全场景高效 因已有明确修改点和意图上下文 但让AI纯粹处理任务则需大量上下文[19][20] - 短期困难包括AI幻觉和上下文不足 导致团队效率提升数据在10%-20%体感误差范围内[20] Agent专业化趋势 - 不会有通用Agent 最终会分化成专用Agent 如金融Agent 测试Agent 重构Agent[24] - 工程生产线需差异化 如特斯拉造车产线不会用于生产飞机 否则不经济[24] - 开发语言进一步专业化 自然语言编程提升抽象层次 但最终会出现领域特定语言(DSL)[25][26] - 描述和Agent都会分化 形成更专业化生产线[27] 组织管理变革 - 未来组织是1+N模式 即1位人类小队长带领N个AI特工协同工作[35][38] - 需把Agent当成员工管理 建立注册 KPI考核 任务冲突调解等管理机制[24][35] - 考核体系变化 人的效能不再是个人产出 而是带领多少Agent产出多少[38][42] - 兵种主建 战区主战 类似国家军事改革 在职能线上叠加交付型组织[30] - 科技团队不能孤立谈管理 需与PMO 财务等职能部门深度卷入 为整个公司治理服务[47] 技术债与质量管控 - AI可能加速技术债累积 如果过分强调效率或代码行数等指标 会导致低质代码更快产出[53] - 使用得当AI反而减少技术债 如AI生成单元测试能力非常强 形成自闭环[54] - 布设单元测试像铃铛 代码被不该改的地方触碰就会报警[54] - 需传统度量体系感知质量 如交付效率 缺陷修复时间 代码重复度等[53] 工具与平台演进 - 知微工具平台将Adapt方法论理念变为数字化工具 如分层需求体系 多维组织架构[49] - 知微是可配置零代码平台 像高级定制西装 根据客户情况量体裁衣 而非定制开发或盒装软件[52] - 知微会逐渐中台化 大模型也是其用户 通过API调用 成为组织流程资产中心[60] - 未来IDE和CLI是主入口 界面越来越少 因AI改善工具使用 根据工作上下文自动操作[60] 程序员能力重塑 - 未来重要能力是对AI的了解和沟通协同能力 需学会与AI有效沟通[66] - 程序员需放下对AI戒备和抵制 进行心理角色转换 从种地变为地主[77] - 与人沟通和团队协作能力变得非常重要 需补强[78] - 对业务理解至关重要 程序员现在创业更容易[78] - 有技术底色的程序员更具优势 因懂技术细节可不关心 但产品经理压根不懂则难做精准判断[74] - 马斯克 扎克伯格 比尔·盖茨等有编程能力者最终成为顶尖产品缔造者[75] 行业长远展望 - 软件工程终极图景是黑灯软件工厂 AI自主编码 人类负责指挥和规划[9][81] - 软件不会用后即弃 因承担产生数据使命 有长生命周期 形成领域知识[80][83] - 软件行业类比制造业 产能飞跃后可能解决更高阶问题 产生新需求 如星际旅行 可控核聚变 智能医药[82][83] - AI颠覆原有冯·诺依曼架构 LLM是全新概率引擎 从确定性输出变为合理可能结果 拓展软件能力边界[61][62] - 软件边界和形态发生变化 从服务顾问变为直接服务用户 从确定性软件变为能给出不确定结果的软件[63] - 测试和质量过程都需改变 因软件给出不确定结果[64]