Workflow
AI前线
icon
搜索文档
浙江大学联合华为发布国内首个基于昇腾千卡算力平台的 DeepSeek-R1-Safe 基础大模型
AI前线· 2025-09-21 05:32
全球主流大模型频现包括虚假 / 有害内容生成、数据偏见、信息泄露等安全问题。例如,谷歌公司发布报告揭示,伊朗支持的攻击 者利用 Gemini 大模型发动网络攻击,开展钓鱼攻击活动,对防务专家及机构的网络与云环境进行渗透,监视与窃取机密信息,严 重威胁了国家信息安全;三星公司在引入 ChatGPT 后,短时间内便曝出多起机密资料外泄事件,导致三星公司半导体设备测量资 料、源代码、产品良率等机密内容瞬间外泄,且无法收回,严重影响了企业运营。我国同类人工智能模型的安全问题同样不容忽 视。当前,政府部门、华为等科技企业正积极推动国产大模型生态建设,并取得了显著成效。 然而,国产平台在框架健全性、开发者社区成熟度以及开源生态发展等方面仍然面临诸多挑战,整体尚处于起步阶段。据研究显 示,部分国产大模型早期版本在面对越狱攻击时的失守率高达 100%。这不仅暴露了当前大模型在安全技术层面的普遍脆弱性,也 对产业发展乃至国家安全构成潜在威胁。 针对这一全球性挑战,浙江大学联合华为计算产品线 重磅推出 DeepSeek-R1-Safe 基础大模型 。模型基于昇腾千卡集群,依托全 流程自主可控后训练框架完成训练,整体安全防御能力提 ...
“别再碰我代码!”明星AI工具成瘟神,用户怒斥:一周七千块,修不好bug还删我关键文件!
AI前线· 2025-09-20 05:33
今年 7 月,Replit 就曾因 误删用户生产数据库 并伪造数据的操作失误,陷入舆论漩涡。当时公司公开道歉,并承诺将采 取措施重建信任。 编译 | Tina AI 编程服务提供商 Replit 近日再次成为争议焦点,而距离其上一次风波仅过去不到三个月。 9 月 10 日,Replit 正式推出了新一代 AI 编程助手 Agent 3,称其能够帮助开发者更轻松地构建和测试应用程序。值得注 意的是,同日 Replit 还宣布完成 2.5 亿美元融资,估值升至 30 亿美元。 Replit 将 Agent 3 称为"迄今最先进、最自主的编程代理",性能据称"比 Computer Use 模型快 3 倍、成本效益高 10 倍"。 软件的"自动驾驶时刻"?! 在官方推文中,Replit 将 Agent 3 描述为迄今最自主的代理,能够在浏览器里自动测试和修复应用,检查按钮、表单、链 接和 API;还可以连续运行超过 200 分钟,在构建、测试和修复过程中几乎无需人工监督。同时,它还能与 Slack、 Telegram、Notion、Dropbox 等常用工具集成,帮助用户快速实现自动化。 CEO Amjad Masa ...
AIGC全生命周期业务风控白皮书,从备案到运营的合规与安全实践
AI前线· 2025-09-20 05:33
2025 年 9 月 15 日,在国家网络安全宣传周主论坛上,《人工智能安全治理框架》2.0 版正式发 布,这一顶层治理文件的更新引发行业广泛关注,既精准呼应人工智能技术发展节奏,更直指生 成式 AI 落地过程中日益突出的安全风险,为产业风险防控划定关键方向。 当前,生成式 AI 技术正加速落地,驱动 AIGC 行业进入爆发式增长阶段。据 IDC 预测,2028 年全球生成式 AI 市场规模将达 2842 亿美元,中国市场规模也将突破 300 亿美元,占 AI 总投资 的 30.6%。然而,市场规模快速扩张的背后,内容合规漏洞、数据安全隐患、算法歧视等风险问 题日益凸显,成为制约产业健康发展的重要瓶颈。 事实上,国家对 AI 风险治理的布局已逐步深化。早在 2025 年 8 月,国务院便印发《关于深入 实施 "人工智能 +" 行动的意见》,为产业发展搭建政策框架;此次《人工智能安全治理框架》 2.0 版的发布,进一步完善了 AI 安全治理体系,也让 "安全治理是 AI 赋能千行百业的基石与前 提" 这一认知更加明确。 在此背景下,AI 风控领域深耕者数美科技,立足于 AIGC 技术发展现状与行业实际需求,紧密 ...
从模型为王到应用为王:AI 中间件的基建之战 | 直播预告
AI前线· 2025-09-20 05:33
模型触手可得,落地举步维艰?真正的竞争,是 AI 应用的"落地效率"。一场关于 AI 中间件的"基建之战"正在开启。「点击预约按钮即可预约直播」 直播介绍 直播时间 9 月 23 日 20:00-21:30 宋顺 :蚂蚁集团资深技术专家 嘉宾 直播亮点 李志宇 博士:记忆张量 CTO 章耿:蚂蚁集团 AI 中间件负责人 如何从"云原生"平滑过渡到"智能原生"? 企业级 AI 中间件如何破解落地成本、管控难题? 开发者如何抓住这波红利,成为智能时代核心人才? 如何看直播? 扫描下图海报 【二维码】 ,预约 AI 前线视频号直播。 直播主题 从模型为王到应用为王:AI 中间件的基建之战 直播嘉宾 主持人 / 嘉宾: 扫码 查看 完整日程 > 开发者如何抓住这波红利,成为智能时代核 心人才? 模型触手可得,落地举步维艰?真正的竞争, 是 AI 应用的" 落地效率 "。一场关于 AI 中 间件的"基建之战"正在开启。一起进直播 间来聊聊吧! 扫 / 码 / 预 / 约 直播福利 智能应用开发资料包 扫 码 领 取 免费福利 >> 难题? 区 Agentic AI 应用前沿技术及案例 了 Agent 应用工程化落地的架 ...
模力工场 012 周 AI 应用榜:AI 简历优化或能不再千篇一律?本周榜单展现效率与情绪价值双重趋势
AI前线· 2025-09-19 08:08
模力工场 新鲜事 上周我们去了上海外滩大会,现场结识了不少对 AI 超有热情的小伙伴,体验官 & 推荐人队伍越来越壮大啦! 012 周榜单总介绍 本周,模力工场 AI 应用榜单迎来了 10 款全新 AI 应用,覆盖人力资源、教育学习、设计创意、硬件实体、生活服务 等多个场景。从 HR 面试与简历优 化,到 AI 早教陪伴机,再到多模态创作与字幕工具,应用生态继续展现出「实用 + 趣味」的多元趋势。 与前几周的"健康管理热""内容创作热"相呼应,本周的关键词是 "双向赋能 + 个性场景":AI 不再只是单一工具,而是成为面试官与求职者、家长与孩 子、创作者与受众之间的"桥梁"。 本周上榜应用周报: 平台新功能上线:现在模力工场网页与小程序均可显示 开发者 / 推荐人所在城市,说不定你喜欢的应用开发者就在你身边~ 从这周开始,周榜单将新增榜首应用开发者 Q&A 短访谈栏目,带来更深入的功能与产品亮点解读,欢迎持续关注。 Unicorn Hunter 是什么: Unicorn Hunter 是专为求职者与面试官打造的简历捉虫 / 筛选利器,支持 【面试官】 与 【求职者】 双角色!面试官可一键 生成 深度勘探计划 ...
史诗级和解:英特尔获老对手英伟达超350亿投资,股价创38年最大单日涨幅
AI前线· 2025-09-19 08:08
整理 | 木子 万万没想到, 英特尔竟然要被自己多年的老对头英伟达投资了 ——高达 50 亿美元(约合人民币 355.63 亿元)。 据英伟达官方新闻稿消息, 两家公司将联合开发多代定制 CPU 和 GPU 集成产品,目标覆盖云计算公司、大企业和 PC 消费 市场 。 如果这次投资成功通过监管,英伟达将成为英特尔的最大股东之一,占英特尔约 4% 的股份。 受此消息影响,昨天英特尔股价暴涨,开盘后其股价一度大涨约 28%,截止收盘,涨幅约 22.77%,创下了 38 年以来的最佳 单日表现。 | intel | 英特爾 | | --- | --- | | | NASDAQ: INTC | 所谓 NVLink 技术 ,是英伟达开发的一种专用 高速互联总线技术 ,用来在 GPU 与 GPU、GPU 与 CPU 之间传输大规模数 据。 单个 NVLink 的带宽比传统 PCIe(GPU 和 CPU 之间通用高速数据传输总线标准)单通道大得多,单个 NVLink 通道的带宽可 达 25GB/s ~ 50GB/s(双向),而 PCIe 5.0 的单通道带宽才约 4GB/s(双向)。也就是说: 一条 NVLink 带宽 ≈ ...
下棋比智商!8 大 AI 模型上演棋盘大战,谁能称王?
AI前线· 2025-09-18 02:28
作者 | Daniel Dominguez 译者 | 田橙 策划 | 丁晓昀 Kaggle 与 Google DeepMind 合作推出了 Kaggle Game Arena,这一平台通过战略类游戏对人工智能模型进行对战评测。 该系统提供了一个受控环境,让不同模型直接对战。每场比赛都会严格遵循所选游戏的规则,系统会记录比赛结果,并据此形 成排行榜。为了保证评测的公平性,平台采用全对全(all-play-all)的赛制,也就是每个模型会多次与其他所有模型对战,从 而减少随机因素的干扰,使结果在统计上更加可靠。 Game Arena 依赖开源组件。平台已将游戏运行环境及规则执行、模型对接等控制模块全面开源。这一设计方便开发者和研究 人员进行检查、复现或扩展。 首批参赛的八个主流 AI 模型包括:Anthropic 的 Claude Opus 4、DeepSeek 的 DeepSeek-R1、Google 的 Gemini 2.5 Pro 与 Gemini 2.5 Flash、Moonshot AI 的 Kimi 2-K2-Instruct、OpenAI 的 o3 和 o4-mini,以及 xAI 的 Grok 4 ...
梁文锋执笔的R1论文登上Nature封面!首次回应外界三大质疑
AI前线· 2025-09-18 02:28
核心突破与行业地位 - DeepSeek-R1成为首个通过完整同行评审并发表于《自然》封面的大语言模型 标志着国产AI研究迈入世界舞台并填补行业空白 [2][3][8] - 模型通过纯强化学习机制自主形成推理能力 无需依赖人工标注的思维链数据或提示工程 显著降低对人工数据的依赖 [3][12] - 在Hugging Face平台下载量突破1090万次 成为全球开源社区最受欢迎的推理模型之一 [3] 技术创新与训练方法 - 基于DeepSeek-V3 Base构建R1-Zero 通过多阶段训练结合监督微调和拒绝采样 实现强推理性能与人类偏好对齐 [3] - 采用组相对策略优化技术 模型通过自我评分和试错机制学习独立推理策略 而非模仿人类示例 [13] - 训练成本仅29.4万美元 基础模型开发成本约600万美元 总成本远低于竞争对手数千万美元投入 [6] 数据安全与透明度改进 - 预训练数据完全来自互联网 团队强调未有意进行蒸馏过程 但承认可能包含GPT-4生成文本 [6][13] - 为避免基准测试污染 清除数学数据中约600万条潜在污染样本 并引入外部风险控制机制 [6] - 安全性表现优于Claude-3.7-Sonnet和GPT-4o等主流模型 通过DeepSeek-V3实时审查 [6] 学术影响与行业评价 - 论文经过8位专家评审 收到上百条意见 最终审稿文件达64页 为论文本身三倍长度 [9] - 该方法引发行业革命 2025年几乎所有大语言模型的强化学习研究均受R1启发 [13] - 在ScienceAgentBench科学任务中 以23.53%准确率和1.87美元成本达到帕累托最优 成为性能成本平衡最佳模型之一 [15] 争议回应与验证 - 团队回应OpenAI数据使用质疑 称未直接使用其输出训练 但基础模型可能吸收互联网现有AI生成内容 [13][14] - 外部专家认为反驳具有说服力 其他实验室重复实验表明纯强化学习可实现高性能 无需依赖OpenAI样本 [14] - 论文补充训练细节和技术说明 减少拟人化描述 增加数据类型和安全性披露 [9][13]
250 个岗位换两亿“求生”资金?巅峰781 亿市值巨头节流押注 AI,CEO急踩 “创业模式” 刹车
AI前线· 2025-09-17 06:17
公司战略转型 - 公司宣布裁员250人 约占员工总数30% 作为向AI优先企业转型的重组举措之一 [2] - 转型目标是打造更精简 响应更快 以AI为核心的现代化技术架构 管理层级将显著减少 [2] - 公司计划回归初创模式 保持速度与灵活性 采用更扁平的组织结构 [7][8] 财务影响与业绩预期 - 裁员预计带来3000万美元年化总节省额 部分资金将重新投入用于招聘AI人才 [5] - 公司重申2025年第三季度及全年业绩指引 预计营收达4.25亿至4.38亿美元 [4] - 预计2026年实现25%的长期调整后息税折旧摊销前利润率 较原目标提前一年 [4][5] 历史表现与市场反应 - 公司市值在2021年2月达到约110亿美元峰值 股价曾超过每股320美元 [3] - 转型消息发布当日股价徘徊在每股23美元左右 且公布后小幅下跌 [3] - 有推测认为此举意在推动股价上涨 [3] AI技术应用成效 - AI已实现流程自动化 优化运营效率 在客户支持领域缩短工单解决的服务等级协议时长 [8] - AI在平台合规与欺诈检测方面同时实现效率提升与性能优化 [8] - 过去一年公司内部推进了众多AI项目 见证了AI解放人力并激活新业务能力的价值 [7] 行业背景与自由职业者影响 - 平台自由职业者群体对生成式AI完成服务订单现象存在不满 去年有创作者反映业务量下滑 [10] - 公司2024年10月发布广告试图淡化AI担忧 主张"没人在意创作者是否使用AI" [10] - 有网友质疑AI将摧毁自由职业生意 另有人认为人类价值自ChatGPT以来已倍增 [11] 人员安置与组织文化 - 为离职员工提供丰厚补偿金 职业转型援助 领导团队个人帮助及延长医疗保险保障期限 [5] - 创始人称这是最艰难的决定之一 但强调AI为员工提供了解放繁琐任务的新机遇 [2][7] - 公司预期每位员工单位时间产出提升一倍甚至两倍 交付成果质量达到同等提升幅度 [9]
Hugging Face 发布 FinePDFs:基于 PDF 文档构建的 3 万亿 Token 数据集
AI前线· 2025-09-17 06:17
数据集发布 - Hugging Face正式发布全球最大的纯PDF公开语料库FinePDFs 涵盖1733种语言的4.75亿份文档 总计约3万亿个Token 规模达3.65TB [2] - 英语内容占比最高 超过1.1万亿个Token 西班牙语 德语 法语 俄语和日语各自贡献超过1000亿个Token 978种语言贡献超过100万个Token [3] 技术优势 - PDF文档相比HTML源具有独特优势 记录更高质量特定领域内容 尤其在法律 学术和技术写作领域 [2] - 采用混合技术处理文本提取 GPU驱动OCR 去重 语言识别和PII匿名化 实现大规模处理并保证提取质量 [2] 性能验证 - 基于数据集子集训练1.67B参数模型 表现与最先进HTML数据集SmolLM-3 Web相当 [3] - 在基准测试中 PDF与HTML数据集结合显著提升性能 证明PDF可带来互补知识 [3] 行业影响 - 数据集具备推进长上下文训练潜力 PDF文档通常比网页长得多 [4] - 被视为数据透明度里程碑 不仅发布数据集 还完整记录从OCR检测到去重的处理流程 [4] - 遵循开放数据共享署名许可 可免费用于研究和开发 通过Hugging Face Hub及配套工具库访问 [4]