Workflow
生成式人工智能
icon
搜索文档
打破推荐系统「信息孤岛」!中科大与华为提出首个生成式多阶段统一框架,性能全面超越 SOTA
机器之心· 2025-06-20 10:37
传统推荐范式的痛点 - 传统推荐系统采用多阶段范式(召回、排序),导致阶段间信息损失、偏差累积和协作困难 [3] - 独立训练的各个阶段难以完整传递信息,潜在兴趣点被过早过滤 [3] 生成式AI的解决方案 - UniGRF框架将召回和排序整合到单一生成模型中,实现信息充分共享 [4][6] - 通过序列生成任务统一处理两大核心任务,保持模型通用性和可扩展性 [6][8] UniGRF的核心优势 - 参数共享减少信息损失,提升任务协作效率 [7] - 支持与主流生成模型架构(如HSTU、Llama)无缝集成 [8] - 单一模型在训练和推理上可能比独立模型更高效 [9] 关键技术模块 - 排序驱动的增强器:利用排序阶段高精度输出来优化召回阶段 [10][11] - 梯度引导的自适应加权器:动态调整任务权重实现同步优化 [12] 实验验证结果 - 在MovieLens-1M、MovieLens-20M、Amazon-Books数据集上性能显著超越SOTA基线 [14][18] - 排序阶段性能提升尤为明显,直接影响最终推荐质量 [18] - 模型参数扩展时符合Scaling Law,展现良好可扩展性 [18] 未来发展方向 - 计划扩展至更多推荐阶段(如预排序、重排) [16][17] - 探索工业场景大规模应用的可行性 [17]
今夏面世 OpenAI剧透GPT-5
北京商报· 2025-06-19 14:52
GPT-5发布计划 - GPT-5预计将于2024年夏季发布,具体日期未定,性能较GPT-4有显著提升 [1] - 公司内部讨论是否简单提升版本号或延续GPT-4的优化模式,7月是初步目标但可能调整 [3][4] - GPT-5定位为更接近通用人工智能的代理模型,具备推理、规划和跨情境互动能力 [3] 技术升级与竞争 - GPT-5目标是在某些任务上达到博士水平,而GPT-4仅相当于优秀高中生 [3] - 公司计划先发布GPT-4 5(代号Orion),作为最后一个非思维链模型,再推出集成技术的GPT-5 [6] - 深度求索的DeepSeek-R1性能接近公司o1模型,训练成本约600万美元,加剧行业竞争 [6] 产品策略与命名 - GPT-4o已完全取代GPT-4,其"全能"特性拓展了应用场景,但命名混乱问题待解决 [5] - 未来版本命名将简化,避免如o4-mini等复杂名称,GPT-5和GPT-6将更易使用 [5] - GPT-5将免费开放基础功能,订阅用户可享受更高智能级别 [5] 商业模式探索 - 公司主要收入来自企业客户购买增强版ChatGPT,但未排除广告可能性 [7] - 广告需谨慎处理,确保不修改模型输出且对用户有用,可能通过点击内容获得交易收入 [8] - 隐私保护是核心原则,公司反对《纽约时报》要求保留输出日志数据的诉讼 [7] 行业动态与挑战 - 多模态大模型领域将因GPT-5发布迎来新一轮技术竞争 [1] - 公司高管承认开源策略需调整,以应对竞争对手的追赶 [6] - GPT-5开发曾面临跳票、烧钱、缺人和数据不足等问题 [5]
高质量3DGS表示!𝒳-Scene:新颖的大规模驾驶场景生成框架~
自动驾驶之心· 2025-06-19 10:47
以下文章来源于3D视觉之心 ,作者3D视觉之心 3D视觉之心 . 3D视觉与SLAM、点云相关内容分享 点击下方 卡片 ,关注" 3D视觉之心 "公众号 第一时间获取 3D视觉干货 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 大规模场景生成的挑战 近年来,生成式人工智能的进步对自动驾驶产生了深远影响,其中扩散模型成为数据合成和驾驶仿真的关键工具。 一些方法将扩散模型作为数据生成机器,用于生成高保真的驾驶视频或多模态的合成数据,以增强感知任务,并生 成如车辆插队等关键但罕见的情况,从而丰富规划数据。除此之外,还有一些方法将扩散模型作为世界模型,用于 预测未来的驾驶状态,从而实现端到端的规划和闭环仿真。这些研究主要强调通过时间递归生成长期视频,鼓励扩 散模型输出时序一致的视频序列,以服务于后续任务。 然而,具备空间扩展能力的大规模场景生成仍是一个新兴但尚未被充分研究的方向,其目标是构建可用于任意驾驶 仿真的广阔而沉浸式的三维环境。一些开创性工作已经探索了大规模的三维驾驶场景生成。例如,有的方法利用扩 散 ...
苹果高管:AI将改变芯片设计
半导体芯闻· 2025-06-19 10:32
苹果公司芯片设计战略 - 公司计划利用生成式人工智能技术加速定制芯片设计流程,硬件技术高级副总裁约翰尼·斯鲁吉在比利时演讲中明确提及该方向 [1] - 公司自2010年iPhone的A4芯片到最新Mac及Vision Pro的芯片开发中,强调必须采用最先进的电子设计自动化(EDA)工具 [1] 半导体行业技术动态 - 全球两大EDA巨头Cadence Design Systems和Synopsys正竞相将人工智能功能整合至芯片设计软件中 [1] - 独立研发集团Imec与全球主要芯片制造商保持紧密合作,斯鲁吉此次演讲与接受Imec奖项相关 [1] 苹果芯片开发方法论 - 公司在Mac产品线从英特尔芯片转向自研芯片时采取"无备用计划"策略,2020年转型投入包括大规模软件开发资源 [2] - 斯鲁吉指出芯片设计需"大胆尝试不回头",迁移至Apple Silicon被视为关键战略赌注 [2] 技术应用前景 - 生成式AI被评估具备显著提升设计生产力的潜力,可缩短芯片开发周期 [1][2] - EDA供应商对处理复杂芯片设计至关重要,AI技术有望优化其工作流程 [1][2]
苹果高管称其计划利用AI设计芯片
快讯· 2025-06-19 08:48
公司技术战略 - 苹果硬件技术高级副总裁约翰尼·斯鲁吉透露公司计划采用生成式人工智能优化定制芯片设计流程 [1] 行业技术应用 - 生成式人工智能技术将被应用于半导体设计领域以提升芯片开发效率 [1]
苹果拟借助生成式AI技术加速定制芯片设计流程
环球网· 2025-06-19 06:53
公司战略与技术发展 - 公司正考虑运用生成式人工智能技术加快定制芯片设计进程 [1] - 自2010年推出iPhone专用A4芯片后,定制芯片已广泛应用于Mac台式机、Vision Pro头显等设备 [4] - 关键经验之一是芯片设计过程中必须采用最先进的工具,包括电子设计自动化(EDA)领域的最新设计软件 [4] 行业动态与合作伙伴 - EDA行业巨头Cadence Design Systems和Synopsys正争相将人工智能功能融入各自产品 [4] - EDA企业在支持处理复杂芯片设计任务方面作用重大,生成式AI有望在更短时间内完成更多设计工作,极大提升效率 [4] 重大决策与转型 - 2020年公司决定将Mac系列彻底从英特尔芯片转换为自主研发的Apple Silicon,无备用方案或旧架构分支产品 [4] - 此次转型涉及巨大软件工作量,公司采取果断决策、坚定推进的策略 [4]
苹果(AAPL.US)高管:考虑利用生成式AI设计芯片
智通财经网· 2025-06-19 02:20
苹果芯片设计战略 - 苹果硬件技术高级副总裁表示公司有意利用生成式人工智能来加速定制芯片设计 [1] - 公司从2010年iPhone的A4芯片到最新Mac和Vision Pro芯片积累了丰富经验 [1] - 强调需要使用最先进工具设计芯片 包括EDA公司的最新软件 [1] - 认为生成式AI技术可大幅提高生产力 在更短时间内完成更多设计工作 [1] 芯片设计行业动态 - EDA行业两大巨头铿腾电子和新思科技正在竞相将AI技术融入产品 [1] - EDA公司在支持芯片设计方面扮演关键角色 [1] 苹果芯片转型策略 - 2020年Mac电脑从英特尔芯片转向自家芯片时未制定任何应急计划 [2] - 公司将此转型视为重大赌注 全力以赴投入包括软件在内的各方面资源 [2] - 强调在芯片设计领域要大胆下注 不要回头的重要经验 [1][2]
活动 | 福布斯中国与渣打「优先私人理财」共同推出第二届“创新无界”商业创意大赛
搜狐财经· 2025-06-18 12:12
继2024年首届"创新无界"商业案例大赛开展以来,福布斯中国与渣打中国联合为年轻一代持续倾注优质资源,不仅突破了传统商赛的固有框架,更实现了 金融机构实战经验与知名媒体深度洞察的无缝对接。 2025 渣打「优先私人理财」联合福布斯中国全新升级打造创新无界商业创意大赛,诚邀「优先私人理财」客户16至22岁的杰出子女参与。本次大赛聚焦 "AI 人工智能",旨在鼓励参赛者拥抱 AI 技术,借助其浪潮策划独特商业创意。 以创意之名,破圈而上:改变世界的起点,立足于无界的创新。 升级赛事亮点抢先看 梦幻跨界合作:福布斯中国携手渣打「优先私人理财」,强强联合、焕新升级赛事,为选手带来更广阔的商业视野。 2 优质创投资源:福布斯中国创投社交圈梦幻联动,行业资深导师全赛程深入辅导,助力优化商业计划,为参赛选手保驾护航。 5 官方认证:所有参赛者可获得福布斯中国及渣打「优先私人理财」官方参赛及获奖证书。 6 面试机会:决赛冠军组有机会获得一次国际知名媒体福布斯中国总部(上海)商业运营的面试选拔机会。 *最终结果将依据候选人综合表现及福布斯中国综合评定为准,非渣打中国决定 2025赛事安排及招募说明 报名阶段 即日起至2025年 ...
高盛:智能体AI将重塑软件业格局 2030年市场规模激增超20%
智通财经网· 2025-06-18 09:33
生成式AI下一阶段发展 - 生成式AI的下一阶段"智能体AI"将彻底改变企业软件生态 未来三年智能体将在应用层释放生产力红利 [1] - 到2030年全球软件市场规模预计至少扩大20% 其中客户服务软件市场增速或达45% 智能体将占据超60%的份额 [1] 智能体AI对企业生产力的影响 - 企业AI驱动生产力提升的下一阶段将聚焦智能体在软件应用层的效能释放 未来三年是关键窗口 [2] - 目前大多数案例仍属于集成基础大语言模型的聊天机器人 但部分更先进的AI已支持更具价值的用例 技术持续改进 [2] - 客户服务软件市场规模将比未受影响的2030年基准增长20%-45% 但这是软件行业的"下限" 在直接关联收入生成的领域市场扩张潜力更大 [2] SaaS企业在智能体生态中的机遇与挑战 - SaaS公司在新的智能体市场规模中有望占据较大份额 到2030年智能体将占软件市场总规模的60%以上 [3] - SaaS公司面临两大风险:基于AI原生技术栈的新竞争者 以及传统定价模式向基于价值/代理的定价模式过渡前的压缩 [3] - 行业龙头正在提升执行力 如赛富时调整Agentforce定价策略 微软构建跨生态连接能力 ServiceNow计划收购MoveWorks/Cloud [3] 技术架构变革与中间件发展 - 生成式AI应用需要不同于传统云/SaaS应用的全新技术栈 这将引发现有架构的重大变革 [4] - AI平台层的崛起及其关键中间件的完善将成为AI原生应用发展的重要催化剂 微软已构建面向智能代理应用的开发支持体系 [4] - SaaS企业需积极适配新兴AI标准并调整架构 才能顺利融入生成式AI的企业应用生态 [4] 投资标的与增长预期 - 高盛建议投资者关注微软、谷歌、赛富时、ServiceNow、HubSpot、Adobe和财捷 以及私有企业Aisara、Decagon、Intercom、Sierra和Writer [5] - 当前SaaS巨头转型受限于生成式AI技术成熟度等因素 但预计这些因素将在2027年后转化为持续增长动能 [5]
万字解读AMD的CDNA 4 架构
半导体行业观察· 2025-06-18 01:26
AMD CDNA 4架构核心升级 - CDNA 4是AMD最新面向计算的GPU架构,专注于提升低精度数据类型下的矩阵乘法性能,这对机器学习工作负载至关重要[2] - 架构采用与CDNA 3相同的大规模芯片组设计,包含8个加速器计算芯片(XCD)和4个基础芯片,通过Infinity Fabric技术实现一致内存访问[4] - 相比CDNA 3的MI300X,CDNA 4的MI355X减少了每个XCD的CU数量但提高了时钟速度,整体性能差距不大[5] 性能参数对比 - MI355X采用TSMC N3P工艺(计算芯片)和6nm工艺(基础芯片),时钟速度2.4GHz,比MI300X的2.1GHz和Nvidia B200的1.965GHz更高[5] - MI355X配备8个HBM3E堆栈,提供288GB内存和8TB/s带宽,优于MI300X的192GB/5.3TB/s和B200的180GB/7.7TB/s[5] - 在FP6精度下,CDNA 4的每CU矩阵吞吐量与B200 SM相当,但在16位和8位数据类型上B200仍保持优势[6] 计算单元改进 - CDNA 4重新平衡执行单元,专注于低精度矩阵乘法,许多情况下每CU矩阵吞吐量翻倍[6] - 矢量运算方面,CDNA 4保持MI300X的优势,每个CU有128条FP32通道,每周期提供256 FLOPS[8] - LDS(本地数据共享)容量从CDNA 3的64KB提升至160KB,读取带宽翻倍至每时钟256字节[14][15] 系统架构优化 - MI355X升级使用HBM3E内存,计算带宽比提升至每FP32 FLOP 0.05字节,优于MI300X的0.03字节[25] - 二级缓存新增"回写脏数据并保留行副本"功能,优化内存子系统带宽使用[20] - 架构采用两个IOD(输入输出芯片)而非上代的四个,简化了Infinity Fabric网络,延迟降低14%[52] 产品规格与性能 - MI355X GPU提供1400W直接液冷版本,FP8稀疏计算峰值达10PFLOPS,FP6/FP4达20PFLOPS[74] - 相比MI300X,MI355X在FP16/BF16矩阵运算性能提升1.9倍,FP8/INT8提升1.9倍,并新增FP6/FP4支持[47] - 内存分区支持NPS1(全内存交错)和NPS2(144GB分池)两种模式,后者可减少跨IOD通信开销[60][61] 软件生态系统 - ROCm软件堆栈支持Kubernetes编排,提供PyTorch和JAX等框架优化[70] - 针对生成式AI优化了vLLM和SGLang等推理框架,提供Llama系列等流行模型的Day 0支持[72] - 包含分布式训练框架如Maxtext(JAX)和Megatron LM(PyTorch),支持Flash Attention v3等关键技术[71]