Workflow
深度学习
icon
搜索文档
英伟达自动驾驶算法工程师面试
自动驾驶之心· 2025-08-28 23:32
作者 | Neob0dy 编辑 | 自动驾驶之心 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 本文只做学术分享,如有侵权,联系删文 具体职位:规划控制方向,自主记忆泊车-自动开出,职位描述在最后。nv大军压境入局自动驾驶,和其他主机厂、L4创业公司相比最大的区别就 是职位划分真的非常细。hr表示nv今年没有校招名额,只有这个实习转正(说大概率可以转正),拿到offer后支持线上实习。笔试之后总共面了5 轮通过,笔试3道题,另外每面都有1-2道算法题。 笔试 已经记不太清了,一道打卡题图搜索,一道模拟没做出来,最后一道是leetcode难度中等的动态规划,给定一个数组,每次可以对相邻的两个数进 行异或操作,操作次数不限,问操作过后的结果相加最大是多少。问题转化之后和leetcode上一个小偷最多可以偷多少房间类似(不能偷相邻的不 然会触发警报)。测试用例第一题过了90,第二题寄了,第三题应该是边界没处理好过了70%。 一面 按流程自我介绍,问了几个项目,着重问了参加比赛的经历,怎么管理和领导团队。单独拎 ...
科学界论文高引第一人易主,Hinton、何恺明进总榜前五!
机器人圈· 2025-08-27 09:41
学术引用排名分析 - Yoshua Bengio总被引用量达973,655次 近五年引用量698,008次 位列全球科学家首位[1] - 其2014年发表的生成对抗网络论文引用量突破100,904次 2015年深度学习论文引用量达100,061次[1][2] - Geoffrey Hinton总被引用量超95万次 近五年引用量57万次 排名第二[3] - Hinton参与的AlexNet论文引用量达181,968次 为计算机视觉领域突破性研究[3][5] 跨学科引用表现 - 医学领域研究者Ahmedin Jemal总引用量924,788次 近五年引用量520,211次 排名第三[7] - 数学与生物学交叉领域研究者Eric Lander总引用量737,656次 近五年引用量247,907次 排名第四[7] - 何恺明总引用量735,881次 其2016年ResNet论文引用量达290,239次 排名第五[9] - ResNet被Nature评为21世纪被引量最多论文 引用范围在103,756-254,074次之间[9][10] 高影响力论文特征 - AlexNet论文引用量181,968次 推动深度学习在计算机视觉应用[3][5] - 生成对抗网络与深度学习论文引用量均超10万次 形成持续学术影响[1][2] - 全球科学家排名涵盖2,626,749名研究者 涉及221个学科领域[1] - Ilya Sutskever总引用量超67万次 单篇最高引用18万次 排名第七[10]
打磨7年,李航新书《机器学习方法(第2版)》发布,有了强化学习,赠书20本
机器之心· 2025-08-27 03:18
机器之心报道 机器之心编辑部 每个领域的发展,都离不开几本奠定基础的经典书籍,人工智能亦是如此。 此前,李航老师的《统计学习方法》《统计学习方法(第 2 版)》可以说是机器学习宝典,很多学生、老师都将此书奉为必读书籍。 然而,随着 AI 技术的快速发展,特别是深度学习的飞跃式进展,一本仅覆盖传统机器学习的教材,已无法全面反映当前机器学习技术的全貌。 因此,李航老师在前两版的基础上,又推出了《机器学习方法》,新增深度学习内容。 而近期,AI 圈对于强化学习的关注也在迅速升温。从大模型与智能体的融合尝试,到强化学习在游戏、机器人控制、决策优化中的广泛应用,这一方向再次成为 焦点。然而,此前许多教材对此涉及较少,甚至完全缺席,导致很多人无法系统学习。 现在这个问题也解决了。 李航老师全新上线新书《机器学习方法(第 2 版)》 ,将强化学习独立成篇,系统介绍了强化学习的基本框架与代表算法,包括马尔可 夫决策过程、多臂老虎机问题、深度 Q 网络等。 全书共分为 4 篇( 或 4 册) ,对应 监督学习、无监督学习、深度学习和强化学习 4 个主要分支。 至此,《机器学习方法(第 2 版)》构建起了一个覆盖监督学习、无监督 ...
陶朗食品双AI解决方案国内首秀,水果分选进入双AI时刻
中国食品网· 2025-08-26 06:48
产品技术展示 - 公司携两款双AI光学分选分级平台Spectrim搭载LUCAi™与InVision²搭载LUCAi™亮相2025中国国际水果展和亚洲国际果蔬展览会 这是双AI分选分级平台首次在中国境内同台展出 [1] - LUCAi™人工智能引擎基于深度学习技术 通过超过250000张数据图片驱动数据库 精准识别水果的各类瑕疵 包括蓝莓的疤痕 发霉 发软 皱缩 开裂等 [2] - 双AI系统突破水果复杂瑕疵识别瓶颈 可识别传统机器学习难以处理的轻度腐烂 日灼伤 软果 剪切损伤 果窝缺陷等 [2] - AI系统依赖全球不同地区20多个果季采集的水果图像训练数据 LUCAi™引擎每秒可处理多达40000张图像 能分辨细微缺陷差异并量化严重程度 [3] - Spectrim搭载LUCAi™支持苹果 柑橘 猕猴桃 核果等水果分选 InVision²搭载LUCAi™支持樱桃等小果分选 [4] 技术优势与行业影响 - 双AI分选平台剔除人工分选主观偏差 挖掘传统技术无法触及的品质细节 重新定义水果的"智"与"质" [3] - 技术为水果从采摘到上市提供精准品质坐标 保障消费者获得更可靠产品 为生产者创造更高附加值空间 [3] - 推动行业进入"品质可控 价值可知"的新生态 [3] - 展会现场搭建沉浸式体验区 展示双AI系统对苹果 柑橘 猕猴桃等多品类水果的精准瑕疵辨别与实时决策能力 [4] 中国市场战略 - 公司持续深化对中国市场的本土化布局 构建完整本地服务体系 提供从技术设备落地到产业升级的赋能方案 [5] - 已建成区域总部 制造基地 供应链中心及技术测试中心 形成覆盖研发 生产 服务的全链条布局 [5] - 本土化网络显著缩短设备交付与技术支持响应时间 确保客户获得24小时本地化运维保障 [5] - 人工智能分选系统通过采集本地化数据进行算法升级和智能学习 有效筛选地方特色瑕疵 保障果品品质 [5] - 采用"以本地数据训练全球算法"模式 使分选效果更贴合中国果品实际品质需求 [5] - 中国是全球最大水果生产与消费国 公司以双AI解决方案为支点 助力客户抢占高附加值市场 践行"在中国 为中国"战略 [5]
让东北老铁人人都能当周杰伦
虎嗅APP· 2025-08-25 13:34
AI音乐行业发展历程 - 1938年贝尔实验室成功建造第一台电子语音合成器Voder 标志着AI与音频首次结缘[7] - 1957年通过算法生成人类历史上第一支计算机创作音乐作品《Illiac Suite》[7] - 2016年谷歌推出音乐生成项目Magenta 利用深度学习框架展示AI音乐生成能力[7] - 2024年Suno实现歌词 人声 伴奏等音乐内容一次性AI生成 被称为音乐界ChatGPT[9] 音潮公司核心战略 - 致力于实现音乐平权 让每个人都能用音乐记录生活 类比短视频平权塑造快手抖音的逻辑[10][35] - 通过自研音乐大模型技术 打造端到端生成能力 已建立国内最大音乐数据标注库[32][54] - 采用B端开放API接口与C端按首收费双轨模式 提供免费创作额度与IP收益分成机制[52][53] - 产品迭代周期为移动端三周一次 网页端双周一次 持续增加激发用户创作热情的功能[39][48] 技术突破与行业影响 - 2016年深度学习技术突破解决人声与伴奏分离行业痛点 分离效果异常干净[7][12] - Transformer架构大模型出现推动行业质变 千万级训练数据触发智力涌现现象[9][36] - 国内AI音乐研究人员屈指可数 资源有限导致领域封闭 仅少数高校培养相关人才[14] - 采用国产芯片降低训练推理成本 通过训推一体动态调度实现性价比优化[49] 市场竞争与差异化 - 与Suno形成差异化服务 聚焦MV配乐 YouTube版权音乐等垂直场景[60] - 面对Eleven Labs等国际竞争对手 采取API 创作工具 消费平台 IP衍生服务多维布局[61] - 产品设计融合游戏化社交元素 开发音果混合创作 音缘社交关系等独特功能[45] - 锁定学生群体作为核心用户 通过高频使用与新鲜事物接受度实现破圈传播[46] 团队构建与数据壁垒 - 核心团队包含音乐学院背景人才 算法团队可组成乐团 具备跨学科协同优势[40][62] - 与上海音乐学院建立联合实验室 由数十名学生参与构建音乐数据标注库[54] - 通过用户共创形成数据飞轮 用户花费时间越多则资产增值效应越显著[55] - 产品刚上线即获数十万注册量 通过世界人工智能大会等渠道实现推广[68]
超97万:Yoshua Bengio成历史被引用最高学者,何恺明进总榜前五
机器之心· 2025-08-25 06:08
全球顶尖科学家学术影响力排名 - Yoshua Bengio成为全球被引用次数最多的科学家 总被引用量达973,655次 近五年引用量698,008次[1][3] - 排名基于AD Scientific Index平台 涵盖全球2,626,749名科学家 涉及221个国家地区24,576家机构[3] - Bengio的生成对抗网络论文引用量突破100,904次 深度学习论文引用量达100,061次[3] 人工智能领域核心研究者表现 - Geoffrey Hinton排名第二 总被引量952,643次 近五年引用577,970次 占比60.7%[4][6] - Hinton参与的AlexNet论文引用量高达182,853次 标志着深度学习在计算机视觉领域的突破[4][5] - 何恺明排名第五 总被引量735,881次 近五年引用619,578次 ResNet论文引用量达290,239次[8][10] - ResNet被Nature评为21世纪被引量最多论文 引用范围在103,756-254,074次之间[10][11] 跨学科高影响力研究者 - 医学领域Ahmedin Jemal排名第三 总被引量924,788次 近五年引用520,211次 占比56.3%[8] - 数学与生物学交叉领域Eric Lander排名第四 总被引量737,656次 近五年引用247,907次 占比33.6%[8] - Ilya Sutskever排名第七 总被引量671,834次 近五年引用504,890次 ImageNet论文引用量182,853次[11][14][15] 高影响力论文特征分析 - 顶级论文持续产生深远影响 如AlexNet(2012年)和ResNet(2016年)至今仍被广泛引用[5][10] - 计算机视觉领域论文占据主导地位 前10名中包括多篇图像识别和神经网络相关研究[10][11] - 生成对抗网络和注意力机制等基础架构论文引用量显著 如Attention Is All You Need引用范围56,201-150,832次[11][15]
科学界论文高引第一人易主!AI站上历史巅峰
量子位· 2025-08-25 05:54
Yoshua Bengio学术成就 - Yoshua Bengio成为各领域被引用次数最多的在世科学家 总引用量超过95万次[1][4] - 2018年与Geoffrey Hinton、Yann LeCun共同获得图灵奖 表彰深度神经网络突破性贡献[4][12] - 三篇核心论文引用量极高:2014年GAN论文引用100,904次 2015年《Deep learning》引用100,061次 2016年深度学习著作引用81,400次[16][17] 关键学术贡献 - 2003年发表《一种神经概率语言模型》 解决语言建模维度灾难问题 为GPT等大语言模型奠定基础[4][14] - 2014年作为共同作者提出生成对抗网络(GAN) 推动计算机视觉领域发展[4][16] - 在注意力机制、循环神经网络、词嵌入等方向做出开创性工作 影响机器翻译与自然语言处理发展[13][16] 学术背景与职业轨迹 - 1986-1991年于麦吉尔大学完成计算机科学本硕博 师从Geoffrey Hinton[10] - 曾在MIT与贝尔实验室从事研究 期间与Yann LeCun开展合作[10] - 1993年起任职蒙特利尔大学 现任蒙特利尔学习算法研究所(MILA)所长[11] 行业影响力与创业动态 - 2024年6月成立非营利组织LawZero 已筹集3000万美元启动资金 专注于AI系统透明度与安全性研究[19][20] - 其弟Samy Bengio现任苹果公司AI与机器学习研究高级总监[9] - 深度学习研究成果直接推动自然语言处理与计算机视觉技术商业化应用[4][16] 学术引用排名格局 - Geoffrey Hinton以94万次总引用量位列第二 与Bengio差距微弱[21] - 何恺明以73万次引用量排名第五 Ilya Sutskever以67万次引用量排名第七[24] - AD Scientific Index覆盖全球260万科研人员 数据每20天更新一次 排名每2天重新计算[23]
地平线HSD量产在即:国内最像特斯拉FSD的辅助驾驶系统,定义行业新高度
IPO早知道· 2025-08-25 03:39
产品与技术优势 - 地平线发布高性能城区辅助驾驶产品HSD,基于征程6P打造一段式端到端系统,实现光子输入到轨迹输出的超低时延,提升安全、效率和舒适性 [3] - HSD被誉为国内最像特斯拉FSD的系统,覆盖城区、高速、乡间小路、停车场等场景,支持复杂道路拓扑下的精准感知和流畅通行 [3] - 征程6P算力高达560TOPS,具备高集成度、高算力、高效率、高处理能力、高接入能力及高安全六大特点 [8] - 地平线采用"一段式端到端+强化学习"架构,通过自我探索激发模型潜力,实现智能涌现 [8] - 公司已建立超3万个场景数据集的安全测试场景库,完成超1000万公里大里程回灌,并获得全球首张ISO 8800 AI功能安全认证 [10] 市场进展与商业成果 - HSD已与全球近10家汽车品牌达成合作意向,首搭奇瑞星途星纪元E05车型并即将量产 [3] - 截至今年一季度末,地平线前装量产出货超800万套,量产上市车型超200个,量产定点车型超310个 [16] - 征程家族累计量产即将突破1000万套,将成为国内首家达成千万套出货量的企业 [16] - 高阶辅助驾驶市场快速增长,今年前5个月中国乘用车城区NOA交付量达90.22万辆,同比增长152.5% [5] 发展战略与行业定位 - 公司坚持"软硬一体"战略,十年间推出三代BPU架构,计算性能提升超1000倍,支持超10款计算方案规模化量产 [19] - 2023年发布端到端自动驾驶大模型UniAD并获CVPR最佳论文,2024年推出Vision Mamba模型超越Vision Transformer [20] - 地平线是国内唯一具备"软硬全栈+大规模落地经验+开放生态"的智驾科技企业,有望通过HSD成为高阶辅助驾驶市场顶级玩家 [23] - 公司强调"以快打慢"的竞争策略,认为技术创新速度和产品质量是维持市场领导地位的核心 [15][21] 技术演进与行业趋势 - 城区辅助驾驶经历从规则系统到混合系统,再到端到端技术的突破,实现性能体验跃迁和安全性的显著提升 [7] - 端到端技术突破使城区辅助驾驶上限大幅提高,带来系统能力和心理安全性的双重提升 [7] - 行业正从技术验证阶段迈向大规模普及阶段,地平线通过持续技术迭代保持竞争优势 [5][16]
三个月、零基础手搓一块TPU,能推理能训练,还是开源的
机器之心· 2025-08-24 04:02
大模型技术发展推动AI专用芯片需求 - 大模型技术进步显著提升对AI专用芯片的关注度 专用芯片在计算任务负载中效率更高 谷歌TPU自2015年部署后已迭代至第7代 采用最先进制程工艺并针对机器学习推理任务优化架构[1] - TPU技术推动Gemini等大模型发展 加拿大西安大略大学团队基于学术研究目的开发开源TinyTPU芯片 支持机器学习推理和训练功能[1] TinyTPU开发动机与设计理念 - 项目初衷包括构建机器学习负载芯片的实践吸引力 以及填补同时支持推理和训练的开源加速器代码库空白[5] - 团队采用"Hacky Way"设计理念 优先尝试自主方案而非依赖逆向工程或AI代码生成工具 强调基础原理推导和硬件设计学习[6] - 开发过程注重深度学习算法与硬件设计的结合 通过图形化表达强化理解[6] TPU技术原理与架构特性 - TPU作为专用集成电路(ASIC)专注于提升机器学习推理和训练速度 与通用GPU相比在数学运算效率上具有显著优势[9] - 核心采用脉动阵列结构 由处理单元(PE)网格组成 每个PE执行乘累加运算 在时钟周期内同步处理数据[26][28] - 矩阵乘法占Transformer计算操作的80-90% 在超大型模型中达95% 占CNN计算操作的70-80% 脉动阵列专门优化此类运算[14] TinyTPU实现方案与技术细节 - 选择XOR问题作为验证场景 使用2x2脉动阵列(而非TPUv1的256x256) 输入为4x2矩阵代表4种二进制组合[18][21][23] - 采用权重平稳架构 通过矩阵旋转90度 输入交错延迟和权重转置实现数据对齐[35][38][44] - 集成偏差模块和LeakyReLU激活函数(泄漏因子α=0.5) 采用流水线技术将操作分解为多时钟周期以提升效率[50][52][58] - 创新性引入双倍缓冲机制 通过影子缓冲区预加载权重 减少50%时钟周期 支持持续推理[61][64] - 控制单元采用24位指令集(ISA)实现标志控制和数据加载 后期扩展至94位指令集以满足训练需求[68][117] 训练功能实现与优化 - 支持反向传播训练 使用均方误差(MSE)作为损失函数 通过链式法则计算梯度[71][74][75] - 发现前向传播与反向传播的数学对称性:前向使用转置权重矩阵相乘 反向使用未转置矩阵相乘[79][108] - 开发向量处理单元(VPU)统一处理逐元素操作 整合偏差 激活 损失和梯度计算模块[89][92] - 设计统一缓冲区(UB)模块存储激活值 权重和临时数据 配备双读写端口减少数据争用[97][98] - 对激活导数模块实施缓存优化 减少统一缓冲区访问次数[102][104] 性能验证与实际应用 - 通过GTKWave波形模拟验证权重更新功能 展示一个训练周期后参数变化[119] - 完整架构支持持续数据流处理 最大化脉动阵列利用率 实现推理和训练的硬件级协同[118]
淘宝灰度测试“AI万能搜”新功能,电商搜索迎来变革
搜狐财经· 2025-08-22 01:24
淘宝AI搜索技术升级 - 公司推出"AI万能搜"新功能 目前处于灰度测试阶段 入口位于淘宝搜索激活页[3] - 该功能采用口语化交互模式 用户可通过日常对话式提问获取商品推荐 例如"适合职场新人的简约风格连衣裙"或"预算500元左右送父亲的实用礼物"[3] - 系统基于AI技术理解语义和场景需求 生成包含商品链接、测评视频、选购指南的多维答案报告 覆盖购物攻略、口碑对比、优惠信息等全链路消费需求[3] 技术实现与功能特性 - 功能依托阿里云通义大模型技术能力 结合淘宝海量商品数据与用户行为洞察 具备强大语义理解、意图识别和内容生成能力[4] - 系统能自动拆解预算、场景、人群、偏好等需求维度 例如输入"如何选择手机"时自动解析性价比、预算区间、续航能力等核心维度[4] - 具备"购物偏好"功能 采用协同过滤算法参考用户偏好 使AI既拥有产品知识又了解用户品味[4] 用户体验优化 - 结果页面提供AI提炼的核心选购标准、针对性避坑提醒及搭配建议[4] - 若用户对结果不满意 系统会引导细化需求 提供"按品牌筛选"或"对比同价位机型"等二次提问选项[4] - 对于"适合小户型的高性价比空调"类查询 除推荐机型外还提供安装注意事项、能效对比、用户评价摘要及使用效果短视频[4] 技术细节待明确 - 尚未明确是否使用DeepSeek等其他模型 以及搜索数据是基于商品详情还是种草笔记[5]