Workflow
Genesis
icon
搜索文档
登上NeurIPS,Genesis开创无需OCC引导的多模态生成新范式,在视频与激光雷达指标上达到SOTA水平
机器之心· 2025-09-28 04:50
技术突破 - 提出业内首个无需占用网格(OCC)引导的多模态图像-点云联合生成框架Genesis 通过两阶段架构实现逼真的自动驾驶场景生成 第一阶段基于DiT扩散模型学习环视图特征 第二阶段转换到鸟瞰图特征空间并结合条件学习点云特征[2][4] - 引入DataCrafter模块 基于视觉语言模型(VLM)提供场景级与实例级结构化语义描述 通过多视角一致性处理和冗余消除生成层次化场景描述 包括全局场景语境和物体实例的类别 边界框及详细描述[10][13][18] - 在nuScenes基准测试中达到当前最先进水平 视频生成指标FVDmulti为83.10 FIDmulti为14.90(无首帧条件) LiDAR生成指标Chamfer distance在1秒预测时达到0.611 较之前最佳结果提升21%[4][26][27] 架构设计 - 视频生成分支采用3D-VAE编码与DiT骨干网络 通过注意力机制融合场景布局和语言描述 创新性引入YOLOv8x-Pose检测行人姿态增强动态场景语义表达[19] - 激光雷达生成分支通过点云自动编码器将稀疏点云体素化为BEV网格 采用Swin Transformer压缩特征 结合NeRF渲染模块重建点云 并通过时空扩散模块集成跨模态语义条件[23] - 通过LSS算法将RGB图像转换为BEV特征作为点云生成条件 强化模态间一致性 无需依赖占用网格或体素等中间表示[10][23] 性能表现 - 在无首帧条件设定下 FVDmulti指标为83.10 优于DriveDreamer-2的105.10 在有首帧条件设定下 FVDmulti进一步降至16.95 与MiLA的18.20相当[26] - LiDAR生成在3秒预测时Chamfer distance为0.633 较HERMES的1.17降低45% 在真实图像和生成图像条件下均保持优异性能[27] - 下游任务测试显示 生成数据使BEVFusion 3D目标检测的mAP提升0.91至67.78 NDS提升1.48至71.13 多模态联合生成带来最高增益[29][30] 应用价值 - 解决现有方法依赖昂贵OCC标签的问题 降低工业应用成本 同时突破单模态生成局限 实现视觉与几何模态的深度协同[7][8] - 结构化语义引导生成过程提升输出可控性和可解释性 生成场景具备高度时空连贯性与语义保真度 满足高阶自动驾驶数据需求[10][22] - 为自动驾驶提供多样化 高拟真度的合成数据 支持3D目标检测等下游感知任务性能提升 证明多模态生成的互补优势[30]
Hyundai Motor Company (OTCPK:HYMT.F) 2025 Investor Day Transcript
2025-09-18 15:02
Hyundai Motor Company (OTCPK:HYMT.F) 2025 Investor Day September 18, 2025 10:00 AM ET Company ParticipantsChang Kim - EVP and Head of Electrification Strategy SolutionsZayong Koo - CIOZayong Koo - CIROScott Lee - CFOJosé Muñoz - President and CEOJi–han Yoo - SVP, Head of Autonomous Driving Development CenterHeungsoo Kim - EVP of Global Strategy OfficeConference Call ParticipantsNone - Analyst 1None - AnalystYoungsuk Shin - Research AnalystPaul Hwang - AnalystNone - Analyst 2José Asumendi - Equity Research A ...
Everspin (NasdaqGM:MRAM) 2025 Conference Transcript
2025-09-16 19:02
Everspin (NasdaqGM:MRAM) 2025 Conference September 16, 2025 02:00 PM ET Company ParticipantsBill Cooper - CFOSanjeev Aggarwal - President, CEO & DirectorOperatorWelcome to Q3 Investor Summit Virtual. We appreciate your participation in today's virtual event. Up next, we are pleased to introduce Everspin Technologies. If you would like to ask a question during the webcast, you may drop them in the chat box button on the left side of your screen. Please type your question into the box and click "Send" to subm ...
一位90后融资7个亿
投资界· 2025-07-03 09:21
公司融资与团队背景 - 具身智能初创公司Genesis AI完成1.05亿美元种子轮融资,创硅谷具身智能行业种子轮最大融资纪录[2] - 创始人周衔为90后博士,团队集结卡内基梅隆大学、MIT、清华、北大等顶尖院校学者,平均年龄不到28岁[5][7] - 联合创始人包括许臻佳(英伟达前真机系统负责人)、王尊玄(MIT博士)、乔怿凌(马里兰大学博士)等,技术背景深厚[7][8] 技术方向与产品 - Genesis AI结合物理引擎与生成式AI,可自动生成4D物理世界(如机器人操作策略、交互式3D场景),专为通用机器人和具身智能设计[6] - 公司目标为打造通用机器人,实现体力劳动自动化,解决物理AI滞后于数字AI的问题[6] - 此前开源项目Genesis为GitHub最大具身智能开源项目,奠定技术基础[6] 行业动态与竞争格局 - 国内具身智能领域融资活跃:银河通用单轮融资超11亿元,累计融资24亿元;宇树科技C轮获腾讯、阿里等投资;帕西尼A轮融资数亿元[12] - 2025年国内机器人赛道融资达163笔,智元机器人、千寻智能等企业获大额融资[13] - 中国在全球人形机器人产业链占比63%,拥有56家核心企业,具备成本工程与产业集成优势[14] 投资方与市场前景 - Genesis AI种子轮由Khosla Ventures、Eclipse领投,谷歌前董事长Eric Schmidt、红杉中国等参投[10] - 投资人认为Genesis AI在通用机器人基础大模型路径上最具潜力[10] - 行业爆发需技术路径清晰化与成本突破,但中国在应用场景和数据资源上具备优势[14]
SS&C (SSNC) FY Conference Transcript
2025-05-13 21:30
纪要涉及的公司 SS&C(SSNC) 纪要提到的核心观点和论据 财富投资技术业务竞争环境 - 财富投资技术业务分为保险市场、资产管理、另类投资和财富平台四个类别,其中资产管理领域竞争最为激烈 [3][5][6] - 公司在各细分领域有核心产品,如保险市场的Singularity、资产管理的Genesis、另类投资的Geneva和财富平台的Black Diamond [4][5][6] - 公司在竞争中更聚焦大型、复杂的资产管理者,提供专注的解决方案,并通过研发和创新保持竞争力 [7] 产品整合与客户目标 - 公司简化了市场推广策略,整合了部分产品,提高了研发效率,使产品更聚焦 [8] - 产品向云服务转型,如Genesis和Eclipse,能提供增强服务,减少客户本地部署需求 [9] 多产品优势与竞争 - 拥有多个产品可在零售另类投资等领域形成优势,如Geneva与基金管理业务结合,以及EZ与Eclipse的无缝集成 [10] 业务增长趋势 - 向云服务转型是重要里程碑,客户升级到云服务后可能带来1.5 - 2.5倍的收入增长,并可外包部分服务 [11][12] - 客户对复杂资产类别、地理区域和解决方案的需求增加,公司在医疗保健等行业也看到类似趋势 [13] 定价策略 - 过去几年及今年价格涨幅约为1.5%,部分合同与CPI变化挂钩 [16] - 公司认为未来可更精准地评估定价,在新业务或定价偏低的领域调整价格 [18] - 公司产品价格较高是因其功能更强大,而非相同产品提价20% [19] 另类业务与股市相关性 - 约60%的另类业务收入与对冲基金相关,该部分业务收入呈中个位数增长 [20] - 私募市场(包括私募信贷和私募股权)占比超25%,增长达两位数;零售另类投资占比超10%,同比增长超20%,这些业务与股市相关性较弱 [21][22][23] AUA增长情况 - AUA在Q1增长但增速放缓,这更多是公司层面的情况,公司表现优于行业整体 [24] 退休业务 - 收购Insignia对公司在澳大利亚退休市场有积极影响,预计下半年带来3500万 - 7000万美元收入,全年收入翻倍,业务有望实现低到中个位数的有机增长 [27][29] 数字员工影响 - 公司拥有超3000个数字员工,虽难以量化具体美元影响,但估计节省了约1亿美元的人力再投资成本 [30][31] - 数字员工提高了公司内部效率,还可作为销售产品向客户展示 [32] 自动化与分析部门 - RPA市场整体疲软,公司认为将Agenic AI融入RPA套件是发展方向,可处理更复杂任务 [34] Intralinks部门 - 交易流程业务受市场影响,交易活动放缓,但公司在资本市场和非交易门户服务方面有一定进展 [36][37] 医疗保健业务 - 与医疗巨头的合资企业Money RX平台旨在降低医疗技术成本,目前主要处理折扣卡项目,未来将逐步拓展到医保、医疗补助和商业保险等领域,大型合同收入影响可能在2027年显现 [39][41][44] 整体业务展望 - 公司提高了整体收入指引,但对有机增长持保守态度,主要考虑Q1业绩和外汇汇率因素 [46][47] - 业务收入可能在下半年集中体现,原因包括Insignia业务启动、Bateia收购收入确认和业务管道分布 [49][50] 收购与杠杆 - 公司倾向于使用债务进行收购,历史上曾两次将杠杆率提升至略超5倍,市场接受度良好 [51][52] 国际市场拓展 - 公司在澳大利亚和欧洲有业务拓展机会,国际业务占比约三分之一,但北美市场仍是主要收入来源 [55][56] 股权补偿与资本分配 - 公司CEO支持股权激励,近期从期权转向传统RSUs,费用结构有所变化 [59] - 在无并购机会时,投资者更倾向于股票回购 [62] 其他重要但是可能被忽略的内容 - 公司在LP沟通中使用Intralinks,嵌入Geneva等工具,方便客户获取信息 [37] - Bateia收购交易的收入确认在过去不稳定,但预计2025年第四季度收入集中,与2023年情况类似 [50]
AI 月报:10 亿美元训练不出 GPT-5;低成本中国开源大模型走红;AI 幻觉不全是坏处
晚点LatePost· 2025-01-07 14:59
技术进展 - OpenAI训练GPT-5遇阻,已投入20个月和至少10亿美元算力成本,但性能提升未达预期,两次从头训练均未突破博士生水平目标[4] - 数据短缺迫使OpenAI采用人工生成数据(工程师/科学家每日5000字)和模型生成数据(o1模型)补充,但规模仍远低于GPT-4的10万亿字训练量[5] - o3模型在CodeForces编程竞赛得分比o1提升44%,数学测试EpochAI解决25.2%问题(其他模型<2%),但AGI评测得分因数据预训练存在争议[7][9] - 强化学习重要性提升,OpenAI推出RFT微调方法,LangChain报告显示人类反馈强化学习应用增长18倍[5][9] - 世界模型取得突破:DeepMind的Genie 2生成可交互虚拟场景,李飞飞团队实现AI图片转3D场景,CMU/英伟达开源机器人模拟系统Genesis[14] 行业竞争 - Google Gemini 2.0 Flash系列模型抢占Chatbot Arena前三,OpenAI首次失去榜首地位[18][21] - 中国开源模型崛起:DeepSeek-V3以578万美元训练成本逼近GPT-4o性能,Qwen2.5-plus超越Meta Llama 3.1[23][26] - 芯片领域博通市值破万亿美元,2024年AI收入增长220%至122亿美元,为Google/Meta等提供自研芯片方案[29] - 英伟达推出B300 GPU适配o系列模型,算力/显存提升50%,xAI计划将H100算力中心从10万张扩展至100万张[33][34] 应用与商业化 - OpenAI推出12项ChatGPT升级:订阅费最高2000美元/月,集成Sora视频生成、电话交互、生产力工具插件等功能[36] - Agent成为新趋势,Google Gemini 2.0专为Agent优化,YC预测其市场规模将比SaaS大10倍[12][13] - 大模型嵌入传统行业:Salesforce招聘2000人推广AI Agent,微软Phi-4模型(140亿参数)性能超越更大模型[38][12] - AI硬件进展:Meta计划为Ray-Ban眼镜增加屏幕,OpenAI重组机器人团队,中国预计2025年出现"百镜大战"[40] 投融资动态 - 21家AI公司获超5000万美元融资:中国智谱AI获30亿元(估值200亿元),阶跃星辰聚焦多模态模型,Liquid AI开发新型神经网络架构[42][43] - 基础设施领域Databricks融资86亿美元(估值620亿美元),Tenstorrent获7亿美元开发RISC-V架构AI芯片[44] - 应用层公司多成立于ChatGPT前:Zest AI(金融风控)、Tractian(工业设备监测)、Speak(语言学习)等获大额融资[46][47][48] 科学价值 - 大模型"幻觉"被科学家重新定义:加速抗生素研发(MIT)、生成全新蛋白质(诺奖得主Baker实验室获100项专利)[50][51]