Workflow
Retrieval-augmented generation (RAG)
icon
搜索文档
人工智能-2025 年全球 TMT 大会要点-Artificial Intelligence-2025 Global TMT Conference Day One Takeaways
2025-09-07 16:19
这份文档是花旗全球TMT会议第一天的要点总结 涵盖了9家私有AI公司的炉边谈话内容 以下是详细分析 会议及行业背景 * 会议为花旗全球TMT会议 聚焦于科技、媒体和电信行业 重点关注人工智能领域[1] * 会议于2025年9月3日在纽约举行 第一天举办了9家私有AI公司的1对1炉边谈话[1] 数据与AI平台公司:DataRobot * 公司是专注于AI的企业软件提供商 开发平台将智能AI无缝集成到企业中 其发明包括AutoML[4] * 公司CEO认为推理的价值将证明基础设施层投资的合理性 长期来看30%-40%的推理将在云上或混合环境中进行[4] * 数据管理需演进 因单纯数据访问不足 数据需要可解释性 且企业内访问权限各异导致安全控制担忧 语义数据访问仍是挑战 未来将是联邦式平台而非单一平台主导[5] * 企业用例包括供应链预测 如库存水平 货运延迟 与CPG和制造公司合作 实现更交互式的预测 以应对局部供需变化 最终设想通过智能步骤促进和执行供应链关键命令[6] * 与NVIDIA合作共同设计Agent Workforce平台 与SAP合作提供为SAP财务和供应链操作定制化的预构建AI应用套件[7] * 新开源框架Syfter旨在识别提高商业应用性能的智能工作流 解决了优化准确性、成本和延迟的问题 CEO认为将有一些闭源系统表现良好 其余由开源模型服务 开源与闭源模型之间的差距正在缩小[8] * 内部效率方面 软件开发生产力已提高 但量化生产力仍困难 CEO认为生产力期望应反映业务具体部分而非严格遵循30%的经验法则 公司已扩充工程团队 但看到通过自动化在支持职能上提高效率的机会 数字员工将成为劳动力一部分[9][10] 企业AI公司:Uniphore Technologies * 公司是AI原生、多模态企业级SaaS公司 专注于语音分析和对话AI平台[11] * 公司定位为大型企业的构建者平台 帮助构建AI堆栈 平台使组织能以零复制方式连接所有数据源 并构建精调、适合用途的小语言模型和智能体 主要竞争对手包括亚马逊Bedrock、谷歌Agentspace和微软Azure Data Factory[12] * CEO看到三个趋势推动本地需求 resurgence 驱动对像Uniphore这样不依附任何超大规模云提供商、可在任何云、私有云或本地运行的平台的兴趣 1) 企业对数据主权的需求 2) 主权AI经济考量 3) 对美国关税/贸易政策的负面反应驱动非美企业减少对美国超大规模云提供商的依赖[13] * 用例正经历指数级增长 企业可能在广泛横向采用上未见成效 但在特定行业的具体用例中看到深度采用 例如与四大咨询公司合作 已有数百个智能AI用例 包括帮助大型石油天然气公司解决合同泄漏 其他用例包括保险公司在承保、理赔和向上销售/交叉销售流程中部署智能体 银行客户利用SLMs/智能体进行客户交易和邮件通信的合规与监控 至少五家电信公司精调SLMs自动化复杂计费流程 一家金融科技客户计划在未来几年完全关闭与记录系统的合同[14] * 业务AI云与定价方面 应用堆栈已超越客户服务 过去两年大量转向智能应用 向全平台选择的转变与生成式AI的出现同时发生 AI成为集中采购主题 去年实现6亿美元订单额 今年增长80% 净收入留存率超过130% 定价模式为客户预支付一定消费额换取积分并使用[15] * CEO认为90%的企业用例最适合用小语言模型服务 AI研究正朝两个方向发展 1) 超级智能 2) 适合用途的AI[16] 自动驾驶AI公司:Applied Intuition * 公司提供跨垂直领域的自动驾驶基础设施 其模块化平台包括车辆OS、自动驾驶堆栈和模拟/AI工具 使OEM能够构建、测试和部署跨环境的自动驾驶系统 公司正从模拟供应商快速演进为平台级供应商[17] * 平台正从模拟根源转向全栈自动驾驶供应商 充当自动驾驶的脚手架而非垂直解决方案 与特斯拉或Waymo不同 其不可知论方法让OEM可在自有OS或公司OS上集成自动驾驶 使采用和集成更容易 这种灵活性类似于安卓的开放模式与苹果专有iOS的对比 合作伙伴可仅采用OS 仅采用自动驾驶堆栈 或两者都采用[18] * 市场定位方面 公司正扩展超越汽车行业 汽车业现在占比小于45% 进入卡车运输、采矿、海洋、农业、国防和其他垂直领域 平台支持确定性环境如采矿和动态环境如城市街道 最近在日本卡车运输领域取得进展 CFO暗示下周将宣布采矿领域的大型新客户 其在国防领域的双重用途方法提供了灵活性并对抗支出周期[19] * 全球视角方面 公司密切关注中国快速的电动车和自动驾驶进展 并适应最佳实践以保持竞争力 公司看到中国以外地区的重大机会 旨在成为中东等其他尚未出现核心提供商市场的自动驾驶供应商 其将技术跨垂直领域和地域泛化的能力是战略优势[20] * 产品采用和工程文化方面 公司拥有工程密集团队 超过80%员工是工程师 其他大多数员工也有工程背景 其协作、白盒集成模式与OEM建立了深度信任 部署后 OEM保留最终责任但依赖公司的透明度和专业知识 其工具链通过大规模场景生成、闭环测试和持续回归降低验证成本[21] * AI战略与差异化方面 其AI工具是自动驾驶的核心推动力 其模拟和数据基础设施允许快速迭代和验证AI模型 这对于处理边缘案例和监管要求至关重要 与许多专注于构建模型并后期货币化的AI超大规模云提供商不同 公司提供的技术堆栈从第一天起就解决实际商业需求 其模型提供类似SaaS的利润率和正自由现金流 每个新客户都强化了平台[22][23] * 自动驾驶时间表和监管展望方面 公司对更高级别自动驾驶持务实态度 但相信行业正朝着大规模L5部署努力 目前正在实现L2+和L3 但真正的L5自动驾驶需要更多模型训练和监管清晰度 预计各州存在差异 OEM谨慎行事以避免超越市场和监管准备度[24] AI基础设施公司:VAST Data * 公司提供为分布式智能计算和AI智能体设计的AI操作系统 构建在其DASE架构上 该架构整合并管理企业内所有结构化和非结构化数据 其AI操作系统旨在满足拥有1万-10万GPU的AI集群的极端数据延迟和吞吐量需求[25] * 与新云提供商如Crusoe和Coreweave的合作是互利共赢的 通过与像VAST Data这样的目标“中间栈”公司合作 这些新云可以通过 combined out-of-the-box 解决方案更有效地与大型集成云提供商竞争 公司通过基于订阅的“登陆并扩展”模式按容量和核心收费 最初专注于相对较小但高使用率的客户群 使公司能高效增长收入 累计已售出20亿美元软件 并保持现金流为正[26] * 数据结构化瓶颈和DASE架构方面 公司早期认识到规模数据存储的关键瓶颈需要重新设计传统堆栈架构 因为生成式AI对海量非结构化数据集和密集嵌入向量提出了前所未有的I/O需求 其DASE架构专为这些环境定制 是数据需求日益复杂的企业解决方案 传统数据仓库模型的局限性源于其旧世界设计 因为环境在机器学习出现之前非结构化数据较少 企业现在意识到以前当前数据服务无法访问的归档数据需要迁移到统一系统[27] * 本地部署趋势方面 CEO认为数据安全仍是企业的首要考虑因素 此外 他预见混合环境将随着时间的推移成为常态 因为计算更靠近边缘 公司由于其虚拟化能力和数据空间架构 在这一演变格局中处于有利位置 最终消费者将越来越多地采用这种分布式模型[28][29] * 电力需求/约束方面 随着业务扩展 供应链的各个部分持续面临挑战 观察到一些客户 特别是在中东和北非地区 围绕发电厂建设基础设施以解决能源约束 尽管存在这些挑战 CEO看到市场成熟后优化的机会 例如“首次令牌时间”效率提高减少GPU消耗需求 这些优化应能改善功耗[30] * QLC和内存架构方面 CEO认为四层单元闪存是平衡价格、性能和规模的最佳机制 通过其QLC实施 延长了闪存存储的生命周期 证明最低成本的闪存可用于最密集的数据工作负载[31] * 企业用例方面 CEO认为最相关的用例是那些涉及大量数据且需要快速上市的应用 虽然最初客户主要是AI原生公司 但现在观察到企业客户份额不断增长[32] 市场状况:花旗银行小组讨论 * 花旗投资银行成长股权主管和花旗投资银行全球科技主席参与了关于当前科技资本市场状况的坦诚讨论[33] * 估值与AI影响方面 讨论认为AI正在推动估值提升和代际转变 但警告收益不会均匀分布[33] * IPO和并购趋势方面 科技IPO活动被描述为市场晴雨表 今年复苏缓慢 迄今有11宗上市 预计至少还有4宗 引用历史周期 指出正常化通常需要数年时间才能实现 并购市场活动强劲 迄今科技交易达4000亿美元 预计到年底达6000亿美元 指出工业软件的战略交易估值丰厚 而赞助商驱动的交易倍数较低 预计小盘和中盘软件估值将保持低位 因为AI吸引了市场大部分注意力 两位小组成员都指出持续监管审查 特别是对大型科技和半导体行业[34] * 独角兽积压和退出路径方面 尽管美国科技市场有超过700家独角兽 但历史上这些公司大多通过并购而非IPO退出 预计只有最成功、最知名的公司会上市 并强调私募市场提供深厚的资金池 使公司更容易保持私有更长时间 进一步强调上市和成为上市公司可能是一项艰巨的任务 伴随着增加的审查 这阻碍了通过IPO融资[35] * 资本密集度和融资创新方面 讨论了AI和基础设施所需的非凡资本 例如 谷歌、Meta、亚马逊、甲骨文和微软预计明年资本支出达4000亿美元 指出融资结构正在演变 其他行业的工具被调整用于科技 此外 强调主权财富基金和合作伙伴关系日益重要[36][37] * 私募/公募市场动态方面 描述了延续工具和二次发行如何模糊了公募和私募市场之间的界限 将当今环境追溯到2012年的JOBS法案 该法案通过提高股东限制和改变股东定义 为公司保持私有更长时间奠定了基础 认为公募市场仍提供透明度和纪律[38] * 行业展望和人才趋势方面 指出软件仍是领导者 与AI相邻的模型和基础设施公司获得关注 还强调了对安全和普通软件的新兴趣 指出了收购雇佣和反向收购雇佣交易的兴起 这使创始人受益 但如果人才从公司剥离 可能对更广泛的科技生态系统构成风险并引发身份危机[39] * AI对SaaS和未来IPO的影响方面 不相信AI会压制SaaS 而是会迫使提供商适应并提高平台适用性 补充说投资者现在经常询问每家公司的AI战略 类似于多年前互联网影响时期的方法 两位小组成员都认为交易促进者和企业聚焦模型最持久 预计第一个真正的AI原生IPO将来自基础设施公司 企业采用和可演示产品是关键驱动因素 此外 强调投资者将关注公司如何赚钱及其基础设施的持久性[40] * 展望未来 看到市场正在转型 预计2026年公募退出将谨慎重启 私募资本持续主导 以及AI基础设施的创造性融资 两位小组成员都强调成功将取决于可防御的技术、可预测的收入和清晰的盈利路径[41] 数字身份公司:ID.me * 公司是面向政府机构和企业的数字身份网络和验证公司[42] * 数字身份格局方面 公司将欺诈视为数字身份最重要待解决的问题 根据美国政府问责办公室数据 2018-22年间美国联邦政府因欺诈年损失2300亿至5210亿美元 且面临来自僵尸网络和国家行为者的攻击日益增长 公司认为随着AI工具加速网络欺诈和身份盗窃 其数字身份网络将在识别与ID盗窃相关的上下文模式从而抵御攻击方面发挥关键作用 公司寻求成为数字身份钱包提供商 让个人安全拥有和控制其数据和身份[43] * 增长轨迹方面 公司收入从2020年约2500万美元增长至如今近2亿美元 目前拥有1.52亿以上用户 占美国成年人55% 2024年新增超过2000万用户 平均每天增加超过5万用户 除国务院外 是最大的NIST合法ID凭证发行方 超过7800万身份 提供跨多个领域的互操作性 包括医疗保健、退伍军人事务、国税局、社会保障、州级残疾索赔和SMART健康卡等 最近赢得一家制药公司数百万美元合同 使多个登录合并为一个ID.me登录 公司毛利率目前为百分之六十多[44][45] * 数字身份在AI经济中方面 公司看到令牌驱动的AI经济 并正在构建身份信任图 除了用户授权 公司看到获得用户许可以主动使用身份的机会 公司认为身份上下文和记忆令牌创建了可信交互的数据飞轮 驱动更高参与度和更好个性化 公司将令牌视为基本认证令牌、ID验证令牌和上下文配置文件令牌[46] * 数据安全方面 公司已大量投资满足安全基准 并持续过度投资安全 公司参与认证/信任层 但不参与行为层 因此只有用户使用的应用会看到应用内活动 而公司只看到进入应用[47] * 竞争方面 关键竞争对手是身份市场的数据经纪人 但公司认为经纪人收割和转售身份数据的旧模式不可持续 拥有超过1.52亿用户跨越联邦、州和医疗机构 公司相信提供更高转化率 因其拥有最多数据的模型 将Clear视为最接近的真正竞争对手 但认为公司在规模上遥遥领先[48] 向量数据库公司:Pinecone Systems * 公司是专为AI工作负载优化的向量数据库 支持通过含义和上下文进行语义搜索和检索[49] * 技术架构方面 其分布式、无服务器向量存储支持数十亿高维向量 并使用高级索引算法 如近似最近邻和混合密集/稀疏检索 实现大规模低延迟查询 平台抽象了集群管理 根据查询负载和数据量自动扩展资源 支持多模态嵌入 允许跨文本、图像和其他数据类型的统一搜索 并可托管多个模型进行实时查询重新排名和多模态检索[50] * 集成和互操作性方面 与主要云提供商和AI赋能平台集成 暴露用于嵌入摄取、向量更新插入和实时查询的API 该系统设计为与流行嵌入模型无缝协作 支持密集和稀疏表示 其上下文引擎为智能工作流协调检索 使LLMs能从非结构化源获取相关上下文[51] * 运营AI和内部工具方面 CEO强调了公司使用自有AI堆栈进行内部运营 拥有超过1500家客户但只有3名销售人员 公司使用LLM智能体自动化销售和支持交互 进行转录、总结和更新销售运营 大部分支持查询通过内部智能体搜索公司知识库解决 边缘案例才需人工干预 值得注意的是 十分之九的支持请求由AI智能体处理 反映了深度运营自动化[52] * 可扩展性和资源优化方面 其共享硬件模型允许多个企业租户利用相同物理资源 优化成本和吞吐量 系统根据工作负载模式动态分配内存、CPU和GPU资源 支持流量突发和稳态流量 高级缓存和重新排名算法确保即使数据和模型复杂性增长也能提供相关结果 公司设计为从小型部署扩展到高吞吐量企业应用[53] * 行业转变方面 CEO强调行业正逐渐从孤立的专用软件转向能更好地协调跨所有数据孤集的智能工作流的统一平台 低代码/无代码智能体开发的兴起意味着初级员工可以构建和部署智能体 加速企业采用 公司即将推出的上下文工程产品将通过动态组装智能体的相关上下文来自动完成任务 进一步改变企业访问和使用非结构化数据的方式[54] * RAG和用例方面 其向量索引作为检索增强生成的上下文平面 减少幻觉并提高LLM输出的相关性 用例包括企业/人员搜索、深度文档分析和高级问答 CEO指出用户需求出现分歧 高级用户构建复杂的排名和智能行为 而其他用户寻求快速、可扩展且生产就绪的向量数据库[55] * 与现有厂商的价值对比方面 CEO认为其架构与改造添加向量搜索的传统数据库根本不同 虽然如MongoDB或PostgreSQL等平台可以添加向量功能 但它们缺乏针对生产规模AI工作负载的优化索引、内存管理和查询路由 客户在遇到现有解决方案的可扩展性和延迟限制后经常迁移到公司 尽管一些小规模用户发现通用数据库足以满足需求[56] * 风险和展望方面 CEO承认来自传统厂商添加向量功能带来的商品化风险 以及服务海量嵌入工作负载的经济性风险 即便如此 公司相信其技术差异化 可扩展索引、多模态支持和智能协调 应有利于其增长前景 最后 CEO提到了即将推出的专注于上下文工程的产品 应能进一步自动化和协调检索工作流[57] AI芯片公司:Syntiant Corp * 公司开发低功耗神经形态半导体 旨在将AI和ML从云端移动到边缘设备[58] * 边缘计算方面 从CEO视角 虽然数据中心计算对传统平台应用有效 但边缘计算在外部世界接口如语音或降噪方面具有优势 他预计随着更多计算移向边缘 性能改进应会实现 并看到边缘推理解决四个关键问题 延迟、功耗、隐私和成本 他设想最终成本降低高达90%[59] * 产品优先级方面 耳塞和眼镜是目前高容量市场 具有不错的支付意愿 因为消费者通常对个人产品的质量和性能有更高标准 因此公司主要优先考虑这些市场垂直领域 但公司已逐渐优先考虑其医疗保健业务 特别是助听器 但指出不预期该市场增长如一般消费类耳塞/眼镜快[60] * 客户细分方面 公司通常将客户群分为两部分 1) 检测聚焦 主要包括远程控制和始终在线监听 2) 性能增强聚焦 通常以降噪为特色 长期来看 CEO相信AI将嵌入几乎所有消费产品 无缝赋能几乎所有在边缘操作的消费设备 公司目前软件业务利润率接近100% 并以其软件优先进入市场 但预计业务分配将逐渐转向硬件 2026年硬件将代表更大份额[61] * NDP250和供应链考虑方面 Ndp250是公司第三代核心 可运行高达600万参数的模型 该尺寸通常适合大多数计算机视觉需求 从供应角度 公司从四家代工厂采购 并有两家工厂 虽然供应约束在最近过去是担忧 但CEO不再认为边缘类型供应约束显著[62] AI安全公司:BigID * CEO描述每家企业现在都在现有数据操作之上分层AI 同时通过微调和RAG绕过构建商业级模型 公司重点是连接数据和AI之间的点 帮助组织识别跨平台的高价值、高风险数据 并为安全、合规的AI使用准备数据[63] * 技术定位方面 公司利用向量数据库从企业数据中提取嵌入