Workflow
生成式AI
icon
搜索文档
SoundHound AI(SOUN) - 2025 Q2 - Earnings Call Transcript
2025-08-07 22:00
财务数据和关键指标变化 - 第二季度营收达4300万美元 同比增长217% [6] - 平台月查询量突破10亿次 [7] - 季度总查询量达30亿次 较去年同期增长超100% [35] - GAAP毛利率39% 非GAAP毛利率58% [37] - 研发费用2580万美元 同比增长64% [38] - 现金及等价物2.3亿美元 无债务 [42] 各条业务线数据和关键指标变化 汽车业务 - 在中国市场赢得新客户 为全球前五大汽车品牌之一供货 [15] - 生成式AI解决方案Chat AI在北美三大品牌上线 [15] - 每车平均收入(ASP)实现两位数增长 [36] 餐饮业务 - 活跃餐厅数量超1.4万家 新增1000家门店 [35] - 新增IHOP、Red Lobster等知名客户 [18] - 与PAR Technologies达成合作 扩展全球餐厅覆盖 [22] 企业AI服务 - Amelia平台销售达成率从收购前40%提升至100%以上 [33] - 净收入留存率从90%以下提升至120% [33] - 与全球前10大金融机构中的7家合作 其中4家实现增购 [21] 各个市场数据和关键指标变化 - 北美市场:汽车语音助手新增三大品牌部署 [15] - 中国市场:赢得重要汽车供应商订单 [18] - 欧洲市场:与多家汽车品牌开展语音商务试点 [27] 公司战略和发展方向 - 三大支柱战略形成完整生态系统:产品(汽车)、服务(企业AI)、语音商务 [16] - 自研Polaris模型性能领先:准确率超竞品35% 延迟降低4倍 [12] - 收购整合成效显著:12-18个月内实现被收购业务扭亏为盈 [7] - 新增视觉AI能力 打造多模态交互系统 [13] 管理层评论 - 行业前景:"语音AI正成为AI时代的先锋" [31] - 技术优势:"Polaris模型持续扩大领先优势" [12] - 市场机会:"我们服务的市场渗透率仍然很低" [65] - 财务展望:预计2025年营收1.6-1.78亿美元 年底实现调整后EBITDA盈利 [44][46] 其他重要信息 - 语音商务生态系统进展顺利 与多家汽车厂商和商户开展试点 [26] - 代理AI平台Amelia 7已开始迁移15家大型企业客户 [23] - 通过渠道合作伙伴加速市场覆盖 与Avant等达成销售合作 [22] 问答环节 业务增长驱动力 - 各垂直领域全面增长 企业AI表现突出 [48] - 现有客户钱包份额仍有很大提升空间 [65] - 间接渠道开始贡献收入 [88] 中国市场进展 - 在中国与本土AI公司竞争 依靠技术优势和语言覆盖能力胜出 [55] - 新签中国汽车客户涉及数百万台设备 [18] 财务指引 - 下半年收入将环比增长 Q4强于Q3 [82] - 指引未包含潜在收购影响 [74] 语音商务 - 已产生间接收入影响 推动其他业务线增长 [100] - 即将实现规模化商用 [101] 餐饮行业 - 已覆盖前20大QSR中的7家 [105] - 14000家门店中大部分为电话订餐 数百家为得来速 [111] - 通过简化硬件方案加速得来速部署 [112]
腾讯研究院AI速递 20250808
腾讯研究院· 2025-08-07 16:01
GPT-5系列模型 - OpenAI提前披露GPT-5四个版本:标准版gpt-5、轻量版gpt-5-mini、低延迟版gpt-5-nano和多模态复杂对话版gpt-5-chat [1] - 模型将分层开放:免费用户用基础版,Plus用户用更强推理版,Pro用户独享"研究级智能"的GPT-5 Pro [1] - 实测显示SimpleBench推理测试准确率达90%,需特定提示激活复杂思考,编程和视觉表现有提升但未达惊艳水平 [1] MiniMax语音模型 - 新一代Speech 2.5模型支持40种语言真人级生成,实现跨语种音色保留和口音复刻 [2] - 相比5月版本在多语种自然表达、音色复刻和语种覆盖三方面突破 [2] - 已被Vapi、Pipecat等海外平台及高途教育、喜马拉雅、网易等国内头部平台接入 [2] 小红书多模态模型 - 开源首个多模态大模型dots.vlm1,基于12亿参数NaViT视觉编码器和DeepSeek V3构建 [3] - 视觉理解能力接近Gemini 2.5 Pro和Seed-VL1.5 Thinking,能解数独、破解高考数学题等 [3] - 两个月内连续开源dots.llm1、dots.ocr、dots.vlm1三款模型,反映技术自研力度加大 [3] 面壁小钢多模态模型 - MiniCPM-V 4.0仅用4B参数在OpenCompass等榜单取得SOTA成绩,支持手机端稳定运行 [4] - 显存占用仅3.33GB,256并发下吞吐量达13856 tokens/s,远超Qwen2.5-VL和Gemma 3 [4] - 开源推理部署工具MiniCPM-V CookBook便于开发者简易部署 [4] 通义千问新模型 - 发布Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507两款小尺寸模型,支持256K上下文 [5][6] - Qwen3-4B-Thinking在AIME25测评得81.3分,Agent能力超越Qwen3-30B-Thinking [6] - Qwen3-4B-Instruct全面超越GPT-4.1-nano,性能接近Qwen3-30B-A3B [6] 大模型对抗赛 - OpenAI的o3以4比0完胜o4-mini,展现100%准确率 [7] - Grok 4与Gemini 2.5 Pro常规赛2比2平,加赛逼和对手晋级 [7] - 决赛由Grok 4对阵o3,国际象棋冠军Magnus Carlsen等将解说 [7] Gemini教育功能 - 推出"引导式学习"模式,通过问题分解、视觉辅助和互动测验构建知识 [8] - 为美日等国大学生提供一年免费AI Pro计划(价值200美元) [8] - 承诺三年内向美国教育投入10亿美元 [8] 具身智能技术 - Skild AI推出端到端视觉感知控制方案,实现机器人稳定爬楼梯和复杂障碍通过 [9] - 采用纯视觉输入方法,通过单一神经网络实现"本能级"动作控制 [9] - 优势在于连贯运动切换和环境适应能力,可实时调整动作应对地形 [9] 理想汽车智驾 - 推出国内首个量产VLA模型,在视觉和行为间加入语言环节使决策更拟人 [10][11] - 系统每天通过"世界模型仿真系统"行驶30万公里迭代,4B模型实现10Hz帧率 [11] - 预计辅助驾驶明年达1000MPI里程碑 [11] AI应用平台趋势 - a16z认为AI应用平台将走向专业化而非赢者通吃,形成互补共存 [12] - 市场分化为原型制作、个人软件和生产级应用三类,70%用户仅活跃于单一平台 [12] - 未来三至五年每类别将出现2-3家主导企业 [12]
前瞻全球产业早报:《上海市具身智能产业发展实施方案》发布
前瞻网· 2025-08-07 12:12
汽车制造业发展 - 安徽上半年汽车产量达149.95万辆 超过广东位居全国第一 [2] 科技创新与研发突破 - 未来科学大奖2025年生命科学奖授予季强、徐星、周忠和 表彰其发现鸟类起源于恐龙的化石证据 [2] - 未来科学大奖2025年物质科学奖授予方忠、戴希、丁洪 表彰其在拓扑电子材料的计算预测及实验实现贡献 [2] - 未来科学大奖2025年数学与计算机科学奖授予卢志远 表彰其在非易失性半导体存储单元密度、器件集成度和数据可靠性领域的发明 [2] - 智元机器人联合研究团队系统性探索机器人操作学习中数据多样性的三个关键维度:任务多样性、机器人本体多样性和专家多样性 [4] - 国内首条稀土盘式电机智能示范线建成投产 首款厚度6毫米稀土永磁轴向磁通电机引发业界关注 [6] - 华为公布"车辆编队方法及电子设备"专利 应用于多设备环境以降低延迟并提高智驾安全性 [6] 人工智能与智能产业发展 - 英伟达声明其芯片不存在后门、终止开关和监控软件 [3] - 上海发布具身智能产业发展实施方案 目标到2027年实现核心技术突破不少于20项 核心产业规模突破500亿元 [3] - 微软宣布将OpenAI的gpt-oss模型引入Azure AI Foundry 支持混合AI应用 [7] - 马斯克宣布xAI将于下周开源聊天机器人Grok 2 [9] 机器人技术进展 - 傅利叶发布全尺寸人形陪伴机器人GR-3 身高1.65米 体重71公斤 主打交互陪伴和可触摸特性 [5][6] 航空航天与高端制造 - 波音777-9机型完成首次试飞 飞行时长2小时27分钟 [11] - 英国民航局向英国罗拉天空公司颁发首张本土火箭发射许可证 授权发射"云雀L"亚轨道火箭 [11] - NASA将加速推进在月球建造核反应堆计划 设定最终时间表 [10][11] 消费电子与互联网 - iPhone 17系列发布会可能于9月9日举行 [8] - 淘宝上线大会员体系 打通饿了么、飞猪等阿里系资源 覆盖吃喝玩乐、衣食住行场景 铂金及以上会员可88元开通88VIP [6] 企业财务与资本市场 - 本田汽车第一季度经营利润2441.7亿日元 低于预估3096.5亿日元 净利润1966.7亿日元同比减少50.2% [12] - 本田将全年经营利润预期从5000亿日元上调至7000亿日元 仍低于市场预估8962.4亿日元 [12] - 汉桑科技在深交所创业板上市 开盘价91.5元/股较发行价28.91元高开216.5% 总市值达118亿元 [13] - 思博控股向SEC提交IPO申请 计划筹资至多700万美元 [13] 产业投融资动态 - AI虚拟电厂企业GreenVoltis完成数百万美元融资 由民银国际独家投资 [12] - 九千尺智行完成1000万元天使轮融资 专注于民用航空器及零部件研发与生产 [12]
云计算一哥首度牵手OpenAI,大模型「选择」自由,才是终极胜利
机器之心· 2025-08-07 10:30
亚马逊云科技与OpenAI合作 - 亚马逊云科技首次通过Amazon Bedrock和Amazon SageMaker两大平台支持OpenAI新开源模型gpt-oss(120b和20b)[1] - 此举打破微软独家转售OpenAI服务的局面,标志着AI行业格局变化[3] - 合作填补了亚马逊云科技模型库的关键空白,使其模型托管厂商增至13家[13][15] 亚马逊云科技AI生态系统战略 - 公司提出"Choice Matters"战略,强调多模型协同而非单一模型主导[6][9] - Amazon Bedrock和Amazon SageMaker两大平台已汇聚400+款商业及开源模型[10] - Bedrock专注于商业API调用,SageMaker侧重开源模型部署和定制化[9] 技术优势与性能表现 - gpt-oss-120b在Bedrock上的性价比是Google Gemini的3倍、DeepSeek-R1的5倍[14] - 平台安全功能可阻止88%有害内容,支持定制模型导入和知识库[13] - Claude Opus 4.1支持混合推理模式,在多步骤工作流中表现突出[17] 行业影响与未来展望 - 合作使OpenAI技术触达亚马逊数百万客户,扩大商业化渠道[15] - 公司角色从云服务商升级为AI能力聚合平台[19] - 多模型自由组合可能催生下一代颠覆性AI应用[31] 模型选择与应用场景 - 不同场景需特定模型组合:翻译用DeepSeek R1+Claude 3.7,研究用DeepSeek R1+Claude 4[9] - 开发者可按需选择模型,如Claude Opus 4.1适合编程,gpt-oss-20b适合日常任务[23] - 企业可通过统一API实现安全合规的规模化部署[24]
全球最大AI模型聚合平台诞生!不争冠军只做擂台
量子位· 2025-08-07 09:02
战略核心 - 亚马逊云科技提出"Choice Matters"战略,强调AI价值在于为不同场景选择最适合的模型而非追求单一最强模型 [1][2] - 该战略基于云计算领域的洞察:AWS提供429项计算服务、266项存储服务、513项数据库服务和421项AI/机器学习服务 [3][4] - 战略得到市场验证,OpenAI开源模型加入Amazon Bedrock平台,gpt-oss-120b与gpt-oss-20b展现3倍于Gemini、5倍于DeepSeek-R1的性价比优势 [6][8] 平台能力 - Amazon Bedrock平台提供217款商业API服务,Amazon SageMaker支持185款商业和开源模型部署 [21] - 平台聚合超过400款主流商业及开源大模型,成为全球最大AI模型聚合平台 [22] - 平台模型合作伙伴包括Anthropic、Meta、DeepSeek、Google、OpenAI等顶级AI公司 [22] 模型性能 - Claude Opus 4.1在Agentic coding SWE-bench测试中达74.5%,高于OpenAI 03的69.1%和Gemini 2.5 Pro的67.2% [12] - Claude Opus 4.1在Graduate-level reasoning GPQA测试中达80.9%,低于OpenAI 03的83.3%和Gemini 2.5 Pro的86.4% [12] - Claude Opus 4.1在Multilingual Q&A MMMLU测试中达89.5%,与OpenAI 03的88.8%相当 [12] 应用模式 - "最佳匹配"模式:特定场景选用单一模型,如实时翻译选Nova、学术研究选DeepSeek、内容创作选Claude [14] - "协同增效"模式:复杂场景多模型协作,如翻译系统组合DeepSeek R1/Claude 3.7与Nova Lite [15][16] 生态发展 - 2023年4月Anthropic入驻,2023年7月Meta Llama系列加入,2023年9月Stability AI推出Stable Diffusion系列 [23] - 2024年2月Mistral AI带来混合专家模型,2025年2月DeepSeek R1模型登陆,2025年8月OpenAI开源模型加入 [23] - 生态案例包括野村证券使用Llama处理数据、Doordash使用Claude优化客服、Zalando借助Mistral AI实现电商智能化 [25]
微软破 4 万亿,被裁员工扎心!70 级工程师天价薪酬曝光:入职大礼包 2700 万
程序员的那些事· 2025-08-07 08:49
微软市值突破4万亿美元 - 微软成为史上第二家市值突破4万亿美元的公司,紧随英伟达之后[5][8] - 本季度净收入达到272亿美元,同比增长显著[4] - 微软对OpenAI的数十亿美元押注已改变游戏规则,凭借独家访问权限在生成式AI领域领先[23] AI战略推动业绩增长 - 从Office到Azure再到Copilot,微软将OpenAI模型能力无缝接入产品全家桶[20] - Microsoft 365企业版Copilot月活已破亿,企业级AI赋能成效显著[24] - Azure成为当前最大收入来源,云服务业务猛涨[24] - 预计本财年Q1资本支出高达300亿美元,创单季度最高记录[24] 五大科技巨头AI布局 - 英伟达市值达4.4万亿美元,一年内翻三倍[29] - 苹果市值3.12万亿美元正在追赶[22] - 谷歌和亚马逊市值均在2万亿美元左右徘徊[22] - 五家AI巨头占标普500指数四分之一权重[16] 裁员与薪酬结构 - 7月裁员9000人,约占员工总数4%,此前5月已裁员6000人[36] - 公司20%-30%代码由AI编写,生产力提升导致裁员[39] - 70级工程师年薪40.8万美元,入职股票奖励190万美元,年度股票奖励最高147.6万美元[55][56] - 70级工程师总薪酬包可达378.4万美元(约2727万元人民币)[9][57] 财务数据表现 - 2024年6月30日季度营收2451.22亿美元,同比增长15.7%[14] - 总毛利润1710.08亿美元,毛利率69.8%[14] - 研发支出295.1亿美元,同比增长8.5%[14]
OpenAI模型首次登陆AWS云平台
搜狐财经· 2025-08-07 05:50
合作动态 - OpenAI首次在AWS平台提供两款开放权重推理模型 作为Bedrock和SageMaker AI服务的模型选项[2] - 亚马逊在OpenAI充分知情和批准下提供模型 合作模式类似早期提供DeepSeek-R1的方式[2] - 微软Azure仍为OpenAI最重要云合作伙伴 同时将提供针对Windows设备优化的新模型版本[3] - 甲骨文与OpenAI签署每年300亿美元数据中心服务协议 金额超过其他云服务客户总和[4] 竞争格局 - AWS此前主要托管Anthropic Claude模型 该模型是OpenAI最大竞争对手之一[3] - AWS的AI服务同时包含Cohere、DeepSeek、Meta和Mistral等厂商模型及自研模型[3] - 亚马逊CEO安迪·贾西公开回应竞争压力 指出第二名云服务商规模约为AWS的65%[4] - 华尔街分析师质疑AWS在生成式AI领域落后于微软和谷歌 担忧市场份额流失[4] 战略意义 - OpenAI通过合作AWS增强与微软谈判地位 双方正在重新谈判长期合作协议[5] - 合作使AWS大量企业客户能便捷使用OpenAI模型 扩大OpenAI市场影响力[6] - 此举削弱Meta竞争优势 Meta可能不再开源所有"超级智能"模型[5] - 云计算巨头通过AI模型合作争夺企业客户 加速生成式AI应用落地[2][3]
五年前,对王兴兴的一次未公开访谈
虎嗅· 2025-08-07 03:42
谈几点让我印象深刻的细节: 本文来自微信公众号:投中网 (ID:China-Venture),对话嘉宾:郑俊聪、王兴兴,编辑:刘燕秋, 题图来自:AI生成 五年前,当四足机器狗还是一个新奇事物,人形机器人还被视为好莱坞大片里的科技幻想时,祥峰便投 资了宇树科技,并与创始人王兴兴展开了一场对话。如今,这家全球消费级机器人领军企业即将IPO, Blue hour从祥峰那里获得了这段珍贵的采访,并将其整理出来。 访谈全文一万多字,问题深刻全面。尽管今年我做过几篇宇树的报道,但这场对话仍然给我提供了理解 宇树和王兴兴的新素材和视角。五年前的很多言论,在今天看来充满前瞻性,也让我更真切地理解,为 什么偏偏是这个人站上浪潮之巅。 第一,或许可以说当时的王兴兴还不是"六边形战士",但不能否认,这是一位十分聪明的创业者。所 谓"聪明",按我理解,就是一个人知道自己到底在干什么,以及为什么要这么干。访谈中,他对于波士 顿动力的判断,对双足和轮式机器人优缺点的论述,以及对自身的定位、技术路径和商业化选择的阐 明,今天看来都很准确。他知道每一种选择意味着什么,更准确地说,知道自己舍弃的是什么。 第二,他深深地懂得"慢就是快"的道理 ...
ChatGPT“进宫”:OpenAI以1美元价格撬动政府大门
金十数据· 2025-08-07 03:15
根据OpenAI与美国总务管理局(GSA)于周三联合发布的声明,未来一年内,联邦机构可仅以1美元的 象征性价格使用OpenAI的模型。 这项合作是OpenAI首席执行官山姆·奥尔特曼(Sam Altman)与公司高层数月努力的成果。自2025年1月 特朗普重返白宫以来,OpenAI便积极与新一届政府接触,持续推进与各联邦机构的关系。 奥尔特曼在发给美国《连线》科技杂志的声明中表示: "让AI真正造福全体人民的最佳方式之一,是将它交到为国家服务者手中。我们很荣幸能与 总务管理局携手合作,助力特朗普总统的人工智能行动计划,在联邦政府系统内推广 ChatGPT,支持公务员更好地服务美国人民。" 据《连线》获取的文件显示,自今年5月起,OpenAI多位高管便陆续与GSA及食品药品管理局(FDA) 等机构展开会谈,积极推介公司AI工具。 7月23日,OpenAI首席运营官布拉德·莱特卡普(Brad Lightcap)与其他高层受邀出席了在华盛顿特区举 行的Hill and Valley Forum闭门晚宴。 据外媒获取的邀请函显示,受邀嘉宾还包括多位参与AI政策制定的政府人员,例如政府效率部 (DOGE)成员Akash ...
AI应用板块“牛市叙事”再强化! “AI+数字广告”霸主Applovin(APP.US)业绩超预期 净利润猛增164%
智通财经网· 2025-08-07 00:04
公司业绩表现 - 2025财年第二季度调整后每股收益2.39美元 超出华尔街预期2.32美元 [2] - GAAP准则下每股收益2.28美元 高于华尔街预期1.98美元 [2] - 第二季度净利润8.20亿美元 同比增长164% [2] - 营收12.6亿美元 同比增长17% 超出华尔街预期12.2亿美元 [2] - 剔除已出售游戏业务后 广告业务销售额同比增长77% [2] - 调整后EBITDA达10.18亿美元 同比增长99% [3] - 第三季度营收指引13.2-13.4亿美元 中值超越华尔街预期13.1亿美元 [3] 业务战略调整 - 以4亿美元对价将移动游戏业务出售给Tripledot Studios 获得20%股权 [4] - 剥离10家游戏工作室及特许经营权 专注AI+数字广告核心业务 [4] - 管理层将增长重点放在AI驱动的企业全球扩张 [4] - 通过AXON 2.0引擎打造买量到变现闭环 广告类型营收占比达78% [5] 技术竞争优势 - AXON 2.0引擎结合深度学习与强化学习 实现微秒级实时竞价 [6] - 处理数十亿条用户与上下文信号 精准匹配高ROI竞价方 [6] - AI算法平台覆盖手游获客 电商 金融科技和CTV等高增长领域 [6] - 形成数据网络效应与规模经济 推升eCPM与ROI指标 [5] 行业发展趋势 - AI+数字广告被瑞银列为最具确定性超级赛道 [7] - 谷歌与Meta快速引入生成式AI技术优化广告系统 [8] - AI提高广告定向精准度与转化效果 推动广告主ROI提升 [8] - 企业级AI应用软件需求旺盛 加速渗透各行业 [9] 资本市场表现 - 公司股价年内涨幅达20% 大幅跑赢标普500指数 [1] - 尽管业绩超预期 盘后股价下跌超6% [5] - 瑞银给予买入评级 列为财报季首选股 [7] - AI应用软件公司估值获得重大助力 [9] AI应用前景 - AI应用发展方向集中于生成式AI软件与AI智能体 [10] - AI智能体可自动化重复任务 实现大数据分析与决策 [10] - 能够参与全球大型项目全阶段 大幅加快项目进度 [10] - 企业对于降本增效需求推进AI应用广泛落地 [10]