Workflow
硬AI
icon
搜索文档
蔡崇信:DeepSeek取得突破后,阿里巴巴工程师春节无休全力追赶AI浪潮
硬AI· 2025-06-12 07:04
阿里巴巴AI战略与竞争态势 - 公司在DeepSeek发布R1模型后意识到AI领域落后,工程团队取消春节假期加速开发,几周内推出Qwen系列模型[1][2][3] - Qwen系列模型成为全球最受欢迎的开源大型语言模型之一,公司全面转向聚焦通用人工智能(AGI)[3] - 未来三年将投入超过3800亿元人民币(约530亿美元)建设AI基础设施,包括数据中心[3] 开源策略与云计算协同 - 选择开源Qwen系列模型以推动AI应用普及,带动训练和推理需求增长,从而促进云计算业务发展[3][4] - 开源策略已与苹果公司建立合作,为iPhone提供AI技术支持[4] 公司经营现状与挑战 - 2024年第一季度销售额仅同比增长7%,AI领域大规模投资的回报仍不确定[4] - 2023年公司经历"巨大考验时期",存在扩张过快、方向迷失等问题[4] - 尽管面临挑战,管理层对未来发展保持乐观态度,认为公司"正走在一条非常好的路上"[4] 中国AI行业竞争特点 - 中国消费互联网环境充满活力,工程师群体存在激烈竞争文化,持续推动AI领域创新[2][3] - 行业竞争表现为快速响应机制,如阿里巴巴在竞品发布后迅速调整资源推出对标产品[1][2][3]
甲骨文预计新财年云基础设施营收将涨超70%,盘后一度涨8%
硬AI· 2025-06-12 07:04
财报核心数据 - 第四财季营收159亿美元,同比增长11%,超分析师预期155.9亿美元 [3] - 第四财季运营利润70.4亿美元,超分析师预期68.5亿美元 [4] - 运营利润率44%,符合预期 [5] - 调整后EPS为1.70美元,超分析师预期1.64美元 [6] 云业务表现 - 云基础设施(IaaS)营收30亿美元,同比飙升52%,略低于分析师预期30.7亿美元 [7] - 整体云收入(IaaS+SaaS)达67亿美元,同比增长27%,占总营收42% [8] - 未履行业绩义务(RPO)同比大增41%至1380亿美元,显示未来收入可见性强劲 [12] 未来业绩指引 - 2026财年云基础设施营收预计增长超70%,高于本季52%增幅 [1][9] - 2026财年总营收预计超670亿美元,高于分析师预期651.8亿美元 [9] - 2026财年Q1营收增长指引12%-14%,调整后EPS指引1.46-1.50美元 [9] - 2026财年总云收入增速预计从24%加速至40%以上,RPO增长超100% [14] 战略布局与资本投入 - 与OpenAI合资成立"Stargate"项目,签约xAI、Meta等云计算客户 [12] - 2025财年资本支出超210亿美元(2024财年不足70亿),2026财年将增至250亿美元 [1][17] - 已上线23个多云数据中心,未来12个月计划新增47个,多云数据库收入季度环比增长115% [16] - Oracle Cloud@Customer专属数据中心收入同比增104%,计划2026财年新增30个 [16] 市场反应 - 财报公布后股价盘后波动,先跌3%后转涨8% [1][10] - 过去一个月股价累计上涨17% [10]
黄仁勋GTC大会演讲全文:量子计算正迎来拐点,计划在欧洲新建20家“人工智能工厂”
硬AI· 2025-06-12 07:04
英伟达欧洲AI工厂计划 - 计划在欧洲新建20家"人工智能工厂",配备10000个GPU,包括DGX B200系统和RTX PRO服务器 [1][2][4] - 欧洲AI算力将在两年内增长10倍,助力工业领军企业加速制造应用 [2][4] - 与西门子、ANSYS、Cadence等软件供应商合作,运行CUDA-X库和Omniverse加速工作负载 [4][5] 工业人工智能云平台 - 打造全球首个工业人工智能云平台,支持从设计到数字孪生的全流程制造应用 [2][3][4] - 数据中心向"AI工厂"转型,核心任务是生产"智能通证",类比发电厂产生电力 [6][7] - 德国AI工厂将采用Omniverse蓝图框架,利用Cadence数字孪生平台优化设施设计 [4][5] Blackwell架构技术突破 - Blackwell架构专为AI推理设计,NVLink背板带宽达130TB/秒,超全球互联网峰值流量 [9][38] - GB200系统实现30-40倍代际性能提升,液冷设计支持每周量产1000套 [44][45] - 新一代RTX Pro服务器可运行Windows/Linux及AI工作负载,集成8块Blackwell GPU [46][47] 量子计算进展 - 量子计算迎来拐点,CUDA-Q软件工具包将加速于Grace Blackwell 200芯片 [12][13] - 预计逻辑量子比特每5年增长10倍,纠错能力持续增强 [16][28] - 量子计算机通过量子比特叠加态实现并行处理,解决传统计算机难以处理的问题 [15] 智能体与机器人技术 - 智能体AI(Agentic AI)实现从感知到规划执行的进化,物理形态为机器人技术 [17][18] - 机器人"Greg"在Omniverse虚拟世界训练后部署至物理环境,宝马/奔驰等企业已应用数字孪生技术 [20][75] - 人形机器人或成万亿级市场,Thor计算机开发工具包支持传感器到电机控制的全栈开发 [83] 欧洲合作生态 - 与宝马、奔驰、舍弗勒等合作推进工业AI,在7国建立AI技术中心促进研发 [23][53] - 法国Mistral合作建设AI云,施耐德电气参与数字化AI工厂设计 [55][56] - 欧洲将新增20个AI工厂,包括吉瓦级设施,推动本土AI基础设施发展 [52][55] Omniverse与数字孪生 - Omniverse构建物理精确的虚拟环境,支持工厂/仓库/交通工具的数字孪生开发 [20][75] - 数字孪生需遵循物理定律以训练机器人,迪士尼/DeepMind合作开发高保真模拟 [84] - 实时数字风洞和工厂模拟优化汽车设计,丰田/奔驰等已部署应用 [75][76] 代理AI与推理架构 - 代理AI通过多步骤规划执行复杂任务,单个提示可生成超万倍标记量 [61][62] - Nemo Tron框架增强开源模型,支持区域语言和企业数据定制 [58][59] - DGX Lepton实现多云AI部署,Hugging Face模型可一键接入Spark系统 [66][70]
日均token调用量狂飙137倍!火山引擎展示字节AI实力:新模型豆包1.6支持多模态思考
硬AI· 2025-06-11 11:18
豆包大模型1.6发布 - 字节跳动旗下火山引擎发布豆包大模型1.6系列,支持多模态思考和GUI操作,在高考数学中取得144分[1] - 豆包1.6采用统一定价模式,企业常用区间综合成本降低63%[1] - 截至2025年5月底,豆包大模型日均tokens使用量超过16.4万亿,较去年5月增长137倍[1][3] - 豆包1.6是国内首个支持256K上下文的思考模型,在复杂推理、竞赛级数学等测试集上表现全球前列[3] 市场表现与增长 - 豆包大模型在中国公有云大模型市场份额达46.4%,超过百度智能云(19.3%)和阿里云(19.3%)的总和[4][7] - 日均tokens调用量从去年12月的4万亿增长至今年5月的16.4万亿,两月内增长近30%[5][6] - 火山引擎2025年营收预计翻倍至250亿,调用量几乎等于阿里与百度之和[4] 技术能力突破 - 豆包1.6系列包含三个版本:All-in-One综合模型、深度思考强化版本和极速版本[20] - 具备多模态思考能力,支持深度思考、多模态理解和图形界面操作[20] - 视频生成模型Seedance 1.0 pro在文生视频、图生视频两个维度登顶全球竞技场第一[24] - 视频生成定价每千tokens仅0.015元,生成5秒1080P视频只需3.67元[25] 定价策略创新 - 首创按"输入长度"区间定价策略,0-32K区间价格锁定在输入0.8元/百万tokens、输出8元/百万tokens[13] - 综合成本仅为2.6元,相比豆包1.5和DeepSeek R1的7元降低63%[13] - 设置"特惠区",32K输入、200tokens输出以内请求价格降至2元/百万tokens[16] 应用场景扩展 - AI工具类tokens消耗五个月内增长4.4倍,其中AI搜索增长十倍,AI编程增长8.4倍[10] - 视觉理解模型推动tokens增长,K12在线教育场景tokens消耗增长12倍[10] - 新出现的线下场景如智能巡检、视频检索等实现日均百亿tokens突破[11] AI云原生生态布局 - 发布12款面向Agent开发工具产品,构建从开发到部署的全链条服务体系[26] - 升级AI IDE产品TRAE(月活超100万),发布火山引擎MCP服务等[26] - 推出AgentKit、TrainingKit、ServingKit三大套件,云原生推理套件性能提升2-3倍[27] 战略定位与行业影响 - 字节跳动将Agent视为继Web和APP之后的新一代技术主体[29] - AI有机会成为调度者,通过调用不同Agent和工具实现"all in one"开发[31] - 客户覆盖全球TOP10手机厂商中的9家、8成主流汽车品牌、70%系统重要性银行及超5成985高校[31] - 通过激进价格战略和技术创新,构建完整AI生态帝国,为Agent时代抢占制高点[33]
微软或迎来Copilot最大客户 单笔交易涉及百万账号
硬AI· 2025-06-11 02:11
微软Copilot潜在百万级客户 - 微软首席商务官透露一家拥有超100万Microsoft 365许可证的大客户拟增购Copilot服务 [1][2] - 若按当前30美元/用户/月定价计算,该交易或为微软带来年收入约3.6亿美元 [4] - 实际计费模式可能采用按用户数或使用量灵活调整,大客户或享受折扣 [4] 商业合作细节与行业影响 - 交易条款尚未最终确定,微软正探索AI产品商业化最优路径 [4] - 公司计划整合繁多的AI产品线以简化销售流程 [4] - 亚马逊因曾限制员工使用外部AI工具,被推测为潜在客户但可能性较低 [6][7] 微软财务与市场表现 - 最新财报显示云计算和AI服务需求强劲,公司被视为"稳定绿洲" [9] - 股价自4月低点累计上涨超30%,市值增长逾8000亿美元达3.48万亿美元 [9] - 机构评价微软具备AI变现能力,长期或成最大受益者之一 [9]
Meta自研AI不行,小扎急了!豪掷148亿美元收购Scale AI 49%股份
硬AI· 2025-06-11 02:11
Meta收购Scale AI交易分析 - Meta以148亿美元收购Scale AI 49%股份 交易完成后Scale AI估值从138亿美元飙升至280亿美元 成为史上最大规模私营公司融资交易之一 [1][2][4] - 交易结构设计为部分收购而非全资 旨在规避监管审查 因Meta正面临Instagram和WhatsApp收购的反垄断调查 [2] - Scale AI CEO Alexandr Wang将加入Meta并领导新实验室"超级智能" 这位28岁MIT辍学生是AI领域顶尖人才 [2] Scale AI公司概况 - Scale AI成立于2016年 专注AI训练数据标注服务 客户包括谷歌、微软、亚马逊、英伟达和OpenAI 覆盖70%市场AI模型构建 [4] - 2024年营收约8.7亿美元 预计今年突破20亿美元 但去年EBITDA亏损1.5亿美元 未达销售和利润目标 [4] - 公司与美国政府合作密切 今年3月签署数百万美元国防合同 与Meta在国防技术领域存在共同利益 [4] Meta的AI战略困境 - Llama 4大型语言模型表现不及预期 Behemoth模型发布一再推迟 引发开发者社区质疑 [6] - 人才流失严重 Llama首版论文14名作者仅剩3人留任 扎克伯格亲自招募50名AI专家 重组办公布局并举办私人招聘活动 [6][7] - Meta在底层AI模型和消费级应用均落后OpenAI等竞争对手 促使首次大规模依赖外部收购提升AI实力 [8] 行业竞争态势 - 科技巨头通过大额投资而非直接收购获取AI人才和技术 谷歌投资Character AI 微软押注Inflection AI [3] - AI军备竞赛白热化 交易反映扎克伯格既有焦虑又有野心 Meta急需弥补技术短板 [1][3]
一边“背刺”微软一边内卷:OpenAI被爆竟与谷歌云达成合作,o3降价80%
硬AI· 2025-06-11 02:11
行业动态 - OpenAI与谷歌达成云服务合作协议 谷歌云将为公司提供算力支持 双方此前已讨论数月 合作于5月敲定 [1][5][6] - 此前因OpenAI与微软的锁定协议 谷歌无法与OpenAI合作 今年1月前 微软一直是OpenAI独家云服务供应商 [1][8] - 行业竞争格局因算力需求发生改变 巨额计算成本正在重塑AI行业 公司间从竞争对手转变为合作伙伴 [5][6] 公司战略 - OpenAI采取多元化算力策略 除谷歌外 还与软银/甲骨文合作5000亿美元"星际之门"项目 预计到2030年将支持75%算力需求 [9] - 公司计划今年敲定首款自研芯片设计 减少对外部硬件依赖 [10] - 公司年度经常性收入达100亿美元 较去年55亿美元增长近翻倍 但所有收入都投入模型运行和开发 [6] 产品与定价 - OpenAI大幅降价80%推出推理模型o3 同时推出o3 Pro [2][3] - 今年1月DeepSeek发布高性价比开源模型后 OpenAI随即推出成本效益最高的o3-mini模型 并向免费用户开放 [3] - 降价策略被视为应对行业竞争加剧的措施 推动大模型领域"内卷" [3] 合作关系 - 微软不再担任OpenAI独家云供应商 但仍保留优先购买权 合作协议持续至2030年 [8] - 微软可独家转售OpenAI模型 并复用其知识产权 同时享有25%收入分成 [8] - 双方正重新谈判数十亿美元投资协议条款 包括微软未来股权份额 [8]
苹果WWDC:AI加持Siri尚需时日,向开发者开放基础模型,界面设计液态玻璃首秀
硬AI· 2025-06-10 06:42
苹果AI与开发者生态 - 苹果推出基础模型框架,允许第三方开发者将内置LLM直接集成到App中,基于Apple Intelligence开发[1][5][6] - 该框架现已开放开发者测试,7月开放公测版,包含引导式生成和工具调用等内置功能[8] - 开发者可通过Apple开发者计划和Beta软件计划获取该框架[8] 操作系统命名与设计更新 - 苹果简化操作系统命名方式,改以年份命名,如iOS 26、watchOS 26等[1][8] - 推出"液态玻璃"设计语言,应用于iPhone、Watch等设备生态系统,实现半透明自适应界面[1][9][11] - iOS迎来2013年以来首次重大设计更新,被称为"公司史上范围最广的新设计"[2][9] iOS 26功能更新 - 相机、照片、电话、FaceTime等核心App重新设计,菜单更精简[13][14][16][18] - CarPlay升级为CarPlay Ultra,支持自定义布局和车载控制功能[20] - 短信App新增群聊投票、发现金功能,未知发件人单独显示[20][21] - 新增游戏App,整合所有手机游戏功能[34][35] AI与智能功能 - 推出Genmoji功能,可组合创建新表情符[23] - 实现通话和视频实时翻译,Apple Music新增歌词翻译[25] - 强化图乐园功能,与ChatGPT深度集成[25] - Visual Intelligence支持搜索屏幕截图[37][38] 其他操作系统更新 - watchOS 26新增AI加持的Workout Buddy和实时翻译功能[41][42] - macOS Tahoe采用液态玻璃设计,新增智能操作和游戏优化[46][48][49] - visionOS 26增强空间感知和小工具自定义功能[51] - iPadOS 26改进多任务处理和窗口系统[52][53] 应用与服务更新 - 地图App新增"首选路线"和"已访问地点"功能[29] - 钱包App扩展车载功能和数字身份证支持[31] - Apple Pay新增积分兑换和订单追踪功能[33] - 音乐服务新增自动混音和置顶功能[27]
生数科技CEO骆怡航:从模型到生产,多模态AI如何推动视频创作更高效
硬AI· 2025-06-09 14:07
多模态大模型行业趋势 - 多模态大模型正处于规模化生产落地的关键拐点,技术迭代迅速,行业需求旺盛[1][5][6] - 视频生成技术需同时满足优质内容、百倍效率提升和成本大幅降低三大条件才能实现规模化落地[1][7][9] - 行业痛点包括传统内容生产周期长、成本高、专业软件依赖性强,多模态大模型可显著改善这些问题[7][9] 生数科技战略与产品布局 - 公司聚焦多模态生成领域,当前以视频生成为核心,未来将拓展至3D叙事空间等方向[3][9] - 目标覆盖8大行业(如互联网广告、动漫、电商等)和30大场景,已服务2000+企业客户[11][22] - 产品矩阵包括Vidu系列模型(1.5/2.0/Q1)及SaaS/MaaS平台,支持移动端和API接入[10][11] 技术突破与产品迭代 - Vidu 2.0实现5秒极速生成,Q1版本新增高清/首尾帧/动漫支持,并优化音效生成能力[3][11] - 模型能力持续升级:1.5版本提升多主体一致性,Q1版本在文生/图生领域登顶国内外榜单[10][13] - 全球覆盖200+国家和地区,拥有3000万创作者用户,日活跃用户生成数百万次创意内容[11][12] 商业化进展与案例 - 专业创作占比增长300%,企业客户增长150%,严格场景(广告/动漫/电商)应用占比达80%[4][22] - 典型案例包括:与飞鹤合作品牌广告(成本效率显著提升)、索尼电影水墨风宣传片(成本节省90%)[18][20] - 创作者案例:动漫作品《观察者悖论》观看量达300万次,效率较传统方式提升10倍[14][16] 行业应用价值 - 赋能内容生产全流程:从个人创作者(如60岁作家视频化著作)到企业级批量生产(飞书API集成)[16][18] - 在影视/广告领域实现突破:好莱坞动画工作室采用AI工作流,十天完成传统需一个月的预告片制作[20][21] - 核心价值主张:生产效率需提升百倍,生产成本需降至传统方式的1%以下以推动行业变革[7][9][22]
过去两个月暴涨70%,市值突破万亿,AI芯片火爆,但博通太贵了?
硬AI· 2025-06-09 14:07
博通的市场表现与估值 - 公司股价在过去两个月飙升70%,市值突破1万亿美元,成为美国第七大上市公司 [2] - 预期市盈率达33.6倍,较费城半导体行业指数溢价23%,接近十年最高溢价,较英伟达溢价13% [1][8] - 三季度AI处理和网络芯片收入预计达51亿美元,同比增长60%,占总销售额三分之一 [2] AI业务增长与客户集中风险 - 公司AI收入高度依赖谷歌,谷歌TPU订单占其AI收入的80%以上 [1][6] - 定制AI芯片业务从"副业"变为主要增长引擎,但客户多元化需等到2026财年下半年 [5][6] - 长期挑战在于市场有限性,定制AI芯片可能仅适用于财力雄厚的科技公司 [7] 性能、成本与市场竞争 - 谷歌定制AI芯片性能仅为英伟达产品的一半,勉强达到财务可行性门槛 [10] - 定制芯片配套系统(如光纤网络技术)成本高于英伟达的铜线系统,抵消部分成本优势 [10] - 面临英伟达、Marvell和联发科等厂商的竞争,市场份额被逐步蚕食 [11] 长期增长前景与行业预测 - AI浪潮的上升趋势将支撑公司需求,网络产品组合在AI集群扩展中处于有利位置 [13] - 2027财年预测AI销售额达450亿美元,若达到750亿美元目标中点,每股收益或增长13-14美元 [14] - 定制芯片市场规模预计从2023年的120亿美元增长至2027年的300亿美元 [14]