小熊跑的快
搜索文档
llya 发言评述
小熊跑的快· 2025-12-02 07:12
AI行业发展阶段划分 - AI发展正从以算力规模化为核心的时代回归到以基础研究为驱动的时代[1] - 2012-2020年为研究时代:以AlexNet、ResNet、Transformer等新架构突破为特征[2] - 2020-2025年为规模时代:GPT-3和Scaling Laws的出现使行业聚焦算力、数据和模型规模的扩大[2] - 2025年后为回归研究时代:规模扩张的边际效益递减,需要新的基础研究突破[2] 当前技术瓶颈与研究方向 - 算力目前相对充裕,而高质量训练数据成为主要限制因素[2] - 单纯扩大模型规模的策略正在失效,需要重新思考研究方法论[2] - 强化学习和基于打分的训练方法可能产生缺乏泛化能力的"答题机器"[3] - 价值函数在决策指引中具有重要作用,人类情绪被视为有效的价值函数系统[3] 新兴AI发展理念 - 提出研发具备自我学习成长能力的"新智能"系统,类比十五岁少年的学习能力[3] - SSI公司专注于研究和对齐技术,唯一目标是研发安全的超级智能[4] - SSI致力于打造具备人类好奇心和长远规划能力的AI系统[4] - 公司采取"研究优先"路线,暂不考虑商业化和盈利[4] 行业需求与市场前景 - 文本领域大模型发展遇到瓶颈,与训练数据耗尽有关[4] - 训练算力需求占比不足50%,推理需求占据主要部分[4] - Google云纯推理API收入预计达30亿美元[4] - AI硬件租赁市场规模达90亿美元,API收入预计翻倍增长[4] - IaaS租赁市场预期保持40-46%的高速增长[4] - 推理需求将成为未来AI计算的主要增长动力[4]
Ai端侧
小熊跑的快· 2025-12-01 13:41
行业趋势:AI端侧应用成为明确发展方向 - 行业普遍认为AI端侧是重要趋势,特别在迭代几次、精度提升后,完成C端客户指令的准度能上升到99%,将带来下一次AI智能体入口价值的重估 [4] - 相信未来的手机厂商,如OPPO、小米等,都会跟进AI端侧的发展 [6] 公司动态:字节跳动即将发布多款AI端侧产品 - 字节跳动计划在12月18日的“原动力大会”上发布多个AI端侧产品,包括AI手机、AI眼镜、AI耳钉、AI手环和AI戒指 [2][3] - 公司内部将这些产品视为“打个样”,对具体销量不确定,但坚信这是趋势所在 [4] - 公司推出的“豆包手机助手”产品显示货源有限,已出现售罄,需通过预约申请F码进行购买 [8][9] 产品与技术:AI端侧实现方案与功能 - 即将发布的AI手机未改动操作系统,主要通过软件优化,利用智能体实现一些应用方案功能 [3] - AI端侧应用的实现需要授权,以进行跨APP调用并提供解决方案,其功能类似ChatGPT的搜索功能,但需授权 [6] - “豆包”与各种终端结合的策略,旨在争夺端口价值,预计未来会有越来越多的APP嵌入并调用其背后的智能体 [7] 市场与验证:AI端侧商业化取得初步进展 - 海外运营的Robotaxi(自动驾驶出租车)已实现单车UE(单位经济模型)转正,意味着单车不再亏钱 [2]
领先市场太多 也很苦恼
小熊跑的快· 2025-11-26 03:45
投资策略复盘 - 2025年10月投资组合加权胜率为37.09%,加权超额收益为-2.77% [1] - 腾景科技在10月9日至10月14日的4天持有期内产生区间超额收益-12.36%,调整后贡献为-0.98% [1] - 腾景科技在9月23日至9月30日的6天持有期内产生区间超额收益-19.59%,调整后贡献为-2.29% [1] 行业趋势判断 - 8月初识别出Google及其产业链("谷链")的投资机会 [2] - 市场在约一个半月后开始反应Google产业链的上涨行情,但此时股价已充分上涨 [2] - 当前看好AI应用落地领域的投资机会,预计市场可能需要至少一个月时间才能反应 [5] 市场反应时效性 - 投资建议领先市场约两周被认为是较理想的时间窗口 [4] - 过度领先的市场判断可能导致短期内难以获得市场认同 [4]
阿里云继续 大幅上涨
小熊跑的快· 2025-11-25 11:54
云计算业务表现 - 第二财季云计算收入同比增长34%,略超市场预期的380亿元人民币 [1] - 人工智能相关产品收入连续第九个季度实现三位数同比增长 [1] - 阿里云EBITDA利润率为9.0%,高于彭博预期的8.7%,较上季度的8.8%环比提升0.2个百分点 [2] 公司整体财务状况 - 公司整体营收同比增长4.8%,达到2478亿元人民币(348亿美元) [1] - 阿里巴巴中国电子商务集团营收同比增长16% [1] - 调整后EBITA同比下降78%至91亿元人民币,部分归因于在快速商务领域的投资 [2] - 整体毛利率同比从15%降至2%,上个财季为15% [2] - 经调整EBITDA利润率同比从20%降至7%,上个季度为21% [2] 资本支出与战略投资 - 公司在人工智能和云基础设施方面已投入约1200亿元人民币的资本支出 [2] - 第三财季资本开支为315.01亿元人民币,同比增长80.1%,环比下降18.6% [2] - 资本支出受三方面因素影响:H20芯片采购受限、自研平头哥芯片于6月开始回片并处于产能爬坡期、上季度因一次性确定某些租赁设施导致超额增长 [2][3]
跌的有点…
小熊跑的快· 2025-11-20 23:41
市场整体表现 - 市场指数大幅下跌486.18点,跌幅达2.15%,收盘于22564.23点 [1] - 当日开盘价为23057.00点,最高价23147.33点,最低价22043.20点,波动幅度较大 [1] - 今年以来市场指数已下跌14.33% [1] 个股表现分化 - 传统大型科技股如谷歌、台积电、苹果、微软表现相对稳定 [3] - 高杠杆或投机性较强的股票出现大幅下跌,例如SMR、OKLO、HOOD、SNDK等 [3] 市场流动性状况 - 市场出现流动性紧缩的迹象,并呈现蔓延趋势 [4]
nv+
小熊跑的快· 2025-11-20 14:21
财务业绩表现 - FY26Q3(即2025年第三季度)实现收入570.06亿美元,同比增长62%,环比增长22%,超出市场预期的551亿美元 [1] - FY26Q3实现净利润319.10亿美元,同比增长65%,环比增长21%,超出市场预期的297亿美元 [1] - FY26Q3每股收益(EPS)为1.30美元,同比增长67%,环比增长20%,超出市场预期的1.26美元 [1] - FY26Q3实现毛利率73.4%,超出上季度指引的72.4% [4] - 公司指引FY26Q4毛利率为74.8%,显示毛利率持续提升趋势 [4] - 公司预计FY26Q4收入为650亿美元,同比增长65%,环比增长14%,超出市场预期的616亿美元 [3] 终端市场收入表现 - 数据中心业务是核心增长引擎,FY26Q3数据中心收入为430.28亿美元,同比增长56%,环比增长57%,超出市场预期的416.46亿美元 [3] - 游戏业务FY26Q3实现收入42.65亿美元,低于市场预期的44.25亿美元 [3] - 自动驾驶业务FY26Q3实现收入5.92亿美元,低于市场预期的6.22亿美元 [3] - 专业可视化业务FY26Q3收入为4.54亿美元,汽车业务收入为3.46亿美元,OEM及其他业务收入为0.88亿美元 [2] 数据中心业务细分 - 计算(Compute)业务FY26Q3收入430.28亿美元,其中GB300量产爬坡,本季度GB300营收超过GB200,贡献了约2/3的Blackwell收入 [3] - Hopper平台本季度收入20亿美元,H20产品收入5000万美元,但国内市场未采购H20 [3] - 网络(Network)业务FY26Q3收入81.87亿美元,超出市场预期的77.46亿美元,主要受益于NVLink规模化应用以及Spectrum X和Quantum X营收双位数增长 [3] - 公司预计从2025年初至2026年底,Blackwell和Rubin平台将实现5000亿美元收入,未来还有进一步增长空间 [3] 技术平台与供应链 - Rubin平台按计划于2026年下半年量产爬坡,目前已从供应链伙伴获得芯片,正在推进产品调试工作 [3] - 公司供应链涵盖全球所有科技公司,包括台积电(负责封装)、内存供应商、系统原始设计制造商等,均已进行良好规划 [5] - 公司架构在总拥有成本(TCO)方面具有最佳性能,在每瓦性能方面处于领先地位 [5] - 公司认为信息技术行业正经历三大范式转移:加速计算技术普及、生成式AI崛起、具备自主行为能力的物理AI演进 [5] 行业前景与预测 - 至2030年,全球AI基建规模预计将达到3-4万亿美元 [3] - AI投资并未出现泡沫,三大范式转移将在未来几年推动基础设施增长 [5] - AI行业内部继续分化,格局好的公司进一步提升议价权,推动毛利率提升 [5]
Gemini3 正式发布
小熊跑的快· 2025-11-19 00:09
产品发布与定位 - 谷歌于2025年11月19日正式发布Gemini 3,定位为当前全球最强大的多模态理解模型、智能体模型及“vibe coding”模型 [1] - 公司推出了Gemini 3 Pro预览版以及增强推理模式Gemini 3 Deep Think,后者将优先提供给安全测试人员,随后面向Google AI Ultra订阅用户开放 [1] - 该产品是谷歌在推动模型智能加速方面的最新成果,并同步发布了全新的智能体开发平台Google Antigravity [8] 核心性能表现 - Gemini 3以1501 Elo得分位居LMArena排行榜首位,并在Humanity's Last Exam上取得博士水平的推理表现,得分37.5% [1] - 在数学能力上,模型在MathArena Apex取得23.4%的最新最优成绩,在AIME 2025上不使用工具得分95.0%,使用代码执行可达100% [1][3] - 在多模态推理方面,Gemini 3 Pro在MMMU-Pro上成绩为81.0%,在Video-MMMU上成绩为87.6%,重新定义了行业标准 [2][3] - 在事实准确性方面,模型在SimpleQA Verified上取得72.1%的业界领先成绩 [2][3] Deep Think模式增强 - Gemini 3 Deep Think模式进一步提升了模型性能,在Humanity's Last Exam上成绩提升至41.0%,在GPQA Diamond上达到93.8% [4] - 该模式在ARC-AGI-2上使用代码执行取得45.1%的成绩,显示出在推理与多模态理解方面的飞跃式提升 [4] 智能体与编码能力 - Gemini 3是公司最出色的vibe coding和agentic coding模型,以1487 Elo成绩登顶WebDev Arena排行榜 [8] - 在Terminal-Bench 2.0测试中模型获得54.2%的成绩,在SWE-bench Verified上达到76.2% [3][8] - 在长周期智能体任务中,Gemini 3 Pro在Vending-Bench 2测试中平均净值为5,478.16美元,显著高于竞争对手 [3] - 模型在LiveCodeBench Pro上的Elo评级达到2,439,显示出强大的竞争性编程问题解决能力 [3] 多模态与上下文能力 - Gemini 3设计用于跨文本、图像、视频、音频和代码多种模态,具备100万tokens的上下文窗口 [6] - 模型在长上下文性能测试MRCR v2 (8-needle)中,128k上下文平均成绩为77.0%,1M上下文点状成绩为26.3% [3] - 在多语言能力方面,模型在MMLU上取得91.8%的成绩,在Global PIQA上达到93.4% [3] 平台集成与应用场景 - 用户可在Google AI Studio、Vertex AI、Gemini CLI及新平台Google Antigravity中使用Gemini 3,该模型也已集成至Cursor、GitHub、JetBrains等第三方平台 [8] - Google Antigravity平台深度集成Gemini 3 Pro、Gemini 2.5 Computer Use及Nano Banana图像编辑模型,将AI提升为主动合作伙伴 [9][10] - 搜索中的AI模式现已使用Gemini 3,能根据搜索查询实时生成沉浸式视觉排版、交互式工具和模拟器 [7] - 模型具备实际任务处理能力,例如分析运动视频生成训练计划、整理邮箱、预订本地服务等复杂多步骤流程 [7][10]
gemini3 流出版?
小熊跑的快· 2025-11-18 12:22
模型评估方法 - 评估方法涵盖推理、多模态能力、智能体工具使用、多语言性能和长上下文处理等多个基准测试[2] - 详细的基准测试方法、结果和方法论可在指定网站获取[2] 核心性能表现 - 在学术推理测试Humanity's Last Exam中得分37.5%,显著高于Gemini 2.5 Pro的21.6%[2] - 视觉推理测试ARC-AGI-2得分31.1%,远超Gemini 2.5 Pro的4.9%[2] - 科学知识测试GPQA Diamond得分91.9%,优于Gemini 2.5 Pro的86.4%[2] - 数学测试AIME 2025无工具条件下得分95%,使用代码执行后达到100%[2] - 挑战性数学竞赛MathArena Apex得分23.4%,显著高于Gemini 2.5 Pro的0.5%[2] - 多模态理解测试MMMU-Pro得分81%,优于Gemini 2.5 Pro的68%[2] - 屏幕理解测试ScreenSpot-Pro得分72.7%,远超Gemini 2.5 Pro的11.4%[2] - 复杂图表信息合成测试CharXiv Reasoning得分81.4%[2] - 视频知识获取测试Video-MMMU得分87.6%[2] - 长上下文测试MRCR v2在128k平均得分77%,在1M点对点得分26.3%[2] 编程与智能体能力 - 竞争性编程测试LiveCodeBench Pro获得2439 Elo评分,显著高于Gemini 2.5 Pro的1775[2] - 终端编码测试Terminal-Bench 2.0得分54.2%[2] - 智能体编码测试SWE-Bench Verified得分76.2%[2] - 智能体工具使用测试t2-bench得分85.4%[2] - 长视野智能体任务Vending-Bench 2平均净值5478.16美元[2] 知识检索与多语言能力 - 内部基础测试FACTS Benchmark Suite得分70.5%[2] - 参数化知识测试SimpleQA Verified得分72.1%[2] - 多语言问答测试MMMLU得分91.8%[2] - 跨语言文化常识推理测试Global PIQA得分93.4%[2] 市场评价与预期 - 测评人员对模型给予极高评价[7] - 具体点评预计在两周内发布[8]
昨晚三杀
小熊跑的快· 2025-11-18 01:32
降息对融资成本的影响 - 当前融资成本已达8.3%的高位[3] - 降息是降低融资成本的必要条件[3] 降息对特定行业及公司的影响 - 降息对黄金产生直接影响[2] - 降息对AI行业产生间接影响[3] - 甲骨文和Coreweave等公司高度依赖融资维持运营[3]
阿里Qwen 屠版,应用大涨
小熊跑的快· 2025-11-17 03:46
阿里巴巴AI战略与千问APP发布 - 公司于11月17日正式宣布“千问”项目,全力进军AI to C市场,核心管理层将其视为“AI时代的未来之战”[1] - 千问APP公测版上线,基于全球性能第一的开源模型Qwen3,凭借免费策略和与生活场景生态的结合,与ChatGPT展开全面竞争[1][12] - 公司计划将地图、外卖、订票、办公、学习、购物、健康等各类生活场景接入千问APP,战略目标是打造未来的AI生活入口[3] 产品定位与市场拓展 - 千问APP定位为“会聊天能办事的个人AI助手”,已上架各大应用商店并提供网页和PC版,面向全球市场的国际版也将在近期上线[3] - 与ChatGPT付费计划(每月20美元)相比,千问APP凭借免费优势直接争夺海外用户[12] - 公司通过两大核心路径实施AI战略:通义千问坚持开源开放路线,致力于打造“AI时代的Android”;构建作为“下一代计算机”的超级AI云[10] 技术实力与模型性能 - 通义千问Qwen稳居全球AI大模型第一梯队,超1T参数的旗舰模型Qwen3-Max性能超过GPT5、Claude Opus 4等,跻身权威LMArena榜单全球前三[11] - Qwen3-Max-Thinking推理模型斩获数学推理双满分,为国内首个;下一代架构Qwen3-Next训练成本较密集模型大降超90%,长文本推理吞吐量提升10倍以上[11] - 在HuggingFace发布的模型榜单中,全球前十的模型中有7个来自通义,阿里千问Qwen实现“屠榜”[11] 资本投入与市场反应 - 公司今年2月宣布计划投入3800亿元建设AI基础设施,CEO吴泳铭公布向“超级人工智能”迈进的长期目标,预计到2032年阿里云全球数据中心能耗规模是现在的10倍[9] - 受千问APP发布消息刺激,AI应用板块大涨,多只相关股票出现显著涨幅,例如宣亚国际上涨19.99%,海峡创新上涨16.64%[5][7] - 阿里巴巴股价自年初上涨超过87%,AI领域的连续布局引发资本市场价值重估[9] 行业影响与生态合作 - 千问APP的发布带动了政务、金融、烟草、游戏、电商等行业IT厂商上涨,也包含了IDC和网安合作商上涨[8] - 公司成为国内唯一具备软硬一体、垂直整合能力的全栈AI公司,阿里云是亚太第一云计算公司,为AI研发提供坚实底座[8] - 千问Qwen模型已成为开发者口中的“源神”,也是最受企业欢迎的模型,显示出强大的开源生态影响力[8][12]