Serverless
搜索文档
宝通证券:港股周报:港股大跌,港股涨跌?-20251211
宝通证券· 2025-12-11 05:39
港股市场表现 - 恒生指数上涨106点或0.4%,收于25,540点[1] - 恒生科技指数上涨26点或0.5%,收于5,581点[1] - 港股大市全日成交总额为1,933.92亿元[1] A股市场表现 - 上证综指下跌9点或0.2%,收于3,900点,成交7,304亿元[1] - 深证成指上涨39点或0.3%,收于13,316点,成交1.05万亿元[1] - 中国人民银行进行1,898亿元逆回购,单日净投放1,105亿元[1] 美股市场与货币政策 - 道琼斯指数上涨497点或1.1%,收于48,057点[2] - 标普500指数上涨0.7%,收于6,886点[2] - 美联储宣布降息25个基点,联邦基金利率目标区间下调至3.5%-3.75%[2] - 香港金管局跟随降息,贴现窗基本利率下调25个基点至4%[2] 公司动态与行业数据 - 丘钛科技11月摄像头模组销量为4,175.5万件,环比下降11.9%,同比微升0.4%[3] - 舜宇光学科技11月手机镜头出货量1.19亿件,环比降2.3%,同比升7.5%;车载镜头出货量1,263.4万件,同比大幅增长69.4%[3]
阿里云 正式发布函数计算AgentRun
每日商报· 2025-12-10 22:21
阿里云发布AI基础设施平台 - 阿里云于12月10日正式发布一站式Agentic AI基础设施平台“函数计算AgentRun” [1] - 该平台将Serverless的极致弹性、零运维和按量付费特性与AI原生应用场景深度融合 [1] - 平台旨在助力企业优化成本与效率,平均TCO(总拥有成本)降低60% [1] 泡泡玛特董事会人事变动 - 泡泡玛特公告,何愚因其他工作安排辞任公司非执行董事,自2025年12月10日起生效 [2] - LVMH大中华区集团总裁吴越获委任为泡泡玛特非执行董事,自2025年12月10日起生效 [2] 瑞幸咖啡业务扩张 - 瑞幸咖啡近日在云南新成立了“瑞幸咖啡(云南)有限公司” [3] - 新公司法定代表人为夏伟,注册资本为1000万美元 [3] - 公司经营范围包括食品销售、食品生产、餐饮服务、茶叶制品生产等 [3] - 该公司由瑞幸咖啡商贸(香港)有限公司全资持股 [3]
阿里云正式发布函数计算AgentRun
证券时报网· 2025-12-10 09:39
人民财讯12月10日电,12月10日,阿里云正式发布函数计算AgentRun。这是一款以全球领先的函数计 算FC为技术底座的一站式Agentic AI基础设施平台。它将Serverless的极致弹性、零运维和按量付费的特 性与AI原生应用场景深度融合,助力企业实现成本与效率的极致优化,平均TCO降低60%。 ...
GMI Cloud:出海是AI企业释放产能、获取新生的最佳途径|WISE 2025
36氪· 2025-12-09 10:38
文章核心观点 - AI应用出海正经历范式革新,从单向技术输出转向算力、需求、价值的全球化与全球价值共振[8][43] - AI应用出海面临的核心挑战是模型推理服务的及时性、扩展性以及稳定性[2][18] - 北美等海外市场用户对AI应用接受度高,需求旺盛,出海成为中国AI公司释放产能、获取新生的最佳途径[8][15][16] - 作为AI原生云服务商,公司通过构建全球算力基础设施与进化推理架构,旨在解决AI出海的效能问题[6][11][14] 行业趋势与市场观察 - AI市场正处于指数级增长阶段,中国海外AI应用的月活用户持续攀升[15] - 90%以上的美国知识工作者已非常熟练地使用AI工具,中东及拉丁美洲的AI应用也达到较高水位,海外用户教育基本完成[15][16] - 国内SaaS市场高同质化、高获客成本,而出海市场存在极大的需求水位差[16] - 过去两年中国AI服务出海导致AI推理需求指数型暴涨[17] - AI技术栈迭代极快,例如从2025年1月到5月,因多节点系统推理爆发,Token价格从高位降至地板价[20] 公司业务与产品介绍 - 公司是英伟达首批六大Reference Cloud Partner之一,专注于出海AI基础设施[7][13] - 公司在全球多地(东亚、南亚、北美、欧洲、加拿大)建有自有机房[14] - 公司耗资5亿美元,在亚洲与英伟达共建了一座GB300万卡集群的AI Factory[14][21][22] - 公司拥有三大产品线:底层的计算硬件、集群管理、MaaS层的推理服务[14] 集群引擎产品特性 - 集群引擎是标准的IaaS层,覆盖底层硬件、裸金属及集群管理,并提供丰富的可监控性插件[27] - 支持类似AWS、GCP等海外大云的GPU workload功能[27] - 采用特殊化的IB组网技术,允许客户选择所需集群尺寸进行训练[27] - 支持多云架构,客户可在自有资源与传统大云资源间切换,以满足峰值扩缩容需求[27] 推理引擎产品特性 - 推理引擎是Serverless产品,集成了全球头部开源与闭源大模型,通过单一API即可访问[29][30] - 推理引擎2.0支持跨集群、跨地区的自动扩缩容,以应对流量峰值和优化不同地区用户体验[30][31] - 采用三层设计架构调度全球资源,根据工作负载对延迟或成本的敏感度,通过基于队列或负载均衡的调度方式分发至不同大区[31] - 推理引擎具备五大核心特征:全球化部署、二级调度架构、弹性伸缩、高可用设计、所有工作负载的统一管理[33][34][35][36] - 支持混合云,可统一纳管自建集群、公司自有集群及公有云上的工作负载与额度[37] 未来产品与行业展望 - 公司即将上线“GMI Studio”产品,用户无需本地环境,可通过云端拖拽方式自由组合最新AI模型及应用[39][40] - 2026年AI出海范式将升级为“全球价值共振”,即算力、技术、需求在全球范围内形成双向赋能生态[43] - 算力层将实现全球资源余缺互补,应用层的Token将从API调用计量演进为算力结算与生态激励的复合价值载体[43]
华为云联合工商银行落地金融业首个Serverless NPU弹性算力调度技术
新浪财经· 2025-12-02 12:56
合作与技术突破 - 华为与工商银行开展联合创新,成功落地Serverless NPU弹性算力调度技术方案 [1][3] - 该技术方案可将千亿参数MoE大模型推理服务启动时间缩短至百秒级 [1][3] - 相较于传统算力调度方案,新方案使启动效率提升10倍以上 [1][3] 商业模式转型 - 新技术方案实现算力供给模式从“长期绑定”向“按需使用”转型 [1][3]
Akamai Technologies Announces Acquisition of Function-as-a-Service Company Fermyon
Globenewswire· 2025-12-01 13:01
收购事件概述 - 阿卡迈技术公司于2025年12月1日宣布收购无服务器WebAssembly公司Fermyon [1] - 此次收购旨在结合Fermyon的云原生WebAssembly函数即服务能力与阿卡迈的全球分布式平台 [1] 战略与产品整合 - 收购将助力企业构建边缘原生应用,相比传统云原生应用,旨在提供更优性能和更低成本 [1] - 阿卡迈计划深化边缘函数平台与其性能和安全产品的整合,打造更快速、便捷且安全的边缘应用开发平台 [3] - 整合后的云计算平台旨在让开发者以更低成本构建和部署性能超越云原生应用的边缘应用 [3] 技术能力与市场定位 - 结合Fermyon的FaaS能力与阿卡迈的云,将使开发者更容易在边缘创新和执行轻量级代码 [2] - 随着阿卡迈将计算从核心数据中心扩展到互联网边缘,该技术将为开发者提供广泛的云原生和无服务器选项连续体 [2] - Fermyon是无服务器函数和WebAssembly领域的领导者,并活跃于开源社区 [2] 团队与开源承诺 - Fermyon的员工,包括联合创始人Matt Butcher和Radu Matei,将加入阿卡迈云技术集团 [2] - 阿卡迈将继续支持Fermyon维护的Spin和SpinKube云原生计算基金会开源项目,并继续其作为字节码联盟成员的活动 [2] - 该团队将继续倡导Fermyon的开源项目领导地位,并创建下一代无服务器技术 [2] 财务影响 - 阿卡迈预计此次交易不会对2025年公司财务指引产生重大影响 [4]
AI带来技术平权,数据库企业如何从中找商机?OB有新答案
南方都市报· 2025-11-19 03:28
公司战略与产品发布 - 公司推出并开源首款AI数据库seekdb,开发者仅需三行代码即可构建AI应用,实现百亿级多模数据的混合搜索[1] - 公司CEO强调将持续深化"Data×AI"战略,以"一体化"理念推进架构、存储与负载的全面融合[1] - 新产品seekdb支持向量、全文、标量及空间地理数据的统一混合搜索,深度融合AI推理与数据处理,并兼容30余种主流AI框架[5] - seekdb已在GitHub开源,商用LTS版本将于2026年2月2日推出,此举是践行"Data×AI"战略的关键一步[6] - 同期开源的PowerRAG智能文档解析框架与PowerMem分层记忆架构,后者在LOCOMO Benchmark上以73.70分登顶SOTA,Token消耗降低96%[12] AI技术趋势与行业影响 - AI让技术平权成为可能,未来对数据库的需求将出现数量级的增长,但AI场景的负载具有不确定性和突发性特点[1][3][5] - 混合搜索被认为是AI原生数据库的关键分水岭,未来数据库必须同时服务"人"与"智能体",在数据源头驱动实时、可信的智能[1][3] - 公司CTO认为技术发展会经历周期,但AI最终将全面改造软件生态,因此需要提前为AI布局[6] - 公司CEO指出一个技术要成熟需要很多"科技树"同时被点亮,基础设施问题的解决是AI规模化应用的前提[2][7] 全球化布局与市场表现 - 公司明确打造世界级数据库的目标,已启动"全球拓展计划"加速国际化布局[8][9] - 公司商业化以来全球客户数突破4000家,连续五年年均增速超100%,服务覆盖16个国家和地区、60多个地域、240多个可用区[8] - 企业出海成功的关键在于产品技术过硬、生态完善及有重要业务场景背书,本地化是当前重点[9][10] - 公司将加大全球开源投入,融入本地生态,并计划在组织、制度、基建等层面进行Global2.0升级[1][10][12]
为什么 Claude Code 放弃代码索引,使用 50 年前的 grep 技术?
程序员的那些事· 2025-09-25 02:53
文章核心观点 - Claude Code选择使用grep等无索引、实时搜索的方式,这一看似技术倒退的选择,实则是对Unix无状态设计哲学的现代传承,在性能上大幅超越了其他方案[5] - 无状态设计的核心优势在于通过放弃复杂的状态管理,获得更好的可组合性、可靠性和可扩展性,这在计算机科学历史上被反复证明[5] - 在AI时代,Claude Code的选择重新定义了“智能”工具的标准:真正稀缺的不是智能本身,而是可预测性、行为的确定性以及知道何时遗忘[54] 引言:一个看似倒退的选择 - 当主流AI编程助手采用向量索引实现语义搜索时,Claude Code选择了grep这个诞生于1973年的命令行工具,不建立持久代码索引,每次搜索实时执行[5] - 这一选择引发行业讨论,有观点认为这是“一步烂棋”,并质疑其grep-only方式会消耗过多tokens[3] 理解状态的本质 - 状态的本质区别在于:无状态计算的输出仅取决于当前输入(Output = f(Input)),而有状态计算的输出则同时依赖于输入和历史(Output = f(Input, History))[12] - 银行账户是有状态的典型例子,需要记住所有历史交易;而汇率转换是无状态的,只需当前汇率即可完成计算[9] 无状态思想的历史脉络 - 无状态思想可追溯至17世纪的数学函数,其确定性和可预测性成为无状态设计的理论基础[11] - 1973年Unix管道概念的提出将无状态思想带入实践,通过管道符号将多个无状态工具串联,每个工具只做一件事并做到极致,从而获得无限的组合可能[14][16] - 2000年REST架构将无状态作为核心约束,因其在分布式系统中显著降低了横向扩容的复杂度[20][22] - Serverless架构(如2014年的Lambda)通过强制无状态的编程模型,换取运维的简单性和成本的弹性[23][25] 无状态设计的优势 - 可组合性:无状态组件像乐高积木,可通过自由组合解决不同问题,每个新需求只需在已有组合上微调,无需重写整个程序[30][31] - 并行自然性:无状态设计让并行变得简单高效,例如16个CPU核心可独立工作,将搜索任务从42秒缩短至3.8秒,实现10倍性能提升[32][34] - 简单性:无状态服务无需复杂的生命周期管理(如启动准备、关闭清理、崩溃恢复),降低了开发复杂度和系统可靠性风险[35] - 可测试性:无状态函数具有确定性,相同输入永远产生相同输出,测试时无需准备环境或清理状态,排错更简单[35] 现实的权衡 - 某些场景状态是必需品,如游戏世界需要持续性、用户界面需要响应性、资源管理需要经济性[39][41] - 判断标准是:如果系统崩溃重启,用户能接受从零开始则为无状态,否则为有状态[41] - 现实系统通常采用混合策略,最常见的是无状态计算与有状态存储结合,如无状态API服务器搭配有状态数据库[43][44][45] - 核心洞察是:选择无状态或有状态是工程权衡的艺术,状态本身并非问题,无管理的状态才是问题根源[47] AI时代的新思考 - Claude Code的“agentic search”方案在性能测试中大幅超越了RAG(向量索引)等其他方案[49] - 其优势包括零配置自由(立即可用,支持管道组合)、确定性价值(行为完全可预测)、隐私根本保障(完全本地执行,架构上杜绝泄露)以及维护零成本(无索引卡住或缓存损坏问题)[50][51] - 不同技术方案有各自适用场景:Cursor向量索引适合创意编程和探索代码库;JetBrains传统索引适合企业级开发;Claude Code无索引方案则适合重视简单、可控、可组合的场景[52][53] - 在AI时代,无状态设计的意义在于重新思考智能工具的标准,强调可预测性和行为确定性比单纯的记忆更重要[54]
云上技术服务方案和实践
阿里云· 2025-09-22 05:42
**报告行业投资评级** - 该报告未明确提供行业投资评级 [1][18] **报告的核心观点** - 游戏行业已发展成融合技术、艺术与人文的庞大生态系统,技术革新与架构突破是产业飞跃的关键 [4] - 游戏开发与运维面临复杂性指数级增长,需系统化解决方案应对高效稳定架构、千万级玩家体验及数据价值挖掘等挑战 [4] - 阿里云提供全链条技术方案,覆盖游戏架构、网络优化、安全防护、数据管理及AI美术创新,助力行业构建稳定、安全且具创意的游戏世界 [5][16] **根据相关目录分别进行总结** 游戏架构 - 游戏分类基于运行平台(端游、主机、手游、页游、云游戏、VR/AR)和玩法类型(MMORPG、SLG、MOBA等),不同类别对架构设计、资源需求及网络延迟要求差异显著 [20][55][60] - 游戏架构涵盖系统架构(玩法逻辑与内容设计)、技术架构(服务端、客户端、数据处理及网络通信)和部署架构(全球分布式部署),需综合考虑延迟要求、数据合规性、扩展性及成本效益 [21][54][80][95] - MMORPG强调分布式服务器架构与全球低延迟同步 [101][105];SLG侧重集中部署与数据合规 [110][113];MOBA要求极低延迟与高实时交互 [117][120];放置经营类注重异步设计与经济系统稳定性 [124][126] 游戏网络 - 网络需满足实时性(MOBA延迟<100ms)、可靠性(99.99%可用性)及扩展性(分钟级扩容)三大基础特性 [127] - 节点选型策略基于用户区域分布:国内全局服延迟要求100ms以内(上海/杭州),海外全局服200ms以内(新加坡/香港/美西) [129][133] - 网络拓扑采用多活架构(同城双活+异地灾备)、分层设计(接入层-逻辑层-数据层)及弹性带宽预留(20%~30%冗余),结合全球加速(GA)、CEN组网及智能运维工具(Terraform)提升体验与运维效率 [135][136][139][143] 游戏安全 - 安全架构需应对三类挑战:业务主机直接暴露公网端口、集群暴露四层/七层接口 [27] - 防御体系包括高冗余水位防护、高可用容灾、全链路多重防护及可用性监控 [28] - 重保实践涵盖防护能力梳理、配置巡检、监控告警及应急预案演练 [29] 游戏下载 - 高可用架构采用多CDN厂商+主备源站、OSS源站高可用及CDN缓存优化方案 [30] - 安全防护聚焦OSS安全策略与防篡改机制 [30] - 运维监控通过客户端/服务端埋点日志及监控告警实现,容灾预案包括限流与质量预案,活动准备涉及CDN/OSS资源报备及预热 [31] 游戏数据库 - 灾难类型包括资源生命周期问题、实例误操作、错误配置及数据删除 [32] - 恢复原理分实例层级(整体恢复)和SQL层级(细粒度数据恢复) [33] - 规避方案涵盖账号/实例维度管控、权限限制、定期备份、云产品高频备份及跨地域灾备 [35][36] 游戏大数据 - 运营场景依赖实时湖仓架构(云原生或开源生态)及Flink等工具挖掘玩家行为数据 [38] - 常见问题包括Flink高频问题、数据备份及产品容灾能力 [39] 游戏美术 - AIGC可提升美术效率(通义系列辅助创意与个性化设计)但存在创造力局限、质量控制及版权问题 [42][45] - 美术设计阶段涵盖角色、场景、UI/UX、特效及后期合成 [40] 游戏内容审核 - 审核方法包括人工、自动化及混合式(人机协作),面临语境复杂性、模型偏见、对抗攻击等挑战 [46] - UGC安全审核需解决业务痛点并通过技术方案实现合规与效率提升 [47][50] 游戏行业展望 - 技术演进从"基建时代"(本地化到互联网化)到"智能运营时代"(云原生驱动),未来将进入"虚实共生时代"(全面云化、AI深度融合、UGC 3.0及元宇宙入口) [51][52]
Agent应用爆发,谁成为向上托举的力量?
36氪· 2025-08-06 10:31
AI Agent发展现状 - AI Agent正从被动响应迈向主动决策 成为连接数字世界与物理世界的核心枢纽 [1] - 具备推理、规划、记忆与工具使用能力的智能体正在重塑产业形态 涵盖企业Agent、学术Agent和个人Agent [1] - 2025年AI Agentic基础设施迎来爆发拐点 开源大模型突破提供认知"大脑" 模型上下文协议生态繁荣赋予灵活"四肢" [1] - 全球80%企业将在年内部署Agent 大脑与四肢的协同进化倒逼基础设施全面升级 [1] 企业应用痛点 - 早期RPA产品只能自动化简单单一工作流程 不具备真正智能且不能解决复合化复杂问题 [3][4] - 生成式AI出现后真正具备智能的Agent应用带来效率提升 但网页或App形式不适合专业开发者与企业用户 [5] - 本地部署面临五大核心痛点:AI推理算力限制、任务执行算力弹性不足、工具配置复杂、权限冲突问题、安全性差 [5][6][7][8][9] - 消费级设备无法部署高精度大模型 云端算力成为主流方案但存在弹性扩展难题 [6] - 超过43%的MCP服务节点存在未经验证Shell调用路径 83%部署存在配置漏洞 88%AI组件未启用防护机制 [9] - Agent缺乏长期记忆影响业务使用范围 语义记忆和场景记忆缺失限制任务完成能力 [10] 基础设施解决方案 - 云厂商竞相推出新一代Agent Infra架构:AWS AgentCore解决长时执行与状态记录 Azure AI Foundry集成Serverless计算 Google Vertex AI优化长时运行需求 [12] - 阿里云函数计算Function AI提供自主选择模型与工具的组装式设计 PPIO推出国内首个Agentic AI基础设施服务平台 [13] - 新一代基础设施聚焦长时运行、会话亲和、会话隔离、企业级IAM和VPC及模型框架开放等技术突破 [18] - 突破传统Serverless执行时长限制(如AWS Lambda15分钟上限)支持数分钟至数小时连续工具调用 [18][19] - 通过状态持久化、冷启动优化和开放集成解决LLM Agent持续推理、Workflow Agent状态流转和Custom Agent灵活定制需求 [22] - 开发范式从手动拼凑传统组件转向利用原生Infra实现高效安全可扩展的开发部署 [23] 市场机遇与发展趋势 - Agent Infra成为模型公司、云厂商和初创公司积极拓展领域 创业公司存在显著机会 [24] - 机会存在于现有Infra的AI-native需求环节 包括更快冷启动速度、更强隔离性及更好的AI workflow结合 [24] - 易用性高且价格合理的Infra产品有望被广泛采用 因Agent开发追求研发投入ROI [24] - 基础设施持续创新推动Agent生态共建 使开发变得像组装乐高积木一样便捷 [24]