Workflow
Agent Infra
icon
搜索文档
AI版街边游戏,重塑中国烟火气
36氪· 2025-12-17 03:30
核心观点 - AI技术正以多种“接地气”的应用形式渗透并改造中国的“地摊经济”或线下小微商业场景,其核心价值在于通过个性化、趣味性和低门槛的解决方案,为传统街头商业增添新活力并创造新的消费体验 [1][4][23] AI在街头巷尾的具体应用案例 - **AI调香**:在集市展会上,通过小程序嵌入文心大模型,用户输入姓名和MBTI人格即可生成专属香水配方,旨在提供个性化、有趣的体验,目前用于试错并验证需求 [2][4] - **AI手串**:在北京潘家园古玩市场,摊贩通过植入NFC芯片的珠子,让顾客用手机触碰即可根据姓名和方位接收每日运气,已售出1万多个 [5][9] - **AI台球**:在广东出现,通过在球桌上方安装投影仪和摄像头,利用算法识别并投影进球路线,辅助练习,收费为每小时40-50元起步 [6][9] - **AI象棋/五子棋**:在广东街头出现,使用机械臂与人对弈,成人收费5元/盘,儿童免费 [8][9] - **AI理发**:理发店尝试利用大模型(如千问)通过视频通话分析用户头型并推荐发型 [8] AI地摊经济的商业模式与创业成本 - **加盟模式(高成本)**:创业者通过加盟垂类大模型公司(如AI台球、AI KTV)的产品进入市场,前期投入需数十万元起,盈利受地理位置、经营能力和消费者新鲜感持续时间影响 [11][12] - **硬件零售模式(低成本)**:创业者购买现成的AI智能硬件(如AI象棋机器人,价格在500至2000多元不等)进行小成本创业,盈利同样依赖客流和新鲜感 [13] - **自开发模式(低门槛)**:无编码基础的创业者利用傻瓜型AI开发工具(如秒哒、京东云JoyBuilder、字节扣子、阿里Dify等)快速搭建应用,大幅降低了开发成本,例如AI调香小程序的开发无需专业程序员 [16][17] 行业技术基础与发展阶段 - **基础大模型基建完成**:中国已拥有众多参数超1000亿的基础大模型,为垂类模型和应用提供了肥沃土壤 [11] - **进入AI Agent基建(Agent Infra)阶段**:行业正从大模型基建迈向AI Agent基建和智能体应用时代,这是当前AI地摊经济涌现的技术背景 [20] - **Agent协作支撑应用**:复杂的AI应用(如AI调香小程序、数字人直播)背后由多个专业智能体(如需求分析、开发执行、测试优化)协作完成,实现了无需专业开发者的快速搭建 [20][21] - **大厂发力Agent基础设施**:为保障智能体运行稳定、低价,阿里云推出了无影AgentBay,腾讯云推出了Agent Runtime等Agent Infra基础设施 [22]
PPIO姚欣:AI正在进入自主行动与创造时代,智能体需要全新的操作系统|MEET2026
量子位· 2025-12-15 10:33
AI行业趋势:迈向Agentic AI时代 - AI行业正从生成式AI迈向自主执行和创造的Agentic AI时代,这被视为真正的落地元年,正在改变应用形态并重塑AI技术栈的底层逻辑[1] - 未来的AI应用将从回答问题的工具转向能够直接完成任务的助手,行业迫切需要一种新的基础设施——Agent时代的操作系统[2] - 智能体将成为未来AI应用的主力,而Agent Infra将成为下一个AI时代的操作系统,其核心目标是通过新的Runtime体系,实现模型能力、工具能力与执行能力的高度融合[3] 智能体的定义与演进 - 行业正从Generative AI向Agent AI进步,标志性产品如豆包手机能够自动下单、比价比价和执行任务,展示了AI应用像智能体一样自动化完成任务和进行创作[8] - 当前行业内许多人将智能体定位为工作流,但早期的编排工具(如扣子)或具备Deep Research功能的AI工具只是智能体的早期形态,并非完全体[9][10][11] - 真正的完全态智能体需要具备自主分析、自主决策以及自动化完成任务的能力,其核心在于执行与落地环节[11] - 真正的智能体需要从能力堆叠走向系统化结构,它需要全新的架构和形态,不能依赖旧式应用或工作流体系[12][13] 智能体的核心架构与组件 - 根据OpenAI研究员的论文,真正的智能体包含四个核心组件:记忆、规划、工具和行动[14][15] - 在数字生命体类比中,记忆类似于大脑的记忆功能,负责短期和长期记忆;规划更像思考单元,负责深度推理和分析;工具和行动则类似于感知和影响外部世界的五官与手脚[17] - 真正的智能体是一个具备从思考到执行再到分析的综合系统,而不仅仅是执行机器[17] Agent Infra:AI时代的操作系统 - 智能体的基础设施更像操作系统,它是管理异构资源、抽象标准化功能调用的核心中间层,这一角色在PC、移动和云时代都未改变[18][21][22] - Agent Infra本质上是构建AI时代的操作系统,它管理的资源是模型能力、工具调用能力以及任务和执行能力,并完成资源管理、统一调度与抽象,以方便上层应用构建[23] - 在整个Agent Infra体系中,最核心的部分是Runtime,它解决智能体“能否跑起来”的问题,确保其能在各种环境下大规模、通用地适配并稳定运行[24] PPIO的实践与产品 - PPIO是一家AI云计算公司,构建了从底层算力到IaaS、PaaS、MaaS的完整AI云能力,为Agent Infra提供底座支撑[26] - 在算力网络层面,公司整合了大量数据中心闲置算力,在中国拥有4000多个算力节点和1300多个合作伙伴,并在2024年将算力网络部署扩展至全球六大洲三十多个地区和国家[28] - 在GPU推理云平台层面,公司于2023年打造了第一代推理云平台,2024年推出分布式推理引擎,托管近百个开源与社区模型,每天处理接近2000亿Token[28] - 公司发布了首个兼容E2B的Agent沙箱,这是一个专为Agent执行任务设计的云端运行环境,以Runtime为核心整合了模型调用、记忆和数据库能力[28][29] - PPIO Agent沙箱基于Firecracker MicroVM构建,具备强安全隔离、毫秒级极速启动(小于200毫秒)、高并发创建(可同时快速启动数千个实例)三大特性[31] - 该沙箱支持动态调用多种工具,旨在为Agent赋予安全可靠、高效敏捷的“手和脚”,并通过安全隔离环境帮助降低错误率,自上线以来月度活跃数持续增长[29][31][32]
Agent 正在终结云计算“流水线”,Infra 必须学会“思考” | 专访无问芯穹夏立雪
AI前线· 2025-12-02 04:28
基础设施范式转变 - 基础设施演进正从AI Infra走向Agent Infra乃至Agentic Infra,成为推动智能体规模化落地的关键力量[2] - 范式从“处理”转变为“思考”,基础设施需从“生产线工厂”转变为“解决方案公司”,为Agent的整体产出质量提供系统性支撑[3] - 基础设施需具备智能性,能够保障Agent执行任务的质量,协调连续且相互关联的多任务协作[3][4] Agent Infra 核心升级维度 - 运行环境需灵活适配Agent的执行方式,环境的沙盒化与灵活调度能力尤为关键[4] - 为Agent配备完善的工具,使其能够有效调用资源[4] - 提供精准而充分的上下文信息,确保任务理解与执行的一致性[4] - 通过安全与监控机制,保障整个任务过程的可控性与可观测性[4] Agentic Infra 的演进与目标 - Agent Infra是第一阶段,旨在让算法能力被更好地发挥,推动智能体走出实验室环境,帮助Agent从演示品走向生产力[9] - Agentic Infra是第二阶段,重点构建能更好支持下一代AI进化与规模化落地的基础设施,推动智能体深度参与基础设施的核心工作流[10] - 目标是实现从“将智能体视为工具”到“将智能体视为协作者”的范式转变,构建支撑智能体高效、稳定、低成本协作与进化的基础设施新形态[10] 当前Agent发展的核心问题与瓶颈 - 模型能力已经相当出色,但配套给Agent的基础设施服务与工具尚不成熟,瓶颈不在模型本身,而在支撑体系的响应能力[5][6] - 用户对“无代码编程”的期待是“用自然语言一步到位生成完整程序”,但现实仍需频繁迭代和更专业知识,高门槛和不确定性导致用户流失[5] - Lovable平台的用户数从6月的峰值3512万跌至9月的不足2000万,下降了超过40%[5] 算力资源优化与调度创新 - 传统AI算力基础设施以固定虚拟化或容器化单元划分资源,在Agent场景下极不经济,造成资源浪费[15] - 良好Agent Infra通过微虚拟化沙箱、沙箱调度和高并发沙箱管理机制,实现毫秒级环境切换和接近100%的资源利用[16] - 容器冷启动过程通常耗时数秒到数十秒,在高频创建和销毁任务的Agent场景中会造成大量时间损耗与资源空转[15] 异构算力统一调度与生态整合 - 核心技术创新是实现资源的统一标准化,包括功能层面打通不同类型算力的使用和效率层面实现任务的合理分配[16] - 国内算力资源种类多样、分布分散,基础设施必须始终面向最前沿,让Agent像使用水电一样使用算力[7][17] - 技术适配是早期最大阻力,一旦把不同模型与不同硬件之间的M × N映射打通,后续维护成本不高[17] 技术先进性与工程落地的协同 - 构建AI原生的基础设施,技术先进性与应用落地性相辅相成、互相迭代[19] - 研发支持弹性伸缩和动态资源调度的沙箱系统,每个Agent的沙箱可以按需启动或销毁,实现毫秒级响应[20] - 资源分配可根据任务类型和负载自动调整,通过智能调度引擎实现高峰弹性扩容、低峰快速收回,显著提升集群资源利用率[20] 未来基础设施形态与发展愿景 - 未来希望看到智能体之间进一步形成组织,共同完成更复杂的任务,各个智能体的KV Cache和上下文可以根据需求实现共享或隔离[14] - 目标是释放无穹算力,让AGI触手可及,通过系统层面的创新,让AGI能够更高效、更可持续地实现[22] - 基础设施引入Agent能力后具备自主性,从而实现更高效的资源整合和更具价值的功能创新[13]
一个好用的Agent Infra,让你闭眼造好智能体
虎嗅· 2025-09-28 03:46
行业趋势 - AI智能体在2024年迎来大爆发 [1] - 企业普遍期望数字员工能创造更多价值 [1] - 大型科技公司纷纷进入AI智能体基础设施领域 [1] 技术焦点 - Agent Infra(智能体基础设施)成为行业关注的核心 [1]
阿里闪电入局Agent Infra!智能体新基建亮相WAIC,“超级大脑”开箱即用
量子位· 2025-07-31 06:51
AI基建与Agent发展 - 大模型时代下AI基建重要性凸显,全球巨头如马斯克19天内组建10万块H100 GPU,扎克伯格计划建设1GW+超算集群 [1] - WAIC 2025显示模型应用成为发展主旋律,基础设施呈现更细化进展 [1] Agent Infra领域动态 - Agent Infra概念被敏锐厂商捕捉,AWS发布Amazon Bedrock AgentCore智能体沙盒并投入1亿美元研发资金 [3] - 阿里云在WAIC推出首款专为AI Agents设计的"无影AgentBay",提供云端沙箱环境支持3行代码快速部署 [3][7] 无影AgentBay核心功能 - 覆盖Linux、Windows、Android等系统层及Browser Use、Code Space等应用层环境,支持移动终端开发 [9] - 支持视觉理解、自然语言控制、任务解析等多模态交互方式,提供原子化工具API和远程串流协议 [11] - 升级跨平台数据漫游系统,实现状态和内存级持久化,减少重复登录操作 [12] - 提供企业级安全沙箱,采用数据加密传输和权限隔离,实现本地环境零侵入 [13] - 基于阿里云算力支持秒级弹性伸缩与千级并发运维能力 [13] Agent落地挑战与解决方案 - 开发环境与算力是Agent落地两大难题,本地设备难以满足高并发、高算力需求 [15] - 无影AgentBay通过云端高性能环境解决硬件限制,自带海量MCP工具并支持可视化操作 [16] - 该方案降低部署门槛,节省运行时间,加速AI Agents规模化进程 [17][18] 行业竞争与市场格局 - 阿里云与AWS在Agent Infra领域同步发力,阿里云产品比AWS早三个月推出 [16][21] - 阿里云2024年下半年稳居中国公有云市场首位,AI收入连续六个季度三位数增长 [22][23] - Agent大规模落地需新基建支持,要求云厂商兼具云技术、AI技术及行业洞察能力 [20][21]
我不给人做产品,给 Agent 做 | 42章经
42章经· 2025-06-29 14:48
Agent Infra市场机会 - Agent Infra被视为下一个投资热点 未来Agent数量将达到SaaS的几千倍[1][2] - 现有互联网基础设施不适合AI使用 需要为Agent重构[2] - Agent Infra市场规模巨大 类比AWS级别的机会[17] - 互联网上40%流量来自机器人 但大模型流量仅占0.1% 未来可能有10万倍增长空间[23][56] Agent与人类差异 - 交互方式:Agent通过文本和多模态后端交互 人类依赖前端界面[5] - 学习方式:Agent可同时执行任务和学习 人类无法并行[5] - 工作模式:Agent多线程并行 人类单线程按流程执行[6][7] - 责任界定:人类可负责自身行为 Agent需要安全边界[8][10] - 执行状态:Agent需保持多任务状态 人类天然不需要[8] Agent浏览器特性 - 云端化运行 持续工作不需休息[24] - 无前端界面 直接后端交互[25] - 设计反馈循环 支持自主迭代[26] - 安全机制:本地处理账号密码 不泄露给大模型[28][29] - 支持多线程任务连续性 避免资源浪费[31] Agent Infra技术架构 - 三层架构:Runtime层(浏览器内核) Agentic层(交互控制) Knowledge层(领域knowhow)[32] - Runtime层解决网页拉取和渲染 Agentic层控制AI与网页交互[33] - 必须同时构建Runtime和Agentic层才能实现完整功能[35] - Browserbase估值3亿美元 专注Runtime层[22][34] Agent Infra细分领域 - 主要环境:Coding环境(逻辑执行) Browser环境(网页交互)[37] - 工具类:身份认证 支付能力 通讯工具等可重做[38] - 场景切入:旅游Agent需CRM 搜索 支付等工具[40] - 数学环境:公式执行器 定理检索等工具[42] - 物理环境:传感器 具身智能 空间智能等[38] 市场发展阶段 - 类比22年AI Coding 当前Browser Use处于早期[44] - 全球软件开发市值3-4万亿美元 AI Coding仅100亿 增长空间大[47] - 互联网活动通过AI提升5%效率将创造巨大市场[48] - 差异化关键:深耕细分场景 抢占99.9%未开发市场[56] Agent产品设计核心 - 反馈循环设计比上下文或数据更重要[50] - 人类知识可能非必要 Agent可通过强化学习自主迭代[51][52] - AlphaProof案例:仅用+1/-1奖励机制 不参考人类解法即获奥数银牌[52] - 未来范式:Agent通过环境体验获取真实反馈 自主进化[53]
活动报名:Agent Infra 领域里的下一个大机会 | 42章经
42章经· 2025-06-15 13:57
Agent Infra赛道机会 - Agent赛道热度持续数月 大量不同方向项目已获融资 行业关注下一波机会方向 [1] - Agent Infra被视为新兴机会领域 包含重构基础设施的潜力 [1] - 硅谷热门项目E2B和Browserbase引发行业关注 代表Agent专用工具的创新方向 [1] 行业活动核心议题 - 活动将探讨从人类产品向Agent产品的转型路径 分析基础设施重构机会点 [2] - 重点讨论Agent专用浏览器的必要性 分享Browser应用实践方法论 [2] - 涉及Agent长期记忆技术解决方案的最新进展 覆盖基础设施层关键技术突破 [2] 行业参与者特征 - 活动聚焦一线创业者实战经验 包括Grasp浏览器创始人等实践者深度分享 [1][2] - 采用50人小型私密交流形式 优先筛选与Agent Infra领域匹配度高的参与者 [2]
活动报名:Agent Infra 领域里的下一个大机会 | 42章经
42章经· 2025-06-15 13:53
Agent赛道热度与机会 - Agent赛道热度持续数月 多个方向项目已获融资 行业关注下一波机会 [1] - Agent Infra被视为新兴机会 涉及基础设施层创新 [1] - 硅谷热门项目E2B和Browserbase引发行业讨论 [1] Agent Infra发展路径 - 产品设计从"面向人类"向"面向Agent"演化 需重构交互逻辑 [2] - Agent专属浏览器成为关键基础设施 需解决差异化需求 [2] - 行业探索长期记忆解决方案 技术进展受关注 [2] 行业实践动态 - Grasp创始人提出Agent Infra方法论 强调实践观察 [1][2] - 线下活动聚焦一线创业者经验 覆盖浏览器实践等主题 [2] - 行业交流趋向垂直化 限定非投资领域从业者参与 [2]