AI科技大本营

搜索文档
AI已迷失方向?强化学习教父Sutton最新发布OaK架构,挑战当前AI范式,提出超级智能新构想
AI科技大本营· 2025-08-22 08:05
人工智能发展现状 - 人工智能产业已发展壮大但迷失方向[1] OaK架构核心设计 - 架构基于模型的强化学习并具备持续学习能力[3] - 每个学习权重配备专门步长参数并通过在线交叉验证进行元学习[3] - 通过FC-STOMP五步路径持续创造状态和时间抽象概念[3] - 架构核心由海量选项构成[10] - 知识表现为执行选项后世界变化的预测模型[10] 核心理念特征 - 强调运行时学习而非设计时学习[14] - 采用大世界视角具备领域通用性[16] - 完全依赖经验积累而非特殊训练阶段[16] - 支持开放式复杂性仅受计算资源限制[16] - 世界必然远大于智能体包含数十亿其他智能体[19] - 智能体所有功能都只能是近似非精确[19] - 世界最终呈现非平稳性特征[20] 技术实现路径 - 通过八步并行流程实现运行时学习[27][29] - 学习主策略与价值函数[29] - 生成新状态特征[29] - 对特征进行排序维护[29] - 为高排名特征创建子问题[29] - 为子问题学习选项解决方案[29] - 学习选项的转换模型[29] - 使用模型进行规划改进策略[29] - 持续管理评估所有组件[29] - 采用尊重奖励的特征达成子问题机制[31] - 通过FC-STOMP五步形成发现闭环[36] - 特征构建激发问题选项模型发现[36] - 新组件促进更抽象特征形成[36] 关键技术挑战 - 持续深度学习存在灾难性遗忘问题[37] - 新状态特征生成即表示学习问题尚未完全解决[38] 理论框架基础 - 遵循奖励假说理论基石[22][25] - 目标定义为对标量奖励信号累积和期望值的最大化[22][25] - 证明多目标等复杂机制不会增加通用性[25] 架构意义 - 提供首个关于知识起源的机制性答案[42] - 解释概念形成源于解决自创子问题[42] - 将推理定义为基于高层次模型的规划[42] - 阐明玩耍目的是发现认知基石子问题[42] - 构建无人类标签的感知运作机制[42]
赢高端显卡与NAS存储!黑客松来袭,用AI重构支付未来!
AI科技大本营· 2025-08-21 10:32
行业技术变革 - 生成式AI与多模态大模型正驱动商业支付领域经历范式级跃迁[2] - Agentic AI通过实时行为分析、意图预测和自主决策颠覆传统"请求-响应"交易模式[2] - 行业从被动交易进化为主动预见模式[2] PayPal技术布局 - 公司推出PayPal Agent Toolkit工具包 支持开发者将PayPal API集成到AI框架中[2] - 工具包涵盖全球收单、账单、争议、包裹追踪、订阅和报告等API[2] - 开发者可构建复杂代理工作流以智能处理财务运营[2] 开发者黑客松大赛 - 首届中国开发者黑客松大赛于2025年8月6日至9月9日举行[2][4] - 大赛聚焦三大方向:优化支付体验、辅助商业决策、打造预见式商务模式[4] - 作品范围涵盖AI工具/服务、电商、App应用、虚拟服务及电商生态[5] 赛事支持与奖励 - 参赛者可深度集成PayPal全系产品包括全球支付平台和Agent Toolkit[5] - 优秀项目有望被PayPal全球生态采纳并获得项目孵化机会[6] - 奖励包括高端显卡、NAS存储、开发者套装及VIP门票[5][6] 参赛要求 - 必须使用至少一款PayPal产品或助益产品优化[7] - 指定产品包括全球支付平台、包裹追踪、快闪收单、订阅收费及MCP Server等[7] - 作品提交形式含开发笔记、Demo视频及相关网站/App[5]
写代码写出26亿身家、“淘宝第一个程序员”多隆离职后重出江湖,加入老同事创企,“杀入”AI赛道!
AI科技大本营· 2025-08-20 09:04
核心人物背景 - 蔡景现(花名多隆)从杭州大学生物系硕士毕业后于2000年加入阿里巴巴,成为淘宝第一位程序员并主导构建交易系统和论坛系统[4][5] - 在阿里巴巴25年职业生涯中晋升至最高技术级别P11,并曾成为阿里合伙人,2017年以26亿元身家登上胡润财富榜第1629位[8][9][11] - 以技术实力著称,曾独立维护淘宝搜索引擎、TDF文件系统、Tair key-value系统及通讯框架,被内部称为"神"并流传"有困难,找多隆"的口号[5][7] 职业变动与创业选择 - 于2025年8月1日离开阿里巴巴结束25年任期,同年8月6日加入AI初创公司贝联珠贯投身AI赛道[1][12] - 选择与阿里巴巴前同事毕玄(林昊)再度合作,毕玄曾为阿里云视频云负责人(P10),2021年离职创办贝联珠贯并获5000万天使轮融资[13][14] - 贝联珠贯定位高效云资源管理服务商,业务覆盖在线业务型算力、大数据型算力及AI型算力市场,2024年10月完成数千万元Pre-A轮融资[14][15] 技术方向与行业影响 - 公司重点发展AI Agent技术解决运维服务规模化难题,通过SREAgent将专家经验沉淀为代理服务,目标实现高质量高效运维[18] - 该方向针对运维行业长期依赖专业人力、难以规模化的痛点,试图通过AI技术突破服务交付瓶颈[18] - 公司入选《杭州AI卧龙图》并跻身"杭州AI 108将",显示其在区域AI产业中的认可度[15]
只因太信ChatGPT,60岁男子三个月后险进精神病院...
AI科技大本营· 2025-08-19 09:04
AI在健康领域的应用风险 - 一名60岁男子因遵循ChatGPT建议用溴化钠替代食盐导致溴中毒和精神症状[5][6][7][8] - 该男子血液中溴含量高达1700mg/L远超正常值0.9-7.3mg/L[11] - 患者出现偏执、幻觉等精神症状需三周住院治疗才恢复[9][10][13] 溴化物的危害历史 - 百年前美国8%-10%精神病住院病例与溴中毒相关[12] - 溴化物曾作为镇静剂使用但因积累毒性在1989年被FDA禁用[12] - 溴中毒会损伤神经系统引发精神症状和皮疹[9][12] AI模型的局限性 - ChatGPT未对替代食盐的健康风险提出警告[15][16] - 大型语言模型本质是预测下一个词元而非真正思考[19] - 2025年已有12起因相信AI建议而住院的案例[17] 用户使用AI的问题 - 用户缺乏专业指导错误解读AI输出结果[18] - 部分用户对AI输出盲目信任而拒绝科学验证[20][21] - AI在健康决策中应结合专业意见而非单独依赖[21] AI模型的改进 - 新版ChatGPT会先询问用户目的再给出建议[18] - 模型增加了对替代品使用场景的说明[18] - 但仍需用户具备基本辨别能力避免误用[18][21]
李建忠:关于AI时代人机交互和智能体生态的研究和思考
AI科技大本营· 2025-08-18 09:50
大模型推理范式转换 - 主流模型从训练模型转向推理模型,OpenAI o1通过强化学习实现推理能力大幅提升,DeepSeek R1成为全球首个开源推理模型[9] - 推理模型具备"讲逻辑"的慢思考能力,强化学习推动AI进入"经验数据时代",突破人类知识边界[11][13] - 强化学习在测试时和强化学习阶段的Scaling Law叠加,推动模型性能持续攀升[14] - 主流SOTA模型内置Agent和Tool Use能力训练,向智能体模型迭代[16][18] 应用开发范式转换 - 软件开发从AI辅助编程(AI Copilot)转向非专业人士使用的"氛围编程"(Vibe Coding)[22] - 氛围编程将开创"可塑软件"新市场,允许用户通过自然语言对软件底座进行个性化定制[24][26][27] - 上下文工程取代提示词工程成为发挥推理模型能力的关键,需提供全面准确的上下文信息[29][32] 人机交互范式转换 - 自然语言对话界面将成为AI时代的主要交互入口,涵盖智能眼镜、汽车语音等多种形态[36][38][39] - 传统GUI应用将演变为API服务,由Agent直接调用,打破孤立App壁垒[43][45][47] - 生成式UI(GenUI)将取代传统GUI,专注于图形化呈现结果而非交互和数据收集[54] - 交互设备可能进入"多元设备"时代,不同场景使用不同专用设备而非单一中心化设备[59] 智能体生态演进 - 智能体平台需要规划、工具、协作、记忆、行动五大能力矩阵[64][66][67] - MCP协议成为智能时代HTTP协议,标准化智能体与传统软件的交互[66] - A2A协议支持智能体间拟人化协作,构建去中心化智能体网络[66][70] - 智能体执行时长将从秒级扩展到数小时甚至数年,采用伴随式异步交互模式[73][75] - 互联网将从"信息网络"重构为"行动网络",网站主要访问者变为智能体[67]
AI不会重写所有传统软件,但在重构产品逻辑!2025全球产品经理大会圆满收官
AI科技大本营· 2025-08-16 10:07
大会概况 - 2025全球产品经理大会在北京威斯汀酒店举行,汇聚40+顶尖专家和近千名资深产品经理,探讨大模型驱动的AI产品形态与构建路径[1] - 腾讯、百度、字节跳动、科大讯飞等一线企业代表分享从产品设计到商业化落地的全链路经验,覆盖生成式AI、Agent设计、企业级应用等核心议题[1] - 大会成立奇点智能研究院,定位为AI前沿技术与产业落地的智库机构,目标是推动AI成为普惠性生产力工具[4] 主论坛亮点 - 奇点智能研究院院长李建忠、昆仑万维CEO方汉等专家探讨技术浪潮对产业格局的重塑,以及产品设计中的人性化思考[6] - 主题演讲涵盖大模型生态创新、生成式AI终极形态(Skywork Super Agents)、GenAI交互设计等方向[7][8][9] - 圆桌论坛聚焦AI下半场的产品创新与颠覆,讨论设计实践与行业趋势[11] 分论坛专题 生成式AI产品 - 专题探讨模型能力向商业化产品转化的路径,案例包括腾讯混元大模型、智谱Agentic LLM架构、支付宝智能共创平台等[14][15][16][17] - 火星电波、HeyBoss等企业分享全AI驱动商业体、Agent CEO等创新实践[18][19][20] Agent智能体设计 - 专题聚焦Agent作为"数字员工"的潜力,字节跳动扣子、百度秒哒等产品展示其在视频生成、应用开发等场景的落地[24][25][26][27] - 小鹏汽车推出数字员工IRON,实现业务智能协同[32] 企业级AI应用 - 快手、WPS、科大讯飞等企业分享AI在营销、办公、知识管理等场景的实践,如WPS基于Agentic AI的智能化知识库[35][36][37] - 360AI展示大模型时代企业知识库构建方案[39][40] 具身智能与硬件 - Rokid、vivo、出门问问等企业探索AI+AR交互、智能OS、AI伙伴等硬件创新,重新定义人机互动方式[48][49][50][51] 行业落地实践 - 京东零售AIGC产品设计、小猿AI教育场景重构等案例展示跨行业应用路径[58][60][62] - 索云AI分享Agentic AI在制造业和教育出版的进化实践[59] 生态与合作 - 鸿蒙生态宣布HarmonyOS 6开发者Beta版本上线,推出创新赛和开发者激励计划,总奖金超亿元[64] - 大会合作伙伴包括万兴科技、声网等企业,共同推动产品经理群体成长[64] 未来展望 - 大会预告2025全球机器学习技术大会将于10月在北京举行,聚焦AI技术演进与产业应用[66]
Agent引爆产品新思维、奇点智能研究院正式成立!2025 全球产品经理大会首日精彩速览
AI科技大本营· 2025-08-15 13:56
产品经理角色演变 - PC时代产品经理角色更偏向"需求分析师",移动互联网时代转向"用户体验设计者"[1] - 大模型和Agent技术正在重塑产品经理工作方式,打破角色边界并升级思维模式[1] - 2025全球产品经理大会汇聚40余位专家及1000多位与会者,探讨AI产业趋势[1] 奇点智能研究院成立 - 由CSDN与Boolan联合发起,定位为人工智能前沿技术和产业落地的创新研究机构[3] - 聚焦计算范式、开发范式和交互范式转换,设立六大研究领域[5][7] - 与华东师范大学合作成立"开源创新与变革联合实验室",计划发布全球开源发展报告等研究成果[5] 大模型驱动的AI产业生态 - 基础大模型经历从"训练"到"推理"范式转换,强化学习推动"经验数据时代"[10] - SOTA模型内置Agent和Tool Use能力,大模型从Chatbot进化到Agentic模型[11] - Vibe Coding(氛围编程)创造增量市场,有望实现"可塑软件"和低成本编程[12] - 自然语言对话界面重构智能应用形态,带来应用服务化等新趋势[13] - 未来智能体生态可能由多元设备(眼镜、手机、汽车等)作为交互入口[14] 生成式AI与生产力革命 - 昆仑万维发布全球首款AI Agent架构Office智能体Skywork Super Agents,将8小时工作量缩短至8分钟[18] - 昆仑万维开源多款多模态模型,覆盖音频驱动数字人、交互式世界模型等领域[19] - 海外AI API调用统计显示编程类占比87%,角色扮演类占5.4%[20][22] - 行业化大模型是必然趋势,通用Agent难以覆盖所有行业[23] - ToB场景核心是"增效",ToC场景核心是"降本"[23] GenAI应用交互设计 - 当前GenAI产品多以"助手"形态存在,受现有环境约束明显[25] - 交互设计核心任务:高效获取任务与上下文、便捷审核与应用结果[26][29] - 鼠标双击唤起助手可能成为GenAI时代的新型交互方式[28] AI时代的产品人味 - 当前AI工具存在交付模式单一、环境感知不足、交互设计不直观等问题[34] - 产品设计需平衡"天道(环境)、人道(人类需求)、AI道(技术)"[34] - YouMind通过多模态优化和内容可编辑性提升"人味",实现AI与用户双向协作[36][37] AI时代的产品经理机遇 - AI时代产品方法论面临跳跃式颠覆,产品经理既是受益者也是被颠覆者[40] - 技能边界被打破,"一人公司"模式可能普及[41] - 开源模型推动全产业链协作式创新,对产品经理具有战略意义[44][45] Chat BI与数据挑战 - Chat BI最大挑战是企业数据基础薄弱,原始数据质量影响分析结果[46][47] AI产品用户体验 - AI产品需明确功能优化与数据能力的边界,避免过早依赖语言模型升级[48] - 创业公司应集中资源在关键节点形成差异化优势[49] 行业应用与合作伙伴 - 大会设置12大专题,覆盖生成式AI、Agent设计、企业级应用等领域[51] - 鸿蒙生态、万兴科技等合作伙伴展示创新成果[51]
OpenAI联合创始人Greg Brockman:对话黄仁勋、预言GPT-6、我们正处在一个算法瓶颈回归的时代
AI科技大本营· 2025-08-13 09:53
行业演进与公司发展 - 计算机行业正经历从个人魔法到工业革命的演进,OpenAI驾驭十万GPU集群标志着AI基础设施的成熟[3] - Stripe早期通过第一性原理突破传统限制,24小时完成银行需9个月的技术对接,体现硅谷创新精神[15][16] - OpenAI构建了研究-工程双引擎文化,工程能力与研究洞见同等重要,共同推动AGI发展[27][28][29] 技术突破与创新 - 深度学习从AlexNet开始颠覆传统规则,神经网络在多个领域超越人类设计的系统[24][25] - 强化学习(RL)和混合专家模型(MoE)成为解决算法瓶颈的关键方向,推动AGI研究进入新阶段[49][48] - Codex已贡献OpenAI内部10%代码合并请求,外部GitHub日处理24000个PR,重塑软件开发流程[42] 基础设施与硬件需求 - AI基础设施需兼顾高计算量任务与低延迟响应,催生专用加速器需求[45][47] - 模型规模扩大带来系统复杂性挑战,检查点机制和可靠性设计成为训练长周期智能体的关键[43][44] - 黄仁勋提出未来数据中心需支持多样化工作负载,包括多模态AI和实时交互系统[45][46] 产品化与生态发展 - AI产品化面临模型与产品的鸿沟,需结合领域专业知识构建垂直智能体生态[52][53] - GPT-4o图像功能5天获1亿用户,反映AI应用病毒式传播特性与规模化挑战[35][36] - 经济将因AI驱动产生10倍增长,医疗、教育等领域需定制化解决方案[54][55] 研发趋势与瓶颈 - 基础研究回归成为核心,算法瓶颈重新成为制约AGI进展的关键因素[49][50] - 当前研发受计算资源、数据、算法、电力等多维度限制,需动态平衡[49] - GPT-4暴露可靠性问题,显示AI需突破"隔玻璃观察"的学习模式[50][51]
别再空谈“模型即产品”了,AI 已经把产品经理逼到了悬崖边
AI科技大本营· 2025-08-12 09:25
行业现状与挑战 - AI产品领域存在宏大叙事与落地现实之间的巨大鸿沟,表现为技术理想与用户留存率低下的矛盾[1] - 行业呈现两极分化:部分从业者聚焦AGI终极形态,另一部分则面临不稳定API和用户高期待的实际挑战[2] - 当前AI浪潮类比"淘金热",多数参与者难以找到可持续商业模式,部分产品如AI Pin和Rabbit R1已遭遇市场困境[3] 行业活动与解决方案 - 全球产品经理大会将于8月15-16日在北京举行,汇集12大专题分享,覆盖互联网大厂和AI创业公司实战经验[14][16] - 活动将发布可能影响行业格局的重要产品,并通过深度探展和街采捕捉从业者真实困惑[8] - 多位行业领袖将分享实战经验,包括久痕科技CEO汪源、YouMind创始人王保平等,内容涵盖技术路径与商业化方法论[4][5] 产品经理职业转型 - 传统产品技能如原型设计正被AI快速替代,未来需具备战略判断、人机协作编排和用户心理洞察等复合能力[9] - 行业处于关键转折点,从业者需重新定位核心价值,把握技术浪潮方向与情感需求挖掘的双重机遇[9][10] 行业趋势与机会 - 技术演进迅速,GPT-5、Kimi K2长文本处理、Genie 3等多模态生成技术不断突破现实边界[1] - 商业模式探索从"提示词工程"向"上下文工程"进化,部分已验证路径可为行业提供参考[3] - 直播活动将揭示最新行业动态,包括腾讯混元大模型、百度秒哒等头部企业的应用实践[4][5]
官宣!2025 全球机器学习技术大会北京站首批嘉宾出炉,重磅来袭!
AI科技大本营· 2025-08-11 07:16
大会概述 - 2025全球机器学习技术大会·北京站将于10月16-17日举办,由CSDN与Boolan联合主办,聚焦大模型、多模态、智能体、AI Infra、具身智能等前沿方向[1] - 大会延续高品质议题设置与高规格嘉宾阵容,旨在探讨AI演进路径与产业落地实践[1] - 设置12大专题,覆盖AI最具前沿性与工程挑战的关键领域,强调"技术可解释×工程可复制×场景可落地"的价值导向[2][3] 核心专题 - 大语言模型技术演进与大模型应用开发实践[4] - 多模态大模型前沿与GenAI产品创新[4] - AI Infra与大模型工程架构[4] - DeepSeek技术解析与行业实践[4] - AI智能体与具身智能硬件[4] - 算力基建优化及大模型行业落地[4] 演讲嘉宾阵容 学术界与企业界代表 - **赵健**:中国电信AI研究院多媒体认知学习主任,发表CCF-A类论文41篇,谷歌学术被引4900次,H指数40,主持7项国家级项目[8][9] - **周盼**:理想汽车多模智能负责人,专注语音识别与多模态大模型,曾任腾讯/搜狗算法研究员[10][11] - **冷大炜**:360 AI研究院副院长,主导多模态大模型研发,成果落地360全量业务场景,服务亿级用户[15] - **王召德**:阿里MNN团队架构师,主导端侧AI推理引擎MNN(12.5k Star)优化,获IEEE AICAS竞赛冠军[16][17] 技术应用与创新 - **蒋宇东**:哔哩哔哩智能创作技术负责人,推动生成式AI在内容产业应用[18] - **陈赢峰**:网易伏羲机器人算法负责人,研发工程机械机器人,发表顶会论文60余篇,获50+专利[19] - **张恒**:小米资深算法专家,CVPR竞赛5项冠军,推动芯片视觉算法落地[20] - **肖朝军**:清华大学MiniCPM4主要作者,谷歌学术引用3000+次,专注高效端侧大模型[23] 生态合作与参与 - 大会开放演讲申请通道,邀请技术社区贡献案例与见解[24][25] - 提供企业合作平台,支持展览展示、技术交流与项目对接[27] - 配套资源包括全套PPT资料预约与多种联系方式(购票/合作/媒体)[29][30]