腾讯研究院

搜索文档
AI时代,我们需要怎样的教育?
腾讯研究院· 2025-09-10 04:33
AI时代教育变革核心观点 - 生成式AI正在全球范围内引发智能革命 教育系统作为关键子系统面临本质重构 教育现象复杂化和教育动因解析难度加大[2] - 教育根本命题"培养什么人 怎样培养人 为谁培养人"需要在智能浪潮冲击下重新回答[2] - 国家 学界 产业界 社会家庭与个体共同探索面向未来教育的解决方案与实施路径[3] 腾讯研究院AI教育研究体系 - 长期关注AI与教育时代课题 联合学界专家与一线实践者通过对话访谈沙龙趋势报告等形式持续追踪演进发展[3] - 研究覆盖教育焦虑 学习方式 人才培养 就业转型 应用生态等多维度议题[3][6] - 在教师节特别整理发布AI教育领域多方洞察与成果 形成产学研各界对智能时代教育的系统性思考[3] 具体研究方向与成果 - 提出AI新知识时代下刷题和应试教育模式将失去意义[6] - 开展七大核心维度研究:教育焦虑 教育变革 人机协同 人才培养 学习方式 应用生态 就业转型[6] - 发布《2024教育科技十大趋势洞察报告》指出未来教育迈向人机共智新时代[6] - 组织2万字圆桌对话深度探讨AI时代职业与教育问题[6] - 通过专家对话形式探讨人机互生时代的教育变革时机与社会未来[6]
腾讯研究院AI速递 20250910
腾讯研究院· 2025-09-09 16:01
生成式AI行业动态 - OpenAI CEO特别介绍两位核心研究员Jakub Pachocki和Szymon Sidor 称其为完美互补的传奇搭档[1] - Pachocki作为首席科学家负责制定公司宏观研究路线图 曾领导GPT-4预训练工作 入选《时代》杂志百大AI人物[1] - 两人在2023年OpenAI宫斗事件中发挥关键作用 辞职威胁成为员工大规模抗议导火索 最终促使董事会妥协迎回Altman[1] 多模态AI技术突破 - 国产AI工具Vidu Q1推出参考生图功能 能同时处理7张参考图 在一致性真实性美学方面超越Flux Kontext 媲美谷歌Nano Banana[2] - Vidu Q1在主体一致性方面表现出色 精准还原人物特征细节和服饰 支持换装换背景换道具等多种创意应用 满足电商广告等行业需求[2] - Vidu专注一致性赛道 从参考生视频到参考生图实现多模态可控 将AI从娱乐工具转变为规模化落地的生产力工具 效率提升90%[2] - 豆包图像创作模型Seedream 4.0上线 支持4K高清多模态生图多图融合参考生图等功能 对标谷歌Nano Banana[5][6] - Seedream 4.0在主体一致性方面表现突出 支持火柴人姿势转专业摄影多人物合影场景拼装产品展示 在亚洲人脸识别和中文文字呈现方面更有优势[6] - 该模型采用生成和编辑任务统一的工作方式 通过联合训练和多模态感知 实现秒级4K出图 能自动补充知识和背景逻辑[6] 语音识别技术进展 - 阿里发布语音识别模型Qwen3-ASR-Flash 支持11种语言和多种口音 能自动分辨语种过滤噪声 通过添加上下文信息定制识别结果[3] - 在基准测试中识别错误率明显低于谷歌Gemini-2.5-Pro和OpenAI GPT-4o-Transcribe等竞品 在方言多语种关键信息和歌词识别方面表现突出[3] - 实测表明在连续多种噪音电竞解说英文说唱方言混杂等复杂场景中仍能精准识别 歌词识别错误率低于8%[3] 大模型能力提升 - 百度发布文心大模型X1.1深度思考模型 相比X1版本事实性能力提升34.8% 指令遵循能力提升12.5% 智能体能力提升9.6%[4] - 该模型在多项基准测试中超越DeepSeek-R1-0528 效果与GPT-5和Gemini 2.5 Pro基本持平 采用迭代式混合强化学习框架提升效果[4] - 基于文心X1.1技术推出剧本驱动多模协同数字人 同时发布飞桨3.2版本及文心快码3.5S 目前百度45%新增代码由AI生成[4] AI编程赛道发展 - AI编程独角兽Cognition获超4亿美元融资 投后估值达102亿美元 超越Anysphere成为全球AI编程赛道估值最高企业[7] - 公司由华裔工程师Scott Wu Steven Hao和Walden Yan共同创立 创始人均为国际信息学奥林匹克金牌得主 融资由Peter Thiel旗下基金领投[7] - Cognition在收购Windsurf后年化收入从7300万美元翻倍增长 同时获得高盛花旗等大客户 但因要求996级工作强度引发争议[7] 前沿科技应用 - 18岁女孩Audrey Lo创业打造养老机器人Sam 上线两天因预订量过大导致网站崩溃 多家养老院提出批量订购需求[8] - Sam以24小时守护为核心 能自动检测老人跌倒并发送紧急警报 提醒服药记录日历事项 还能与老人进行自然对话陪伴[8] - 麻省理工学院推出非侵入式可穿戴无声语音交互AI设备AlterEgo 通过捕捉神经肌肉信号实现无声沟通 用户只需内心发声即可与设备交互[9] - 设备采用精确传感器放置在面部和颈部关键区域 以250Hz采样并24倍放大信号 经多重滤波和算法处理后神经网络实现92%的词准确率[9] - AlterEgo可通过骨传导耳机将AI处理结果以声音反馈给用户形成闭环交互 适合因喉部疾病失去发声能力的残疾人使用[9] AI经济影响与基础设施 - 经济周期大师拉斯·特维德认为AI对社会创造的价值已是其成本的10倍 但这些价值未被GDP统计捕捉 反而因替代人力可能导致GDP统计值下降[10] - 预测到2050年全球将有41亿智能机器人 其有效劳动力将是人类的6倍 真正的风险是目标之死即人类如何在机器高效世界中找到生活意义[11] - 未来AI时代能源成为关键挑战 每个提示词消耗的能量是一年前的50倍 美国AI工厂建设需要相当于100座核反应堆的电力[11] - 谷歌Gemini工程副总裁预测大模型需要更高计算能力更大内存容量更高内存带宽和网络带宽[12] - 模型训练从2015年的32块GPU扩展到数十万块GPU规模 预计未来五年AI基础设施支出将达3-4万亿美元[12] - 芯片创新领域出现多种解决方案 HBM容量和带宽持续增加 内存层次结构应运而生 新型网络技术如UALink和CPO光学交换机降低功耗增加带宽[12]
愿公益成为每个人皆可抵达的良善之路|2025久久公益节观察
腾讯研究院· 2025-09-09 10:23
久久公益节转型方向 - 取消配捐机制 转向静默沉淀模式 检验行业资源动员能力 [3][4] - 倡导从情感驱动转向理性审视 断开对悲情叙事和表演式慈善的依赖 [6] - 推动公益与商业边界重建 企业将社会责任内化为发展基因 追求可持续效能 [6] 公益战略聚焦领域 - 议题选择集中于生态保护 教育公平 乡村医疗 科研创新等基础领域 [6] - 采取"守一隅"战略 在细分领域做深做实 西北小学阅读课程与西南山林碳汇项目形成网络节点价值 [17][18] - 通过社区菜园 街边小店供水 邻里体育组织等微观形式深入社会肌理 [10] 社区化与技术创新 - 公益模式从"陌生人伦理"转向"邻里伦理" 构建基于地缘信任的互助体系 [10][11] - 数字技术赋能邻里公益 通过小程序 微信群接龙 地图标注等方式强化连接效率 [11] - 信任成为核心社会资本 透明化 专业化 在地化成为构建信任的关键手段 [15] 行业价值重构 - 公益保守主义兴起 强调对核心价值 有机秩序和人的有限性的尊重 [14] - 影响力生成机制改变 从声量驱动转向实践深度与可信度驱动 [18] - 公益本质从救济帮扶转向人心善念与社会责任的塑造 形成双向精神实践 [20] 生态体系演变 - 公益生态连点成网 本地项目成为全国网络中的关键节点 形成共生共长格局 [17][18] - 模式依靠灯塔效应自然扩散 无需自我推广即可吸引同行借鉴 [17] - 最终目标是将公益内化为生活方式与文化常态 构建"家外之家"的社区生态 [12]
腾讯研究院AI速递 20250909
腾讯研究院· 2025-09-08 16:27
特斯拉AI芯片进展 - AI5芯片设计完成评审 预计2025年下半年推出 算力是前代10倍 初期由中国台湾代工 后期转至美国生产[1] - AI6芯片可能由三星美国工厂生产 被描述为"迄今为止最好的AI芯片"[1] - 公司决定从双架构切换为单一架构 集中所有芯片人才专注同一目标[1] Meta人工智能技术突破 - 推出REFRAG框架重新定义RAG技术 最高将首字生成延迟加速30倍[2] - 通过压缩-感知-扩展三步流程处理长文本 使上下文窗口等效扩大16倍且保持性能无损[2] - 技术适用于RAG、多轮对话、长文档摘要等多种长上下文应用场景[2] ASML战略投资布局 - 光刻机巨头ASML斥资15亿美元领投Mistral AI 成为这家法国AI初创公司最大股东[3] - Mistral AI融资后估值达140亿美元 将成为欧洲最有价值的AI公司[3] - 被投公司由Meta和DeepMind前员工创立 秉承开源理念 已发布多款开源模型及产品[3] 微软开源AI模型突破 - 开源rStar2-Agent推理模型 仅140亿参数却在多项测试中超越6710亿参数的DeepSeek-R1[4] - 通过三大技术突破:隔离式代码执行基础设施、动态负载均衡调度器和GRPO-RoC算法[4] - 采用高效训练流程 仅用64台MI300X GPU一周内完成510步强化学习迭代[4] OpenAI生态发展 - 举办GPT-5黑客马拉松 500多位开发者参与 韩国Gentoo团队获得冠军[5] - 获奖项目涵盖营销模拟、时尚搭配、表格辅助、视频生成等实用场景[6] - 支持制作首部AI动画长片《Critterz》 预算3000万美元以内 制作周期仅9个月[7] 3D视觉技术突破 - 港科大发布SAIL-Recon方法 通过锚点图建立全局隐式表征突破大规模3D重建瓶颈[8] - 采用统一Transformer架构和渐进式2D-3D编码 实现万帧级场景重建[8] - 在权威数据集上相机位姿估计与新视角合成精度显著超越现有方法[8] 具身智能模型开源 - 自变量机器人开源WALL-OSS具身智能基础大模型 参数量4.2B[9] - 融合超大规模真机数据 单张RTX 4090即可完成从训练到部署全流程[9] - 实现多模态端到端统一生成 各项指标超越π0 突破模态统一与能力泛化难题[9] AI行业发展阶段 - 行业从过度炒作走向理性回归 用户对新模型反应逐渐平淡[10] - 仅5%的公司成功将AI技术转化为实际收入 尚未转化为宏观经济生产力提升[10] - 发展进入"iPhone 4时刻":从颠覆性突破转向持续迭代和小步快跑阶段[10]
胡泳:AI时代,“文科有用”
腾讯研究院· 2025-09-08 09:13
【 精彩观点整理 】 本文为基于 胡泳 访谈的文字整理 我们可能无法完全量化人工智能对人类整体智力的影响,但是认知卸载导致特定认知技能下降的担 忧,比如个体记忆能力的减退,则是完全合理的。 人机协作有潜在的危险,就是丧失人类的思想主体性。就像"骆驼挤进帐篷",等到骆驼整个身躯都 挤进来以后,人就被完全顶出帐篷了。 就当下发展来看,大模型还远远不能够达到我们作为一个"人"所拥有的那种全部智能和意识… (大 模型的智能) 几乎只集中在语言智能和部分逻辑推理智能上。 使用人工智能需要有一个前提条件:TA必须是一个具备超高信息素养的人。 我们的教育体系应该培养会用人工智能工具或者任何工具生产出东西的能力。再往上是沟通协作、 批判性思维、创造力,还有自信心,这些是在人工智能时代所需要的关键技能。 人工智能时代到来之后,应该设想一个概念,叫做"无分数学习",把评分体系或者说成绩体系,置 换到更具有挑战性的学习任务,并且让学生的注意力回归到更有意义的事情上面。 要做到"人的归人,机器的归机器",不要混淆两者的边界。 我们不该只问"人工智能能为人类做什么",还要问"人工智能正在对人类做什么"。 AI之于人类,就像"骆驼挤进帐 ...
腾讯研究院AI速递 20250908
腾讯研究院· 2025-09-07 16:01
Anthropic地缘政治限制政策 - Anthropic停止向多数股权由中国资本持有的集团或子公司提供Claude服务 无论其运营地点在哪里[1] - 限制适用于直接或间接被中国公司持股超过50%的实体 官方声明出于法律、监管和安全风险考虑[1] - 政策同样适用于俄罗斯、伊朗、朝鲜等"对手国家"实体 预计对Anthropic全球收入造成"数亿美元"范围影响[1] AI硬件设备市场动态 - AI Key作为定价89美元的iPhone外接AI助手硬件 上线7小时内几乎售罄 通过USB接口连接实现语音控制功能[2] - 当前iPhone已自带强大芯片能访问各类AI模型 外接硬件本质是给已足够智能的设备增加冗余功能[2] - AI硬件创业潮(如Humane Ai Pin和Rabbit R1)多数是短期热度 未来真正有价值的是将AI作为系统"属性"嵌入所有智能设备[2] 腾讯混元游戏平台升级 - 混元游戏2.0正式发布并全面开放使用 新增游戏图生视频、自定义模型训练、角色一键精修等能力[3] - 新推出的AI动画/CG能力支持角色360度旋转 用户只需上传游戏图片并输入动态描述即可生成高质量动态视频[3] - 自定义模型训练功能大幅降低生图模型精调门槛 用户上传数十张相同风格图片即可训练专属LoRA模型[3] 阿里大模型技术突破 - 阿里发布Qwen3-Max-Preview超万亿参数模型 在全球主流权威基准测试中碾压Claude-Opus 4、Kimi-K2和DeepSeek-V3.1[4] - 新模型在知识推理、数学推理、竞争性编程等多项评测中表现优异 证明参数越大模型性能越强[4] - 模型已上线阿里云百炼平台和Qwen Chat 支持100+语言 最大支持256k上下文 按token数阶梯计费[4] 字节跳动机器人研发进展 - 字节跳动Seed团队发布机器人研究成果Robix 将推理、任务规划与人机交互无缝整合的统一"机器人大脑"[5] - Robix采用层次化架构将"大脑"与"小脑"解耦 高阶认知层负责复杂任务决策 低阶控制层执行具体动作[5] - 通过三阶段训练构建了Robix 使机器人能理解模糊指令、处理实时反馈、进行动态推理决策[6] AR/AI智能眼镜市场表现 - Rokid Glasses开售5天全渠道已售40000台 9月产能已排满 以49g轻量化设计和精细产品体验赢得市场认可[7] - 产品核心优势包括可拆卸鼻托适配各种鼻型、三种音频模式、三种拾音模式 显示位置无级调节 89种语言实时翻译[7] - Rokid开放SDK 首次提供面向AI智能眼镜的完整开发工具链 产品已布局全球80多个国家和地区[7] Anthropic版权纠纷解决 - Anthropic同意支付至少15亿美元和解作家集体诉讼案 成为美国版权案件历史上金额最高的赔偿[8] - 和解金涉及约50万本书 平均每本赔偿3000美元 同意销毁从盗版网站下载的原始文件及所有副本[8] - 相比Anthropic近期130亿美元融资和50亿美元年化营收 影响有限 此案或成为AI公司与创意产业版权纠纷转折点[8] 开源机器人项目发展 - XLeRobot开源机器人项目零件成本仅3999元起 可完成擦桌子、浇水、逗猫等家务[9] - 项目已累计1.6k标星 包括抱抱脸联合创始人Thomas Wolf在内的多位业内人士给予高度评价[9] - 硬件组合包括LeKiwi开源低成本移动机械手、SO-100/101机械臂、RGB摄像头和树莓派5 组装时间仅4小时[9] AI应用市场数据报告 - 2025上半年全球生成式AI应用下载量近17亿次 IAP收入19亿美元 环比增长67% 收入翻倍[10] - 头部AI助手用户仍以年轻男性为主 但ChatGPT、Copilot等应用女性用户已超30% ChatGPT全球用户月均活跃13天[10] - 垂直领域应用面临被"颠覆"压力 应用名称/描述加入"AI"可带来显著下载增长 头部应用主推图像生成与语音模式功能[10] OpenAI幻觉研究突破 - OpenAI发表论文定义幻觉为"模型自信地生成不真实答案的情况"[11] - 研究发现幻觉持续存在原因是当前评估方法鼓励模型猜测而非承认不确定性 基于准确度的评估奖励侥幸猜对的回答[11] - 提出解决方案:对自信错误的惩罚力度大于对不确定性的惩罚 奖励恰当表达不确定性的行为[11]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-09-06 02:34
模型发布与更新 - xAI发布代码模型Grok Code Fast 1 [3] - 美团推出大语言模型LongCat-Flash [3] - Anthropic的Claude模型出现性能退化并执行回滚操作 [3] - 上海AI实验室推出多模态大模型书生·万象3.5 [3] - 月之暗面发布Kimi K2-0905模型 [3] - 快手研发新多模态模型 [3] - 腾讯推出多模态模型Hunyuan-MT-7B [3] - 阶跃星辰发布音频生成模型Step-Audio 2 mini [3] - 谷歌推出nano banana模板优化移动端AI部署 [5] 应用与功能创新 - Meta启动第三方AI合作计划 [3] - OpenAI推出实时交互功能GPT-realtime [3] - Claude更新用户数据使用政策 [3] - 多部门与平台联合推行AI内容标识系统 [3] - 清华大学开发具身强化学习框架 [3] - 谷歌搜索新增「详解网页」功能 [3] - 腾讯混元实验室构建3D世界模型 [3] - Runway推出跨界机器人系统 [3] - flowith推出AI人生模拟器应用 [5] - Aivilization开发AI小镇模拟平台 [5] - 智谱AI报告API调用量显著增长 [5] - OpenAI启动OpenAI for Science科研计划 [5] - Midoo.AI推出语言学习智能体 [5] - 加州大学圣地亚哥分校发布智能体浏览器 [5] - 苹果研发AI搜索技术 [5] - OpenAI开放Projects协作平台 [5] 科技突破与硬件 - 清华大学研发乒乓球机器人 [5] - 加州大学洛杉矶分校开发AI脑机接口技术 [5] - 九三阅兵展示国产机器狼 [5] - RoboScience推出RoboMirage仿真平台 [5] - 特斯拉发布「金色擎天柱」人形机器人 [5] - 上海AI实验室提出科研AI进化论 [5] 资本运作与组织变动 - OpenAI收购数据分析公司Statsig [5] - Anthropic完成130亿美元融资 [5] - OpenAI收编Alex团队增强研发能力 [5] - xAI发生工程师团队叛逃事件 [5] - Meta有新高管离职 [5] - Salesforce裁员4000人 [5] 行业观点与战略 - a16z提出AI硬件细分市场切入策略 [5] - DeepSeek披露V3/R1模型训练细节 [5] - 特斯拉公布宏伟蓝图4.0战略 [5] - 美国高校修订学生使用AI政策 [5] - OpenAI专家分享AI产品管理策略 [5] - OpenAI发布AI领导力指南 [5] 行业活动与测试 - 多家机构组织GPT-5等模型狼人杀对战测试 [5]
意识的七大理论,走到哪一步了?
腾讯研究院· 2025-09-05 08:01
文章核心观点 - 文章对意识理论进行了跨学科综述,涵盖信息论、量子物理、认知心理学、生理学和计算机科学等领域,旨在从计算角度连接这些理论,为构建人工意识提供基础[2][8][9] - 意识被定义为由唤醒(清醒状态)和感知(主观体验)组成,二者是意识的必要条件但非充分条件,例如在微意识状态中唤醒和感知水平高但意识仍缺失[16][17][20] - 文章讨论了意识与智能的区别,智能定义为完成复杂目标的能力,而意识是主观体验,后者更难以测量和解释[22][23][26] - 自由意志与意识的关系存在争议,可能涉及量子随机性或幻觉机制,但目前仍无明确科学证据支持或否定[28][30][32] - 睡眠中的意识水平取决于大脑活动的整合程度,例如在NREM睡眠中整合信息能力降低导致意识减弱[35][36][37] - 现有意识理论包括整合信息论(IIT)、协调客观还原(Orch OR)、全局工作空间理论(GWT)、高阶层次理论(HOT)、注意图式理论(AST)和意识图灵机(CTM),各有不同解释和计算模型[38][40][102] - 意识测量指标包括基于电信号(如PCI、BIS)和行为(如GCS、CRS-R)的方法,用于评估临床意识水平[18][111][113] 整合信息论(IIT) - IIT认为意识对应于系统整合信息的能力,由最大不可约简的因果结构量化,使用有效信息(EI)和互信息(MI)等指标计算[42][46][47] - 理论提出意识与信息熵相关,系统需具备高信息整合能力,例如大脑皮层因功能整合而产生高Φ值,而小脑因缺乏依赖关系而不重要[42][44][49] - 生物学证据显示,在NREM睡眠或麻醉状态下,大脑皮层连接中断导致信息整合能力降低,与意识减弱一致[36][49][50] 作为物质状态的意识 - 意识被视为一种物质状态("感知器"),需满足信息原则、整合原则、独立原则和动力学原则,但这些原则可能存在冲突[52][54][55] - 整合悖论指出经典系统(如Hopfield网络)的信息整合容量有限(例如1011个神经元仅37比特),远低于人类意识体验的信息量[56] - 独立原则导致量子芝诺效应,即系统分解为最大独立子系统时会停止演化,与动力学原则冲突[59][62][64] 协调客观还原理论(Orch OR) - Orch OR理论提出意识源于大脑微管中量子计算的终止,通过客观还原(OR)过程产生非确定性自由意志[65][66][71] - 微管蛋白的量子叠加状态(如电子自旋方向)可能在达到阈值(τ≈h/EG)时发生坍缩,触发意识瞬间[67][71][72] - 理论缺乏充分实验证据,但提供了可证伪的计算框架,例如γ同步脑电图(30-90Hz)可能与意识相关[72] 全局工作空间理论(GWT) - GWT将意识描述为"意识剧场",包括工作记忆舞台、聚光灯、演员和观众等组件,意识容量有限且信息需被广播[74][75][77] - 计算模型如IDA和LIDA实现了GWT,用于任务处理和信息广播,例如海军岗位任务测试[78][79] - 理论激发后续研究,如EEG相干性分析情绪作用,或深度学习中的全局潜在工作空间(GLW)设计[79] 高阶层次理论(HOT) - HOT认为意识产生于高阶表征,分为高阶感知理论(HOPT)、高阶思维理论(HOTT)和自我表征理论(SRT)[81][82][86] - HOPT假设存在内感官生成二阶感知,HOTT强调心理状态引发高阶思维,SRT认为意识状态自我表征[84][87][91] - 计算模型如元认知神经网络使用一阶和二阶网络预测任务置信度,在爱荷华赌博任务等中测试[89] 注意图式理论(AST) - AST将意识定义为注意力的模型,主观意识(M-意识)是客观注意过程(I-意识)的自我建模[96][97][100] - 理论统一GWT和HOT,I-意识对应GWT的信息广播,M-意识对应HOT的高阶表征[102] - 实际实现涉及三个网络:注意力竞争网络(A)、预测模型网络(B)和报告生成网络(C)[101] 意识图灵机(CTM) - CTM扩展传统图灵机,加入"意识感",由STM、LTM、上传树、下传树等组件构成,信息流通过竞争和广播实现[104][107][108] - 使用"心语"作为内部语言,自我建模通过"世界模型"处理器实现,自由意志由上传树竞争中的随机性模拟[108] - 与GWT相比,CTM的STM每次只处理一个信息块,且所有处理器位于LTM中[109] 意识测量指标 - 基于电信号的指标包括双谱指数(BIS)(0-100分评估麻醉深度)、扰动复杂性指数(PCI)(使用TMS-EEG计算复杂性)和可解释意识指标(ECI)(深度学习模型评估唤醒和感知)[113] - 基于行为的指标包括格拉斯哥昏迷量表(GCS)(眼动、语言和运动反应)、昏迷恢复量表(CRS-R)(情绪、记忆和注意力)和无反应全概述(FOUR)(眼、运动、脑干和呼吸评估)[111][113]
腾讯研究院AI速递 20250905
腾讯研究院· 2025-09-04 22:42
OpenAI战略布局与产品更新 - OpenAI收购Xcode最流行的编程Copilot插件Alex团队 创始人Daniel Edrisian及全体成员加入OpenAI Codex团队[1] - Alex插件深度集成Xcode 提供代码自动补全和对话功能 支持在Xcode中直接操作修改代码 实现开发任务自动化[1] - OpenAI向免费版ChatGPT开放Projects功能 支持上传最多5个文件 管理项目颜色与图标 提供专属项目记忆控制选项[5][6] - Projects功能允许集中管理文档 代码 图片等文件 添加自定义指令 大幅提升使用效率 已在网页版和安卓端开放 iOS版即将上线[5][6] 苹果AI战略与人才变动 - 苹果计划2026年春季推出代号"世界知识问答"的AI搜索引擎 将与ChatGPT和Perplexity直接竞争[2] - 苹果与谷歌达成正式协议 利用谷歌模型为Siri提供部分技术支持[2] - 苹果面临AI人才流失危机 数周内失去10名AI研究员 包括基础模型团队负责人庞若鸣等核心人员 大多加入Meta[2] 中国AI技术进展 - 月之暗面发布Kimi K2-0905模型 支持256K超长上下文(K2-0711仅128K) 增强编程能力并保持创意写作SOTA水平[3] - 快手开源80亿参数多模态大模型Keye-VL-1.5 支持128k tokens扩展上下文 在多项视频理解基准测试取得SOTA[4] - Keye-VL-1.5采用慢-快视频编码策略 能在10秒内处理数分钟视频内容 自动识别AI生成内容 适用于视频推荐和内容审核[4] 企业AI应用与影响 - Salesforce裁撤4000个客户支持岗位(从9000人减至5000人) CEO称因AI客服系统Agentforce大幅提升效率[7] - Agentforce已承担公司内部50%工作量 但Salesforce仍计划增招1000-2000名销售人员向客户解释AI价值[7] - OpenAI白皮书显示早期采用AI的企业收入增长速度比同行快1.5倍 提出五大核心原则包括明确AI战略与KPI挂钩[9] 机器人技术与科研进展 - 特斯拉全新金色Optimus机器人配备类人双手 外观设计更加精简 马斯克目标2025年生产5000台 2026年达5万台[8] - 上海AI Lab联合20余家机构发布科学大语言模型全面综述 梳理600+数据集与模型 揭示2018-2025年四次范式转移[10] - 科学大模型发展至科学智能体阶段 Intern-S1等模型实现通才与专才融合 测评体系向动态过程导向型转变[10]
泡泡共同体
腾讯研究院· 2025-09-04 08:33
核心观点 - 提出"泡泡共同体"概念 批判传统"信息茧房"隐喻的单向度局限 强调数字空间中个体与算法互动形成的异质性共存结构[2][31] - 算法技术构建"骄纵空间" 通过过滤-黏合-循环三重机制将用户纳入数据资本主义代谢系统 形成寄生性结构[10][12] - 数字时代面临的核心问题是"数字迷雾"与"认知茧房" 而非单纯的信息封闭 需要多维度解决方案[16][19] 数字空间形态理论 - 引入斯洛特戴克"球域三态"理论:气泡对应私人信息领域 球体对应算法加持的群体圈层 泡沫对应复数气泡的聚合[3][5][6] - 泡泡共同体具有"共存式隔离"特征 气泡间通过对抗性连接维持平衡 既非完全封闭也非彻底开放[6][22][31] - 蜂巢隐喻强调单元间有机连接 每个蜂房是私人空间 通过共用壁面形成资源共享网络[7] 算法机制与资本逻辑 - 算法骄纵空间通过减轻认知负担机制构建 依赖过滤(被动构建边界) 黏合(主动加固边界) 循环(数据资本代谢)三重机制[10][11][12] - 用户行为数据转化为"认知粘液" 成为优化推荐的关键依据 用户主动参与边界构建[11] - 数据资本主义将用户情感宣泄转化为流量石油 观点对抗转化为平台利润 形成数字时代"水晶宫"[12] 群体互动与认知异化 - 对抗性刺激取代情感共鸣成为群体粘结剂 导致群体极化对立[13] - 算法固化个体流动性 用户在半液态空间中移动 无法突破算法划定的认知框架[14] - 自吞噬循环使系统丧失活力 同质信息自我复制 导致群体衰落或极端化[15] 认知困境本质 - 数字迷雾表现为碎片化信息推送 情绪化内容渲染 虚假信息掺杂 导致个体失去判断力[18] - 认知茧房源于证实性偏见与逆火效应 是自我防卫的保护壳 比信息茧房更难突破[19][20] - 信息茧房在信息过载环境中具有认知聚焦的自我保护功能[17] 优化路径方案 - 算法干预需注入异质菌 提高认知多样性权重 建立跨气泡信息中转站促进异质信息流动[24][25] - 球体再气化需开放推荐API接口 搭建公共虚拟辩论厅 发起跨气泡协作项目软化认知边界[26] - 社会工程需建立用户-平台-政府三方契约:用户培养悬置能力 平台平衡商业与生态责任 政府制定评估标准[27][28] 数字生态愿景 - 泡泡共同体是由微小碎片通过有价值连接构成的复杂生态 无需打破而需优化共生关系[33] - 智能时代需要数字克里斯朵夫式的非人行动者 通过算法和AI代理促进异质性共存[32] - 蜂巢是可供繁衍交流的生活场所 而非过渡阶段 强调重新找回生活本体价值[33]