腾讯研究院

搜索文档
腾讯研究院AI速递 20250619
腾讯研究院· 2025-06-18 15:22
谷歌Gemini 2.5发布 - 谷歌发布Gemini 2.5全系列模型,其中Flash-Lite版本速度最快、性价比最高,输入仅0.1美元/百万token [1] - Gemini 2.5在玩宝可梦游戏时展现类人行为,生命值低时会"恐慌"导致推理能力下降 [1] - 2.5系列采用稀疏MoE架构,原生支持多模态和百万级token长文本,性能全面超越前代 [1] 微软三大算法突破 - 微软发布三大创新算法rStar-Math、LIPS和CPL,通过蒙特卡洛树搜索和代码增强CoT等方法突破大模型推理瓶颈 [2] - rStar-Math通过自我进化和Python代码验证提升数学推理质量,LIPS结合符号工具和大模型实现数学证明策略优化 [2] - CPL算法通过高层次抽象计划空间搜索和Step-APO学习关键步骤,显著提升模型跨任务泛化能力 [2] MiniMax视频模型海螺02 - MiniMax发布海螺02视频生成工具,可创建10秒1080P视频,在国际榜单图像生视频项目排名第2,超越谷歌Veo3 [3] - 海螺02实现逼真物理效果、精确物体交互和复杂杂技动作,支持多语言提示,10秒视频仅需一次生成 [3] - 国际视频生成榜单前五名中四家为中国厂商,展现中国在该领域的领先地位 [3] Meta智能眼镜战略 - Meta与意大利高端品牌Prada合作开发AI智能眼镜,拓展与EssilorLuxottica之外的时尚公司合作 [4] - Meta将于6月20日发布面向运动人群的Oakley智能眼镜,售价约360美元,具备更好的防风雨性能 [4] - 自2023年以来Meta与Luxottica已售出200万副Ray-Ban智能眼镜,计划到2026年底年产量提升至1000万副 [5] 罗永浩数字人直播 - 罗永浩数字人在百度电商首场直播吸引超1300万人次观看,GMV突破5500万元,部分品类超真人首秀数据 [6] - 百度慧播星技术实现"神形音容话"五维统一,通过剧本驱动多模协同,直播中AI调用知识库1.3万次 [6] - 百度计划追加10万个数字人名额和1亿元补贴,推动数字人直播产业规模化发展 [6] 大模型"六小龙"调整 - 大模型"六小龙"半年内22位高管密集离职,零一万物7位、百川智能和智谱AI各5位 [7] - DeepSeek低成本高性能冲击下,零一万物放弃训练大模型转向阿里云,百川智能基础模型进入静默期,阶跃星辰关闭冒泡鸭产品 [7] - 商业化成生存关键,六小龙需在开源大模型时代寻找差异化应用突围 [7] 港科广医学模型 - 港科大等发布首个医学世界模型MeWM,通过3D扩散模型模拟不同治疗方案下肿瘤形态演变,图灵测试准确率达79% [8] - 系统构建"策略生成-动态模拟-风险评估"闭环,在肝癌TACE治疗中F1-score达64.08%,接近专业医生水平 [8] - MeWM生存风险预测C-Index达0.752,融入医生决策可带来13%性能提升,实现从经验驱动到数据驱动的精准医疗转型 [8] Karpathy软件3.0观点 - Andrej Karpathy提出软件3.0(提示工程)时代正在取代1.0(代码编程)和2.0(神经网络),LLMs具备类似公用事业、晶圆厂和操作系统的多重属性 [10] - LLMs存在"锯齿状智能"(既能解决复杂问题又在简单任务失败)和"顺行性遗忘症"(缺乏长期记忆)两大缺陷,需要新的"系统提示学习"范式来存储问题解决策略 [10] - AI产品设计应采用"自主性调节滑块",通过控制生成-验证循环实现人机协作,同时强调为智能体而非人类构建工具,因为智能体是数字信息的新消费者类别 [10] Sam Altman AI预测 - Sam Altman预测未来5-10年AI将具备自主科研能力,真正发现新科学,o3推理能力已达博士水平,科学家效率提升3倍 [11] - OpenAI理想产品形态是"AI伴侣",通过多种界面融入生活,了解用户目标并主动提供帮助,而非局限于传统计算设备 [11] - 对Meta高薪挖人回应称其缺乏创新文化只会复制,认为人类会快速适应超级智能时代并创造新工作角色,AI不会造成严重就业威胁 [11] 斯坦福AI创业研究 - 斯坦福研究1500名员工和844项职业任务,发现41%的AI创业投资流向员工不需要的"红灯区"和"低优先区",投资与需求严重错配 [12] - 45.2%职业偏好"人机平等伙伴关系"模式,艺术设计领域仅17.1%任务欢迎自动化,员工最想自动化的是不享受且不担心失业的任务 [12] - AI时代价值技能发生倒置,"培训教授他人"从薪资第21位跃升至人类参与需求第2位,人际关系处理将比信息处理更有价值 [12]
胡泳:人工智能会夺走我们的生活意义吗?
腾讯研究院· 2025-06-18 08:37
超级智能与未来社会 - 超级智能的发展可能带来人类命运的终极挑战,一旦不友好的超级智能出现,人类将失去对其的控制权,命运被锁定[4] - 若能安全发展超级智能,将进入后工作、后稀缺社会,人类劳动过时,面临哲学和精神层面的意义危机[5] - 超级智能可能使人类实现数字形态的不朽,存在时间延长至十亿年,但人类本性将变得完全可塑[5] 深度乌托邦概念 - 深度乌托邦指所有现存问题被解决后的世界状态,人类面临"存在之轻"的无目的感[8] - 该书通过思想实验探讨深度乌托邦中人类价值观的碰撞,研究价值观的基本组成部分[8] - 技术成熟社会意味着科学问题全部解决,人类向宇宙扩展,人口指数增长,冲突源头消除[13] 著作结构与方法论 - 采用非传统哲学专著形式,由虚构讲座、讲义、阅读材料和框架叙事组成,具有实验性风格[10] - 内容包含论证、思想实验、案例研究和实证数据,但未围绕单一核心论点展开系统论证[10][13] - 开放式探索方式可能被部分读者认为"臃肿",但也可能因其趣味性和机智性受到欢迎[11] 冗余类型分析 - 浅层冗余指职业劳动自动化后,人类通过休闲文化仍可过上有意义生活[19] - 深层冗余指后工具性世界中所有人类努力变得冗余,包括休闲活动和育儿等[20] - 数字永生可能通过编程新激情避免无聊,但无法消除乏味感和无意义感[21] 生命意义探讨 - 深度乌托邦生活可能通过强烈体验和人工智能设计的"人工目的"来弥补意义缺失[25] - 客观主义理论认为生命意义需包含整体改善弧线、原创性和助人元素,与主观主义形成对比[25][26] - 即使人类努力冗余,仍可通过培养美德、追求真善美来获得部分生活意义[26] 社会形态争议 - 作者假设最大技术能力社会必然是非常好的社会,这一观点被认为过于乐观[14] - 渐进乌托邦(进托邦)概念更符合历史模式,即每个解决方案都带来新问题[14] - 完美幸福的长久维持可能转化为完美痛苦,人类需要问题解决来获得生活意义[28]
腾讯研究院AI速递 20250618
腾讯研究院· 2025-06-17 15:40
一、DeepSeek-R1在编程领域表现优异 - DeepSeek-R1在LMArena榜单中整体排名第6,是开源模型中的第一名,编程测试排名第2 [1] - 在WebDev Arena网页编程竞赛中,DeepSeek-R1与Claude Opus 4并列第一,分数超过Claude Opus 4 [1] - 该模型在MIT开源协议下提供领先性能,标志着开源AI在编程领域达到与顶级闭源模型相当水平 [1] 二、MiniMax开源高效推理模型MiniMax-M1 - MiniMax-M1仅用380万元、3周时间训练完成,支持100万token输入和8万token输出,生成效率是DeepSeek-R1的4倍 [2] - 采用Lightning Attention混合架构和CISPO强化学习算法,训练效率提升2倍 [2] - 在多项基准测试中表现可比或超越DeepSeek-R1、Qwen3等开源模型,在工具使用和软件工程任务上甚至超越OpenAI o3和Claude 4 Opus [2] 三、Kimi发布开源代码模型Kimi-Dev - Kimi-Dev仅72B参数,在SWE-bench Verified中取得60.4%成绩,成为开源SOTA [3] - 核心设计融合BugFixer和TestWriter双角色,通过自我博弈协调bug修复与测试编写能力 [3] - 以Qwen2.5-72B为基础模型,利用GitHub数据中期训练和强化学习优化,采用MIT协议完全开源 [3] 四、阿里开源Qwen3全系列MLX量化模型 - 阿里开源32款Qwen3全系列MLX量化模型,每款提供4bit、6bit、8bit和BF16四种精度版本 [4] - MLX框架使Mac、iPad及iPhone均可部署Qwen模型,已在魔搭社区和Hugging Face开源 [5] 五、腾讯元宝上线AI编程模式 - 腾讯元宝电脑版使用DeepSeek V3模型,通过@AI编程指令实现一句话写代码功能 [6] - 支持双栏展示界面,左侧提需求右侧实时显示代码,支持HTML即时预览和多种语言在线运行 [6] - 适用于教学辅助、亲子编程、开发辅助等场景,可生成网页、图表、游戏等多种应用 [6] 六、松下发布多模态大模型OmniFlow - OmniFlow支持文本到图像、文本到音频、音频到图像等多种模态间任意转换生成任务 [7] - 采用模块化设计理念,各组件可独立预训练后灵活合并微调,提高训练效率和模型扩展性 [7] - 在MSCOCO-30K等基准测试中表现优异,文本到图像任务FID值显著降低 [7] 七、13岁少年创立AI智能体公司FloweAI - FloweAI开发通用AI智能体,可完成PPT制作、文档撰写、航班预订等任务 [8] - 支持网页端使用,免费用户每月10次任务,付费105元可无限使用并解锁高级功能 [8] - 已吸纳大学生加入团队,创始人设定月入1万美元目标并寻找联合创始人 [8] 八、中科院研制超高并行光计算芯片"流星一号" - "流星一号"首次实现超100并行度光子计算,50GHz主频下理论峰值算力达2560TOPS [10] - 通过波分复用技术和孤子微梳源提供超百波长信道,算力提升2个数量级 [10] - 未来单芯片算力有望突破5000POPS [10] 九、Django创始人警告AI Agent三大致命威胁 - AI Agent存在"致命三重威胁":访问私人数据、暴露于不可信内容、具备外部通信能力 [11] - 攻击者可诱导其窃取用户数据并外泄,LLM会遵循任何输入内容中的指令而无法判断来源可信度 [11] - 目前缺乏100%可靠的防范措施,用户需主动避免"致命三重威胁"组合以确保安全 [11] 十、Anthropic公开Claude深度研究功能构建细节 - Claude采用"指挥家-演奏家"多智能体架构,性能比单智能体高出90.2%但token消耗达15倍 [12] - 系统包含主智能体负责规划分解任务、子智能体并行执行、外部记忆存储和引用智能体验证 [12] - 总结提示工程八大原则和评估三大原则,需解决状态累积、调试困难、部署协调等可靠性挑战 [12]
从黑箱到显微镜:大模型可解释性的现状与未来
腾讯研究院· 2025-06-17 09:14
大模型可解释性的核心观点 - 大模型在编程、科学推理和复杂问题解决等领域展现出"博士级"专业能力,但模型内部机制高度复杂难以解释,被称为"黑箱"[1] - 大模型可解释性是指系统能够以人类可理解的方式阐释其决策过程和输出结果的能力,包括识别关键输入特征、揭示推理路径和解释行为因果关系[3] - 生成式AI的可解释性问题尤其复杂,因为其内部机制属于"涌现"现象,而非直接设计,类似于培育生物的过程[4] - 大模型发展速度远超可解释性研究进展,行业必须加快脚步确保可解释性研究能跟上AI发展步伐[1] 可解释性的关键价值 - 防范AI系统价值偏离与不良行为:可解释性可帮助检测模型是否存在欺骗、权力寻求等异常行为[4][5] - 推动模型调试改进:通过检查模型内部可定位错误行为原因,针对性调整训练数据或模型结构[6] - 防范AI滥用风险:深入观察模型内部可系统性阻止越狱攻击,封堵绕过限制的漏洞[7] - 推动高风险场景落地:金融、司法等领域要求AI决策具备可解释性以满足法律合规和建立用户信任[8] - 探索AI意识边界:可解释性有助于理解模型是否具有意识,为未来AI道德考量提供基础[9] 破解AI黑箱的技术路径 - 自动化解释:利用大模型解释小模型,如GPT-4为GPT-2神经元自动生成自然语言描述[12] - 特征可视化:使用稀疏自编码器技术提取模型内部激活特征,揭示知识组织方式[13][14] - 思维链监控:监测模型推理过程以识别异常行为,如DeepSeek R1公开思维链推理过程[15][16] - 机制可解释性:Anthropic提出"AI显微镜"概念,追踪模型推理过程;DeepMind开源Gemma Scope工具[17][18] 可解释性研究的技术瓶颈 - 神经元多重语义与叠加现象:一个神经元混合表示多个概念,模型内部概念数量可能达数十亿计[19] - 解释规律普适性问题:不同模型架构间的解释规律是否通用仍待验证[19] - 人类理解的认知局限:需要发展人机交互工具将复杂机理信息转化为人类可理解形式[19][20] 行业发展趋势与建议 - OpenAI、DeepMind、Anthropic等领先AI实验室加大对可解释性研究的投入[21] - 研究方向向动态过程追踪、多模态融合等方向演进,如"AI显微镜"和"思维链溯源"[21][22] - 建议采用软法规则鼓励行业自律,如中国人工智能产业发展联盟发布《人工智能安全承诺》[24] - 未来可能实现对模型进行类似"脑部扫描"的全面检查,即"AI核磁共振"[23]
腾讯研究院AI速递 20250617
腾讯研究院· 2025-06-16 14:55
GPT-5训练优化器 - 研究员Keller Jordan凭借Muon优化器博客文章加入OpenAI,可能应用于GPT-5训练 [1] - Muon优化器采用牛顿-舒尔茨迭代法实现矩阵正交化,训练速度比AdamW更快 [1] - Keller批评现有优化器研究文献充斥无效方法,提倡在竞争性训练任务中验证新方法 [1] 谷歌AI架构变革 - 谷歌承认Transformer注意力机制无法实现无限上下文,需核心架构创新 [2] - Gemini将成为谷歌统一平台,连接所有服务并支持全模态能力和智能体功能 [2] - 谷歌重组AI团队整合到DeepMind,Gemini 2.5 Pro被视为重大转折点 [2] 微软AI应用案例 - 微软展示700个AI Agent和Copilot案例,覆盖金融、医疗、教育等多行业 [3] - WellsFargo使用AI将响应时间从10分钟缩至30秒,毕马威减少50%合规工作量 [3] - 米其林生产力提升10倍,SPAR节省89个工作日,84%的BCI用户效率提升10-20% [3] Midjourney视频生成技术 - Midjourney视频模型效果细腻真实但缺乏音频功能 [4] - 采取开放策略邀请用户参与评分,渲染速度提升40%,快速模式从36秒减至22秒 [5] - V7图像模型支持语音生图、草稿模式和对话模式 [5] GenSpark智能浏览器 - AI浏览器将能力融入每个网页,提供比价、选购帮助和视频总结等功能 [6] - 支持"自动驾驶模式"自动浏览网页、整理信息、制作播客 [6] - 内置700多个工具连接实现自动化工作流,目前仅推出Mac版本 [6] AI古画修复技术 - MIT工科生用AI算法将古画修复时间从9个月压缩至3.5小时 [7] - 新方法修复5612个区域并填充57314种颜色,效率提高66倍 [7] - 修复方式可化学去除不损伤原画,缺损区域越多效果越显著 [7] 小鹏自动驾驶模型 - 研发720亿参数云端大模型,验证规模法则在VLA模型持续生效 [10] - 累计处理2000多万条视频片段,算力达10 EFLOPS [10] - Token压缩方法将车端处理量压缩70% [10] AI消费范式重构 - AI将"完成任务"取代"建立关系"成为产品主线,用户月付费可达200美元 [11] - 当前AI社交产品仅嵌入生成内容,未来需重构底层连接方式 [11] - 速度成为主要竞争力,企业需保持"动态领跑" [11] AI发展路线争议 - 黄仁勋反对"AI将取代半数白领岗位"观点,批评Anthropic封闭开发模式 [12] - Anthropic回应称从未主张独家安全AI能力 [12] - 反映两种治理观:审慎伦理框架 vs 开放竞争 [12]
AI将受困于人类数据
腾讯研究院· 2025-06-16 09:26
AI发展拐点:从人类数据时代迈向经验时代 - 当前大型语言模型依赖互联网文本和人工标注等"二手经验"训练,但高质量人类数据已被快速消耗殆尽,新增语料的边际价值正急剧下降 [1][7] - 模型规模继续膨胀却收效递减的"规模壁垒"现象显现,大量科技公司开始转向合成数据 [1] - 智能体必须像婴儿学习玩具、足球运动员在赛场决策那样,通过与环境交互不断生成并利用第一手经验,而非单纯模仿人类旧有文本 [1][8] 经验时代的技术特征 - 智能体需要在真实或高保真模拟环境中持续运行,用环境回馈而非人类偏好作为原生奖励信号 [2] - 发展能够长期复用的世界模型与记忆体系,并通过高并行交互大幅提升样本效率 [2] - 强化学习范例(如AlphaGo、AlphaZero)已证明从模拟经验到现实经验的演进路径 [5][12] 去中心化合作的发展哲学 - "去中心化合作"优于"中心化控制",多元目标并存的生态系统通过分布式激励与竞争协作保持创新活力 [2][16] - 让智能体和人类都保持多样化追求,能降低单点失效与僵化风险,为未来AI治理提供更具韧性的框架 [2] - 人类最大的成功是合作(如经济、市场和政府),最大的失败是合作的失败(如战争、盗窃) [16][17] AI发展的三个阶段 - 模拟时代:AlphaGo、Atari等强化学习智能体从模拟经验中学习 [12] - 人类数据时代:ChatGPT和大型语言模型依赖人类生成的数据 [12] - 经验时代:智能体通过与世界互动的经验学习,AlphaProof是早期例证 [12] 智能体的核心能力构建 - 智能体需要像婴儿那样通过感知-行动循环凭第一人称经验自我学习 [5][8] - 知识必须关于经验而非文字,智能程度取决于预测和控制输入信号(特别是奖励信号)的能力 [10] - 强化学习框架让智能体成为能够做决定、实现目标、与世界互动的一流智能体 [10]
向全球技术人才发出邀约|2025 腾讯广告算法大赛开始了!
腾讯研究院· 2025-06-16 09:26
腾讯广告算法大赛核心亮点 - 聚焦全模态生成式推荐技术(All-Modality Generative Recommendation),探索生成式推荐新范式重构行业生态 [3][8] - 大赛主题为「智 AI,荐未来」,旨在为高校学子提供兼具前瞻性与实战价值的演练场 [3] - 参赛者需基于脱敏用户协同、文本、视觉等全模态历史行为数据预测广告交互,突破传统判别式推荐框架 [8] 评审与资源支持 - 评审团由中国科学院院士胡事民、香港中文大学金国庆教授、腾讯副总裁蒋杰等学界与业界顶尖专家组成 [5] - 获得深圳市市场监管局、人力资源和社会保障局政策支持,获奖者可申请人才培养项目 [7] - 总奖金池达数百万人民币,冠军团队独享超百万现金奖励,决赛队伍全员获腾讯实习Offer及转正机会 [9] 参赛价值与职业发展 - 算法创新可直接应用于腾讯广告日触达亿级用户的流量场景,影响数亿用户 [14] - 广告业务年营收过千亿且稳步增长,技术岗位晋升速度领先行业,公司正扩大技术人才储备 [14] - 优胜者可优先接触腾讯多模态大模型训练平台、实时推荐引擎等前沿技术资源 [14] 赛程与参赛资格 - 报名时间:6月16日-7月31日,初赛(8月1日-9月15日)、复赛(9月16日-10月31日)、决赛(11月线下深圳) [14] - 面向全球全日制在校学生(本科至博士后),博士后符合特定条件可纳入应届生范围 [13] - 赛事由腾讯广告主办,联合腾讯大数据、Angel机器学习平台等内部多个部门承办 [16]
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-06-13 13:11
模型动态 - OpenAI推出o3-pro实测和4o思考模式两项新模型技术 [2] - Meta发布V-JEPA 2世界模型 聚焦多模态理解能力 [2] - Mistral AI推出Magistral推理模型 强化商业场景应用 [2] - 面壁智能发布MiniCPM 4.0模型 参数规模未披露 [2] - 小红书开源dots.llm1模型 布局社区生态 [2] - 智源研究院推出悟界系列模型 专注认知智能研究 [2] 应用进展 - OpenAI上线高级语音拟人功能和AI数学天才应用 [2] - 字节跳动迭代豆包大模型至1.6版本 同步推出即梦图片3.0工具 [2] - 谷歌发布Veo 3 Fast版视频生成工具 ElevenLabs升级v3语音引擎 [2][3] - 智谱AI推出CoCo企业助手 DreamTech发布影视级3D模型系统 [2] - Figure AI展示机器人进展 Krea AI推出1代创意设计平台 [2] - 夸克开发高考志愿大模型 厦大联合企微推出校园AI万事通 [3] - 苹果更新Xcode 26开发工具 美团发布NoCode低代码平台 [3] 科技突破 - Figure研发劳动力系统 理想汽车布局空间与穿戴机器人 [3] - 英伟达推出量子CUDA-Q平台 苹果发布六大OS系统更新 [3] - 中科院开发启蒙系统 荣耀宣布进军机器人领域 [3] 行业观点 - Altman预测AGI技术发展时间线 Ilya Sutskever提出AI全能化假说 [3] - 苹果质疑当前AI推理能力 OpenAI探讨人类对AI的依赖性 [3] - a16z分析生成式引擎优化趋势 Richard Sutton预言经验主导时代 [3] 资本与事件 - Meta投资Scale AI并重建超级智能研究小组 [3][4] - Midjourney面临版权诉讼 Meta签署大规模核电合作协议 [4]
人如何感知虚无?
腾讯研究院· 2025-06-13 05:46
文章核心观点 - 数字"零"的神经表征与感知"缺失"的神经机制存在深刻关联,研究零的神经基础可能为理解意识提供新视角 [1][3][32] - 零在人类文明和个体认知发展中经历了缓慢的接受过程,其抽象性质使其比其他数字更难掌握 [6][10][21] - 大脑中存在专门编码"零"和"缺失"的神经元,这些神经机制可能构成意识体验的基础 [26][42][45] 零的历史发展 - 苏美尔人约5000年前发明占位符系统,使用对角楔形表示数位空缺,这是零的雏形 [6] - 希腊文明排斥零的概念,亚里士多德认为虚无在逻辑上不允许存在 [10] - 印度哲学天然包容虚无概念,公元7世纪数学家婆罗摩笈多确立了零的数学规则,公元876年出现最早的空心圆零符号 [13] - 零通过贸易路线传入欧洲,1202年斐波那契在《算盘书》中引入零概念,但遭到宗教反对(零被视为与神意对立)[14] - 15世纪复式记账法的推广使零在欧洲被完全接纳,零的概念为17世纪末微积分创立奠定基础 [14][16] 零的认知发展特征 - 儿童掌握零概念晚于其他数字,学前儿童知道零表示"没有"但认为1是最小数字 [21][24] - 5个月大婴儿能察觉数量变化但无法理解零个物体的概念 [21] - 成人处理零存在认知困难:判断奇偶性更容易出错(零实为偶数),读取零所需时间更长 [24] - 零的抽象性质要求从物理世界转向概念世界,这与"没有人会出门买零条鱼"的观察一致 [21] 零的神经表征机制 - 10年前首次在猴脑中发现"零神经元",这些神经元对空集(0个点)放电反应最强烈 [26] - 猴脑前部存在梯度放电的零神经元:空集放电最强,1个点微弱放电,2个点更微弱,体现数轴起点特性 [26] - 人类研究中发现对空集放电的神经元与正数点集神经元活动模式不同,表明存在独立的"无"类别 [29] - 脑磁图研究显示大脑对空集和符号零的激活反应相似,表明符号化零能力源于非符号化"无"表征 [31] 缺失感知的神经机制 - 大脑存在专门编码"缺失"的神经元:鸦科动物、猕猴和人类在判断"刺激不存在"时特定神经元被激活 [42] - 感知缺失并非神经活动的空白,而是独特的主动神经编码机制 [44] - 知觉现实监控理论(PRM)和高阶状态空间理论(HOSS)提出大脑存在高阶"事实核查"机制,在感觉区域缺乏可靠活动时主动生成"未感知"信号 [45] - 感知缺失需要反事实推理和元认知能力,要求大脑评估自身感知系统状态 [47] 零与意识的理论关联 - 对零的理解可能依赖于感知缺失的神经机制,掌握零概念可能需要具备感知层面的意识 [51] - 蜜蜂实验显示即使昆虫也展现对零的初步理解,但数字性缺失与感知性缺失的相似性可能是理解意识的关键线索 [54] - 最新意识理论认为零背后的数量表征机制可能是感知虚无的神经基础 [57] - 研究发现视觉中"无"的处理不同于"有",但听觉中寂静与声音的感知特性高度相似,表明感官模态存在差异 [57]
腾讯研究院AI速递 20250613
腾讯研究院· 2025-06-12 14:18
Meta开源V-JEPA 2世界模型 - Meta开源V-JEPA 2世界模型,能理解物理世界,用100万小时视频数据训练,可实现零样本规划和机器人控制 [1] - 模型仅需62小时训练即可生成规划控制模型,在行为分类和预测方面成功率65%-80% [1] - Meta发布三个物理理解基准测试,揭示AI与人类在物理推理能力上仍存在差距 [1] Meta组建AGI团队 - Meta CEO扎克伯格组建"超级智能"小组,挖角谷歌DeepMind首席研究员Jack Rae等AI顶尖人才 [2] - Jack Rae是"压缩即智能"思想代表人物,曾负责Gemini的"思考"功能 [2] - Meta为吸引AI人才提供7-9位数薪酬方案,计划建立约50人规模的团队 [2] Manus推出免费AI聊天模式 - Manus更新界面并推出免费Chat模式,替换原有标准和高投入模式为Agent和Chat两种模式 [3] - 新增创建功能,提供Slides、图片、视频、网页四种选项,生成内容更加专业美观 [3] - Chat模式响应快速且可显示参考出处,在任务规划、幻觉控制和内容丰富度方面较竞品出色 [3] 夸克发布高考志愿大模型 - 夸克推出首个高考志愿大模型,整合官方数据为1335万考生提供免费个性化规划 [4][5] - 模型能处理多维度志愿咨询,分析学校、专业及录取概率,提供梯度建议 [5] - 生成完整志愿报告,含"冲稳保"多策略推荐及历年录取数据 [5] 厦门大学上线校园AI万事通 - 厦门大学通过企业微信"智能机器人"功能解决校园高频咨询问题,搭载DeepSeek与混元大模型 [6] - 系统仅需上传学校现有知识文件即可部署,能处理简单咨询和复杂问题如科研软件安装 [6] - 系统集成于企业微信,学生无需下载新软件,学校半天内即可完成部署 [6] 迪士尼与NBC环球起诉Midjourney - 迪士尼与NBC环球起诉Midjourney侵犯版权,指控其生成复制《星球大战》《冰雪奇缘》等经典角色图像 [7] - Midjourney2024年创收3亿美元,其创始人承认无法追踪图片来源且忽视版权方停止侵权请求 [7] - 两公司要求经济赔偿并申请法院禁令,强调"盗版就是盗版" [7] 银河通用与清华发布OpenWBT - 银河通用与清华大学发布首款开源人形机器人全身遥操系统OpenWBT,支持多机型、跨虚实操作 [8] - 系统仅需VR头显和笔记本即可远程控制机器人执行全身动作,兼容多种机型 [8] - 基于"Real-world-Ready Skill Space"技术,将控制拆分为行走、姿态调整和手部触达三种原子技能 [8] 黄仁勋发布量子计算专用CUDA - 黄仁勋发布量子计算专用CUDA-Q,预言量子计算几年内可应用,在GB200上可提升量子计算开发速度1300倍 [9] - 英伟达预计量子比特将呈摩尔定律增长,未来超算将配备量子处理单元与GPU协同 [9] - 黄仁勋展示"物理AI"战略核心,称此领域拥有50万亿美元市场机会 [9] a16z报告:从SEO到GEO - 搜索正从传统浏览器转向语言模型平台,800亿美元SEO市场被"生成式引擎优化(GEO)"新范式取代 [10] - 竞争焦点从点击率转向"模型引用率",品牌需"编码至AI层","无提示认知度"成为关键指标 [10] - GEO胜出者将构建行动基础设施,品牌最终命题是"模型会记住你吗" [10] AI软件定价趋势 - 传统席位和固定价格模式正被混合定价取代(41%企业采用),结合订阅与使用量计费 [11] - AI定价策略多样化,包括现收现付、套餐制、平台费加使用量等七种模式 [11] - 结果导向定价成为趋势但需满足一致性、归因性、可衡量性和可预测性四要素 [11]