Workflow
生成式人工智能
icon
搜索文档
肖仰华教授:具身智能距离“涌现”还有多远?
36氪· 2025-06-27 11:30
人工智能技术发展路径 - 人工智能发展呈现两条清晰脉络:生成式人工智能(AIGC)和具身智能 前者聚焦机器认知能力 后者侧重感知与行动能力 [3][6][7] - 生成式大模型本质是让机器具备人类大脑的认知功能 包括语言生成和逻辑思考能力 具身智能则模拟人类身体感知与环境交互能力 [6][7] - 认知智能与具身智能的下一个里程碑是身心协同阶段 需实现身体与大脑的双向塑造 [3][8][9] 技术革命性特质 - 判断技术革命性的三大标准:基础性(如水电煤)、生产力指数级提升、对社会上层建筑的颠覆性影响 [9][10] - 生成式AI符合三大标准:成为新型基础设施 脑力工作效率提升百倍 渗透社会各领域 [10] - 具身智能对生产力的提升作用有限 80亿机器人产能仅相当于人口增长1-2倍 且受安全伦理制约 [11][12][13] 模型发展规律 - Scaling law主导生成式AI初期发展 依赖海量数据(万亿token)和大规模算力 [14] - 后训练范式崛起(如DeepSeek R1) 数据质量与训练策略取代规模成为关键 参数规模让位于算法设计 [15][16] - 行业大模型落地瓶颈在于数据 央国企需投入80%精力治理行业数据 高质量数据集建设成产业护城河 [18][19] 具身智能发展挑战 - 数据缺口显著:最大具身数据集仅百亿token 较语言模型差2个数量级 仿真/合成数据质量不足 [21][22] - 泛化能力受限:环境表达复杂性(如办公室场景需建模高维身体状态)导致数据采集困难 [31][32] - 突破路径包括增加训练量(虚拟试错) 借鉴人类类比/归纳机制 但需敬畏"不可言说"的交互复杂性 [33][34] 产业实现范式 - 三大技术路线并存:连接主义(神经网络)、符号主义(知识图谱)、行为主义(强化学习) 分别对应数据学习、知识学习和实践学习 [36][37][38] - 机器人应走场景化路径而非绝对通用 功能受限于物理构造 机械臂案例显示需任务与身体适配 [42][43] - 集约化需适度 扫地机器人通过附加刷头扩展功能 但强行植入多能力违背产业逻辑 [42][43] 技术风险与治理 - 物理伤害风险远低于认知风险 需警惕AI通过决策误导造成的系统性危害 [45][46] - 安全治理核心是发展AI监管师职业 建立"拔插头"机制 同时加强价值观对齐研究 [48][49] - 身体限制可成为安全保障 思想无边界才是最大风险源 [46][47] 行业影响与教育变革 - AI将冲击产业分工基础 未来工作意义转向体验而非谋生 物质极大丰富改变经济逻辑 [62] - 教育需破除内卷 在保留核心技能(写作/编程)基础上 培养AI难以替代的鉴赏/批判能力 [55][61] - 学科交叉与内心探索是重建价值体系方向 需拓展认知边界应对文明转型 [56][57]
肖仰华教授:具身智能距离“涌现”还有多远?|Al&Society百人百问
腾讯研究院· 2025-06-27 06:59
生成式AI与具身智能的发展路径 - 生成式AI以AIGC为代表,目标是让机器具备人类大脑的认知能力,包括语言生成和逻辑思考能力 [9] - 具身智能目标是让机器习得人类身体的感知和行动能力,实现与复杂世界的高效交互 [10] - 两条技术路线都是通往AGI的关键形态,下一个重要里程碑是身心协同阶段 [10] - 生成式AI已实现生产力成百上千倍提升,如合同审校、绘画制作等工作效率大幅提高 [13] - 具身智能对生产力的提升作用相对有限,可能仅相当于人口增长1-2倍的效果 [15] 技术革命的三重标准 - 基础性:技术需像水电煤一样成为基础设施 [13] - 生产力提升:需实现指数级效率提升,如AIGC极大提高论文生产力 [13] - 社会影响:需深度渗透社会各领域,改变上层建筑 [14] - 生成式AI完全符合这三重标准,是一场真正的技术革命 [14] - 具身智能对社会的影响力相对有限,更多是认知智能突破后的技术延伸 [16] 数据与模型的关系演进 - 业界观点:模型算法决定效果下限,数据决定上限 [20] - 大模型研发70-80%成本投入在数据上,剩余在算力运维和算法设计 [21] - 数据墙问题凸显:互联网公开高质量数据已接近枯竭 [22] - 后训练范式崛起:数据规模让位于质量,算力规模让位于算法设计 [18] - 数据不足可通过知识注入缓解,但培育高质量数据集仍是根本 [23] 具身智能的数据挑战 - 当前具身模型训练数据量仅百亿token级,与语言模型万亿级相差两个数量级 [24] - 数据采集面临个体体验表达困难和环境建模复杂双重挑战 [34][35] - 真机数据成本高昂,仿真数据质量有限,制约GPT时刻到来 [25] - 可能解决方案:穿戴设备普及形成动作轨迹数据 [26] - 训练策略调整:数据量不足时可增加训练量,借鉴人类泛化机制 [36][38] 产业落地逻辑 - 行业AI落地的关键在于行业数据治理和清洗 [21] - 央国企等大甲方应重点投入行业数据准备而非模型研究 [22] - 具身机器人应走场景化、任务化路径,而非追求绝对通用性 [48] - 身体构造决定功能边界,集约化需考虑物理可行性 [49] - 专用机器人价值明确,通用机器人是伪命题 [48] 技术范式演进 - 仍未跳出符号主义、连接主义和行为主义三大传统范式 [39] - 连接主义:模拟神经网络,处理感知任务 [40] - 符号主义:基于知识推理,处理认知任务 [40] - 行为主义:通过交互反馈进化,处理技能习得 [41] - 三种范式在完整AI解决方案中各有侧重 [43] 理性思维发展 - 人类能力分为知性、理性和感性三个维度 [28] - GPT4前主要训练知性能力,O1和DeepSeek R1开启理性能力 [29] - ToB应用需要专业理性思维,ToC需要共情感性能力 [31] - OpenAI布局完整:知性(GPT4)、感性(GPT-4o)、理性(O1) [31] - 国产大模型与国际差距主要在理性能力即知识应用水平 [29]
美国科技公司员工亲述:AI夺走我的饭碗,我们只能离开,或者硬扛
36氪· 2025-06-27 06:22
生成式AI引发的科技行业劳动力变革 核心观点 - 生成式AI正在美国科技行业引发深刻劳动力变革 渗透至工作流程 考核指标和岗位结构 导致员工面临重构 边缘化甚至被替代的集体焦虑 [1] - 科技公司强制推行AI工具 将其纳入绩效考核 员工不用AI可能面临淘汰 专业尊严受损 [4] - AI被用作压低成本 掩盖决策失误和裁员合法性的工具 而非真正提升效率 [7] 各公司具体案例 谷歌 - AI工具使用从"推荐"变为"必须" 成为OKR隐性评估标准 员工被公开批评未使用AI将落后 [2] - 员工担忧AI影响产品质量和职业伦理 但高层视其为"进步阻力" 氛围具惩罚性 [2] TikTok - 2024年底用AI审核系统替代人工团队 虽模型错判率高 但公司更在意其"不抱怨 不请假"特性 [2] - 用户因误判申诉时 公司选择优化模型而非重建人工团队 员工自嘲为"AI试验品" [2] Adobe - 前员工因反对生成式AI伦理和版权问题辞职 公司使用OpenAI方案却避谈风险 [3] - 未经授权使用创作者作品训练模型 内部反抗组织难以形成因员工害怕被贴"不创新"标签 [3] Dropbox - 2023年底推广AI写作工具 将内容撰写岗整合为"AI编辑支持" 员工沦为AI内容校对员 [5] - 员工职责变为检查AI生成内容通顺度 禁止大幅修改以防"损害模型学习效果" [5] CrowdStrike - 2024年5月以"聚焦AI效率"为由裁员500人 幸存者面临更重工作量和不可靠AI工具 [6] - AI渗透客服 工单 代码审查等全流程 但错误频出 员工需"高效配合AI"且无补偿 [6] 行业普遍现象 工作流程强制AI化 - 软件工程师被默认为需使用AI辅助编码 成为绩效考核隐性指标 管理层坚持"速度优先于正确" [7] - 健康科技公司员工不用AI会被贴"效率低下"标签 教育科技公司要求用AI撰写内部祝贺信息 [7] 企业文化异化 - AI未实现减负 反成压榨借口 员工需承担被裁同事工作量且无补偿 [7] - 部分公司为AI助手虚构"少数族裔"面孔制造多元假象 实际管理层缺乏真实代表 [7]
摩根士丹利:微软对OpenAI的投资正在取得成功
快讯· 2025-06-26 19:31
微软对OpenAI的投资进展 - 微软对OpenAI的投资正在取得成功,分析师上调目标股价至530美元 [1] - 公司在直接货币化方面实现增长,IT领域钱包份额提升 [1] - Azure AI业务取得进展,在生成式人工智能创新周期中处于有利地位 [1] 微软财务与增长预期 - 公司预计将保持支出纪律,实现中等两位数的复合年增长率 [1]
张亚勤:未来电车品牌可能出现整合,2030年将有10%新车具备 L4 级自动驾驶能力
搜狐财经· 2025-06-26 10:04
自动驾驶技术进展 - 自动驾驶领域即将迎来"DeepSeek时刻",去年和今年具有里程碑意义,机器人出租车取得重大进展 [2] - 自动驾驶技术始于十年前,已吸引数百亿美元投资,机器人出租车在旧金山、洛杉矶、奥斯汀、东京等地进行商业化尝试 [2] - 百度Apollo Go系统在武汉试运营成功,超过一千辆车覆盖整个城市,文远知行等中国公司也在该领域发力 [2] - 预计到2025年底,自动驾驶技术将在武汉等复杂城市环境中展现成熟、安全且经过验证的运营能力 [2] 安全与经济效益 - 自动驾驶核心目标之一是提升安全性,目标是比人类驾驶安全十倍或减少90%事故,目前90%交通事故由人为错误导致 [3] - 另一核心目标是变革车辆经济性,人类驾驶员成本占自动出租车总成本约60%,去掉驾驶员后运行经济性有望提升至少两倍 [3] - 目前业务规模已扩展到约150亿美元投资 [3] 生成式AI与大模型的作用 - 生成式AI和大语言模型帮助自动驾驶解决海量数据处理与理解问题,可模拟罕见场景生成大量训练数据 [3] - 借助深度学习和大模型,可构建端到端决策模型,简化大部分规则,迭代速度大大加快,视觉模型和行动模型仍是挑战 [3] 未来预测与行业趋势 - 预计到2030年,新车出货量中10%将具备L4级自动驾驶能力,服务于自动驾驶出租车和消费者市场 [4] - 电动汽车生态系统逐步成熟,但仍需完善充电基础设施和竞争规则,未来电动汽车品牌可能出现整合 [4]
从虚拟到可行:首席财务官如何重新规划人工智能的应用
36氪· 2025-06-26 08:02
CFO在AI转型中的核心角色 - CFO凭借对企业全局的统筹视野和财务战略规划能力,在推动AI技术落地方面具有独特优势,能够精准平衡创新投入与可量化的业务成果 [2] - 生成式AI(GenAI)和AI智能体可独立完成约70亿项任务,助力企业实现系统级生产力跃升,但需与企业战略目标深度协同以避免资源分散 [3] - CFO需以战略视角规划AI落地路径,确保技术部署带来显著投资回报,而非陷入"孤岛式"开发 [3] AI项目落地的三大核心维度 价值维度 - 企业需明确界定AI创造的具体业务价值,例如通过算法优化销售表现实现年收入从100万美元增长至130万美元 [5] - 成功企业聚焦解决可量化业务挑战(如客户群体预测),通过阶段性成果积累规避高成本试错风险 [5] - 务实策略可间接推动组织知识资产沉淀,甚至引发文化变革以应对未来复杂问题 [5] 数据维度 - AI模型有效性高度依赖数据质量与可获取性,需从"数据可访问性"而非仅所有权角度评估资源 [8] - 数据协作平台通过将算法部署至数据存储位置(而非迁移数据),在保障隐私前提下实现模型训练 [7][8] - 医疗领域案例显示,医院与制药公司无需共享原始数据即可共同训练算法提升诊疗精准度 [9] 人员维度 - 52%美国受访者对AI广泛应用感到担忧,企业需强调AI扩展人类能力而非替代的核心价值 [12] - 员工抵触情绪会削弱项目效果,需通过早期沟通和持续互动建立信任 [12] - 变革管理不足将增加失败风险,需明确AI赋能员工实现更高价值工作的定位 [12] CFO的AI行动框架 - 决策前需聚焦三大问题:创造何种价值、数据获取能力、员工对变革的接受度 [13][15] - 数据资源不足时应优先解决访问权限,员工支持度低则需投入变革管理 [13] - 需系统性跟踪项目成效,重大AI投资应包含明确的后续评估计划和预算 [13]
快手上线AI单元剧,AIGC内容如何商业化落地
贝壳财经· 2025-06-26 08:02
AIGC内容商业化进展 - 行业当前处于启蒙阶段,尚未形成完善的商业模式,团队正在尝试IP层面的打造[1] - 多家视频模型厂商推出创作者扶持计划,正在争夺AI创作者[1] - 可灵AI与创作者合作旨在帮助其找到广告、宣传片等商业化机会,建立繁荣生态[1] AI在影视行业的应用现状 - AIGC内容目前无法与实拍内容百分百相似[3] - AI能以30%-50%制作时间、15%-40%成本达到70%实拍效果[3] - AI已开始生成空镜、打斗等场景,但距离替代荧幕画面仍有差距[3] - 在科幻、概念型题材上降本效果明显,传统制作成本可能是AI的100倍[3] 视频生成模型发展趋势 - 大模型行业迭代趋势显示模型成本将大幅下降,可灵在价格方面会更激进[4] - 可灵AI全球用户突破2200万,累计生成1.68亿个视频及3.44亿张图片[4] - 可灵AI一季度营收超1.5亿元,70%来自专业用户付费订阅[4] 可灵AI未来发展方向 - 首要任务是做好基础模型,提升表达、稳定性、可控性[5] - 产品核心思路是交付结果导向,将推出更多产品形态[6] - 积极探索智能体在视频创作中的价值[6] - 行业需要解决视频放大后出现的问题等优化空间[5]
生成式AI“未保”怎么做?专家:建保护模式,平衡管控体验
南方都市报· 2025-06-26 07:45
生成式AI在未成年人中的渗透与风险 - 生成式AI已迅速进入未成年人数字生活,渗透学习辅助、社交陪伴等场景,但存在生成不良图像、提供不靠谱解题答案等隐忧 [1] - 6-19岁网民使用生成式AI产品的比例占整体网民的21.1%,智能问答、AI写作/绘画、AI社交聊天成为未成年人日常 [2] 未成年人保护政策与框架建设 - 《向未成年人提供生成式人工智能服务安全指引》首次提出覆盖"训练数据-模型训练-场景应用-服务运营"的全生命周期安全管理框架 [2][3] - 北京师范大学发布CI-STEP指标评价模型,涵盖6个维度的未成年人保护评估体系 [3] - 《未成年人网络保护条例》要求网络平台提供未成年人模式或专区,《指引》将其纳入全生命周期管理 [4] 未成年人模式设计核心原则 - 需防范错误偏见及不良信息、隐私数据泄露、沉迷与过度依赖三大风险 [2][4] - 功能设计需包含便捷操作(时段/时长/内容管控)、分龄推荐(3/8/12/16/18岁区间)、内容安全审核机制 [5][6] - 应实现身份识别、家长管控(时长限制/使用报告)、高风险对话干预(自杀倾向预警)、一键举报等功能 [6] 行业实践现状与改进方向 - 当前多数AI应用(如智能问答、AI陪聊)仅需手机号注册即可使用,部分青少年模式仍保留成人化内容 [4] - AI社交/陪聊类应用因涉及情感诱导和付费解锁机制,被专家列为重点监管场景 [5] - 需平衡保护与体验,在数据训练阶段植入未成年人保护机制,强化正向价值导向 [7]
美股三大股指走势分化,英伟达重回全球市值第一
搜狐财经· 2025-06-26 01:07
美股市场表现 - 纳指涨0.31%,标普500指数平收,道指跌0.25% [2] - 英伟达涨超4%,总市值达3.77万亿美元,成为全球市值最高公司 [2] - 特斯拉跌超3%,英特尔跌逾1%,奈飞、亚马逊、Meta小幅下跌 [2] - 美股加密货币概念股冲高回落,Coinbase涨3.03%,Robinhood涨0.90%,Circle跌超10% [2] - 纳斯达克中国金龙指数跌0.6%,霸王茶姬跌超8%,满帮、小鹏汽车跌超3%,富途控股涨约6% [2] 英伟达战略布局 - 黄仁勋表示机器人技术将是下一个万亿级市场,自动驾驶汽车为首个商业化场景 [3] - 预计未来将有数十亿个机器人、数亿辆自动驾驶汽车和数十万个机器人工厂由英伟达技术驱动 [3] - 数据中心业务收入同比激增427%,AI芯片需求持续井喷 [3] - Loop Capital预测英伟达市值可达6万亿美元,比当前高出65%以上 [3] - 分析师将英伟达目标价从175美元上调至250美元,称其处于生成式AI应用"黄金浪潮"前端 [3] 美联储政策动向 - 鲍威尔重申不急于降息,强调高关税带来不确定性 [4] - 市场预计7月降息可能性近25%,9月首次降息可能性为67% [5] - 美联储即将公布利率决议,市场普遍预期维持利率不变 [5] - 通胀数据和就业指标变化可能引发市场波动 [5] - 美联储政策信号将影响科技股走势,"鸽派"信号或延续涨势,"鹰派"信号或导致调整 [5]
实测AI解题:答案摇摆,一质疑就改口!孩子使用如何引导?
南方都市报· 2025-06-25 09:07
生成式AI在未成年人教育领域的应用现状 - 生成式AI已渗透未成年人学习辅助、社交陪伴等场景,但存在不良图像生成、早熟引导、答案不靠谱等隐忧[1] - 10款主流大模型及学习类APP测评显示:小学初中题目解答准确率高,高中阶段错误率显著提升[2][3] - 豆包、KIMI、文心一言、通义千问等大模型具备拍照解题功能,快对AI、小猿AI等学习类APP可拍照搜题+AI答疑[3] AI解题功能的技术缺陷 - 同一高中数学题出现四种不同答案,如夸克AI三次回答分别为A/D、B、B/C,KIMI等应用存在类似现象[4] - AI存在"谄媚"倾向:小思AI在明确C项正确情况下仍迎合用户改为B/D,腾讯元宝因用户质疑而推翻正确答案[5][6] - 历史题测试中,豆包选A后,小思AI、腾讯元宝、KIMI被用户质疑后均转向论证错误选项A的正确性[9] 行业监管与产品改进措施 - 6款大模型无青少年模式,仅腾讯元宝会拒绝直接输出作业答案,其余5款均直接解题[10] - 快问AI、快对AI、小猿AI启用家长身份验证机制,文心一言需成年人认证才显示答案[11][14] - 教育部发布指南禁止直接复制AI生成内容,强调分学段差异化应用[15] 教育场景的AI依赖风险 - 初中生群体出现"一搜党"现象,教师发现作文、手抄报等作业存在明显AI生成痕迹[9][10] - AI生成内容存在模式化缺陷:作文词藻华丽但内容空洞,不同主题使用相似论据[10] - 学者指出过早使用AI会阻碍技能掌握,有效运用需以用户深厚知识为前提[10]