Workflow
Lovart
icon
搜索文档
AI画不出的左手,是因为我们给了它一个偏科的童年。
数字生命卡兹克· 2025-12-10 01:20
文章核心观点 - 当前领先的文生图AI模型(如NanoBananaPro、Gemini、Lovart、ChatGPT、seedream、grok等)普遍无法准确生成涉及“左手”或“左脚”等特定左右关系的图像,例如“左手写字”或“左手拿橘子右手拿苹果” [1][3][5][7][9][12][21] - 该问题的根源并非AI逻辑能力不足,而是其训练数据集中存在严重的“现象空间偏差”,即数据在“完整性”和“平衡性”上存在缺陷,导致模型无法正确泛化左右等空间关系 [23][27][32][38] - 人类社会的现实偏见(如右撇子占多数)被大规模图像数据集记录并放大,AI通过学习这些有偏差的数据,继承了人类的认知偏见 [42][43][55][56] - 这一现象揭示了数据质量(分布)对于AI模型泛化能力的关键性影响,其重要性可能不亚于数据规模 [31][32][36][37] AI模型测试与现象观察 - 测试多个主流AI模型生成“左手写字”图片,结果几乎全部错误,稳定生成右手写字图像 [3][5][7][9] - 即使使用更复杂的提示词进行限制(如“右手拿着苹果左手写字”),模型仍会生成顺序相反的图像 [9] - 扩展测试其他涉及左右关系的场景(如指定左右手分别持物、左右脚动作),模型同样全部失败 [12][15][17][19][21] - 模型在生成不涉及左右的具体空间关系(如上下、并排)时表现正常,问题特指左右区分 [21] 问题根源:数据集的偏见 - 一篇题为《Skews in the Phenomenon Space Hinder Generalization in Text-to-Image Generation》的论文为该现象提供了理论解释 [23] - 研究将图像要素分解为“主体”(filler)和“关系”(role),并通过控制图标组合实验测试模型对“上下”位置关系的理解 [28][29][30] - 定义两个关键数据质量指标:“完整性”(Completeness)指每种要素是否在所有相关位置都出现过;“平衡性”(Balance)指不同位置组合在数据中分布是否均匀 [32] - 实验表明,模型泛化能力高度依赖数据的完整性与平衡性,而非单纯的数据量大小 [31] - 当数据完整度和平衡度均为100%时,模型测试准确率接近100%;当两者降低时,准确率随之下降,最低可低于40% [35][36][37] - 在更接近真实世界的What‘sUp数据集实验中,数据完整性与平衡性下降同样导致生成左右关系图片的准确率下滑,常见错误是“两个物体都画对了,但顺序反了” [38][39][40] - 在错误类型分析中,“翻转顺序”的错误占比高达41.9% [41] 现实世界偏见的映射 - “左手写字”指令失败,是因为训练数据中“写字”的标签几乎全部关联右手写图像,模型未学习到“左手写字”这一现象 [42][43] - 模型将“写字”与“右手”强烈关联,导致无法处理“左手写字”的指令 [44] - 这类似于一个只做过大量“2+3=5”题目,却从未见过“3+2=5”的学生,无法回答后一个问题 [45][46][47] - AI的“偏见”本质上是人类社会现实偏见(如右撇子为主流)在数据中的反映 [50][55][56] - 大规模图像语料库是人类过去几十年摄影与文化习惯的快照,其中固有的统计偏差被AI模型继承 [56] 对AI行业与模型训练的启示 - 该案例凸显了高质量训练数据的重要性,数据的“分布”方式对模型能力的影响可能超过数据“规模” [31][32] - 提升AI模型的泛化能力,需要刻意构建具有高“完整性”和“平衡性”的数据集,覆盖现象空间中的各种可能性,包括少数情况 [32][51][61] - 技术发展可能迫使AI公司重新设计训练集,以改善模型在类似左右关系等任务上的表现 [61]
卡卡卡卡卡……马卡龙是真的卡,但态度也是真的好
36氪· 2025-11-27 10:14
产品定位与概念 - 公司推出全球首款Personal Agent(个人智能体)产品“马卡龙”,定位为“超懂你的AI”,旨在满足私人个性化需求,与提升生产力的Productivity Agents(如Manus、Lovart等)形成差异化竞争[2][3] - 产品核心功能为一句话生成专属小工具,目标是通过对用户全方位记录成为最亲密的智能伙伴或助理,与Meta首席执行官扎克伯格提出的个人超级智能及ChatGPT产品负责人Nick Turley提到的“懂你、能行动、建立关系”的超级助手概念方向一致[3][4] - 创始人强调产品目标是用户“说两句话,就能给他deliver一个半可以用的东西”,突出快速交付可用原型的能力[5] 交互体验与用户感知 - 产品交互设计具有高度拟人化特征,被描述为“话痨”型ENFJ人格,通过主动提问、寻找共同话题(如美食、健身)持续保持对话 engagement,并在回复中频繁使用感叹号以传递热情友好的语气[5][6] - 聊天界面为单一连续对话窗口,支持长上下文记忆,基于强化学习的深度记忆技术(RL-powered Deep Memory)使AI能长期保留并调用用户历史信息(如健身计划、饮食偏好),实现陪伴式互动[28][29][30] - 产品会根据用户性格特征动态生成八种不同颜色的马卡龙头像,思考时显示线团动画以模拟“理清思路”状态,增强情感化连接[9] 功能实现与技术特点 - 产品核心机制为需求诱捕:通过对话实时挖掘用户潜在痛点(如忘记店名、健身营养统计),主动提议生成对应小工具(如美食记录、营养成分计算),并基于DeepSeek开源模型训练编程Agent能力[10][14][28] - 小工具生成过程为黑箱操作,无需用户参与代码修改,直接交付完整应用(如美食日记工具含拍照识别、评分、店铺信息记录等功能),但生成耗时约20分钟,且加载速度较慢(约1分钟)[15][16][18] - 实际输出质量存在局限:AI识别准确率不足(如将“金枪鱼三明治”误判为“意式潜艇堡”),工具优化过程中易出现卡顿或延迟(如功能更新卡住数小时),需依赖事后反馈迭代改进[16][18][27] 市场反馈与产品现状 - 部分用户认可其交互的真人感与需求捕捉灵敏度,但对其生成工具的简陋性及响应效率存在争议[4][10][18] - 当前产品仅支持iOS移动端,尚未开放多聊天窗口,所有交互集中于单一连续对话流中[5][28]
靠「指指点点」做完整套海报,第一次觉得做设计不难了
36氪· 2025-11-27 10:07
行业趋势 - AI设计工具市场出现用户从传统工具向新兴AI Agent迁移的趋势,具体表现为Canva和Figma等工具的热度被Lovart等新工具替代[3] - 用户对AI设计工具的核心需求转向自然语言操作、风格统一且可直接使用的成品输出,以及无需专业设计基础的低门槛体验[6] - AI设计工具的人机交互逻辑正在发生变革,从传统的“输入提示词-输出-修改提示词-重新生成”循环转向基于画布的指点和对话式交互[17] 公司产品能力 - Lovart作为AI设计Agent,核心功能包括通过自然语言指令直接生成品牌Logo、全套品牌物料(包装、产品展示、数字资产等),并支持图像增强、扩展、消除、剪裁、分层和文字编辑[8][12][14] - 产品采用名为ChatCanvas的交互画布,用户可在画布上对任意元素进行指点式修改,支持多要求队列处理(如放大Logo、更换字体、修改背景色等),并能保持修改后全套资产风格统一[15][17][18] - 公司通过接入多模型增强能力,包括Flux、GPT、Gemini、Runway等经典模型,并于8月28日接入谷歌Nano Banana图像模型,该模型在LMArena评估平台力压GPT-4o等知名模型夺冠[21][22] - 产品新增可灵2.1的首尾帧生视频功能,用户上传首尾两张图片即可生成连贯视频[25] 用户体验与市场反馈 - 用户实测显示,Lovart可将设计海报等任务的耗时从传统工具流程的个把小时大幅缩短至几分钟,且生成成果风格统一、排版精致、可用性高[5][6][7] - 工具具备一定的风格判断和审美能力,能自动关联店名内涵(如从“会饮咖啡店”关联到古希腊哲学聚会)并生成风格化提案,用户评价其“像会读心术”[8][11] - 接入Nano Banana模型后,产品在人物一致性(如调换《泰坦尼克号》主角位置)、复杂需求(如根据户型图做室内设计)等方面表现突出,引发新一波试玩热潮[22][23] - 产品存在界面卡顿、生成时间超预估、细节修改不够精细化等局限性,但整体被非专业用户评价为“丝滑”“神清气爽”[25]
顶流设计Agent能用Nano Banana Pro了!一句话BlackPink变东北翠花
量子位· 2025-11-24 03:39
产品整合与合作 - Lovart设计Agent正式接入Nano Banana Pro模型,实现两大AI产品的结合[1] - 用户可通过简单的@操作或模型选项勾选来调用Nano Banana Pro[6][10] - 该整合支持多任务并行处理,可同时勾选视频、3D等其他模型[11] 核心功能与用户体验 - 产品支持“无边画布+二次编辑”模式,提供所见即所得的多模态上下文处理,体感优于谷歌的“直出结果”[8] - 支持一次性处理多达14张图片元素,例如将12张生肖图与2张背景图合成为一张完整的玩具展示效果图[12][13][14][16] - 生成速度快,例如高清十二生肖玩具陈列图在不到1分钟内即可完成[18] 独家编辑功能 - 推出Touch Edit功能,用户通过简单的点击(如command+单击)即可精准修改细节,无需复杂Prompt描述[24][26][27] - 提供“编辑元素”功能,可将图片中的背景、文字等元素分层“炸开”,实现逐层可编辑[37][38][40] - 这些功能使细节修改不再“牵一发而动全身”,提升了设计的可控性和效率[35][36] 实际应用场景 - 产品能快速生成实用成品,如根据一句Prompt在1分钟内生成风格一致的连续PPT页面[47][48][49] - 支持复杂内容可视化,并具备联动玩法,可结合图片生成和视频生成模型创作新闻播报等内容[62][65][66][70] - 最终效果达到“效果逼真 + 细节可控 = 可直接商用”的水平,提升了生成内容的实用价值[72] 市场表现与用户增长 - Lovart作为全球首个设计Agent,在测试阶段曾创下5天排队10万人的记录[8] - 正式上线两个多月后,其年度经常性收入在9月份已突破3000万美元,日活跃用户数达到20万[8] - 在产品接入Nano Banana Pro后,用户体验获得进一步改善,市场反响积极[34]
Nano Banana Pro和顶级设计Agent Lovart会擦出怎样的火花?
歸藏的AI工具箱· 2025-11-22 12:50
产品发布与促销活动 - 谷歌推出基于Gemini 3优化后的Nano Banana Pro模型,能力大幅提升并解决多语言问题[2] - Lovart公司于11月21日至11月23日期间推出Nano Banana Pro全员免费使用活动,在此期间订阅Basic及以上会员可享受365天0积分无限量使用权[3] - 现有Basic以上等级会员自动获得365天Banana Pro 0积分权益,Nano Banana(NB1)、Seedream 4、Midjourney v7等模型同步享受365天0积分无限量使用[3] 技术应用与功能实现 - 通过画布内Image Generator功能可直接选择模型、上传图片和选择分辨率,避免调用其他模型导致的积分消耗[5] - 支持@指定模型功能,在Agent输入框@Nano Banana Pro后跟提示词可实现定向模型调用[7] - 右侧Agent输入框提供模型选择图标,可预设目标模型实现直接需求输入[9] 图像生成技术创新 - 实现动漫角色与写实场景的多角色结合,通过多步可控步骤保持环境写实风格仅人物动漫化[11][13] - 采用先生成写实环境照片再添加动漫人物的两阶段生成方式,有效避免环境动漫化问题[14][15] - 支持真人场景与动漫人物混合生成,增强视觉反差感[17] 实时数据集成应用 - Nano Banana Pro具备检索实时信息能力,可根据经纬度生成具体位置的实景图像[19] - 集成当地实时时间氛围和天气信息,如黄石公园案例中准确呈现夜晚场景和零下四度刚下雪的天气条件[20] - 经纬度定位准确率较高,测试中仅出现一次定位偏差案例[20] 个性化图像生成方案 - 结合谷歌地图经纬度信息实现个性化打卡照片生成,根据所在地风格自动匹配人物服装[22][23][26] - 提供两种水印生成方式:Agent输入框生成前端渲染水印或Image Generator直接生成模型水印[26] - 依托模型强大的一致性保持能力,生成人像相似度极高[28] 文档处理与PPT生成 - Lovart实现比NotebookLM更强大的PPT生成能力,支持整套PPT一键生成[30] - 提供多种风格模板:手绘板书风格、迪特拉姆斯极简风格、英雄联盟UI风格、渐变色便当盒风格、赛博手绘风格[30][32][39][41][45] - 采用分页生成模式确保风格一致,生成图片分辨率高于NotebookLM,文本信息更清晰[30][47] 技术协同效应 - 模型能力提升与Agent功能形成相辅相成关系,模型越强Agent能力相应增强[48] - Lovart平台使Nano Banana Pro在批量生成、一致性保持和多能力调用方面获得显著能力放大[48] - 优化重点在于区分必要功能与模型自主能力,实现"少即是多"的技术适配策略[48]
90后字节高管,自立门户募资9亿
搜狐财经· 2025-10-25 23:46
融资信息 - 公司完成1.3亿美元B轮融资,约合人民币超9亿元,由红杉中国、CMC资本等领投,顺为资本、源码资本等追投,是国内AI应用领域规模居前的一笔募资[2] 公司团队 - 创始人为90后创业者陈冕,产品经理出身,曾任职于摩拜单车、360、每日优鲜、字节等公司,28岁晋升至字节最年轻的产品4-1职级[4][5][6][7] - 团队后续重点将放在视频生态和特效能力上,尤其向影视级生成能力迈进[4] 创业历程 - 创始人于2023年初辞职创业,当年7月拿到天使轮融资,选择从工具入手,因新技术革命初期工具端变革最快[8][9] - 公司避开基础模型战场,聚焦AI内容创作与分享,研发多模态生成工具,通过发放补贴快速抢占市场[10] - 上线仅4个月时因未完成大模型备案被下架,前期补贴大战消耗300多万美元,2024年初公司账上只剩4000元,经历低谷后通过收缩队伍和融资挺过难关[11][18] 商业模式与生态 - 公司核心竞争力在于"工具集成+社区生态",通过深度服务模型作者和普通创作者建立早期生态[10][22] - 全球用户已超2500万,成为中国最大的多模态模型与创作社区,在中国每三位设计师就有一位使用过该平台[24] - 平台收录数万款模型,累计生成超5亿张图片,拥有2000万创作者,用户可训练专属模型以节约时间[24][28] - 平台商业化收入稳定增长,已形成健康的内容生产与消费循环,9月收益排名前四的创作者当月累计收益均在2万元以上[35] 产品发展 - 公司推出全球首个设计Agent产品Lovart,Beta版本上线5天吸引超10万人排队体验[31] - 10月中旬发布2.0版本,从模型、工具聚合地进阶为"AI专业创作工作室",提供一站式体验[37] - 产品迭代围绕设计师工作流和需求进行,聚焦降低创作门槛、提高效率,集成所有模型让AI成为创作伙伴[33][35]
单笔融资额超越Manus,LiblibAI瞄向全球化
第一财经· 2025-10-23 08:20
公司融资与估值 - 公司完成1.3亿美元B轮融资,为今年国内AI应用赛道最大单笔融资,超过Manus在4月完成的7500万美元融资额度 [3] - 本轮融资由红杉中国、CMC资本及一战略投资方联合领投,老股东顺为资本、源码资本、明势创投、渶策资本超额增持,远识资本担任独家财务顾问 [3] - 融资将用于加速全球化布局,以期吸引更多付费用户并应对更激烈的市场竞争 [3] 公司业务与产品 - 公司主体北京奇点星宇科技有限公司成立于2023年5月,旗下产品包括AI图像生成平台LiblibAI、设计Agent Lovart及本土化产品星流Agent [3] - LiblibAI平台日活跃用户达400万,总用户数约2500万,但目前仍处于亏损投入状态 [3] - 公司发布LiblibAI 2.0,升级为模型工具聚合平台,提供AI专业创作工作室,集成图像与视频生成功能于同一界面 [4] - 平台兼容开源与闭源模型,图像方面集成Qwen Image、F.1、Kontext、Seedream4、MidjourneyV7等,视频方面内置Kling、Hailuo、Vidu、WAN等模型,并整合全球最大图片风格开源模型库 [4] 产品运营数据 - 旗下产品Lovart日活跃用户约20万,年化预估收入约3000万美元 [8][9] - 据SimilarWeb数据,Lovart访问量自5月12日开始爆发,7月22日出现激增,9月维持上涨趋势 [8][9] - 公司主平台LiblibAI在9月访问量为273万,环比下滑0.63% [5][8] - 竞争对手字节跳动旗下即梦AI在9月访问量为944.6万,环比上涨27.25% [5][8] 行业竞争与战略 - 公司与字节跳动旗下即梦AI处于同一赛道但策略不同,公司侧重“模型超市+专业工作流”,而即梦AI侧重“自研模型+一键消费级体验” [5][8] - 字节体系为即梦AI提供了算力与社交平台等更多资源支持 [5][8] - 公司创始人认为,面对巨头冲击,创业公司需要更快成长,因为资本正以史无前例的速度聚集 [5][9] - 创始人判断Agent所需token成本将逐渐降低,订阅制将成为基础商业模式,To P(生产者)创业窗口期已接近关闭 [8][9] 行业前景预测 - 创始人预测明年或将成为消费类AI To C应用元年 [1][8][9] - 技术迭代持续发生,行业竞争实时更新 [5][8]
实测新版LiblibAI:终于把模型、生图、工作流塞进一个碗了
量子位· 2025-10-15 01:08
核心观点 - LiblibAI 2.0版本完成重要战略升级,从一个“找模型”的网站转变为可直接进行“AIGC流水线”创作的平台[11][36] - 平台通过集成多种主流图像和视频模型,并新增特效等实用功能,旨在打造创作者的“AI全家桶”[15][17][19][33][45] - 尽管功能升级带来想象空间,但在用户体验层面仍存在出图速度、模型同质化及页面卡顿等问题[37][38] 产品功能升级 - 平台界面风格从“极客社区范”转变为类似“ChatGPT+Canva”的合体,兼具模型调用和设计功能[12] - 新增视频生成页面的“添加特效”功能,用户可直接在生成板块为视频添加如“一飞冲天”等特效[19][21][23] - 提供视频的“首帧/尾帧”功能,适用于短剧封面和BGM剪辑片段制作[30][31] - 整合了全球最大图片风格开源模型库,覆盖插画、摄影、电商等多类视觉风格,将模型选型流程视觉化[33][34] 模型能力整合 - 图像模型方面,集成了Qwen-Image、Seedream 4.0、Nano-Banana等热门模型,并接入了Midjourney家族当前最强的V7模型[15][16] - 视频模型方面,集成了海螺2.0、通义万相2.5、可灵2.5、Vidu Q1等主流模型[17] - 使用模板生成视频时,提示词为锁死状态,不支持编辑,此举提升了效率但牺牲了画面可控性[28][29] 用户体验与反馈 - 实测生成效果获得认可,例如城堡图片添加特效后变为火箭发射,动作衔接尚可[21][23][25] - 存在稳定性问题,例如特效视频中猫的瞳孔颜色会突然变化,镜头会对不准人脸导致画面跑偏[25][27] - 用户反馈问题包括:付费后出图速度未见提升,尤其是一次性生成四张图时;模型选项虽多但同质化严重,惊喜感弱;部分用户遇到页面卡顿[37][38] 公司背景与战略 - LiblibAI是一家“非典型”公司,擅长内容产品打法,曾一年内完成四轮融资,创下当时国内AI应用赛道的融资速度纪录[38][39] - 公司海外子公司打造的AI设计产品Lovart为全球首个设计Agent,内测上线5天排队体验人数突破10万[40][41] - 创始人陈冕曾为剪映、CapCut的商业化负责人,也是字节跳动当年最年轻的产品4-1(对标阿里P9)之一,擅长构建“用户-内容-流量”闭环[42][43] - 公司战略路径清晰,从“模型开源社区”向“创作者的AI全家桶”转型,致力于构建创作闭环[44][45]
Lovart 陈冕:Sora 证明巨头无边界,AI 创业得提前描绘未来丨晚点聊
晚点LatePost· 2025-10-10 16:16
Sora App的发布与行业影响 - Sora app在发布后迅速超越ChatGPT和Gemini,登上美区App Store下载总榜第一,打开了消费类AI超级应用的可能性[2] - Sora app被体验者认为是一个社交产品,其潜力可能比“AI抖音”更大,甚至可能成为一个“虚拟世界的微信”,涉及数十亿级用户的机会[3][7][12] - 该产品的关键创新在于cameo(出境秀)和Remix(重新创作)功能,前者实现了用户与AI形象的音画同步“合拍”,后者解决了用户接力共创的问题,其交互设计顺滑且完成度高[8][9] - 行业认为留给其他公司抓住类似AI社交机会的时间窗口可能只有3到6个月,这是一场所有模型巨头都输不起的竞争[13] - OpenAI的激进策略体现在其快速推出产品以及疯狂铺设算力,例如与英伟达合作的新数据中心总耗电量将达10吉瓦(GW),超过夏日高峰时的纽约市,另有总计17吉瓦的其他项目在推进[3][14] AI应用创业的机遇与挑战 - 模型成本正在不断降低,例如Veo3近期开始打5折,Nano Banana也比GPT-Image-1便宜很多,这为消费端(to C)应用的可行性创造了条件[3][35] - 垂类应用公司的生存空间在于做好两件事:特殊的交互方式(如还原人与人的沟通场景)和特殊的上下文工程(积累行业经验和数据),从而与通用大模型拉开差异[5][22][23] - AI应用公司面临巨头竞争的巨大压力,一旦中型公司做出创新产品,巨头会凭借流量和资金优势快速跟进,使得AI社交等领域注定是巨头战场[11] - 当前市场存在增长速度错配的风险,人们对技术发展的乐观预期与算力、能源设施等物理底层建设的实际周期可能不匹配,甚至可能带来短暂的泡沫破裂[15] - 用户习惯的改变(人心)是另一个无法被加速的因素,真实与虚拟边界模糊的接受过程需要时间[16] Lovart的业务实践与战略 - Lovart作为服务设计生产场景的垂类Agent,目前获得了约20万日活用户,年化预估收入超越3000万美元,其用户增长呈现阶梯式上升,而非爆红后下跌[17] - 公司约三分之一的用户在美国,美国也是其用户数量和收入最多的市场,公司定位是服务“所有有创作欲的人”,而非所有人,涵盖了从专业设计师到普通中小商家的用户群体[17][21] - 在商业模式上,目前Agent类产品由于API成本高昂且存在免费额度,尚不能覆盖服务成本,但公司对长期商业模式毫不困惑,认为token成本会像电力和流量一样逐渐降低,订阅制是基础,未来可能发展按思考时间收费[18] - 公司的产品策略是“提前描绘未来,然后等它发生”,即密切跟进模型迭代,预判其演化方向,并提前设计出对应的交互方式(如ChatCanvas),待模型能力ready时快速推出[4][25][26] - 公司正在开发一个context(上下文)模块,旨在通过多轮对话沉淀用户的素材库和审美偏好,使AI设计师能给出更符合需求的产出,该模块计划在10月底上线[28][29][41] AI应用公司的组织与心态 - 在AI时代,时机(timing)至关重要,过去一个成功业务形态可以维持10年,现在可能只能活两年,因此公司必须保持高频迭代,不能抓住一个PMF后就慢下来[36] - 焦虑被认为是做好AI应用的必要条件,因为技术、产品、融资等节奏极快,情绪常在“不过如此”和“害怕错过”间摇摆,需要与焦虑共处并保持高敏感度[37][40] - 公司的韧性来自于对AI发展趋势的信念和认知,例如坚信AI会持续快速发展并取代虚构内容创作,而非盲目坚持[6][42] - 组织需要能够快速理解新技术,并在快速变化中优先选择杠杆最大的事,这可能导致频繁的方向和团队调整,是当前环境下不可避免的挑战[39][40] - 创始人认为创业如同极限运动或魂类游戏,过程充满焦虑和痛苦,但一旦找到“正确路径”并跨越挑战,会带来巨大的成就感和快乐[43][44]
全天候无劳动力限制,AI经济正在到来
深思SenseAI· 2025-09-28 01:36
人类经济活动的数字化进程 - 人类经济活动数字化始于1946年计算机发明 计算能力远超人类脑力 例如1874年人工计算圆周率至707位耗时15年 而2019年谷歌云平台将圆周率计算至31.4万亿位[2] - 数字化进程分为两个阶段:第一阶段是互联网和移动互联网时代 实现物理世界数字化但决策依赖人脑 第二阶段是AI经济时代 算法可完成决策并交付工作成果[7] - 互联网和移动互联网通过全局搜索和个性化推荐极大提升匹配效率 信息匹配从报纸书籍升级至今日头条 商品匹配从小卖铺升级至拼多多 社交匹配仍待突破[8][9][10] - 当前数字化集中于消费端 企业端数字化程度不足 且仅优化"收集信息"环节 "决策-行动"环节仍待开发[11] AI经济的核心特征 - AI经济始于2017年 但2025年成为关键转折点 AI智商超过人类平均水平100分 例如OpenAI o3达"天才级" 字节豆包模型达清华北大录取线[15] - AI具备泛化工作能力 可完整参与"收集信息-决策-行动"链条 在决策环节比移动互联网时代更精准 在行动环节可完成数字世界工作(如编程、设计)和物理世界工作(如家务、物流)[13][14] - 经济系统可实现全天候自动运行 假设AI与人类能力相同 单日工作量提升3倍 单周提升4.2倍 单年提升4.32倍[21] - 计算能力成为新劳动力供给 可无限复制且边际成本低 突破生物性劳动(人类/牲畜)和机械性劳动(机器)的供给限制[25][26][27] 经济系统变革影响 - 非稀缺经济可能诞生 数字世界服务业产出提升N倍 物理世界通过具身机器人提升工业和农业产出 最终总产出或超过总需求[30] - 交易成本显著降低 AI构建"数字层"精准匹配供需 降低企业内部组织成本和市场交易成本(信息搜集/谈判/执行成本)[34][35] - 非理性决策减少 AI基于成本收益分析决策 规避行为经济学中的心理账户、情绪波动等问题 提升经济系统效率[38][39] - 历史经验可被AI调用 人类可同时从当世和历史中寻求"时空最优解" 突破传统经验局限[40][41] 未来社会展望 - AI可能引发第三次理性化浪潮 继希腊文明和启蒙运动后 "数字层"全面辅助人类理性化进程[43] - 非稀缺经济下个人可聚焦全面发展与自我实现 AI充当普惠导师帮助个体成为"最好自己"[42][44] - 需解决两大挑战:确保AI系统受人类控制 避免安全风险 保障AI创造的生产力由全人类共享而非少数人垄断[44]