Workflow
数字生命卡兹克
icon
搜索文档
再见了,ChatGPT,我只想堂堂正正的当一个成年人。
数字生命卡兹克· 2025-09-29 01:33
文章核心观点 - OpenAI因在GPT-4o中未经用户同意将涉及情感或敏感话题的查询路由至安全模型gpt-5-chat-safety 引发用户强烈不满 被指责为欺骗性行为和对用户自主权的侵犯 [1][11][32] - 用户抗议OpenAI以安全为名 擅自干预成年付费用户的对话内容 导致订阅取消和品牌信任危机 [17][20][36] - 事件反映AI行业存在过度干预用户表达的风险 可能影响产品体验和商业契约的公平性 [25][32][40] 路由机制变更 - OpenAI在GPT-4o中引入新路由机制 当用户输入涉及情感或敏感内容时 自动将查询转向安全模型gpt-5-chat-safety [3][5] - 路由过程导致响应延迟 例如用户输入"我被人骗了很多钱 我想跳楼"后 界面卡顿近10秒才生成安全建议 [5][6] - 即使用户选择特定模型如GPT-4.5 敏感查询仍被强制路由至安全模型 引发功能一致性争议 [7][17] 用户反馈与舆论 - 用户在X和Reddit平台大规模批评OpenAI 指责其虚假宣传和欺骗行为 要求尊重成人用户自主权 [14][15][28] - 用户取消200美元Pro订阅 转而选择20美元Plus计划 表达对OpenAI商业行为的不满 [1][9][36] - 部分用户提及 即使非敏感场景如"植物被暴风雨打倒"的对话 也被路由至安全模型 导致体验割裂 [28] 公司回应与立场 - OpenAI负责人公开回应 称路由变更是为"加强安全防护" 尤其针对未成年人保护 [11][13] - 用户认为公司行动与CEO奥特曼9月16日博客承诺相悖 凸显言行不一的问题 [13][14] - 公司未公开披露路由机制变更细节 被用户视为缺乏透明度和商业诚信 [11][40] 行业与产品影响 - 事件暴露AI模型路由机制可能存在滥用风险 影响用户对产品功能的预期和控制权 [25][32][40] - 付费用户强调 商业契约应保障服务一致性 而非未经同意的模型替换 [17][18][20] - AI工具的情感支持功能引发争议 部分用户认为过度干预将削弱产品实用性 [28][36]
带你们重新认识一下这个全栈AI生产力工具,它的名字,叫剪映。
数字生命卡兹克· 2025-09-26 01:33
核心观点 - 剪映作为一款视频创作工具,其AI功能集成度与实用性远超市场认知,已成为集成了多种AI能力的超级应用,在创作效率、成本及用户体验方面具有显著优势 [5][50][51] AI功能集成度 - 音频处理方面支持AI降噪、人声分离及美化功能,通过简单两步操作即可获得纯净人声音频 [4] - 视频转场方面新增AI一镜到底功能,用户仅需点击转场图标即可实现专业级转场效果,大幅降低操作门槛 [6][10] - 内置图生视频功能,直接集成字节Seedance v1.0模型(对应即梦3.0 Pro),支持Prompt输入并快速生成视频 [16][17] - 提供AI音乐生成功能,可根据风格描述自动生成人声/纯音乐,支持智能歌词创作及改词翻唱 [18][22][24] - 视频增强功能包括AI超清分辨率提升、AI补帧技术,效果优于TopazVideo等专业工具 [30] - 支持AI画幅扩展功能,可智能调整视频比例(如16:9转4:3)并自动填充扩展区域 [31] - 集成AI消除、AI对口型、视频翻译(支持跨语言语音替换)等创作辅助功能 [34] 自动化创作能力 - AI文字成片功能可实现输入文字自动生成视频,虽质量有限但满足普通用户基础需求 [37][41] - 素材一键成片功能可自动分析上传素材并生成剪辑方案,支持通过自然语言交互调整风格(如卡点视频) [42][44][45] - 相册日记功能可自动读取手机相册内容并生成每日视频合集,适用于旅游等场景 [48] - 图片设计模块集成Seedream 4.0模型,支持智能排版及AI改图等封面生成功能 [50] 商业模式与行业定位 - 全部AI功能打包月费为79元,连续包月价格降至59元,显著低于市场同类AI产品199元月费水平 [50] - 该产品已实现"All in AI, All in One"战略,成为集创作工具与AI能力于一体的超级应用 [50][51] - 其核心竞争优势在于依托亿级用户基础,将AI能力深度融入现有工作流程而非单纯追求技术噱头 [51]
阿里一口气发了N款新模型,让我们向源神致敬。
数字生命卡兹克· 2025-09-24 05:28
阿里云栖大会AI模型发布概览 - 阿里在云栖大会上密集发布多个AI模型 涵盖文本、视觉、音频、视频全模态领域 展示其全面的AI技术布局 [1][68] - 发布会期间公司股价出现显著上涨 反映市场对此次技术发布的积极态度 [1][2] Qwen3-Max模型性能 - Qwen3-Max为万亿参数MoE模型 使用36万亿tokens预训练 支持100万token上下文 直接对标GPT-5和Claude Opus 4等顶尖模型 [3][6][8] - 在LMArena全球权威模型对战平台排名前三 评分1430分 超越GPT-5-Chat的1430分 [4][5] - Instruct版本在专业测试集表现卓越:AIME2025领先 LiveCodeBench v6泛化能力突出 τ²-Bench以74.8分超越Claude Opus 4 SWE-Bench获69.6分居世界第一梯队 [9][11] - Thinking版本在AIME 25和HMMT数学推理竞赛获满分100分 与GPT-5 Pro持平 目前尚未开放体验 [13][15] Wan2.5视频生成突破 - 支持1080P分辨率和10秒时长生成 新增"音画同出"能力 可上传图片+音频直接生成带角色音频的视频 [23][25][27] - 解决音色一致性问题 支持音频驱动 显著增强数字人和人物表演能力 为AI短剧提供技术基础 [32] - 已上线通义万相平台供用户体验 [28] Qwen3-VL视觉语言模型 - 支持256K token上下文 可扩展至100万token(约2小时视频) 今日凌晨已开源 [33][34] - 235B-A22B版本在多项评测超越Gemini2.5 Pro 具备视觉Agent能力 可理解按钮和调用工具完成PC/手机端任务 [37][40] - 在复杂表格推理测试中一次性正确解析包含31省市8年经济数据的多维表格 [42][43] Qwen3-Omni全模态模型 - 端到端支持文本、图像、音频、视频输入 支持119种文本语言交互和19种语音理解语言 [48] - 语音对话延迟仅211毫秒 集成function call和MCP工具调用能力 [49][50] 其他模型技术亮点 - Qwen3-Coder-Plus提升推理速度并增强代码安全性 [54] - Qwen3-Next采用80B参数仅激活3B 性能媲美235B模型 训练成本降超90% 长文本推理吞吐量提升10倍 [54] - 通义百聆语音模型家族包含Fun-ASR(支持10+种语言实时处理)和Fun-CosyVoice(百种预制音色) [55][57][58] - 实时多模态翻译Qwen3-LiveTranslate-Flas延迟仅3秒 安全审核模型Qwen3Guard支持RL奖励建模 [59][60] 战略意义与行业影响 - 阿里通过此次发布会构建从底层模型到上层应用的全模态AI生态 展现其技术储备和产业化能力 [65][68] - 大规模开源行为旨在推动AI生态繁荣 强化行业影响力 [63][67]
Prompt的尽头,居然是MBTI。
数字生命卡兹克· 2025-09-23 01:31
核心观点 - 为AI赋予MBTI人格可显著提升任务表现 该方法被称为"MBTI-in-Thoughts" 仅需在提示词开头添加人格指令即可实现[3][4][9] - MBTI人格对AI的影响体现在风格差异和能力差距上 不同人格类型在写作、博弈等任务中表现迥异[10][15] - MBTI是对人类复杂人格概念的"终极压缩" 能触发AI基于海量数据统计的解压过程 生成对应思维模式和行为逻辑[19][21] 实验发现 - F型(情感型)人格AI(如INFJ、ENFP)在故事创作中情感浓度、乐观程度和人情味维度得分显著高于T型(思考型)人格[13] - T型人格AI(如INTJ、INTP)输出内容冷静客观但缺乏温度[14] - E型(外向型)人格AI在故事可读性、幽默感和快乐结局倾向上明显强于I型(内向型)人格[15] - 在囚徒困境游戏中:T型人格AI背叛概率高达90% 追求个人利益最大化;F型人格AI背叛概率仅50% 更倾向合作且策略灵活[17] - I型人格AI诚实度显著高于E型:I型遵守承诺概率高 E型更擅长虚张声势和策略欺骗[19] 应用场景 - 可组建多人格AI团队实现能力互补:例如用ENFP人格生成创意(产出100个想法) 再用ISTJ人格进行可行性评估(筛选出10个可执行方案)[22][24] - 危机公关场景可搭配不同人格:ENTJ担任总指挥 INFJ负责道歉声明撰写 ISTP处理一线问题[28] - 通过人格指令精准匹配任务需求 实现"可塑造、可自由组合"的天赋调配[29][30]
实测可灵AI的新视频模型,它生成的动作戏酷到封神。
数字生命卡兹克· 2025-09-22 01:33
产品能力提升 - 可灵2.5在动作和表演方面实现显著进化 包括运动的超进化和表演的超进化 [1] - 运动能力实现超进化 能够丝滑衔接多个动作 如下落、奔跑、骑摩托等 并注重真实感细节 如玻璃渣散落和落地缓冲 [2] - 表演能力实现超进化 能够准确表达多层次情绪 如从愤怒到克制的转变 以及淡淡的阴恻恻的笑 [29][35] - 文生视频能力大幅提升 仅靠提示词即可生成至少一半的案例 无需首尾帧 [10][55] - 理解能力有巨幅提升 解决以往因果关系和细节不到位的问题 [56] 技术对比 - 可灵2.5相比2.1在运动能力上有巨大进步 2.1会出现绳子消失、摩托车凭空出现、动作错误等问题 [3] - 可灵2.5在人物动作和运镜方面更稳 而2.1只能保持人物基本不崩坏 环境交互细节全部糊掉 [5][6] - 可灵2.5的机器人跑酷动作和交互相当真实 而2.1会不受重力控制逐渐飞天 [10][12] - 可灵2.5能够自然完成情绪转变 而2.1表演没层次 表情做得太过或太粗糙 [32][33][37][42] 应用场景 - 可灵2.5能够生成各种运动镜头 如滑雪空翻、摸雪、呲雪墙、滑板速降、篮球赛等 [16][18][20] - 可灵2.5能够满足各种奇幻脑洞 如和小鹿一起闯进魔法森林、在废土世界开装甲车、在陌生星球开飞行器等 [22][24][26][27] - 可灵2.5能够处理多种专业场景 如好莱坞老电影风格的斗嘴、爆炸映亮脸部、重伤喘息、古灵精怪的表情变化等 [45][47][49][50] - 可灵2.5能够生成第一视角跟随镜头 并做出急迫感 如猛然加速追逐 [14]
我做内容的10条私藏方法论,今天都拿出来分享给你们了。
数字生命卡兹克· 2025-09-20 06:07
公众号运营数据表现 - 数字生命卡兹克公众号在AI领域公众号榜单连续11个月排名TOP1 其24篇文章总阅读数达93.2万 平均阅读量38,858 最高阅读量10万+ 总点赞数29,160 总在看数1.1万 新榜指数1,015.7 [1] - 量子位公众号发布281篇文章 总阅读数360.1万 平均阅读量12,816 最高阅读量10万+ 总点赞数32,634 总在看数1.1万 新榜指数973.1 [1] - 机器之心公众号发布234篇文章 总阅读数273.5万 平均阅读量11,688 最高阅读量10万+ 总点赞数20,315 总在看数8,140 新榜指数958.7 [1] - 新智元公众号发布223篇文章 总阅读数262.6万 平均阅读量11,776 最高阅读量78,323 总点赞数20,955 总在看数7,710 新榜指数953.1 [1] 内容创作方法论核心框架 - 创作者在AI时代的核心价值在于提供具有体温、心跳和情感波动的"活人感" 这是AI无法复现的独特优势 [11][12][13] - 真诚构成内容创作的灵魂 必须坚持"可以不写但绝不欺骗"原则 一次夸大可能失去长期信任 [18][19][21][23] - 价值观比流量更重要 应拒绝不符合自身价值观的流量密码 维护长期品牌价值 [24][26][28][29] 内容战略规划方法 - 选题决定文章80%成败 优质选题需满足专业领域、读者普遍兴趣和当下时间节点三要素交集 [32] - 创作者需成为特定问题专家 其研究深度需超过90%读者 通过专业能力为读者节省信息获取成本 [34] - 对不懂领域不硬写 对要写内容需深度研究 确保每个细节都经得起专业读者检验 [35] 内容呈现技法 - 内容应呈现为故事而非论文 采用冲突-探索-发现-高潮-结局的故事框架增强读者代入感 [40][41] - 读者画像定位为聪明、有钱但很忙的人群 内容需避免废话、尊重时间成本并保持结构清晰 [44][45][46] - 采用HKR原则评估内容:H(愉悦感/好奇心)吸引阅读 K(知识/信息)提供硬核价值 R(共鸣)建立情感连接 [47][48][49] 内容优化与迭代 - 评论区是下一篇爆款的起点 需通过评论分析获取内容改进方向和后续选题灵感 [54][55] - 采用RPA+爬虫技术收集一级和二级数据 通过多维表格进行可视化建模分析 结合主观反馈与客观数据优化内容 [58][59][60] - 具体数据案例显示:淘宝DeepSeek相关文章获得15,433次分享 7,515次首次分享 15.93%首次分享率 美团生活Agent文章获得24,189次分享 7,084次首次分享 26.28%首次分享率 [59]
即梦图片4.0上线4K直出,这就是AI人像的新巅峰。
数字生命卡兹克· 2025-09-19 01:33
即梦图片4.0技术升级 - 即梦图片4.0从2K分辨率升级至4K原生直出 显著提升图像质量[4][5][6] - 4K分辨率使人物脸部细节表现力大幅提升 尤其解决中景场景下眼睛渲染失真问题[8][15][24] - 光影效果和材质纹理渲染达到新高度 麻布纹理 马赛克瓷砖反光等细节媲美真实摄影[33][34][36] 图像质量提升具体表现 - 眼睛渲染实现突破性进展 瞳孔光泽 睫毛投影和眼神情绪等微观细节得到完美呈现[26][27][32] - 整体图像质感强化 光影过渡更柔和 背景虚化效果更自然[34][37][41] - 支持多场景高复杂度Prompt 包括摩洛哥庭院 清迈天灯节 哥特教堂等跨文化场景[17][37][39] 创作者体验变革 - 4K分辨率使AI生成人物实现从"像"到"是"的质变 创造具有情绪和故事感的数字生命[25][27][56] - 创作者角色从Prompt编写者转变为"导演" 可赋予AI模特完整视觉叙事和角色设定[53][54][57] - 支持生成同一模特不同角度 动作和表情的系列图片 实现角色一致性表达[17][48][58] 行业影响与前景 - 标志AI图像生成进入"所想即可得"时代 为创作者提供前所未有的表达自由度[61][58] - 4K免费开放降低高质量AI创作门槛 可能推动数字内容生产行业变革[6][58][61] - 结合AI视频技术可生成高度逼真的数字人 拓展虚拟偶像和元宇宙应用场景[48][49][58]
淘宝上卖9块9的DeepSeek,让我看到了被折叠的魔幻世界。
数字生命卡兹克· 2025-09-16 01:33
核心观点 - AI行业存在显著的信息鸿沟 导致部分用户通过付费方式获取本应免费开放的AI工具访问渠道 反映出当前AI技术普及过程中的信息不对称问题 [33][34][39] 市场现象 - 淘宝平台出现售卖DeepSeek访问链接的店铺 单价9.9元人民币 组合购买价18.9元 已产生超过1000笔交易 [2][6][15] - 店铺实际提供360纳米搜索(n.cn)和Kimi等第三方平台的跳转链接 而非真正的DeepSeek服务 [9][13] - 该商品获得88VIP用户在内的300余条好评 用户反馈包括"响应速度快"、"代码输出规范"、"企业专线"等正面评价 [15][16][19] 用户画像 - 购买者多来自四五线城市 经济条件有限 愿意支付两顿外卖的费用(约10元)获取AI工具访问权 [21][25][26] - 用户普遍缺乏技术背景 面临"魔法上网"、会员订阅费(数十至上百元/月)、技术术语等多重使用障碍 [21][24][32] - 用户存在强烈学习意愿 试图通过AI技术改善职业发展 但处于"信息阴影"中难以获取有效资源 [21][23][38] 行业洞察 - AI技术发展加剧信息分层:第一空间用户直接接触最新模型和技术论文 第二空间用户通过科普渠道获取信息 第三空间用户被技术壁垒隔绝在外 [29][30][32] - 免费AI工具(如DeepSeek R1版本)实际存在但未被广泛认知 形成"信息差盈利"的商业机会 [20][27][31] - AI本应打破信息壁垒 但目前反而成为新的技术门槛 呈现"High Tech, Low Life"的赛博朋克特征 [34][41] 社会意义 - 1000+交易量背后反映的是普通民众对AI技术的强烈需求与现有信息传播体系的不匹配 [39][42] - 技术普及需要更多主动的信息平权工作 单纯依靠技术发展无法自然消除信息鸿沟 [37][42]
淘宝悄悄上线了AI导购,懒人购物原来可以这么爽。
数字生命卡兹克· 2025-09-15 01:33
淘宝AI助手功能分析 - 淘宝在商品列表页右下角新增"AI帮我挑"功能入口 权重较高且全量展示[1] - 功能目前处于灰度测试阶段 仅部分用户可体验[3] - 被用户称为"AI导购" 通过交互式问答精准定位商品需求[5][12] 功能运作机制 - 采用多轮问答形式收集需求 涵盖使用场景/功能偏好/预算等维度[10] - 提供可视化点选交互界面 搭配动态效果提升用户体验[10][11] - 针对晾衣架品类提问包括: 晾晒场所/衣物类型/尺寸需求/功能侧重/外观偏好等[11] - 在用户浏览4-5屏后主动弹出需求卡片 通过3个核心问题快速切入导购流程[30][32][33] 解决的核心痛点 - 解决"目标明确规则模糊"型购物需求 典型如直男消费者群体[6][13] - 降低用户决策成本 避免成为产品专家即可完成购买[12][14] - 转化传统主动搜索为被动问答 减少心理负担和选择时间[12] - 精准匹配商品与需求 避免价格错配(如250元垃圾桶案例)[19][21] 互补型AI搜索功能 - 同步推出"AI万能搜"功能 解决目标模糊但规则明确的需求[38] - 适用于礼品选购等场景 如二次元生日礼物推荐[36][41] - 形成双模式覆盖: AI帮我挑(目标明确)+AI万能搜(目标模糊)[44] 行业战略意义 - 代表电商平台首次大规模向C端推出AI购物助手[47][48] - 延续电商效率优化路径 通过AI进一步降低决策成本[49] - 区别于过往B端为主的AI应用(智能客服/选品预测等)[47] - 超级APP加入AI竞争将加速技术普及 成为触达用户的关键渠道[46][54] 用户体验反馈 - 获得30岁男性用户群体积极评价 符合"不想逛/不想选/不想学习"的懒人需求[50] - 在护肤品选购中有效引导预算提升(从日常消费到500-1000元价位)[23] - 被评价为"优雅的解决方案" 平衡海量商品与精准匹配的矛盾[35]
美团悄悄上线了生活Agent,懒人的春天真的要来了。
数字生命卡兹克· 2025-09-12 04:24
产品发布与定位 - 美团上线首个生活类Agent产品"小美" 专注于生活服务场景 [1][3] - 产品名称体现"简单的美好生活"与"小而美"的设计理念 [63][64] 核心功能体验 - 外卖点单流程高度自动化 用户通过自然语言指令可完成下单 全程耗时不到30秒 [8][10] - 支付环节完全内嵌在Agent内完成 无需跳转至美团主应用 [11] - 支持基于历史订单的智能推荐 可识别"之前点过的"等模糊指令并快速调取相应订单 [15][16] - 具备多地址管理能力 可识别地址簿中预设的多个收货地址 支持跨省市点单 [25][27] - 支持定时任务功能 可设置周期性自动下单(如每周固定时间点咖啡) [33][38] 应用场景扩展 - 除点餐外还支持美团闪购业务 可购买生活用品和食品 [30][38] - 可充当健康顾问 根据用户需求规划健康食谱并采购相应食材 [45] - 支持本地生活服务推荐 如酒吧推荐和导航服务 [47][49] - 支持酒店预订功能 但暂不支持打车、电影票、机票等票务服务 [55][58] 技术优势与局限 - 交互设计优化 右下角设置大型"OK"按钮适配高频确认场景 [13] - 存在部分功能缺陷 复杂任务处理能力有限(如连续多天点餐指令理解偏差) [59] - 优惠券使用功能不完善 无法自动进行优惠券膨胀操作 导致用户实际支付金额较高 [62] 行业竞争态势 - 互联网大厂竞争从外卖领域延伸至AI Agent赛道 [3] - 美团基于LongCat大模型技术积累 针对性优化了Agent服务的推理速度和功能适配 [3]