文章核心观点 - 人工智能,特别是视频生成大模型,被视为与蒸汽机、电力、计算机同级别的通用目的技术,将深刻影响所有行业并成为人人可及的基础设施[4][5][9] - 爱诗科技作为一家AI视频大模型创业公司,通过选择“非共识”的视频生成赛道、打造“人人可及”的C端产品、构建“模型-产品-用户”增长飞轮以及追求极致的组织效率,在全球竞争中脱颖而出,其产品“拍我AI”已拥有超1亿用户[6][10][20][22] - 视频生成大模型代表一种全新的生产力范式,正在重构广告、电商、影视等与视频表达相关的行业,使高质量视频内容的创作门槛大幅降低、成本下降[29][31] 行业背景与趋势 - 2022年是AIGC元年,Midjourney和ChatGPT的推出标志着人工智能进入一个让所有普通人深切感受到其强大的新大时代[4] - 通用目的技术(如AI)具备三个特征:影响所有行业、越来越普及和便宜、推广需要时间和组织制度变革[5] - 上一个AI爆发期是约10年前,由深度学习驱动,但主要服务企业且相对小众[4] 公司战略与定位 - 公司创始人王长虎是拥有20年经验的视频AI领域技术老兵,曾任职于微软亚洲研究院和字节跳动人工智能实验室,主导抖音、TikTok的视觉技术架构及视觉大模型从0到1的建设[1][2] - 2023年,在行业普遍看衰视频生成大模型(认为5年内无法落地)时,公司反其道而行,All in视频大模型赛道,做出了全球TOP25的AI APP[6] - 公司的战略定力源于对视频生成将根本性影响B端和C端的认知,以及团队在视频AI领域的深厚积累,这为其赢得了宝贵的领先时间[9][10] - 公司的战略逻辑是:在颠覆性技术早期,共识意味着红海,“非共识但正确”才是创业公司的机会,关键在于赌注需建立在比别人深十倍的认知上[11][12] 产品与市场 - 公司核心产品“拍我AI”是一款视频生成应用,于2024年1月上线,比Sora早一年推出,上线当月访问量便与当时的明星大语言模型处于同一量级[10] - 产品哲学是“让每个人成为生活的导演”,目标是将视频创作从专业门槛变成人人可及的基础设施,近乎偏执地追求“一键生成”的傻瓜式体验[8][14][15] - 2024年10月上线的v3产品全球爆火,用户只需输入文字描述或上传图片即可在几分钟内生成生动视频,极低的使用门槛使其像病毒一样在全球社交网络裂变[15][16] - 产品覆盖超1亿用户,包括C端普通消费者、专业创作者以及B端的广告公司、电商企业、影视团队[6] - 产品模型迭代效率快,每几个月就有新的升级,持续吸引用户[17] 技术竞争力与增长模式 - 公司的视频生成模型在全球榜单中位列第一梯队,例如其“PixVerse V5”模型在相关榜单中排名第一[8] - 公司构建了“模型-产品-用户”三位一体的增长飞轮:顶级模型驱动产品体验,低门槛产品吸引海量用户,海量用户产生的场景化数据反哺模型进化,形成自我加速的闭环[20][21][22] - 公司是全球少有的在模型、产品、用户三个维度都处于第一梯队的公司[22] 组织与运营 - 公司以实现相对于同行10倍的效率为目标,核心依靠精准的技术判断力和扁平化的组织效率[24][25][26] - 精准的技术判断力源于团队在视频AI领域二十年的深耕,使其在复杂的技术路径选择中能减少试错,用更少资源做更大事情[25] - 扁平化的组织文化借鉴自字节跳动,让好的创意或技术思路能以最快速度直达决策并获取资源,减少内耗[26] - 公司注重吸引优秀、有创业意志的人才,以持续更新技术、保持模型前沿、快速找到用户痛点[28] 行业影响与应用前景 - 视频生成大模型正在重构所有与视频表达相关的行业,广告行业已率先应用,例如为电商场景生成产品广告视频[31] - 该技术催生了新行业(如让漫画直接动起来的“漫剧”),并赋能个人创作者,例如已有完全由一人使用“拍我AI”工具创作的电影在青年电影展入围并获奖[29][31] - 视频生成大模型作为一种新的生产力,使更多人能以更快速度、更低成本创造出同等甚至更高质量的内容[31] - AI已成为一种生产力的底层设施,千行百业都将受益[31]
一个人用AI,也能拍出获奖电影?|看不见的新大陆