Workflow
Genspark
icon
搜索文档
2025服贸会|梅花创投创始人吴世春:资本对AI的兴奋点从技术转向商业结果
北京商报· 2025-09-11 13:30
行业趋势 - 具身智能被视为AI发展的最佳载体 投资机构积极布局从本体到大脑及部件的全产业链项目 [1] - 大模型格局基本确定 巨头已完成市场基础设施建设 资本兴奋点从大模型转向应用层和结果付费模式 [1] - AI相关企业估值在过去一年平均上涨37% 中国科技资产引发全球重新评估 [3] 投资策略 - 投资重点聚焦能形成品牌的科技产品 能构建生态的技术平台 以及能形成垄断的零部件或原材料供应商 [4] - 重点关注垂直细分领域 选择成熟行业深入理解痛点 通过AI重塑工作流程 [3] - 通过跨界连接发现机会 避免同质化创业和大厂业务覆盖区域 [3] 市场定位 - 将2025年定位为产业拐点 类比互联网2002年与移动互联网2011年的发展阶段 [3] - 通用型Agent领域竞争激烈 主要由大厂主导 基础设施层存在标准化挑战 [4] - 优先布局面向特定行业的垂直化Agent 以及面向C端用户的垂直场景应用 [4] 技术发展 - DeepSeek通过改进国产芯片运算逻辑实现技术突破 [3] - 技术门槛降低使纯技术背景优势减弱 行业专业知识和场景理解更为关键 [3]
Koji杨远骋:我们和AI相遇在「十字路口」
混沌学园· 2025-08-25 11:58
核心观点 - AI时代创业者需提升与AI交互能力 通过增强上下文和优化提示词改善AI输出质量[6][7][12] - AI技术发展导致编程岗位需求减少 计算机专业毕业生失业率上升 美国计算机科学专业毕业生失业率甚至高于艺术专业[14] - 未来稀缺人类技能包括审美 分发能力和主观能动性[15][17] - AI时代教育重心应从"脑"转向"手"和"心" 注重项目发起能力和心理健康[18][19][20] - 开源模型降低创业门槛 DeepSeek开源后引发创业热潮 H200GPU租金上涨10%[24][26] - AI Agent领域快速发展 Devin产品展示新交互范式 价格达500美元/次[27][29] - 企业需关注AI长期变革 Bill Gates警示可能高估短期变化低估长期影响[32][34] - 设计师成为AI时代受益者 可独立完成从创意到上线的全流程[38][41][43] - 社群对AI创业者至关重要 AI Hacker House已举办23场活动 吸引3000位行业人士[46][47][52] AI交互优化 - 增加上下文可显著改善AI输出质量 通过语音录音和视觉记录提供全方位数据输入[7][10] - 提示词清晰度和任务拆解是关键优化方向[12] 就业市场影响 - AI可高效完成基层白领工作 人类需转向抽象能力竞争[14] - 计算机专业毕业生面临就业挑战 美国该专业失业率高于艺术专业[14] 未来核心能力 - 审美能力成为关键竞争优势 需具备从海量方案中识别最优解的能力[15] - 分发渠道构建是核心竞争力 因AI缺乏自有受众[17] - 主观能动性超越AI执行能力 体现在项目发起和推动能力[17] 教育体系变革 - 传统教育过度侧重"脑"的训练 在AI时代优先级下降[18] - "手"的能力培养包括项目发起和实践体验[19] - "心"的教育注重情绪管理和心理韧性建设[20] - "脑"的训练转向高阶认知 包括提问技巧和元认知学习[20] 创业环境变化 - 开源模型促进创业公平性 DeepSeek开源后引发一体化设备创业热潮[24][26] - 模型选择多样化利好创业者 千问3发布增强投资人信心[26] - GPU市场需求变化 H200租金在DeepSeek发布后上涨10%[26] AI Agent发展 - Devin展示新型交互范式 具备自主计划制定和进度汇报能力[27][29] - Agent产品快速涌现 包括Manus Genspark等产品[30] 长期行业影响 - AI可能改变商业竞争模式 转向成本和供应链竞争[34] - 需关注AI杠杆效应带来的长期价值创造机会[34] 设计领域变革 - 设计师可独立完成全流程产品开发[38][41] - 设计能力包含用户体验和功能逻辑设计[44] - YC青睐设计背景创始人 因设计体现共情和审美能力[38] 创业者社群价值 - AI Hacker House提供连接平台 促成联合创始人匹配和融资机会[46][47] - 社群带来归属感和信念感 五道口创业社区成为成功范例[52] - 线下活动已举办23场 覆盖23个国家3000位行业人士[47]
2025年Perplexity Comet电商选购类任务测试报告
搜狐财经· 2025-08-15 04:06
测试概况 - 该报告于2025年8月12日由郎瀚威、猫猫头及团队完成 评估四款AI工具在电商选购场景的表现 测试五项任务包括亚马逊商品购买及复购 查找最快发货自行车 购买聚会用系列杂物 给定预算选购风衣 指定条件购买冰箱 [1] - 参与测试的四款AI工具为OpenAI Agent Perp Comet Manus Genspark [1] - 报告共计51页 包含流量分析及更新时间线等内容 [3] 性能表现对比 - 平均耗时方面 Perp Comet以318秒最短 OpenAI Agent耗时1193秒最长 Manus耗时408秒 Genspark耗时52秒 [8] - 正确错误比例方面 Perp Comet和Genspark均为5/0全正确 OpenAI Agent和Manus均为4/1 [8] - 亚马逊复购任务中 Perp Comet和Genspark成功完成 OpenAI Agent和Manus失败 [2] - 查找最快发货自行车任务中 仅OpenAI Agent部分成功 其余均成功 Perp Comet耗时仅20秒 [2] - 购买聚会杂物任务中 除Manus部分成功外均成功 [2] - 给定预算选风衣任务中 四款工具均成功 [2] - 指定条件买冰箱任务中 仅Genspark成功 其余部分成功 [2] 能力梯度分析 - 四款工具在1-7级能力均达标 包括意图解析 搜索执行 结果获取 智能筛选 精准匹配 方案整合 实时交互 [9] - 8-9级购物车操作和订单预处理中 Manus表现欠缺 OpenAI Agent Perp Comet Genspark达标 [9] - 10级支付完成中 仅Perp Comet大概率能完成支付操作 [9] 团队测试感受 - 团队成员普遍认为Perp Comet能力最优 其次是Genspark OpenAI Agent Manus相对较弱 [2] - Perp Comet在效率和全流程操作上表现突出 [2] - Genspark在信息整合和执行细节上有优势 [2] - OpenAI Agent虽能完成部分操作但耗时较长 [2] - Manus多停留在方案提供阶段 缺乏实际购买操作能力 [2] - 具体表现为Manus只能给出选购清单报告 没有后续加购物车操作 [12] - OpenAI Agent能进入亚马逊但无法进行后续操作 页面显示错误 [12] - Genspark可实现加购物车和填写收货地址 但需要手动勾选工具 [13] - Perp Comet在绑定账户后可完成付款操作 [13] 电商场景价值 - 电商购物是AI能力的"展示舞台" 最能体现AI对个性化context的理解能力 [14] - 购物场景需要AI记住用户喜好 预算 购买历史 生活习惯和审美品味 [14] - 执行过程复杂 涉及10个层次能力节点的集中展示 [14] - 反馈机制直观 验收标准明确 没有模糊地带 [14] 测试执行详情 - 亚马逊复购任务来源自Alvaro Cintas 要求查找最后购买的肌酸并重新购买 [15] - Perp Comet执行亚马逊复购任务耗时360秒成功完成 [16] - OpenAI Agent执行亚马逊复购任务耗时83秒失败 [16] - Manus执行亚马逊复购任务耗时120秒失败 [16] - Genspark执行亚马逊复购任务耗时612秒成功完成 [16]
智能体大战分水岭时刻:四种技术路径全解析
36氪· 2025-08-04 07:16
通用AI代理技术架构分析 - OpenAI发布通用型ChatGPT Agent 整合深度研究工具Deep Research与执行工具Operator 实现一站式复杂任务处理 但存在速度慢和个性化不足等短板[1] - 主流Agent底层架构分为四种类型:基于浏览器的Agent、浏览器加沙盒的Agent、限制型沙盒Agent以及工作流集成Agent 不同架构在通用性和效率间存在权衡[11] - 浏览器架构具备万能特性但运行速度慢且Token消耗高 沙盒架构可高效执行本地脚本但无法联网操作 工作流集成架构结果精准但业务范围有限[12] 主要厂商产品特性对比 - ChatGPT Agent在浏览器执行层面表现优异 在Browsing Camp基准测试中达到50%以上分数 远超其他20多分的开源方案[6] - Manus采用虚拟机加浏览器架构 理论覆盖范围广但受浏览器能力限制 执行任务需要30多分钟[18] - Genspark采用模板化垂直Agent方案 通过限制工具数量提升速度 但通用性受限[23] - Pokee通过第三方SDK集成实现速度优势 比市面产品快4-10倍 但仅支持创作者或企业账户[24][27] 商业模式与技术路线选择 - B端产品聚焦专业人士重复性工作场景 C端产品更适合浏览器导向的标准化需求[31] - 美国科技公司API开放程度较高 国内生态正在逐步开放 高德地图在MCP协议推动下已开放地图生态[33][34] - Agent将改变流量分发模式 传统门户网站流量可能下降 Agent入口价值凸显[37] - 协议竞争成为关键 谷歌推出A2A协议 OpenAI和Pokee等厂商也自主推出协议以占据入口地位[40] 行业生态变革影响 - Agent可能重塑广告行业形态 从流量分成转向知识产权付费模式 创作者可通过Agent调用直接获得收益[43][44] - 推荐系统算法面临根本性变革 从排名展示转向连续交互机制 每条推荐需确保精确性以维持交互时长[46][47] - 传统基于排名的推荐系统发展潜力可能被压缩 交互机制更注重体验和探索[49]
模型与「壳」的价值同时被低估?真格基金戴雨森 2025 AI 中场万字复盘
Founder Park· 2025-08-02 01:09
核心观点 - 2025年AI行业迎来多个"李世石时刻",OpenAI通用大语言模型首次达到IMO金牌水准,标志着AI推理能力质的飞跃 [5][7][10] - AI应用和"套壳"价值被低估,Context Engineering成为关键竞争壁垒 [21][23][37] - Agent技术进入早期采用阶段,模型能力与产品设计协同推动生产力革命 [30][32][69] - 模型能力进化速度超预期,推理/编程/工具使用三大主线快速突破 [53][54][64] - 中国团队在AI应用层展现突出竞争力,Kimi等产品实现技术逆袭 [38][46][51] AI技术突破 OpenAI数学推理里程碑 - OpenAI通用大语言模型在2025年IMO竞赛中完成6题5对的成绩,达到金牌水平,且未针对数学专门优化 [5] - 该成绩获奥赛组委会官方认证,相比2024年Google专门设计的AlphaGeometry(银牌水平)更具泛化能力 [7] - 模型采用与GPT-4o相同底层架构,主要优化来自post-training和inference阶段 [9] - 数学证明属于"hard to verify"问题,突破意味着AI具备接近人类顶尖水平的逻辑推理能力 [8][13] 多模态与工具使用进展 - 图像生成从玩具级进化成生产力工具,ChatGPT图像生成可准确理解用户意图 [32] - Veo3模型实现虚拟世界真假难辨的生成效果,首次跨越恐怖谷效应 [33] - 工具使用形成API调用和视觉模拟两条技术路线,MCP生态初步建立 [64][65] 产品与应用演进 Agent技术发展 - ChatGPT Agent发布标志着行业共识形成,但产品体验仍有提升空间 [16][18] - Agent产品token用量相比Chatbot显著增长,Manus等产品进入Early Adopter阶段 [32][73] - 优秀Agent产品需为未来6-12个月的模型能力设计,当前任务完成率约20%,预期年底达70-80% [40][93] - 应用层通过Context Engineering构建三层壁垒:会话级/个性化/硬件增强上下文 [23][59][60] 中国团队突破 - Kimi K2开源模型在coding/Agent工作流/中文写作方面超越Claude,OpenRouter调用量快速攀升 [38] - 中国团队在长文本技术方向的前瞻布局得到验证,产品设计能力突出 [47][48] - 套壳应用展现持久价值,Manus等产品在特定场景表现优于ChatGPT Agent [19][21] 行业竞争格局 模型厂商动态 - Google Gemini 2.5实现技术反超,与OpenAI形成三强竞争格局 [55][56] - DeepSeek采取选择性突破策略,资源聚焦模型智能而非多模态 [42][43] - 模型benchmark出现钝化现象,实际用户体验差异成为新评估标准 [84] 人才与资本趋势 - 硅谷爆发acqui-hire抢人大战,顶尖人才薪资达disruptive级别 [80][82] - 推理算力需求爆发式增长,云服务商迎来新增长周期 [41][74] - 投资逻辑从"模型颠覆应用"转向"人机协作价值创造" [37][38] 未来演进方向 技术前沿展望 - 推理能力从7分到10分的质量提升,小模型开始具备强推理能力 [53][54] - 编程场景context长度与自我纠错能力持续优化,复杂代码一次通过率提升 [55] - 原生多模态、在线学习、高级Agent能力或成下一代模型突破点 [39][94] 社会影响预判 - 生产力提升带来"超级个体",3人团队可能实现独角兽级产出 [85] - 组织管理复杂度突破新量级,美团等企业将管理数百万AI协同体 [86] - 智能边界衡量成为新挑战,人类需建立评估超人智能的新标准 [84][87]
技术狂飙下的 AI Assistant,离真正的 Jarvis 还有几层窗户纸?
机器之心· 2025-07-30 01:30
01 通用 Agent 架构受限,任务智能还停留在「样板房」? - 当前 AI Assistant 的核心挑战集中在智能规划与调用、系统延迟与协同、交互记忆与拟人性以及商业模式与落地路径四个维度 [2] - 在任务执行智能方面,一条核心路线是构建长程、循环、可泛化的通用任务框架,实现从目标理解到任务完成的全过程 [2] - 通用框架的代表 Manus 采用「多步任务规划 + 工具链组合」架构,将 LLM 用作「控制中心」,但在实际测试中对复杂网页结构的抓取覆盖不足 [4] - MetaGPT 强调通用框架需叠加「代码执行、记忆管理与系统调用」等组件,但存在延迟高、调用链复杂、成本不可控等问题 [4] - 「逐场景做透」的技术路线更强调低门槛部署与稳定性,适用于「弱通用、强完成」的应用需求,但在非结构化任务或领域迁移时表现明显下降 [4] - Browser-Use 类路径支持 Agent 模拟浏览器登录、填写表单、抓取信息、提交交易等功能,但稳定性、安全性与权限系统仍未成熟 [6] - 无代码出工具(No‑Code Agent Builder)正成为下一代 AI Assistant 的推荐解决方案,如 AutoGen Studio、Base44 和 StackAI 等 [6][7] 02 一句话唤醒万物,AI Assistant 要补齐的系统短板有哪些? - AI Assistant 最终要以语音为主要形态和用户进行交互,系统优化层面面临语音交互低延迟、全双工语音、能力与硬件/系统行动绑定等挑战 [8]
爆火了大半年,Agent到底能干好多少活
虎嗅· 2025-07-29 07:08
核心观点 - AI Agent的核心能力从表达转向解决问题 代表从Chatbot到Agent的范式转变 [1][3][6] - Agent通过任务链实现自主操作 减少人工干预 提升执行效率 [6][8][10] - 行业分化出通用型Agent和垂类Agent两条路径 前者侧重技术展示 后者强调场景落地 [12][16][18] - Agent Experience(AX)重构交互逻辑 以关系为中心实现持续学习和自动化 [26][27][29] - 大厂与初创公司采用不同策略:大厂通过现有产品嵌入AI 初创公司从零构建Agent原生应用 [33][34][45] Agent技术演进 - Agent链路支持目标拆解为子任务 自主调用工具完成多步操作 [6] - 相比线性对话的Chatbot Agent减少用户介入需求 [6][10] - 浏览器环境成为早期解决方案 如OpenAI Operator聚焦自动操作 [10] - Manus通过可视化执行面板提升用户体验 展示思考过程增强信任 [11] - Agent本质是调度中枢 融合大模型理解能力与工具执行链 [51][52] 产品形态对比 - 通用型Agent优先爆发 因大而全策略易于技术展示和融资 [12] - 垂类Agent聚焦明确场景 如客服、医疗、投研等行业应用 [16][17] - 通用Agent类似瑞士军刀 功能全面但单项不足 垂类Agent如专业工具更实用 [21][23] - 功能细节成为差异化关键 如Manus预估时长和Genspark代打电话 [14][15] 交互范式变革 - Agent Experience(AX)从界面中心转向关系中心 实现持续目标追踪 [26][29] - AX具备状态感知、意图推理和行动选择能力 替代预设流程 [27][29] - 核心特性包括可控性、可预期性、可逆性和可演进性 [30] - 信任构建通过展示工作过程 随信心增长逐步减少提示 [29] 市场竞争格局 - 大厂依托现有产品嵌入Agent 如飞书升级知识问答和会议功能 [35] - 钉钉AI表格将AI作为原生能力 非单纯工具 [36] - 夸克高考志愿大模型处理1200万份报告 需临时调配算力支撑 [41] - 微软Copilot采用渐进集成 保持副驾驶角色避免越权 [43] - 初创公司如YouMind以Agent逻辑原生构建 成为主要执行者 [44] 商业化路径 - 大厂拥有历史数据权限和任务链路 通过打补丁实现商业闭环 [46] - 初创公司凭借灵活性和垂直数据 差异化竞争大而全产品 [47] - Agent融入工作流后具备高替代成本和用户粘性 形成产品护城河 [31] - 技术基础设施依赖开放接口、工具链和稳定模型支持 [52] 未来发展趋势 - 通用Agent是过渡形态 最终被嵌入式垂类Agent替代 [53] - Agent为自动化流程添加大脑 实现理解-拆解-执行闭环 [51] - 行业需解决API权限分散和系统兼容性问题 [9] - 实际应用仍面临产品力落地挑战 避免陷入概念炒作 [15]
Agent爆火,华人赢麻了
36氪· 2025-07-24 10:36
华人AI Agent创业热潮 - 2025年以华人为主角的AI Agent创业热潮席卷全球,Manus和Genspark成为代表性产品[3][7][8] - Genspark在45天内实现3600万美元年度经常性收入(ARR),10周上线8个产品[4][5] - Manus发布当月MAU达2300万,获Benchmark领投7500万美元融资,投后估值超5亿美元[9][10] 代表性公司及产品表现 - MainFunc的Genspark浏览器通用Agent发布45天ARR达3600万美元[5][24] - Monica团队的Manus通用Agent发布当月MAU达2300万[9] - Flowith的Neo无投放ARR达130万美元,6月Web访问量101万[15] - 360的纳米AI超级搜索智能体6月Web访问量达1.57亿[15] - 阿里夸克AI 6月Web访问量超8400万[15] 技术驱动因素 - Claude 3.7 Sonnet混合推理模型提升编程和开发性能[16] - MCP(模型上下文协议)实现AI自由调用外部工具[16] - Agent产品形态从简单聊天演进为能自主规划任务并交付结果的智能体[12] 行业趋势与挑战 - 通用Agent增长红利消退:Manus月访问量从3月2376万次降至6月1730万次,Genspark从4月888万次降至6月769次[19] - 地缘政治影响:Manus退出中国市场可能与美国财政部监察有关[20][21] - 大厂在通用Agent领域进展缓慢,初创公司凭借灵活高效占据优势[26][27][29] 产品发展策略 - 快速响应技术:Manus团队3个月完成产品开发,Lovart团队2个月完成研发[30][31] - 专注用户体验:Manus4次重构智能体框架提升运行速度[32] - 垂类Agent成为新方向:LiblibAI发布设计Agent Lovart,蔡浩宇推出AI游戏《Whispers from the Star》[37][39] 商业化表现 - Genspark仅用9天实现1000万美元ARR,远超AI Coding企业Cursor的21个月[25] - 垂类Agent表现突出:Lovart发布5天注册用户超10万,ListenHub首发当天DAU 5000+[39] - OpenAI的Agent"Deep Research"促使20%用户升级至200美元/月的Pro会员[36]
「Manus+景鲲」领衔主演,华人AI Agent全球狂欢
36氪· 2025-07-24 10:07
行业动态 - 2025年全球科技圈聚焦华人AI Agent,Genspark和Manus成为代表性产品[1][3][4] - Agent行业在2025年迎来"文艺复兴",技术跃升推动产品形态成熟,用户规模和收入显著增长[6][7] - Claude 3.7 Sonnet模型和MCP协议发布,为Agent生态发展提供关键技术支撑[9] - 垂直领域Agent开始崛起,LiblibAI、米哈游等公司在多模态、游戏等细分市场布局[29][31] 公司表现 - MainFunc旗下Genspark实现45天3600万美元ARR,10周上线8个产品的爆发式增长[1] - Monica团队开发的Manus发布当月MAU达2300万,获Benchmark领投7500万美元融资,投后估值超5亿美元[4] - 阿里夸克AI月访问量超8400万,高考志愿报告Agent累计生成1000万份报告[8] - 360纳米AI超级搜索智能体月访问量达1.57亿,美图RoboNeo登顶国内App Store分类榜[8] 产品特征 - 新一代Agent具备自主规划任务、调用外部工具的能力,突破传统聊天机器人局限[6] - Manus定义了显示思维链对话框+任务执行可视化面板的产品范式,被多家公司模仿[10][12] - 通用Agent面临PMF验证问题,Manus和Genspark月访问量分别从2376万/888万下滑至1730万/769万[13] - 垂直领域Agent在图像设计、视频编辑、编程等场景取得突破性进展[31] 市场趋势 - Agent实现高营收速度惊人,Genspark仅用9天达到1000万美元ARR,远超Cursor的21个月[17] - 初创公司在通用Agent领域表现激进,大厂受制于组织惯性和政策限制进展缓慢[18][22] - 地缘政治影响显现,Manus裁撤中国团队转向新加坡市场,面临海外融资压力[14][15] - 行业共识认为未来通用Agent将由模型厂商主导,创业公司需转向垂直领域发展[28][29] 技术发展 - 第三方模型性能提升和低代码工具降低开发门槛,推动Agent产品快速迭代[6][23] - Monica团队4次重构智能体框架,优化运行速度和可扩展性[25] - 产品开发周期大幅缩短,Manus和Lovart分别仅用3个月和2个月完成开发[24][25]
可能是2025-2026年的最佳投资
佩妮Penny的世界· 2025-07-22 10:44
创投行业工具大礼包 - 海外AI工具大礼包价值超过15000美元,包含Cursor、Perplexity、Notion等产品,订阅newsletter年费约200美元,学生可享50%教育优惠 [1] - 国内创投社群推出价值超6000元的工具礼包,包含一级市场数据平台、AI投研工具等,社群会员免费获取体验资格 [2] - 烯牛数据提供个人版APP月卡(价值188元/月)及机构版30天免费试用(年费16800元,约合1640元/月) [3][4][5] - IT桔子为个人用户提供半月卡试用(价值54元/月),涵盖创投事件、产业链图谱等数据服务 [7][8] - 执中ZERONE数据库机构版30天免费试用(年费3万元,约合2500元/月),开放最高权限数据 [9] - Alpha Engine投研平台提供30天Ultra版本体验(价值约1650元),支持DeepResearch功能 [11] - 沉浸式翻译Pro版7天免费试用(价值约18元),支持浏览器插件形态的海外资讯翻译 [13][14] 社群会员权益体系 - 微信群组包含行业资讯分享、同城聚会、垂直领域专业群(消费/医疗/并购等)及姐妹群 [20] - 线上主题分享覆盖行业讨论、副业转型、经验分享等内容 [21] - 线下活动包括主要城市年度聚会及随机饭局,促进深度交流 [21] - 社群知识库整合历史讨论回放、研究报告库、群友名册、招聘内推等资源 [21] - 会员续费率高达90%,社群强调平等、理性交流,鼓励高质量分享与合作 [23][26] 免费AI生产力工具推荐 - 通用聊天工具:ChatGPT、腾讯元宝(集成公众号数据)、豆包(语音互动) [19] - 语音转写/会议纪要:通义听悟、飞书妙计(实时记录)、百度网盘(直接转存) [19] - 深度研究工具:秘塔、Kimi(新版本优化)、DeepSeek [19] - PPT生成工具:Kimi、天工、Genspark [19] 社群运营核心理念 - 社群以成员需求为中心构建平等网络,无层级结构,规则统一适用 [23] - 通过线上线下活动促成合作机会,已有案例包括求职对接、投资人匹配等 [24][25] - 运营方强调时间自由价值,社群形成跨城市人际网络,支持成员生活与工作平衡 [30] - 用户反馈显示社群对创业者、投资者具有持续学习价值,潜水成员亦能获得行业洞察 [31][32]