深度研究
搜索文档
喝点VC|a16z重磅分析:搜索进入“AI原生”时代,谁将主宰下一代搜索基础设施?
Z Potentials· 2025-12-06 05:27
文章核心观点 - 互联网搜索正经历从为人类优化到为AI智能体(Agent)重构的根本性转变,这催生了一个全新的、多样化的AI原生搜索基础设施和服务市场 [3][5][6] - 与1990年代由少数独立产品主导的搜索竞争不同,当前的AI搜索竞争主要由提供API服务的供应商驱动,这些供应商能够快速整合前沿技术,并深度嵌入面向用户的产品中 [3][6][14] - 深度研究(Agentic Research)被认为是AI搜索最具主导性和货币化潜力的形式,客户已表现出为高质量研究结果付费的意愿 [5][18] - 构建和维护网络索引的高成本与复杂性,使得大多数企业倾向于依赖第三方搜索API服务商,而非自建基础设施 [7] - 最终目标是构建一个平衡成本、准确性和性能的AI原生搜索层,能够为智能体提供信息密度高、时效性可控的核心信息片段 [3][9] AI搜索的演进与架构转变 - 早期LLM(如2023年的ChatGPT)因未联网导致信息过时或幻觉,催生了通过检索增强模型能力的需求 [10] - GPT Researcher(一个拥有超过20,000个GitHub星标的开源项目)定义了“为推理而检索”的新范式,成为深度研究工具的原型 [10][11] - 两大关键架构转变推动了AI搜索的实现:检索增强生成(RAG)为模型提供实时信息访问;测试时计算(TTC)允许模型在推理中分配更多计算资源以改进答案 [11] - 这些转变使搜索从静态的实用程序演变为一种交互式的智能形式 [11] - 微软关闭公共必应搜索API并引导开发者转向付费的“Agent构建器”,象征了从传统索引搜索向AI工作流集成搜索的转变 [12] 当前竞争格局与市场参与者 - 当前AI搜索市场参与者可分为两类:同时提供消费者产品和API服务的公司(如Perplexity、Exa),以及专注于API服务的公司(如Parallel、Tavily) [14] - 大多数AI搜索产品都向API平台产品靠拢,通过单一集成提供搜索、爬取、信息提取和深度研究等功能 [15] - 也出现了更面向消费者的新产品,如ChatGPT的深度研究功能、Exa Websets,它们权衡了易用性与灵活性 [16] - 客户通过结果质量、API性能和成本来评估供应商,测试方法从非正式实验到精心设计的内部基准不等,有些公司会同时使用多个供应商以提高覆盖或性能 [16] - 行业早期产品差异有限,竞争主要集中在速度、定价和易集成性,但形势正在迅速变化,部分团队开始在深度研究等领域形成差异化 [22] 核心技术方法与基础设施 - 为AI构建网络索引需要不同于传统搜索引擎的AI原生架构,应聚焦于提取核心信息片段,并精细控制长度与实时性 [3] - 各公司在索引构建上采取不同方法:例如Exa采取基础设施密集型方法,部署了144块H200 GPU并维护大规模URL队列;Parallel则维护为AI Agent优化的大规模索引,每天添加数百万页面 [8] - 另一些公司如Tavily和Valyu,选择以更节省计算的方式抓取网页,但采用强化学习模型来判断页面重新抓取的频率 [8] - 构建高质量网络索引是一项计算成本高昂的壮举,涉及对PB级别数据的排序 [8] 主要应用场景与用例 - **深度研究**:Agent进行多步骤、开放式研究的能力,可在几分钟内完成人类数小时的任务,是搜索API最引人注目的用例之一 [17] - OpenAI的BrowseComp基准显示,人类专家在两小时内仅能正确解决其25%的问题,凸显了AI在此领域的价值 [18] - **CRM线索富集**:自动查找和拼接来自不同来源的人员或公司数据,并可定期更新,将耗时的手动过程自动化 [19] - **技术文档/代码搜索**:为编码Agent提供对实时、最新的代码示例和文档的访问,确保生成代码的准确性和质量 [20] - **主动、个性化的推荐**:利用实时网络数据,为应用程序和Agent提供基于用户背景和偏好的个性化实时推荐 [21] 市场展望与影响 - 本次变革可能催生众多在不同维度和领域蓬勃发展的搜索服务商,而非像过去一样形成少数巨头垄断的局面 [3] - 让搜索对AI智能体更容易访问,也间接使其对人类更容易访问,有助于改善被广告和SEO内容充斥的传统搜索体验 [23] - 随着搜索成为AI工作流程中的原生层,正在涌现出新的、更引人注目的用例 [20] - 供应商在索引方法上的不同权衡,预计将随时间推移演变为更大的差异化,这是值得关注的领域 [22]
助力深度研究 秘塔AI搜索接入MiniMax M2
央广网· 2025-11-21 04:04
公司产品与技术 - 秘塔AI搜索是国内最早由创业团队上线的AI搜索产品 [1] - 产品在知识的索引、整理及输出上保持优异体验 得益于团队的计算机和法律从业背景 [1] - 公司推出「深度研究」模式 该模式试图打开搜索规划算法的「黑箱」 在分析搜索过程中呈现动态「问题链」 使复杂问题的研究过程清晰可见 [4] 行业合作与技术整合 - 公司与MiniMax Speech合作 在新产品「今天学点啥」中应用其技术 使「塔子老师」的知识讲解拥有悦耳自然的声线 [2] - 公司在MiniMax M2模型开源后第一时间试用并部署 [2] - 公司深度研究模式背后有MiniMax M2模型提供的推理能力以及强大的交错思维链能力支持 [3] - MiniMax M2是一款专为顶尖Coding和Agentic能力而生的模型 致力于在提供优秀性能的同时提供最优价格 [4]
非客观人工智能使用指南
36氪· 2025-11-18 23:15
全球AI使用现状 - 全球约10%人口每周使用AI工具,其中绝大多数使用免费版本 [1] 主要AI系统提供商 - 四大最先进AI系统包括Anthropic的Claude、谷歌的Gemini、OpenAI的ChatGPT和埃隆·马斯克xAI旗下的Grok [3] - 第二梯队开放权重AI包括中国的Deepseek、Kimi、Z和Qwen,以及法国的Mistral,这些模型变体占据AI评级系统前35名 [3] - Microsoft Copilot和Perplexity等服务基于上述九个核心AI系统构建 [3] 付费AI服务定价策略 - 高级AI服务月费分为20美元和200美元两档,20美元档满足绝大多数需求,200美元档针对复杂技术和编码需求用户 [6] - 公司正在全球某些地区试验其他定价模式 [6] 付费AI系统功能对比 - 主要付费系统(Claude、Gemini、ChatGPT)均提供智能体能力、语音模式、图像文档处理、代码执行、移动应用和多模态创作功能 [7] - Claude目前缺少图像生成能力,Gemini和ChatGPT具备图像视频生成功能 [7][20] - Grok适合X平台重度用户,但产品安全透明度较低 [7] - Microsoft Copilot通过Windows系统提供ChatGPT功能,但用户对模型控制力较弱 [7] AI模型技术分级 - 聊天模型适合对话场景,响应迅速且具人情味 [9] - 智能体模型可自主执行多步骤复杂任务(网页搜索、代码使用、文档制作),出错概率更低 [9] - 巫师模型用于处理非常复杂的学术任务 [9] 各厂商模型选择策略 - ChatGPT提供从GPT-5 mini到GPT-5 Pro的多层级模型,付费用户可手动选择GPT-5 Thinking Extended(20美元套餐)或GPT-5 Thinking Heavy(200美元套餐) [11] - Gemini提供Gemini 2.5 Flash和Gemini 2.5 Pro两个选项,Ultra套餐用户可使用Gemini Deep Think [13] - Claude采用简化模型选择策略,主要使用Sonnet 4.5处理任务,提供"扩展思考"选项用于难题处理 [14] 数据隐私与功能权衡 - 关闭ChatGPT和Claude的训练功能不会损失功用,但Gemini会牺牲部分功能 [15] AI深度研究能力 - 深度研究模式可进行10-15分钟广泛网络研究,生成高质量报告 [16] - GPT-5 Thinking具备自主研究能力,Claude提供"中度研究"选项 [16] 数据整合能力 - AI系统支持连接Gmail到SharePoint等多种应用,Claude在整合搜索电子邮件、日历和云盘方面表现突出 [18] 多模态输入功能 - Gemini和ChatGPT在语音模式方面表现最佳,Claude语音功能相对较弱 [19] - 所有模型支持PDF、图片和视频上传,ChatGPT和Gemini的App版本支持屏幕共享和摄像头实时交互 [19] 内容创作能力 - Claude和ChatGPT可生成高质量PowerPoint和Excel文件,Claude目前在文档格式处理方面领先 [20] - Gemini拥有最强AI图像生成模型,Gemini和OpenAI具备视频生成能力(Veo 3.1和Sora 2) [20] - Sora 2定位社交媒体应用,Veo 3.1用途更广泛,生成视频均带声音 [20] 技术发展轨迹 - AI图像生成能力显著提升,从2021年生成扭曲图像发展到目前可制作多种风格的高质量视频 [21][23] 行业应用趋势 - AI系统正从基础对话向复杂任务执行演进,用户逐渐探索AI在报告撰写、问题解决和项目管理等方面的应用场景 [24] - 建立对AI系统能力和局限的直觉比掌握具体操作技巧更为重要 [24]
“破局者”财通资管:以“变”与“恒”书写权益投资新样本
每日经济新闻· 2025-11-06 00:49
公司规模与业绩表现 - 截至2025年三季度末,公司总管理规模超3000亿元,公募管理规模近1100亿元,公募非货规模持续居券商资管行业前列 [3] - 公司近7年权益类基金绝对收益率达156.69%,在118家基金管理人中排名前20%(第24位) [3] - 公司权益公募基金规模从最初的7亿元增长到超170亿元(截至2025年三季度) [4] 投研团队建设 - 公司当前权益投研团队约40人,其中权益研究员20余人 [4] - 权益基金经理和投资经理平均证券从业年限超14年,证券从业经验超15年的有6位,另有2位在10-15年之间 [5] - 近20位权益研究员平均从业年限近7年,其中4位从业超10年,多数处于5-10年成熟期,另有5位后备力量 [6] 投研理念与架构 - 公司于2019年提出“深度研究、价值投资、绝对收益、长线考核”的十六字投研理念 [4] - 权益团队细分为权益公募投资一部、二部、权益私募投资部和权益研究部四大部门,各部门负责人均由资深基金经理掌舵 [8] - 权益研究部按科技、消费、制造、医药、周期等核心领域分组,实现了31个申万一级行业的全覆盖 [10][12] 投资策略与特色 - 公司核心目标是聚焦长期相对低波动下的复合绝对回报,不追逐短期热点 [13] - 投资决策基于扎实的产业基本面深度研究,挖掘企业内在价值 [13] - 公司通过长线考核机制,加大长周期收益在考核中的权重,减少短期业绩压力对投资的干扰 [15] 业务发展历程 - 公司前身为财通证券资产管理部,于2014年12月成为独立子公司,成立之初仅有的两只集合产品均为权益类 [4] - 2015年底公司获批公募管理人资格,为权益产品布局提速打下基础 [4] - 公司通过“内部培养+外部引进”双管齐下,补齐了港股及海外市场的研究拼图,并强化了主流赛道的深度研究能力 [12]
财通资管“科技军团”:在产业中徜徉
点拾投资· 2025-08-17 11:00
文章核心观点 - 科技创新在多个领域出现爆发式突破 包括创新药 人工智能和无人驾驶 正深刻改变生活方式和资本市场表现 [1] - 科技股投资具有高增长和高波动的双重特性 只有极少数公司能实现长期持续高增长 需要深度产业研究而非线性外推 [1][2] - 财通资管科技投研团队通过产业沉浸式研究 前瞻性布局和平台化投研体系 在科技投资领域取得显著超额收益 [3][4][6] 科技创新投资特性 - 科技创新并非新现象 100多年前的铁路 电话和电视都曾是高增长科技股 但能连续10年保持25%以上增速的企业极少 [1] - 科技股投资存在无限想象空间与无法预测的未知风险并存的特点 既让人神往又让人望而生畏 [1] - 科技行业多变 需要持续关注技术迭代 竞争格局和经营周期变化 通过深度产业研究才能捕捉变化背后的机会 [2] 财通资管科技产品业绩表现 - 包斆文管理的财通资管科技创新一年持有混合近三年业绩排名前1%(22/2467) 获三年期五星评级 [3] - 财通资管数字经济混合发起式近两年业绩排名前5%(133/3165) 财通资管创新成长混合近一年业绩排名前5%(157/3751) [3] - 李晶管理的财通资管产业优选混合发起式2025年上半年收益6.47% 超额收益6.35% 徐竞择管理的财通资管先进制造混合发起式同期收益30.46% 超额收益28.08% [3] 产业沉浸式研究方法论 - 科技投资需避免"盲人摸象" 不能仅根据新产品人气进行线性外推 关键要看是否真正满足客户需求 [6] - 企业盈利变化通常滞后 必须走在盈利变化之前 提高研究前瞻性和预判性 需基于全局视角的深层次产业理解 [6] - 财通资管权益投研理念强调"深度研究 价值投资 绝对收益 长线考核" 从产业及个股基本面出发进行深度研究 [6] 基金经理投资风格与案例 - 包斆文擅长结合微观细节和宏观背景 找到中观产业脉络 注重政策研判与产业验证 倾向左侧布局低渗透率高景气行业 [7] - 李晶通过"拼图游戏"构建科技产业全景图 制订产业坐标系 偏好中上游通用型环节公司 认为其有更好投资胜率和可验证性 [8][10] - 徐竞择偏好先进制造领域 专注创新成长和景气周期阶段 强调真实用户需求 较早布局智能机器人和AI应用(智能驾驶) [10][11] AI投资成功案例 - 2023年财通资管科技团队坚定看好AI驱动的算力 光模块等领域 尽管年底市场担忧资本开支放缓 团队判断AI将是强产业趋势 [11] - 2024年一季度财报季验证海外巨头对AI投入决心空前 资本开支放缓担忧不攻自破 旗下产品在随之而来的上涨行情中收获颇丰 [12] - 投资决策基于对产业趋势的预判而非单纯公司经营状况 跟随大产业趋势进行投资 [12] 投研融合体系 - 管理规模变大后进入研究驱动投资阶段 研究对投资助力在多变科技行业中尤为明显 [14] - 投研融合基础在于双向互动和彼此信任 研究端需"守土有责" 投资端需充分信任和沟通 实现思想同频共振 [15] - 研究员具有独立性 需在专业细分领域比基金经理研究更细致深入 确保团队在各领域没有明显短板 [15] 团队结构与考核机制 - 3位科技成长风格基金经理平均司龄超7年 证券从业年限平均13年 TMT研究员平均司龄近4年 从业年限超6年 [15] - 研究员推荐股票时很审慎 只有高置信度股票才会重点推荐 而非广撒网 [16] - 研究员晋升投资岗位前两年需承担带教工作 考核中研究工作占比较高 逐年降低直至新人具备独立覆盖能力 [17] 制度与资源分配 - 基金经理持仓需有一定比例来自研究员推荐 重点库与推荐股票需有重合度并纳入考核 [18] - 每个基金经理获得的研究资源平等 与管理产品规模大小无关 确保小规模产品也能获得同等研究支持 [18] - 研究员成果面向所有投资经理 跟踪变化信息需与整个团队共享 研究团队已实现31个申万一级行业全覆盖 [19] 公司文化与团队建设 - 公司文化强调"包容"和"共享" 投研人员人际关系简单 有竞争也有合作 懂得彼此成就 [22][23] - 投资风格在共同理念下适度多元 3位科技基金经理分别侧重成长风格 价值成长风格和成长投资 但都从个股基本面出发 [24] - 对研究员考核主要看实盘贡献 但也兼顾勤奋度和专业度等过程指标 避免唯结果论 [25] 平台化投研体系 - 新时代经济增长范式下科技股投资变得比任何时候都重要 是经济增长最重要的要素 [28] - 资管行业步入平台化时代 需通过打造完善投研体系形成平台化投资护城河 涵盖文化 人才 资源 考核和产品等多方面 [28] - 强大投研平台和体系是基金经理生命力的保障 能保持活力而非依赖个体明星基金经理 [29]
秘塔AI也终于悄悄上线了DeepResearch。
数字生命卡兹克· 2025-07-14 22:11
秘塔AI搜索新功能DeepResearch 核心功能升级 - 秘塔AI搜索推出"深度研究"(DeepResearch)功能,取代原有的简洁/深入/研究三种模式,提供更专业的分析能力[5][6][7] - 功能设计具有游戏化交互体验,通过可视化界面展示AI的思考过程,包括token消耗量(324911)、信源数量(540)、调研时间(8.1分钟)等实时数据[23][25][43] - 采用多链式问题分析框架,将复杂问题拆解为可追踪的节点网络,明确标注结论待完善/检索中/需验证等状态[34][35][45] 行业应用案例 - 外卖行业分析: - 准确识别京东/美团/淘宝外卖大战本质为"高频打低频"的战略对抗,美团通过高频业务切入电商低频市场形成降维打击[54][55] - 生成超万字深度报告,包含四大章节的纵向(10年行业发展)与横向(三家公司对比)分析,严格遵循用户提出的横纵分析法[16][18][53] - 网红现象研究: - 仅凭"红姐"关键词自动关联抖音/B站/微博内容,分析TOP10二创视频完播率,输出包含10个网络梗的万字报告[76][80][86] - 展示完整信息溯源路径,包括视频链接跳转、原文悬浮窗预览等交互功能[46][49][61] 产品差异化优势 - 报告质量达到OpenAI DeepResearch水平,但免费用户每日可获得100搜索额度(每次消耗20-30额度),付费用户年费179元享500额度/日[68][70] - 独创互动研究报告生成功能,自动将长文本转化为可视化网页,支持用户自定义信源偏好管理[63][64][67] - 严格区分浅度/深度研究模式,坚持功能成熟度达标后才正式推出,报告长度控制在1万字上限[94][97] 技术实现特点 - 突破传统AI黑箱模式,通过神经网络式节点连线展示信息关联过程,支持全屏模式下的细节追溯[41][42][45] - 信源处理能力覆盖文字/视频等多模态内容,右侧信息栏可直接跳转原始材料或调用讲解功能[61][49] - 语义理解精准度极高,能根据模糊指令(如"红姐")自动扩展搜索维度,避免误判关键信息[77][80]
一文读懂 Deep Research:竞争核心、技术难题与演进方向
Founder Park· 2025-06-26 11:03
深度研究系统生态现状 - 2025年AI Agent探索浪潮中,"深度研究"类产品成为最早成功落地的领域之一,谷歌、OpenAI、Anthropic等巨头已推出商业竞品,开源社区涌现80+团队参与[1] - 当前生态呈现显著差异化,竞争焦点转向系统架构、工程优化与应用场景适配度的综合比拼[1] - 评估体系从通用基准转向高度专业化测评,"适合与否"取代"好坏"判断[2] 技术实现与核心能力 核心技术差异 - 基础模型与推理效率:OpenAI/DeepResearch等商业系统依托专有大模型在上下文长度和复杂推理占优,Perplexity/DeepResearch通过优化开源模型实现竞争力[4] - 工具集成适应性:AutoGLM等构建全能平台,Nanobrowser专注网页交互,n8n擅长API集成与工作流自动化[5] - 任务规划稳定性:OpenAI/AgentsSDK长于层级化任务分解,Agent-RL/ReSearch利用强化学习提升鲁棒性,smolagents通过多智能体协作提升并行效率[5] 架构选型趋势 - 单体式架构(如OpenAI/DeepResearch)保证推理连贯性但扩展性受限[12] - 多智能体架构(如smolagents)实现功能专业化与并行处理,需解决协调一致性挑战[13] - 混合架构(如Perplexity/DeepResearch)结合多智能体并行搜集与中央推理核心,灵活性最高但实现复杂[13] 应用场景适配 - 学术研究:OpenAI/DeepResearch和Perplexity/DeepResearch在引用严谨性、方法论分析上表现突出[8] - 企业决策:Gemini/DeepResearch和Manus凭借数据整合与分析框架优势明显[8] - 个人知识管理:Open-Manus等开源方案在隐私保护、本地部署方面占优[8] 评估体系演进 - 专业化基准涌现:AAAR-1.0(150项多领域任务)、DSBench(20项数据科学任务)、TPBench(理论物理推理)等[9][11] - 多模态评估兴起:MMSci(研究生级多模态科学问答)、GMAI-MMBench(医学多模态)[10] - 功能评估三维度:任务完成能力(WebArena基准)、信息检索质量(F1分数)、知识综合准确性(TruthfulQA基准)[17][18] 未来技术方向 推理架构突破 - 上下文窗口限制:通过信息压缩(OpenAI分层处理)和外部记忆架构(Camel-AI的OWL系统)解决[23][24] - 混合推理模式:神经网络-符号集成架构实现创造性联想与形式化验证切换[25] - 动态知识图谱:HKUDS/Auto-Deep-Research系统实现知识双向演化[26] 因果与不确定性 - 因果推理三层能力:因果图构建、效应量化、结构化分析框架[28] - 干预建模技术:Agent-RL/ReSearch展示反事实推理潜力[28][29] - 多维不确定性建模:Perplexity/DeepResearch区分源不确定性与集成不确定性[30]
「Reportify 2.0」更新:交互升级,智能问答,深度研究
深研阅读 Reportify· 2024-12-30 06:46
Reportify产品功能更新 - 智能问答系统升级为Agent模式,可执行多任务分解并自动选择定性/定量分析方式,新增对图片和表格内容的召回展示[1] - 定量分析支持结构化数据查询与可视化渲染,图表类型涵盖折线图/柱状图/饼图等[2][7] - 结构化数据覆盖沪深/港股/美股市场的股价/估值/财务数据及部分宏观数据[7] 财务数据分析案例 - 某公司2024年季度财务表现:Q1收入213亿美元(净利润11.29亿),Q2收入255亿(净利润14.78亿),Q3收入251.82亿(净利润21.7亿)[3][4] - 英伟达财务趋势:2020-2024年收入从113.57亿增至260.44亿美元,利润同步增长[12][13][18] - 半导体行业对比:2020-2024年英伟达收入增速显著高于AMD和英特尔,2024Q2英伟达收入260亿时AMD为26亿/英特尔为129亿[15][16][18] 深度研究功能 - 新增深度研究模式可自动生成研究大纲,通过多轮搜索对比形成完整报告,当前限时免费未来将转为付费功能[22] - 文档搜索功能优化结果准确性,右侧新增结果摘要并支持切换对话模式[25] 产品交互改进 - 左侧菜单重组突出数字资产管理功能(自选/订阅/历史等)[30] - 全局搜索框置顶便于快速访问[31] - 公司关注列表展示优化,支持沪深/港股/美股多市场标的[32] 核心数据亮点 - 特斯拉2024Q3业绩:收入251.8亿美元(同比+8%),汽车业务收入200.16亿,储能业务同比+52.41%[23][29] - 特斯拉运营指标:2024Q3毛利率19.8%(同比+195bps),经营现金流62.55亿美元[23] - 产品路线图:2025年上半年计划推出低价车型,目标年销售增长率20-30%[29]