Websets

搜索文档
专为AI打造的搜索引擎崛起,信息获取范式将迎来新一轮转变
36氪· 2025-09-10 11:16
AI搜索范式转变 - AI搜索应用突破传统搜索引擎"十条蓝色链接"范式 直接生成高质量答案[1] - 研究类Agent通过多轮深度搜索输出专业报告 实现更精准信息获取[1] - 专为AI打造的搜索引擎提供全面无偏见的高质量理解 能搜索到过去找不到的内容[1] 行业融资与估值 - Exa获得Benchmark领投8500万美元B轮融资 估值达7亿美元[3] - You.com获得Cox Enterprises领投1亿美元C轮融资 估值达15亿美元[3] - 两家公司融资方均包括Lightspeed Venture Partners Y Combinator和英伟达[3] 技术架构创新 - Exa采用自研神经网络搜索架构 基于向量数据库和嵌入技术而非关键词匹配[7] - You.com开发与模型无关的AI操作系统 使任何大语言模型更准确可信[14] - Exa的Research API在SimpleQA基准测试取得94.9%高分 响应时间低于450毫秒[11] 产品定位差异 - Exa定位"纯粹知识源" 提供按使用量付费的搜索API服务 客户包括Databricks Cursor Notion[11] - You.com构建"Agent时代高速公路" 每月处理超10亿次查询 客户含DuckDuckGo Windsurf Harvey[18] - You.com的ARI产品研究速度比ChatGPT快3倍 平均响应时间3分钟 处理超400个信源[15] 市场前景与机会 - AI搜索查询量将远超人类 搜索领域存在颠覆性创业机会[3][20] - 需将Agent准确率从95%提升至99.9%以支持30步工作流可靠运行[19] - 创业者可选择打造极致性能工具或深度绑定客户工作流两种路径[21]
哈佛95后华人打造“AI版谷歌搜索”,获Benchmark和英伟达等投资6亿元,估值已达50亿元
搜狐财经· 2025-09-04 12:22
公司融资与估值 - 公司于2025年9月3日完成8500万美元B轮融资 约合6.16亿元人民币 估值达7亿美元 [1] - 本轮融资由Benchmark领投 Lightspeed 英伟达和YCombinator参投 [1] - Benchmark合伙人彼得·芬顿将加入公司董事会 [1] 公司业务与产品定位 - 公司成立于2021年 定位为AI专用搜索引擎 目标为超越谷歌搜索 [1][3] - 产品名称为Exa 已为数千家企业提供网页搜索服务 用户包括私募股权公司 咨询公司及Cursor Databricks Notion等科技公司 [1] - 产品核心设计理念为"谷歌搜索之于人类 正如Exa之于AI" [3] 技术架构与性能 - 通过自建GPU集群构建大规模索引系统 开发新型网络搜索技术 [4] - 自研矢量数据库并掌控全技术栈 实现搜索API延迟低于450毫秒 较谷歌封装方案快250毫秒 [6][7] - 网络延迟基准测试显示仅50毫秒 针对北加州数据中心数千次随机查询 [7] 产品核心特性 - 采用高质量知识优化算法 拒绝SEO内容与广告投放 确保AI输入输出质量 [5] - 提供完整页面内容而非仅链接标题 满足AI对全面信息的需求 [5] - 推出Exa Fast快速搜索API与Websets高计算搜索产品 后者号称全球最全面搜索引擎 [7][9] - 支持定制化搜索 可排除数千域名或创建自定义分类器 [9] - 实现零数据保留架构 查询数据不被存储 满足企业级数据隐私要求 [10] 发展历程与团队背景 - 公司于2022年11月推出首款搜索引擎产品 两周后ChatGPT发布促使业务转向AI搜索需求 [4] - 联合创始人Jeffrey Wang为哈佛华裔校友 曾任职Plaid公司三年 负责数据与网络基础设施 [15] - 技术团队包含多名华人成员 毕业院校涵盖哈佛大学 清华姚班 卡内基梅隆大学等 [17] 未来发展规划 - 计划扩大索引与处理能力 收集全球绝大多数信息 [13] - 将建设5倍规模GPU集群 开发新型信息组织技术 [13]
Exa:给 AI Agent 的 “Bing API”
海外独角兽· 2025-04-07 12:09
Agentic AI与搜索基础设施 - Agentic AI的三大要素是工具使用(tool use)、记忆(memory)和上下文(context),围绕这些场景将出现原生Agent基础设施机会 [2] - AI Agent将成为网页信息搜索的主力用户,需要不同于人类的全新搜索基础设施 [6][7] - 现有搜索引擎主要服务于人类快速查询,无法满足AI Agent对复杂查询、丰富上下文和高吞吐的需求 [9] 搜索行为分类 - 高频快速查询:Google/Bing仍占优势,新玩家机会有限 [6] - 研究性质深入查询:LLM/LRM带来的新场景,代表产品为Chatbot和Deep research [6] - 个人偏好查询:大模型可处理更复杂语义查询,但面临长记忆能力不足等挑战 [6] - 长尾查询:覆盖用户小众兴趣领域 [6] - AI在第二、三类场景最具挑战传统搜索的潜力 [6] Exa公司概况 - 定位为LLM时代的"Bing API",为AI重新设计搜索系统 [13] - 主要产品包括面向开发者的API和面向专业用户的Websets [13][20] - 技术衍生自端到端神经网络和Transformer架构,将next token prediction改进为next link prediction [59] - 核心差异化:用户可通过投入更多计算资源获得更全面的搜索结果 [3][61] Exa API能力 - Search API:支持自然语言输入的语义搜索,可定制输出格式 [14] - Get Contents API:爬取多个网页内容 [14] - Answer API:对搜索结果进行智能问答 [14] - Find Similar Links API:返回内容相似的网站 [14] - 性能指标:延迟300ms,每秒处理100+查询,支持数千结果返回 [15] Websets产品 - 通过语义搜索生成完整信息列表,类似通用版Clay [22][23] - 支持任意类别搜索和自然语言筛选,准确性是核心卖点 [23] - 在内部测试中比Google和OpenAI Deep research多发现10倍正确结果 [24] - Pro版定价800美元/月,是OpenAI Deep research的4倍 [29] 使用场景 - 投资研究:辅助搜集初创公司信息 [32] - 超级写作补全:自动补全并附参考 [41] - Twitter分析:跨平台搜索分析能力 [44] - 学术论文搜索:可视化展示论文索引和分类 [48][49] 技术架构 - 选择性对互联网部分内容构建索引,采用"二八效应"策略 [54][57] - 基于Transformer架构改进模型,实现预测最相关网页 [59] - 部署基于NVIDIA H200 GPU的AI集群 [61] - 团队规模小但能力强,每个技术环节由1-2人负责 [65] 市场竞争 - 不与Google直接竞争,专注Google无法完成的复杂查询 [66] - 作为LLM补充工具,定位连接LLM智能与互联网知识 [75] - 相比Deep research产品更专注搜索相关性 [78] - 潜在竞争对手包括Brave Software等Agent基础设施提供商 [78] 融资与经营 - 2021年成立,先后完成种子轮和2200万美元A轮融资 [78] - A轮由Lightspeed领投,英伟达等跟投 [78] - 主要收入来自API销售,用户数量数千家 [79] - 收入在过去几个月增长3倍,ARR估算至少960万美元 [79]