非客观人工智能使用指南
36氪·2025-11-18 23:15

全球AI使用现状 - 全球约10%人口每周使用AI工具,其中绝大多数使用免费版本 [1] 主要AI系统提供商 - 四大最先进AI系统包括Anthropic的Claude、谷歌的Gemini、OpenAI的ChatGPT和埃隆·马斯克xAI旗下的Grok [3] - 第二梯队开放权重AI包括中国的Deepseek、Kimi、Z和Qwen,以及法国的Mistral,这些模型变体占据AI评级系统前35名 [3] - Microsoft Copilot和Perplexity等服务基于上述九个核心AI系统构建 [3] 付费AI服务定价策略 - 高级AI服务月费分为20美元和200美元两档,20美元档满足绝大多数需求,200美元档针对复杂技术和编码需求用户 [6] - 公司正在全球某些地区试验其他定价模式 [6] 付费AI系统功能对比 - 主要付费系统(Claude、Gemini、ChatGPT)均提供智能体能力、语音模式、图像文档处理、代码执行、移动应用和多模态创作功能 [7] - Claude目前缺少图像生成能力,Gemini和ChatGPT具备图像视频生成功能 [7][20] - Grok适合X平台重度用户,但产品安全透明度较低 [7] - Microsoft Copilot通过Windows系统提供ChatGPT功能,但用户对模型控制力较弱 [7] AI模型技术分级 - 聊天模型适合对话场景,响应迅速且具人情味 [9] - 智能体模型可自主执行多步骤复杂任务(网页搜索、代码使用、文档制作),出错概率更低 [9] - 巫师模型用于处理非常复杂的学术任务 [9] 各厂商模型选择策略 - ChatGPT提供从GPT-5 mini到GPT-5 Pro的多层级模型,付费用户可手动选择GPT-5 Thinking Extended(20美元套餐)或GPT-5 Thinking Heavy(200美元套餐) [11] - Gemini提供Gemini 2.5 Flash和Gemini 2.5 Pro两个选项,Ultra套餐用户可使用Gemini Deep Think [13] - Claude采用简化模型选择策略,主要使用Sonnet 4.5处理任务,提供"扩展思考"选项用于难题处理 [14] 数据隐私与功能权衡 - 关闭ChatGPT和Claude的训练功能不会损失功用,但Gemini会牺牲部分功能 [15] AI深度研究能力 - 深度研究模式可进行10-15分钟广泛网络研究,生成高质量报告 [16] - GPT-5 Thinking具备自主研究能力,Claude提供"中度研究"选项 [16] 数据整合能力 - AI系统支持连接Gmail到SharePoint等多种应用,Claude在整合搜索电子邮件、日历和云盘方面表现突出 [18] 多模态输入功能 - Gemini和ChatGPT在语音模式方面表现最佳,Claude语音功能相对较弱 [19] - 所有模型支持PDF、图片和视频上传,ChatGPT和Gemini的App版本支持屏幕共享和摄像头实时交互 [19] 内容创作能力 - Claude和ChatGPT可生成高质量PowerPoint和Excel文件,Claude目前在文档格式处理方面领先 [20] - Gemini拥有最强AI图像生成模型,Gemini和OpenAI具备视频生成能力(Veo 3.1和Sora 2) [20] - Sora 2定位社交媒体应用,Veo 3.1用途更广泛,生成视频均带声音 [20] 技术发展轨迹 - AI图像生成能力显著提升,从2021年生成扭曲图像发展到目前可制作多种风格的高质量视频 [21][23] 行业应用趋势 - AI系统正从基础对话向复杂任务执行演进,用户逐渐探索AI在报告撰写、问题解决和项目管理等方面的应用场景 [24] - 建立对AI系统能力和局限的直觉比掌握具体操作技巧更为重要 [24]