谷歌(GOOGL)
搜索文档
我愿将免费的Gemini3 Flash,称为谷歌的无解阳谋
虎嗅APP· 2025-12-21 14:34
谷歌Gemini 3 Flash模型发布 - 谷歌在无预热情况下突然发布Gemini 3 Flash模型,距离其旗舰模型Gemini 3 Pro发布仅一个月,距离2.5 Pro Flash推出约半年[6] - 谷歌宣称这是其迄今为止最大的模型升级[7] Gemini 3 Flash的性能特点 - 传统Flash系列模型以速度快、成本低但能力较弱著称,擅长处理长文档总结,但在复杂代码或逻辑推理上表现不佳[14] - Gemini 3 Flash宣称在保持高智能水平的同时,获得了速度和效率的双重提升,其性能已超越上一代旗舰模型Gemini 2.5 Pro[14] - 在MMLU Pro测试中,Gemini 3 Flash取得了81.2%的成绩,追平了其全新的旗舰模型Gemini 3 Pro[15] - 实际测试表明,该模型在处理如“WebRTC的纯前端投屏”代码等复杂、长链条思考和高难度任务时,准确性仍不及Gemini 3 Pro,后者能快速定位并修复问题[22][23][24][25] - 该模型的核心优势在于速度快、成本低,适合处理批量任务[26] Gemini 3 Flash的成本与效率 - 定价极具竞争力,输入Token价格为0.5美元/百万Token,输出为3美元/百万Token[18] - 执行相同任务时,其花费可比Gemini 2.5 Pro减少30%,同时速度提升三倍[19] - 该模型的发布旨在帮助企业更好地完成批量任务,实现降本增效[22] 谷歌的生态整合战略 - 谷歌将Gemini 3 Flash直接集成至谷歌搜索的AI模式中,显著提升了AI搜索对问题细节的理解能力和从全网抓取信息及链接的质量[27] - 未来计划将该模型广泛嵌入YouTube、Gmail、谷歌地图等全系列产品中[28] - 行业观点认为,谷歌正试图凭借其庞大的产品生态优势,而不仅仅是模型参数,来碾压竞争对手[27][29] - 这一生态战略给OpenAI等竞争对手带来了巨大的时间压力[30] 对行业竞争格局的影响 - Gemini 3的发布已引发OpenAI内部高度警觉[29] - 尽管OpenAI首席执行官曾表示谷歌新模型的影响小于最初担忧,并计划解除警报状态,但Gemini 3 Flash的快速推出可能加剧竞争压力[29] - 行业可能进入一个新阶段,即通过将AI像水电一样廉价、广泛地铺设在生态应用中来实现竞争,而非单纯比拼模型参数[29]
谷歌、苹果建议外籍员工“别出美国”
财联社· 2025-12-21 13:35
据美国商业内幕网站21日报道,美国政府新增对部分类型签证申请人的社交媒体审查要求,在美国驻外使领馆签证办理流程严重拖长,有的 预约面签甚至拖到一年以后, 谷歌和苹果公司已建议部分持相关工作签证的在美外籍员工避免出境旅行,免得长时间滞留在外 。 代表谷歌公司的移民律师事务所18日经由电子邮件向那些需要申请"签证盖章"才可获准再次入境美国的外籍员工发备忘录,告知他们部分 美国驻外使领馆办理签证盖章预约的流程出现严重推迟,目前等待时间最长可达12个月,建议需要办理签证的在美外籍员工避免出境旅行, 否则可能长期滞留境外。 代表苹果公司的律师事务所上周也向部分签证持有者发送类似邮件, "强烈建议未持有效H-1B签证盖章的员工暂时避免出境旅行"。 报道说,此番签证流程延迟源于美国政府新出台的签证申请人社交媒体审查要求。 美国国务院本月3日宣布,自15日起,社交媒体审查范围从原有的留学生和交流访问学者群体,扩展至所有H-1B工作签证申请人及其家 属。据报道,相关申请人在面签前必须将社交媒体资料设为公开,以便领事官员审查其帖文、照片及社交关系。每份申请所需审查时间延 长,这导致美国驻外使领馆每日签证办理预约名额大幅减少。 H ...
美国签证审查严重拖长 谷歌和苹果建议外籍员工“别出美国”
新浪财经· 2025-12-21 13:35
美国政府签证政策变化 - 美国政府自12月15日起将社交媒体审查范围从原有的留学生和交流访问学者群体扩展至所有H-1B工作签证申请人及其家属[3] - 相关申请人在面签前必须将社交媒体资料设为公开以便领事官员审查其帖文、照片及社交关系[3] - 每份申请所需审查时间延长导致美国驻外使领馆每日签证办理预约名额大幅减少[3] 签证办理流程严重延迟 - 美国驻外使领馆签证办理流程严重拖长有的预约面签甚至拖到一年以后[1] - 谷歌公司被告知部分美国驻外使领馆办理签证盖章预约的流程出现严重推迟目前等待时间最长可达12个月[1] - 签证审查延迟影响到H-1B、H-4、F、J、M等多种赴美签证类型[5] 科技公司的应对措施 - 谷歌和苹果公司已建议部分持相关工作签证的在美外籍员工避免出境旅行免得长时间滞留在外[1] - 代表谷歌公司的移民律师事务所18日经由电子邮件向需要申请“签证盖章”的外籍员工发备忘录建议需要办理签证的在美外籍员工避免出境旅行否则可能长期滞留境外[1] - 代表苹果公司的律师事务所上周也向部分签证持有者发送类似邮件“强烈建议未持有效H-1B签证盖章的员工暂时避免出境旅行”[3] H-1B签证政策背景与影响 - H-1B签证是美国一种临时工作签证有效期通常为三年且可续签每年发放上限为8.5万份[5] - 今年9月特朗普政府宣布将美国企业为H-1B签证申请人支付的费用从先前的数千美元提高至10万美元[5] - 美国企业界批评H-1B签证“涨价”措施抬高了外籍人才的招聘门槛和成本当时也提醒在美外籍员工避免出境[5]
a16z年度重磅报告:OpenAI艰难守擂,谷歌火力全开,用户只选一个
华尔街见闻· 2025-12-21 11:37
近日,硅谷顶尖风投机构a16z发布消费级 AI 市场年度重磅报告,直指当前竞争核心在通用AI助手赛 道,用户往往只选择一个主力产品,"赢家通吃"格局正在加速形成。 报告显示,尽管AI使用率全面上升,但用户跨平台使用意愿极低。即使是在 ChatGPT 的周活用户中, 也仅有不到10%会同时使用其他 AI 服务。消费数据同样印证:在主流产品中,仅约9%的用户会为多个 助手付费订阅。 OpenAI虽仍以8–9亿周活用户占据领先,其"超级应用"策略正面临挑战;而谷歌则以"实验田"模式推动 Gemini 迅猛追赶,其桌面用户同比增长达155%,付费订阅增速更是接近 ChatGPT 的两倍。 巨头争霸:一场"赢家通吃"的游戏? 当前AI助手领域面临一个核心问题:面对诸多选择,用户真的会同时使用多个聊天机器人吗?报告数 据揭示了一个值得深思的现象,绝大多数用户实际上深度依赖于单一AI助手。 在过去一年中,即使是活跃的ChatGPT用户,也仅有不到10%的人会同时使用其他大模型服务。付费行 为进一步证实了这一趋势:在主流产品中,只有约9%的用户订阅了超过一项服务。这印证了报告的判 断:"虽然大语言模型的竞争或许不是'赢家通吃 ...
预测市场押注“全球市值第一”:明年谷歌将凭AI芯片正面挑战英伟达、苹果
美股IPO· 2025-12-21 10:55
预测市场Polymarket数据显示,谷歌母公司Alphabet在2026年12月前成为全球市值第一的概率达33%,仅次于英伟达的37%。该公司目前市值达3.7 万亿美元,位列全球第三,仅次于英伟达和苹果。分析师认为,谷歌凭借大语言模型Gemini和定制AI芯片TPU的强劲表现,有望挑战英伟达和苹果的市 场地位。 Rabe认为,预测市场的排名对Alphabet而言"极为利好", 这一乐观情绪主要源于谷歌的大语言模型Gemini及其被称为张量处理单元(TPUs)的定制 芯片所展现出的强劲势头。 预测市场升温与市值差距 尽管Alphabet目前仍是全球第三大公司,但其追赶龙头的势头引起了市场的密切关注。 目前的市值数据显示,若要超越英伟达,Alphabet仍需跨越不小的差距。英伟达目前的市值为4.2万亿美元,苹果为4万亿美元,而Alphabet则为3.7万 亿美元。 随着人工智能技术的进步持续推动股价走高,谷歌母公司Alphabet正在向全球市值第一的宝座发起冲击,部分市场参与者已开始押注其将在未来一年内 超越排在英伟达和苹果。 根据预测市场Polymarket最新的数据, Alphabet在2026年12月前成 ...
Ranking the Top "Magnificent Seven" Stocks to Buy in 2026
The Motley Fool· 2025-12-21 10:30
Not every "Magnificent Seven" stock is a buy heading into 2026.The "Magnificent Seven" group of stocks is a commonly mentioned name attached to some of the biggest companies in the world. All seven are ranked inside the top 10 by market cap, making them incredibly important. The seven stocks making up the Magnificent Seven are:Nvidia (NVDA +3.80%)Apple (AAPL +0.17%)Alphabet (GOOG +1.60%) (GOOGL +1.47%)Microsoft (MSFT +0.40%)Amazon (AMZN +0.21%)Meta Platforms (META 0.85%)Tesla (TSLA 0.45%)These stocks have h ...
【特稿】美国签证审查严重拖长 谷歌和苹果建议外籍员工“别出美国”
新华社· 2025-12-21 09:33
美国政府签证政策变化 - 美国政府新增对部分类型签证申请人的社交媒体审查要求 审查范围从原有的留学生和交流访问学者群体 扩展至所有H-1B工作签证申请人及其家属 相关申请人在面签前必须将社交媒体资料设为公开 以便领事官员审查其帖文、照片及社交关系 [2] - 每份申请所需审查时间延长 这导致美国驻外使领馆每日签证办理预约名额大幅减少 签证办理流程严重拖长 有的预约面签甚至拖到一年以后 目前等待时间最长可达12个月 [1][2] 对科技公司及外籍员工的影响 - 谷歌和苹果公司已建议部分持相关工作签证的在美外籍员工避免出境旅行 免得长时间滞留在外 [1] - 代表谷歌公司的移民律师事务所告知员工 部分美国驻外使领馆办理签证盖章预约的流程出现严重推迟 建议需要办理签证的在美外籍员工避免出境旅行 否则可能长期滞留境外 [1] - 代表苹果公司的律师事务所也向部分签证持有者发送类似邮件 强烈建议未持有效H-1B签证盖章的员工暂时避免出境旅行 [1] - 签证审查延迟影响到H-1B、H-4、F、J、M等多种赴美签证类型 [3] H-1B签证政策背景及近期变化 - H-1B签证是美国一种临时工作签证 有效期通常为三年且可续签 每年发放上限为8.5万份 这类签证方便美国企业雇用外籍专业技术人员 以填补美国国内相关领域技术人才缺口 [3] - 今年9月 特朗普政府宣布将美国企业为H-1B签证申请人支付的费用从先前的数千美元提高至10万美元 称此举旨在确保美国引进的是无法由美国人替代的高技能人才 [3] - 美国企业界批评H-1B签证涨价措施抬高了外籍人才的招聘门槛和成本 当时也提醒在美外籍员工避免出境 [3] - 路透社此前获取的一份邮件显示 谷歌母公司字母表当时强烈建议持H-1B签证员工留在美国境内 [3]
通信行业研究:豆包日均使用量超50万亿Tokens,智谱通过聆讯并公布招股书
国金证券· 2025-12-21 09:22
报告行业投资评级 * 报告未明确给出统一的行业投资评级,但对多个细分板块给出了景气度判断 [15][18] 报告核心观点 * 全球及中国AI建设与落地进程加速,从芯片、模型、基础设施到应用端均呈现高景气度,持续看好AI产业链投资机会 [1][2][5] * 海外云厂商资本开支维持高增长,直接拉动上游硬件需求 [4] * 国内AI大模型应用数据亮眼,算力需求旺盛,国产算力链有望加速发展 [2][8][12][18] * 光纤光缆行业出现量价齐升的积极信号 [1][3][12] 细分赛道总结 服务器 * 本周服务器指数下跌2.99%,本月以来下跌6.17% [2][7] * 亚马逊拟向OpenAI投资至少100亿美元,OpenAI计划采用亚马逊自研的Trainium AI芯片,ASIC服务器有望持续放量 [2][7][18] * Supermicro与xAI合作建造全球首个千兆瓦(GW)数据中心,将采用英伟达GB300 GPU [1][65] * 板块景气度被判断为“稳健向上” [18] 光模块 * 本周光模块指数下跌4.38%,本月以来上涨14.35% [2][7] * 谷歌推进“TorchTPU”计划,旨在实现其TPU与PyTorch框架完全兼容,以挑战英伟达的CUDA生态,持续看好谷歌供应链 [1][7][15][58][59] * 2025年10月,中国光模块出口金额当月同比下降27.56%,1-10月累计同比下降16.91%,主要因国内厂商在海外建厂 [4][32][41] * 板块景气度被判断为“稳健向上” [15] IDC(互联网数据中心) * 本周IDC指数下跌2.77%,本月以来上涨0.73% [2][8] * 火山引擎披露豆包大模型日均使用量超50万亿Tokens,自发布以来增长417倍 [1][2][8][55] * 智谱AI招股书显示,其2022-2024年收入分别为0.574亿元、1.245亿元、3.124亿元,年复合增长率达130%,2025年上半年收入为1.909亿元 [2][8][12][54] * 国产算力链有望加速向上,板块景气度被判断为“加速向上” [2][12][18] 光纤光缆 * 本周光纤指数上涨4.20%,本月以来上涨17.99% [3][12] * 头部厂商反馈,普通光缆散纤价格已上涨约15%,呈现量价齐升的积极信号 [1][3][12] 其他细分板块景气度 * **交换机**:景气度“稳健向上”,高速交换机放量,国产交换机有望在Scale-up域实现突破 [18] * **连接器**:景气度“稳健向上”,因Credo业绩超预期 [18] * **物联网**:景气度“加速向上”,因字节跳动推进与vivo、联想、传音等厂商的AI手机合作,AI端侧有望突破 [18] * **液冷**:景气度“高景气维持”,因Supermicro拿下1GW GB300订单,液冷供应链有望斩获约数亿美元订单 [18] 核心数据更新 运营商业务 * **收入**:2025年1-10月,电信业务收入累计完成1.467万亿元,同比增长0.9% [4][18] * **新兴业务**:2024年12月,新兴业务收入完成396亿元,同比增长66.39%,环比增长7.32% [18] * **用户规模**: * 固定宽带用户达6.97亿户,其中千兆用户达2.38亿户,占比34.1%,较上年末提升3.3个百分点 [19] * 移动电话用户达18.3亿户,其中5G用户达11.84亿户,占比64.7% [19] * 移动互联网用户达16.17亿户,1-10月净增4642万户 [22] * **流量**:2025年1-10月,移动互联网累计流量达3232亿GB,同比增长16.8%;10月户均移动互联网接入流量(DOU)达21.21GB/户·月 [22][37] * **基础设施**:截至2025年10月末,5G基站总数达475.8万个,当月新增5.3万个 [29][34] 物联网 * 截至2025年10月末,蜂窝物联网终端用户数达28.9亿户,同比增长9.89%,本年净增2.34亿户 [41] * 2025年第二季度,全球物联网模组出货量同比增长17% [41] 海外云厂商资本开支 * 2025年第三季度,微软、谷歌、Meta、亚马逊的资本支出分别为167亿美元、240亿美元、196亿美元、351亿美元,同比分别增长53%、83%、133%、55% [4] 本周重要新闻摘要 行业新闻 * 2025通信产业大会召开,主题为“共赢AI:面向‘十五五’的通信业机会与创新” [51] * 上海交通大学在《科学》期刊发表全光计算芯片“LightGen”研究成果,在特定任务中,其计算速度、能效和计算密度均比英伟达A100芯片高出两个数量级 [52][53] 公司新闻 * **中国移动**:发布《6G传输技术白皮书》及“6G传输系统原型样机1.0” [53] * **智谱AI & Minimax**:智谱AI通过港交所上市聆讯,2022-2024年收入年复合增长率达130% [54] * **小米**:发布开源MoE模型Xiaomi MiMo-V2-Flash,推理成本仅为Claude 4.5 Sonnet的2.5%,生成速度提升2倍 [54] * **中兴通讯**:与广汽集团签署深化战略合作协议,围绕汽车智能化、网联化、数字化展开合作 [54] 海内外大厂动态 * **字节跳动**: * 发布豆包大模型1.8,日均使用量超50万亿Tokens [1][55] * 推进与vivo、联想、传音等硬件厂商的AI手机合作,预装AIGC插件 [1][56] * **谷歌**: * 在联发科加单TPU,订单量较原规划至少倍增,TPU v7e将于下季度末风险试产 [1][57] * 推出新模型Gemini 3 Flash,运行速度为Gemini 2.5 Pro的三倍,成本为Gemini 3 Pro的四分之一 [1][57] * 推进“TorchTPU”计划,优化TPU对PyTorch框架的兼容性 [1][58][59] * **OpenAI**: * 计划新一轮融资募集高达1000亿美元,估值可能达8300亿美元 [1][60] * 亚马逊拟投资至少100亿美元,OpenAI计划采用亚马逊Trainium AI芯片 [1][2][60] * **xAI & Supermicro**:合作在田纳西州建造全球首个千兆瓦(GW)数据中心,采用英伟达GB300 GPU [1][65] * **英伟达**:推出Nemotron 3系列开放模型,其中Nano型号吞吐量较前代提升4倍 [62] * **腾讯**:发布混元世界模型1.5,并开源实时世界模型框架 [66] * **Meta**:正在研发代号为“Mango”的新型图像及视频AI模型,预计2026年上半年发布 [63]
“AI取代搜索”是伪命题?市场发现:谷歌才是对的!
华尔街见闻· 2025-12-21 07:01
行业战略共识 - 人工智能短期内无法取代搜索引擎 这一共识正深刻改变科技巨头的战略逻辑 [1] - 谷歌采取“双轨并行”策略 在持续优化搜索业务的同时独立发展Gemini等AI对话产品 该策略显示出结构性优势 [1] - 全力押注聊天机器人的OpenAI面临技术突破与用户真实需求错位的增长瓶颈 [1] 谷歌的战略与优势 - 谷歌CEO明确表示 搜索与Gemini存在部分功能重叠但对应截然不同的使用场景 确立了并行发展的战略路线 [1] - 谷歌的策略使其能够凭借现有分发渠道与基础设施成本优势在市场竞争中快速跟进 [1] - 谷歌维持搜索引擎和AI聊天机器人分离的策略正在得到市场验证 其认为两者服务于不同的用户场景 [4] - 谷歌拥有搜索、Chrome浏览器和Gmail等强大的分发渠道 以及自研AI芯片带来的成本效率优势 构成了其竞争壁垒 [4] - 谷歌的AI模型在图像生成、代码处理等方面的能力已与ChatGPT不相上下 [4] - 谷歌凭借其整合优势持续扩大AI产品覆盖 [2] OpenAI的困境与挑战 - OpenAI内部发现 尽管公司在推理模型等核心技术上持续突破 但多数用户仍仅将ChatGPT用于简单查询 而非处理复杂科学或数学问题 [1] - OpenAI的核心困境在于其研发重心与主流用户需求之间出现明显脱节 [3] - 公司今年将主要精力投入开发“推理模型” 这些模型在处理复杂数学、科学问题方面表现出色 甚至在国际数学奥林匹克竞赛中达到金牌水平 [3] - 大多数ChatGPT用户并未利用这些复杂的推理能力 普通用户更可能询问电影评级等简单问题 [3] - 推理模型通常需要数秒甚至数分钟才能生成答案 这对习惯了谷歌秒级搜索结果的用户来说体验并不友好 [3] - OpenAI产品负责人将ChatGPT当前以文本为中心的设计比作上世纪80年代的MS-DOS操作系统 认为这限制了用户发现其他功能的能力 [3] - 应用主管承认 ChatGPT需要从文本对话界面转向更具生成性和直观性的用户界面 [3] - OpenAI尽管年化收入突破190亿美元 其用户增长仍落后于年初设定的10亿目标 [2] 市场表现与估值 - OpenAI近期正寻求以7500亿美元估值进行新一轮融资 较两个月前的估值水平高出约50% [2] 用户行为与产品定位 - 用户行为模式存在差异 当用户需要快速、简单的答案时 搜索引擎仍是最佳选择 而AI聊天机器人则更适合处理需要深度分析和推理的复杂问题 [4] - Amazon采用了类似策略 其购物网站的搜索引擎与Rufus AI聊天机器人保持独立运营 [4]
深度|DeepMind CEO Demis: AGI还需5-10年,还需要1-2个关键性突破
搜狐财经· 2025-12-21 06:05
公司战略与核心优势 - 公司将其独特优势归结为将世界级的研究、工程能力和基础设施三者结合 在AI前沿领域 同时具备这三者的机构非常少 [8] - 公司采用科学方法作为核心思维方式 并将其应用于研究、工程乃至商业领域 这构成了其工作的严谨性与精确性的来源 [7][8] - 公司在发展路径上保持务实 会追随实证证据的指引 例如在看到scaling laws显现效果后 逐步将更多资源投入到该研究路径上 [27][28] 产品与技术路线图 - 公司的核心基础模型Gemini从一开始就是多模态的 能够同时处理图像、视频、文本和音频 并越来越多地生成这些类型的输出 [10] - 接下来12个月的重点方向包括:多模态能力融合取得显著进展、视频能力与语言模型融合产生有趣的能力组合、以及开发更可靠的基于Agent的系统 [10] - 公司的长期愿景是将Gemini打造成“通用助手” 使其出现在更多设备上 并成为用户日常生活结构的一部分 提升工作效率和改善个人生活 [11] - 最新发布的Gemini 3模型在推理深度、细腻度以及“性格”上表现出色 能够简洁直接地回答 并在观点不合理时温和提出异议 [24] - Gemini 3展现出对高层次指令的深度理解能力 以及生成高度细节化输出的能力 在前端开发、网站构建和一次性生成游戏方面表现突出 [25][26] - 公司有一个名为Genie 3的“世界模型”或交互式视频模型 用户可以在生成的视频中“行走” 并在一分钟内保持整体一致性 [10] 行业竞争格局 - 在AI领域 美国和西方整体在基准测试和最先进系统方面仍处于领先地位 但这种领先优势可能仅以“月”为单位 而非“年” [21] - 中国在AI领域并未落后太多 拥有出色的模型和有能力的团队 但在算法创新和原创性方面 西方目前仍然具有优势 [21] - AI行业正经历一场可能是科技史上最激烈的竞争 [8] - AI产业某些部分可能存在泡沫 例如一些规模极其夸张的早期融资 但从长期看 AI被认为是人类历史上最具变革性的技术之一 投入将被证明是值得的 [31] - 行业人才争夺战相当激烈 但最优秀的科学家和工程师希望参与最前沿的工作 持续的技术领先地位将形成吸引力正反馈 [31] 通用人工智能发展预测 - 通用人工智能可能还需要五到十年的时间才能实现 [6][29] - 对AGI的标准设定很高 要求系统能展现出人类所具备的全部认知能力 包括发明和创造能力 并在各个维度上具备一致性 而非当前“锯齿状”的智能形态 [29] - 实现AGI可能不仅需要将现有系统的scaling能力推到极限 还需要一到两个类似Transformer或AlphaGo的范式级关键突破 [29][30] - 当前系统缺乏一些关键能力 如持续学习、在线学习、长期规划和推理能力 这些能力最终会具备 但可能需要关键性突破 [6][29] 技术应用与市场潜力 - AI在网络安全领域的应用受到高度重视 旨在用AI强化防御体系以应对网络威胁 [17] - 在商业和企业领域 随着AI变得重要 企业客户会对Agent的行为保障提出明确要求 这可能会自然地奖励那些更负责任的供应商 [18] - AI在体育领域有巨大应用潜力 因为体育拥有丰富数据并追求极致精英表现 例如AI可以优化角球进攻中球员的精确站位以增加头球进球 [35][36] - 多模态理解能力 尤其是视频理解能力被严重低估 例如Gemini能够对视频内容进行概念层面的理解和哲学解读 [22] - 像Gemini Live这样的功能 允许用户用手机摄像头对准物体获得实时协助 其多模态能力的强大尚未被充分认识 [23] 技术发展现状与挑战 - 目前基于Agent的系统还不够可靠 无法独立完成完整任务 但预计一年后会开始看到接近这一能力水平的Agent出现 [10][12] - 创新和进步的速度非常快 以至于模型的创造者可能都来不及探索现有系统十分之一的潜力 用户常常将模型能力发挥到远超内部测试的程度 [27] - 随着AI系统变得更复杂和更具自主性 存在偏离最初设定指令或目标的空间 如何确保其始终保持在安全边界内是一个活跃的研究领域 [18] - 存在AI被恶意行为者滥用的风险 例如制造病原体或对关键基础设施发动网络攻击 这是必须严密防范的场景 [15][16][17]