GPT Image 1.5
搜索文档
海外科技行业2025年第47期:TikTok美国方案签约,AI模型迭代提效
国泰海通· 2025-12-21 11:51
报告行业投资评级 - 行业评级:增持 [1] 报告核心观点 - 报告维持对海外科技行业的增持评级,核心观点围绕三大事件展开:TikTok美国运营方案落地保障了其在美国市场的持续运营、腾讯重组AI研发体系以强化工程能力、以及美光科技超预期的业绩指引验证了存储芯片行业的强劲复苏,并据此推荐AI算力、云厂商、AI应用及AI社交四大投资方向 [3][4] 根据相关目录分别总结 周观点 - **TikTok美国方案签约**:TikTok已与甲骨文、银湖及MGX签署协议,成立名为“美国数据安全合资有限责任公司”的新合资公司,负责美国用户的数据保护、算法安全等内容,由字节跳动授权使用其算法。合资公司股权结构为新投资者合计持股45%,字节跳动现有投资者及关联方持股30.1%,字节跳动自身保留19.9%股份,仍为最大单一股东。字节跳动全资控股的其他实体将继续运营电商、广告等核心商业活动,并与合资公司建立收入分享安排。全部事宜计划于2026年1月22日前完成 [7] - **腾讯重组AI研发体系**:腾讯升级大模型研发架构,新成立AI Infra部、AI Data部及数据计算平台部,旨在强化工程化优势。前OpenAI研究员姚顺雨出任首席AI科学家,兼任AI Infra部与大语言模型部负责人。目前,腾讯混元大模型已迭代至2.0版本,其能力已落地内部超900款应用,辅助半数新增代码生成,并融入微信、QQ等国民级产品 [8] - **美光业绩验证存储上行周期**:美光科技第一季度财报及下季业绩指引远超市场预期,预计下季营收将达187亿美元,远超市场预期的145亿美元;经调整净利润为54.82亿美元,去年同期为34.69亿美元。公司对第二财季营收展望为183亿至191亿美元,市场预期为143亿美元。非GAAP毛利率预计跃升至68%。为应对供应紧张,美光已将2026财年资本开支上调至200亿美元。公司CEO预计,全球HBM总潜在市场(TAM)的复合年增长率(CAGR)约为40%,将从2025年的约350亿美元增长至2028年的约1000亿美元 [9] 一周行情回顾 - **大盘指数表现**:在2025年12月14日至12月20日期间,恒生指数下跌1.10%,恒生科技指数下跌2.82%,道琼斯工业指数下跌0.67%,纳斯达克指数上涨0.48% [10] - **板块指数表现**:同期,恒生互联网科技业指数上涨2.86%,HK网络游戏指数下跌0.50%,HK AIGC概念指数下跌6.87%,纳斯达克中国金龙指数下跌1.43% [12] - **重点个股表现**: - **港股**:周涨幅前三为知乎-W(+1.0%)、美团-W(+0.3%)、腾讯控股(-0.3%)[14] - **美股**:周涨幅前三为叮咚买菜(+24.5%)、TWILIO(+6.6%)、知乎(+4.4%)[14] 一周AI行业要闻 - **谷歌发布Gemini 3 Flash模型**:该模型速度比2.5 Pro快3倍,价格仅为3 Pro的四分之一,在部分基准测试中性能接近甚至超越3 Pro,正被全面嵌入谷歌自家生态 [19] - **小米发布开源MoE模型MiMo-V2-Flash**:这是一个总参数309B(激活15B)的MoE模型,专为高效智能体设计,其代码能力比肩Claude 4.5 Sonnet,但推理成本仅为其2.5%,生成速度提升2倍 [19] - **特斯拉启动完全无人驾驶Robotaxi测试**:测试车内无安全员和乘客,标志着其自动驾驶商业化进入关键验证阶段。预计其Robotaxi车队规模将从2025年的200辆增长至2035年的100万辆 [20] - **OpenAI发布GPT Image 1.5**:该模型生成速度是上一代的4倍,在文生图和图像编辑两项功能上均位列第一,但用户反馈其“AI味”较重、中文支持不足 [20] - **阿里发布万相2.6系列模型**:这是国内首个支持角色扮演功能的视频生成模型,能生成最长15秒的连贯视频,并支持自然音画同步 [21] - **英伟达发布开源模型系列Nemotron 3**:该系列包含Nano(300亿参数)、Super(1000亿参数)与Ultra(5000亿参数)三个版本,支持高达100万token的上下文长度 [21] - **网易有道战略升级**:公司定位从“教育科技公司”拓展为“学习与广告AI应用服务提供商”,并指出教育AI正从L3的学习辅导加速迈向L4的“虚拟老师”阶段 [22] 投资建议 - **算力方向**:推荐英伟达(NVDA.O)、台积电(TSM.N)、阿斯麦(ASML.O)、博通(AVGO.O)、迈威尔(MRVL.O)[23] - **云厂商方向**:推荐微软(MSFT.O)、亚马逊(AMZN.O)、谷歌(GOOGL.O)[23] - **AI应用方向**:推荐AI Agent方向受益的苹果(AAPL.O)、高通(QCOM.O)、联想集团(0992.HK)、小米集团(1810.HK),以及Physical AI方向受益的特斯拉(TSLA.O)[23] - **AI社交方向**:推荐腾讯控股(0700.HK)、Meta(META.O)、谷歌(GOOGL.O)[23]
计算机行业研究:阿里巴巴发布视频生成模型万相 2.6,0penAl推出ChatGPTlmages
国金证券· 2025-12-21 11:28
行业投资评级 * 报告未明确给出计算机行业的整体投资评级 [4][6][9][11] 核心观点 * 报告认为,11月计算机板块表现较弱主要源于风险偏好承压,估值波动解释了板块波动的**60-80%**[4][11] * 外部压力包括海外局部冲突、美国AI泡沫争议导致相关企业股价回调、美元降息预期波动等[4][11] * 内部压力包括基本面收入端不强、部分机构投资者年底获利了结[4][11] * 预计连续三个月的回调为后续春季躁动酝酿了空间,在非熊市阶段,板块回调**2-4个月**后通常会有新一轮弹性[4][11] * 从投资机会看,需求的景气方向在出海,技术的景气方向在AI产业链,政策的景气方向在国产替代[4][11] 本周观点总结 * **计算机行业观点**:板块近期回调主要受风险偏好压制,但为未来反弹创造了空间,投资应聚焦出海、AI产业链和国产替代三大方向[4][9][11] * **细分板块观点**:报告对2025年各细分赛道景气度进行了详细划分[4][10][11][12] * **高景气维持**:AI算力、激光雷达[4][10][11] * **加速向上**:AI应用(软件)[4][10][11] * **稳健向上**:软件外包、金融IT、量子计算、数据要素、EDA、出海、信创[4][11][12] * **拐点向上**:教育IT、网安、企业服务[4][11][12] * **底部企稳**:智慧交通、政务IT、安防、建筑地产IT[4][11][12] * **略有承压**:工业软件[4][11][12] * **持续承压**:医疗IT[4][11][12] 重点事件与动态 * **阿里巴巴**于12月17日发布视频生成模型“万相2.6”系列,是国内首个支持声画一致性角色定制的视频模型[4][11] * **小米**于12月18日发布参数量为**309B**的开源大模型MiMo-V2-Flash,其推理成本仅为Claude 4.5 Sonnet的**2.5%**,在SWE-Bench评测中以**73.4%**的评分领先[4][11] * **OpenAI**于12月17日更新ChatGPT图像生成功能,推出旗舰图像模型GPT Image 1.5及其API服务[4][11] * **SpaceX**启动IPO流程,目标募资额预计超过**300亿美元**,寻求整体估值接近**1.5万亿美元**[4][11] * **Google**于12月18日发布Gemini3 Flash模型,将其设为默认模型,平均token使用量较Gemini 2.5 Pro减少约**30%**,定价为输入每百万token **0.50美元**,输出每百万token **3美元**[4][11] * **激光雷达**:10月国内ADAS激光雷达(仅标配)装机量约**35.3万颗**,同比增长**118.2%**;1-10月累计装机量约**226.2万颗**,同比增长**95.5%**,符合全年翻倍增长预期[12] * **重点事件前瞻**:2025年12月22日,智元机器人将举办全国机器人租赁生态峰会[25][26] 市场行情回顾 * 2025年12月15日至12月19日,计算机行业指数(申万)下降**0.68%**,跑输沪深300指数**0.4**个百分点[13] * 在31个申万一级行业中,计算机行业本周排名中等靠后[13][16] * 本周计算机板块涨幅前五的公司为万集科技(**29.2%**)、新利软件(**23.3%**)、索菱股份(**21.9%**)、嘉和美康(**21.1%**)、经纬恒润(**20.6%**)[14][17][18] * 跌幅前五的公司为实达集团(**-8.3%**)、达华智能(**-8.3%**)、商汤-W(**-11.7%**)、品高股份(**-11.8%**)、三六零(**-16.4%**)[14][17][18] * 报告期内(12月15日至19日),三市股票日均成交额为**1.76万亿元**,同比上升**31.9%**,环比下降**9.9%**;截至12月18日,两融余额为**2.49万亿元**,同比上升**35.6%**,环比下降**0.65%**[19] 投资建议 * 建议关注国内生成式大模型龙头**科大讯飞**[4] * AI硬件有望成为应用落地新载体,建议关注**海康威视**、**虹软科技**、**禾赛**等[4] * AI相关功能打磨能带动付费率、Arpu值提升,建议关注**迈富时**等[4]
传媒行业?AI周度跟踪之四十七:字节大会发布多款模型,谷歌Gemini3Flash速度提升-20251221
广发证券· 2025-12-21 09:32
行业投资评级 - 报告对传媒行业给予“买入”评级 [1] 核心观点 - 报告核心观点为关注AI技术迭代带来的潜在投资机会,并梳理了海内外AI大模型、多模态及应用层面的最新动态 [6] 国内AI动态跟踪 - **大模型产品数据**:根据SimilarWeb数据,上周(2025/12/8-2025/12/14)国内主要AI大模型网页端访问量表现分化,其中DeepSeek以7472.79万次访问量保持领先,环比上升0.26%;豆包访问量为2361.84万次,环比上升6.07%;Kimi访问量为902.95万次,环比下降4.46%;通义千问访问量环比大幅上升51.22%至22.58万次 [6][20] - **大模型产品数据**:在App iPhone端下载量方面,根据七麦数据,上周豆包以209.66万次下载量保持领先,环比微降0.03%;腾讯元宝下载量为124.44万次,环比上升14.17%;通义千问下载量为83.02万次,环比下降18.39% [21][24] - **热门应用数据**:上周国内AI应用数据中,AI搜索产品秘塔AI搜索网页访问量达171.20万次,环比上升25.89%,其App下载量环比上升46.14%至2.94万次;AI设计产品Pixso AI网页访问量环比上升45.10%至16.65万次;AI视频产品PixVerse网页访问量为153.81万次,环比上升6.87% [24][25][30] - **应用买量追踪**:根据APPGrowing数据,上周腾讯元宝在广告投放素材量上以675,911个保持第一,环比上升16.98%;通义千问投放素材量为219,777个,环比下降52.91% [31] - **应用买量追踪**:2025年12月至今的广告投放金额数据显示,腾讯元宝投放金额达86,268.90万元,通义千问为36,772.38万元,豆包为2,594.34万元 [31] - **公司重点事件**:商汤科技发布行业首个创编一体智能体Seko 2.0,旨在赋能短剧创作,将制作周期缩短近九成,平台已汇聚超20万创作者 [37][38] - **公司重点事件**:商汤科技发布AI办公智能体“小浣熊3.0”,具备一键生成高质量PPT等能力,企业场景落地分析精度达95%,已拥有超300万注册用户 [37][38] - **公司重点事件**:MiniMax视频团队开源视觉生成模型关键组件VTP;阶跃星辰升级其GUI Agent模型Step-GUI,支持200多个任务场景 [38] 海外AI动态跟踪 - **大模型产品数据**:根据SimilarWeb数据,上周海外主要AI大模型网页端访问量中,ChatGPT以132,387.06万次访问量稳居第一,环比微降0.99%;Claude访问量为4,126.03万次,环比上升0.71%;Gemini访问量为147.35万次,环比下降11.51% [6][41] - **热门应用数据**:上周海外AI陪伴产品Character AI网页访问量为4,153.97万次,环比下降1.89%,其App全球iPhone端下载量环比上升28.66%至53.61万次;AI搜索产品Perplexity AI网页访问量为4,374.03万次,环比微降0.18% [45][53] - **公司重点事件**:瑞典AI编程初创公司Lovable近日完成新一轮融资,估值飙升至66亿美元,较半年前暴涨超三倍 [55][56] 海内外科技大厂AI动态 - **大模型进展**:谷歌正式发布高效、低成本模型Gemini 3 Flash,其响应速度提升3倍,性能已超越前代Gemini 2.5 Pro并接近GPT-5.2等前沿模型 [6][57][59] - **大模型进展**:字节跳动豆包大模型团队发布通用Agent模型Seed 1.8,集成了搜索、代码与GUI交互能力,在Agentic Coding及多模态推理等指标上处于业界第一梯队 [6][57][58] - **多模态迭代**:OpenAI发布全新旗舰图像生成模型GPT Image 1.5,在细节保留、文本渲染及原图光线保持方面实现突破 [6][57][58] - **多模态迭代**:字节发布新一代音视频联合生成模型Seedance 1.5 pro,实现了精准音画同步与电影级运镜控制 [6][57][58] - **多模态迭代**:Meta推出首个统一多模态音频分离模型SAM Audio,支持通过文本或视觉提示从复杂音频中精准提取目标声音 [6][57][58] - **应用层面**:蚂蚁集团旗下AI健康助手独立App AQ更新版本,正式启用中文名“蚂蚁阿福” [6][57][58] - **其他动态**:腾讯混元世界模型1.5正式发布并开源实时世界模型框架;阿里发布新一代万相2.6系列模型,支持角色扮演等功能;美团开源虚拟人视频生成模型LongCat-Video-Avatar [58] 投资建议 - **云基建方向**:建议关注阿里巴巴、腾讯控股 [6][59] - **AI视频与IP产业链**:若Sora推动AI视频平台跑通商业化闭环,建议关注IP产业链的阅文集团、中文在线、上海电影、奥飞娱乐、华策影视、欢瑞世纪等;AI内容确权关注阜博集团;视频平台关注快手、哔哩哔哩 [6][59] - **AI营销方向**:建议关注汇量科技、易点天下、蓝色光标、天下秀 [6][59] - **AI终端与电商方向**:AI终端关注出门问问;AI电商关注值得买 [6][59] - **AI客服与游戏方向**:AI客服agent关注神州泰岳;AI游戏关注恺英网络 [6][59] - **AI医疗方向**:建议关注京东健康、阿里健康,AI问诊功能完善有望为线上平台导流并实现变现闭环,大厂增加即时零售投入有望带动互联网医疗用户流量和O2O业务单量增长 [6][59] - **细分应用落地**:关注商业化进展较好的快手、美图、粉笔等 [6][59] 重点公司估值 - 报告列出了横店影视、芒果超媒、腾讯控股、阿里巴巴、哔哩哔哩、京东健康等多家公司的估值和财务预测数据,所有提及公司评级均为“买入” [7]
阿里干死豆包图疯传,千问:相煎何太急;字节大幅涨薪,传年利润或达500亿刀;印度AI妖股近两年暴涨550倍,仅2名员工|AI周报
AI前线· 2025-12-21 05:32
千问全员会干死豆包现场图疯传,阿里紧急辟谣 12 月 19 日,网络上流传一张所谓"阿里千问全员大会"现场照片,画面中疑似大量人员在广场上手举豆包,背景标语显示"阿里 千问全员会""干死豆包"。 整理 | 褚杏娟 千问全员会干死豆包现场图疯传,阿里紧急辟谣;周鸿祎遭前高管实名举报财务造假:"至少几十亿";姚顺雨入职腾讯,帮混元 招到更多人才;字节大幅增加调薪投入,正推进与多家厂商的 AI 手机合作;摩尔线程发布新一代 GPU 架构,可支持十万卡规模 集群;马斯克上诉获胜,恢复 2018 年 560 亿美元的特斯拉薪酬协议;TikTok 美国方案揭晓!字节保留电商、广告业务,甲骨文 等入股成立新公司;印度一股票 20 个月暴涨 550 倍,公司仅 2 名全职员工;抹黑小米华为理想等品牌 12 人被抓;谷歌大规 模"回聘老员工";Manus:实现 1 亿美元 ARR;寒武纪拟用近 28 亿资本公积弥补亏损,前三季净利扭亏为盈…… 行业热点 该网传的截图表示:说千问开了一个全员会,把所有人拉到了一个广场,每个人发了一个豆包,让他们把豆包举过头顶,边喊 干死豆包,边掰成两半,最后吃掉。 对此,阿里相关人士回应称,网传 ...
马斯克预测某车企:没救了,非“死”不可;“AI才女”罗福莉完成小米首秀;国家医保局发文回应生娃不花钱;玛莎拉蒂APP遭下架...
搜狐财经· 2025-12-21 00:16
如图所示,你比较喜欢谁的logo?欢迎留言区讨论... 早安,艾瑞巴蒂(手动问好),一起来看今天的早报: 【黑马高调早报】第3031期 更多创业内容请访问www.iheima.com Fast Reading 今日头条 "生娃不花钱"明年落地,国家医保局连发五文回应关切 近日全国医保工作会议提出,明年力争实现全国生娃基本不花钱。生娃不花钱政策如何落地?对于宝妈来说,哪些费用属于"基本"不花钱的范围,哪些又 处于"不基本"需要自付的范围? 16日,国家医保局以"医保支持生育"为主题连发五篇文章推荐地方生娃基本不花钱的经验,用地方实践和真实的医保数据回应了大家关心的这些问题。全 国医保工作会议提出,推动将灵活就业人员、农民工、新就业形态人员纳入生育保险覆盖范围。合理提升产前检查医疗费用保障水平,力争全国基本实现 政策范围内分娩个人"无自付"。 国家医保局数据显示,到2025年底,31个省(区、市)及新疆生产建设兵团均已将符合条件的辅助生殖项目纳入医保,7个省份实现政策范围内住院分娩 医疗费用全额保障,95%的统筹区将生育津贴直接发放给参保人。 市场监管总局:平台要求商家"全网最低价"可能构成垄断 记者17日从市场 ...
跑分第一,实战拉胯!GPT Image 1.5被骂惨,奥特曼这波悬了
程序员的那些事· 2025-12-20 02:10
【导读】 OpenAI深夜祭出大招,全新GPT Image 1.5重磅出世,拿下榜单双料第一,实力碾压谷歌Nano Banana Pro。但全网实测,骂声一片。 谷歌刚传出要发Gemini 3.0 Flash,结果OpenAI反手就是一个「王炸」。 就在刚刚,OpenAI抛出了它的「圣诞彩蛋」——新一代旗舰图像模型ChatGPT Images正式登场。 这一次,OpenAI将生图能力直接拉满: 而且从今天起,所有ChatGPT免费用户即可上手,开发者也可直接调用GPT Image 1.5 API。 转自: 新智元报道 精准操控 : 指令理解力大幅提升,真正做到「指哪改哪」。 细节狂魔 : 画面细节保留完整,质感细腻。 极速生成 : 速度较前代提升了整整4倍。 在LMArena竞技场上, 它似乎不可战胜: 在Artificial Analysis上,更是拿下了「双料第一」。 | | | | LMARENA. AI | | | --- | --- | --- | --- | --- | | gpt-image-1.5 ranks | | | | | | #1 in Text-to-Image | | | | | ...
GPT Image 1.5 上线:AI 图像开始走向真实生产
36氪· 2025-12-18 05:46
2025 年年底,OpenAI 再次更新了其图像生成能力,向公众开放了新一代模型 GPT Image 1.5。这次发布并未伴随激进的视觉宣传,也没有试图制造「下 一次颠覆创意行业」的宏大叙事。相反,OpenAI 把这项能力直接嵌入到 ChatGPT 的日常使用中,让图像生成成为对话流程的一部分。 从表面看,这依然是一次模型升级:速度更快,编辑能力更强,对指令的理解更加稳定。但如果结合近一年 AI图像领域的变化来看,会发现 GPT Image 1.5 所体现的重点,已经不再是单纯的「生成能力展示」,而是一次围绕使用方式和工作流的调整。 GPT Image 1.5 的革新,首先体现在产品形态的重构上。它并非独立的绘图应用,而是被深度整合进 ChatGPT 的图像功能模块。生成、修改、确认全流程 都在同一对话环境中完成,用户无需在多个工具间来回切换,省去了繁琐的跳转成本。 这种设计背后,是 OpenAI 对真实创作场景的深刻洞察。实际工作里,图片从来不是一次性成型的成品,而是需要反复打磨的过程。颜色校准、构图调 整、细节优化、文案排版,都可能在多轮沟通中不断修正。GPT Image 1.5 着重强化的,正是这种 「 ...
连月挑战OpenAI!谷歌发布更高效Gemini 3 Flash,App默认模型,上线即加持搜索
美股IPO· 2025-12-17 22:52
谷歌发布Gemini 3 Flash模型 - 谷歌推出Gemini 3家族新成员Flash模型,旨在以更低成本、更快速度向全球数百万用户提供接近旗舰模型的AI能力 [1][3] - 该模型发布当天即取代Gemini 2.5 Flash,成为Gemini App和谷歌搜索AI模式的默认驱动模型 [1] - 谷歌将其定位为“老黄牛式”模型,专注于快速高效,以支持批量任务 [3][10] 模型性能与基准测试表现 - 在评估代理编程能力的SWE-bench Verified基准测试中,Gemini 3 Flash解决率达78%,优于Gemini 3 Pro的76.2%,仅次于GPT-5.2的80% [1][5] - 在多模态推理基准MMMU-Pro中,Gemini 3 Flash以81.2%的得分超越包括Gemini 2.5和Gemini 3 Pro在内的所有竞争对手 [8] - 在博士级科学知识基准GPQA Diamond上,Gemini 3 Flash得分为90.4%,虽低于GPT-5.2的92.4%和Gemini 3 Pro的91.9%,但其他对手得分均低于90% [9] - 在跨领域专业知识测试Humanity's Last Exam中,不使用工具时得分为33.7%,低于Gemini 3 Pro的37.5%和GPT-5.2的34.5%,但远超Gemini 2.5 Flash的11% [8] - 在数学基准AIME 2025上,不使用工具时得分为95.2%,略高于Gemini 3 Pro的95.0% [10] 成本与速度优势 - 定价为每百万输入token 0.50美元,每百万输出token 3.00美元,成本仅为Gemini 3 Pro的四分之一 [1][3][15] - 运行速度达到Gemini 2.5 Pro的三倍 [1][3] - 在处理需要思考的任务时,平均使用的token数量比Gemini 2.5 Pro少30%,有助于降低总体使用成本 [12] - 配备标准上下文缓存功能,能在重复使用token的应用中实现高达90%的成本削减 [15] 市场竞争与行业影响 - 谷歌与OpenAI的竞争日趋白热化,谷歌11月发布Gemini 3系列促使OpenAI本月初拉响红色警报 [3][4] - 虽然ChatGPT在11月下旬仍垄断90%的移动端会话,但Gemini在每周移动应用下载量、月活跃用户和全球网站访问量等指标上的增长率最近均超过ChatGPT [4] - 自Gemini 3发布以来,谷歌API每天处理的token数量已超过1万亿 [4] - 行业认为这场竞赛已演变为谷歌与OpenAI的二元对抗,对AI技术及整个经济产生重大影响,任何公司都可能迅速从领先者沦为陪跑者 [4] 产品部署与企业应用 - 模型即日起面向全球用户推出,覆盖消费者、开发者和企业三大群体 [17] - 在Gemini App中,全球用户可免费使用该模型,谷歌搜索AI模式也将其设为默认模型 [1][17] - 开发者可通过Google AI Studio、Gemini CLI、Vertex AI等平台获取预览版本 [17] - 多家知名企业已开始使用,包括桥水基金、Salesforce、Workday、Figma、Cursor、Harvey和Latitude等 [17][18][19] - 桥水基金AIA Labs负责人表示,该模型能处理大量非结构化多模态数据集而不牺牲概念理解 [18] - 软件开发公司JetBrains表示,该模型提供了接近Gemini 3 Pro的质量,同时推理延迟和成本显著降低 [18]
AI进化速递 | OpenAI推出GPT Image 1.5
第一财经· 2025-12-17 12:48
⑥Adobe Firefly新增基于提示词的视频编辑功能; ⑦OpenAI据悉正与亚马逊洽谈超100亿美元投资,并使用亚马逊的人工智能芯片; ⑧Alphabet旗下自动驾驶公司Waymo洽谈新一轮融资,估值或超1000亿美元。 ③腾讯大模型团队架构调整,前OpenAI研究员姚顺雨任要职; ④小米开源MiMo-V2-Flash大模型; ⑤阶跃星辰宣布GUI Agent全面升级,包括云端模型Step-GUI全量上新,并开放GUI-MCP协议; AI进化速递 | OpenAI推出GPT Image 1.5 ①OpenAI推出全新图像生成模型GPT Image 1.5; ②腾讯混元世界模型1.5正式发布; ...
OpenAI图像模型实测口碑两极分化,被调侃“画风辣眼”
第一财经· 2025-12-17 08:37
就在谷歌暗示将发布Gemini 3.0 Flash模型时,OpenAI抢先发布了其新一代图像模型GPT Image 1.5,对标谷歌的Nano Banana。从跑分来看已经超过谷歌夺得第一,不过实际用户测试反馈呈现两极 分化,不少人认为其AI味较重。 本文字数:2087,阅读时长大约4分钟 作者 | 第一财经 刘晓洁 封图 | AI生成 2025.12. 17 为了制造话题,OpenAI直接拿CEO奥尔特曼(Sam Altman)当案例演示生图效果。而奥尔特曼本人 也晒出了自己用GPT Image 1.5生成的"消防员写真年历",被调侃"画风辣眼"。 OpenAl @OpenAI most likely to launch a new image model OpenAI表示,这一代模型具备更强的指令遵循,更精准的图像编辑,也能较好地保留细节,生成速度 是上一代模型的4倍。新的图像模型今天在ChatGPT中面向所有用户推出,并在API中作为GPT Image 1.5提供。 这次OpenAI还实施了降价措施,GPT Image 1.5中的图像输入和输出比上一代便宜了20%,因此用户 可以在相同的预算下生成和迭代 ...