大模型技术
搜索文档
GPT-5能让普通人变成博士,但魔法依旧没有
虎嗅APP· 2025-08-09 13:38
GPT-5核心性能与突破 - GPT-5被定位为"博士级专家"模型,在各领域达到专业水平,能辅助用户完成复杂工作如财务分析、医疗决策等[4][12] - 模型系统采用256k token上下文窗口,支持多模态输入和结构化输出,内置自动切换器根据问题复杂度分配极速响应或深度思考模式[13][14][15] - 编码能力显著提升,可单次提示生成完整网站/应用/游戏,前端开发和大型代码库调试表现突出[16][8] - 写作能力优化,能处理复杂文学形式如抑扬格五音步诗,输出自然度较GPT-4提升明显[18][19] 技术评估与行业地位 - 在多项基准测试中创纪录:数学(AIME 2025得分94.6%)、编码(SWE-bench 74.9%)、多模态理解(MMMU 84.2%)、健康领域(HealthBench Hard 46.2%)[20] - 登顶LMArean排行榜(得分1481±11),超越Gemini 2.5 Pro(1460±6)和Claude Opus 4(1420±6)[24][25] - 幻觉率大幅降低:事实错误比GPT-4o减少45%,"欺骗性回答"概率从86.7%降至9%[28][30] - 效率提升:相同任务输出token数量比前代减少50%-80%[31][32] 商业化策略与市场反应 - API定价极具竞争力:输入/输出成本为1.25$/10$每百万token,低于Claude Opus 4(15$/75$)和Gemini 2.5 Pro(2.5$/15$)[34][35] - 发布会时长超1小时(以往约30分钟),但现场图表错误引发质疑,被部分业内人士批评为"预期管理失误"[37][38][39][41] - 竞争对手快速反应:马斯克称Grok 4 Heavy更智能,学者Gary Marcus评价其"非巨大飞跃"[43][44][45] 实际应用场景 - 教育领域:可即时生成交互式学习工具(如法语贪食蛇游戏),动态解释复杂概念(伯努利公式)[6] - 企业服务:3分钟生成可交互财务演示板,直接输出专业级商业文档[6][18] - 医疗辅助:帮助癌症患者理解治疗方案并做出个性化选择,显著降低专业门槛[9][12] - 创意生产:通过3段提示词生成完整3D游戏(含射击功能与NPC对话)[8]
接入豆包大模型,酷开OTT大屏的花式玩法
财富在线· 2025-08-08 10:14
公司核心业务与战略 - 公司是创维集团旗下子公司,专注于探索创新智能硬件,在AI时代积极探索OTT行业的新形态和新交互[1] - 公司通过“酷开超级智能体”大屏AI解决方案,将大模型带来的自然语言交互加速渗透到智能硬件的各个垂直场景,实现从“人找服务”到“服务找人”的主动服务[1] - 截至2025年5月,公司服务的终端用户数已超2亿,月活用户数达8,804万[1] 产品与解决方案:酷开超级智能体 - “酷开超级智能体”是一个大屏AI解决方案,通过接入多款不同模态的豆包大模型、联网问答Agent等产品,能够在影音、教育、健康、创作、生活、设备六大专业场景下直接交付服务[1] - 该解决方案以“长记忆、快思考、秒行动”为核心能力,通过用户专属的数字管家、极简交互及六大专业智能体完成服务闭环[2] - 该解决方案不仅应用于电视大屏,还将“对话即服务”的体验带到了学习机、闺蜜机、车载屏等更多智能硬件上[1] - 六大智能体支撑酷开AIOS系统的全面升级,并面向运营商、车企等生态合作伙伴同步推出[3] 核心智能体功能详述 - **影音智能体**:通过接入豆包视觉理解大模型,支持用户根据模糊印象、剧情或台词搜片,搜片速度压缩至1.5秒内;接入火山引擎联网问答Agent,可一键直达全网片源,实时搜索互联网与抖音生态内容资源[2] - **教育智能体**:通过接入豆包视觉理解、语言、图片生成大模型,支持作业批改、拍题解题等K12场景,以及AI绘图、儿童互动创作场景;其“AI 1对1家教”服务能深度解析解题思路并推送个性化方案;“AI绘本馆”能12秒实时生成定制化故事并支持音色克隆,上线后用户粘性提升60%[3] - **创作智能体**:依托豆包文生音乐大模型,支持电视端、硬件端AI音乐创作场景[3] - **生活智能体**:接入火山引擎新闻智能体,支持问答式新闻获取、热点榜单速览及基于兴趣的智能推荐[3] - **健康与设备智能体**:在不同终端设备连接,构建场景化服务闭环[3] 技术合作与数据能力 - 公司与火山引擎深度合作,利用其豆包大模型在多模态上的性能优势、数据营销产品、公有云大模型API调用的稳定高效,满足了硬件设备实时交互要求高、稳定性和性能要求高的需求[6] - 在数据营销场景,公司通过火山引擎的用户行为分析平台DataFinder和高性能实时分析引擎ByteHouse全面升级数据分析体系,提升重要指标的准确性与实时性,实现真正的“千人千面”精准推荐[4][5] - DataFinder高效收集分析用户在内容浏览、影视播放等场景中的每一次点击与互动,确保行为指标的准确性和实时性[5] - ByteHouse凭借卓越处理能力和存算分离架构,显著降低海量数据存储成本,并实现资源的弹性伸缩,从容应对业务瞬时高峰[5] - 整套方案通过混合云架构保障数据安全与统一管理,解决如与媒资合作方数据标准不统一等问题[5] 产品成效与数据表现 - 在接入豆包大模型、酷开超级智能体大屏方案后,终端用户开机体验相关数据提升10%[6] - 酷开全新AIOS的语音使用频次为7.95次,相比旧版人均5.33次显著提升[6] - 通过AIOS方案,公司对接了多种智能硬件设备及内容数据渠道,酷开AI学习机、闺蜜机等消费电子硬件产品也通过火山引擎AI产品和技术进一步提升用户体验[6]
技术应用 | DeepSeek赋能经营洞察,助力专业决策——北银金科小京财智建设实践
搜狐财经· 2025-08-08 05:00
行业趋势 - 市场竞争加剧促使企业需要快速处理财务信息、敏锐洞察运营状况、精准支持决策制定 [1] - 传统财务分析手段受限于数据处理时效性、分析维度单一性和人工操作繁琐性 [1] - 大模型技术发展显著提升人工智能在数据处理、模式识别、自然语言处理等方面的能力 [1] - 银行业作为数字化转型先行者积极应用人工智能技术探索日常办公、客户服务、运营管理等场景 [1] 技术发展 - DeepSeek-R1推理大模型具备强大自然语言处理能力、跨领域学习能力和思维推理能力 [2] - 大模型技术推动财务分析智能化、高效化和精准化开辟崭新维度 [2] - AI大模型技术趋于通用化与专用化垂直领域成为企业落地主战场 [13] 产品建设 - 小京财智通过私有化部署DeepSeek-R1结合高质量知识库和提示词工程打造金融垂直领域财务分析工具 [2] - 产品融合多方数据源建立专家知识库和预处理算法集构建财报知识网络实现知识融合和深度思考能力 [3] - 平台采用"检索+图谱"融合方案增强系统准确性和时效性迭代优化提示工程提升大模型行为可控性 [4] 系统架构 - 协同引擎作为核心调度模块实现任务自动化调度执行和信息无缝对接 [5] - 知识库覆盖11个金融垂直子领域提供高质量金融知识支持 [5] - 提示工程为应用场景量身定制提示词指导模型输出精准内容 [5] - 模型工厂微调大模型提升金融领域专业能力实现复杂场景精准处理 [5] 核心功能 - 智能财报分析支持秒级分析42家A股上市银行近10年财报数据实现指标、增速、排名及对比分析 [6] - 智能报告生成支持一键生成A股上市银行年报、半年报、季度报分析报告提升智能化水平 [6] - 智能体应用包含波士顿矩阵助手、SWOT分析助手等业务、战略、管理、办公智能体支持用户自助创建 [8] 应用成效 - 策略复盘助手帮助业务人员在1分钟内掌握关键指标节省超过90%时间准确率提升30%以上 [12] - 智能尽调助手提升报告撰写自动化水平节约30%报告撰写时间 [12] - 产品实现财报分析专业化、报告撰写高效化和决策辅助精准化 [11] 未来展望 - 小京财智将依托智能化大模型评测体系引入先进模型能力深入业务场景释放大模型潜能 [13] - 产品通过自动识别、提取、分析财报关键信息为企业经营决策提供全面支持展现大模型数据分析潜力 [13]
GPT-5能让普通人变成博士,但魔法依旧没有
虎嗅· 2025-08-08 03:32
千呼万唤始出来的GPT-5终于在昨天晚上1点问世,在持续了一个小时10分钟的发布会上,OpenAI向世人展示了一个性能绝对强大,更加 易用,甚至能够理解或者说准确猜测用户真实意图并且交付符合预期的产品的大模型。 用Sam Altman在发布会上的话来说,GPT-5在各个领域都能达到博士的知识水平,能力可以比肩专业人士,从而让普通人能够完成以前 自己无法想象的工作。 相比于OpenAI两年前发布GPT-4时,整个世界对于大模型的认知和体验已经充分得多。观众和用户已经不会对模型能够看懂网络梗图这 种事情感到惊叹不已。但是作为一个几乎每天都会使用AI产品的人来说,GPT-5的发布依然足够惊艳。 最重要的原因就是,从发布会上传达出的内容,我能深切地感受到,OpenAI想让大模型已经从一个"玩弄"语言和"智能",不时让人感受 到惊喜和挫败的大玩具,加速进化到一个生活中的可靠帮手。就像你的手机一样,如果你离开它,你将深刻地感受到不方便,不习惯, 甚至不安全。 下面我将用发布会的几个瞬间来帮助大家理解这一切是怎么发生的。 孩子让你给他解释流体力学中的伯努利公式,以前的AI可能给你一篇文章,GPT-5能按照你的要求,一句话直 ...
中国银协:2024年三成以上客服中心与远程银行开始探索应用大模型
环球网· 2025-08-08 02:35
【环球网财经综合报道】8月7日,中国银行业协会发布《中国银行业客服中心与远程银行发展报告(2024)》。数据显示,2024年客服中心与远程银行智能 技术综合使用率提升至93%,较2023年提高1个百分点;已有31%的客服中心与远程银行开始探索应用大模型技术。 | 中国银行业协会 | 自律 维权 协调 服务 | | | | | | | --- | --- | --- | --- | --- | --- | --- | | 首页 关于协会 | | 协会要闻 | 党建专栏 | 专业委员会 | 行业动态 | 研究与培训 | | | | | 协会要闻 | 领导讲话 | | 文语目 | 具体来看,报告统计,2024年,客服中心与远程银行人工电话、在线、视频接通率分别达94.18%、91.45%、89.30%,服务水平行业均值提升至77.38%。智 能服务占比提升至59.41%,机器人问题识别率与解决率分别达96.19%和92.59%。 截至2024年末,已有37家银行客服中心更名为远程银行中心,占比44 %,较2023年提高4个百分点。(闻辉) 报告认为,客服中心与远程银行作为银行重要的服务窗口,2024年,客服中心与远 ...
GPT-5免费开放 马斯克不服
21世纪经济报道· 2025-08-08 01:08
产品发布 - OpenAI于8月7日发布新一代旗舰AI模型GPT-5 距离GPT-4发布已过去两年半 目前该模型正向所有用户包括免费用户提供 [1] - GPT-5集成大语言模型GPT系列和推理模型o系列 用户无需手动切换不同模型 [4] - 模型在数学、编程、视觉感知和健康领域大幅超越前代 成为OpenAI最强大模型 [4] - 事实错误率较GPT-4o降低45% 深度思考模式下较o3降低80% [4] - 整体智能水平实现跃升 在大模型竞技场LMArena所有细分类目中位列第一 得分为1,481分 [5][7] - 编程能力提升最大 可快速创建游戏应用和财务分析模板 例如仅用几句话创建"Jumping Ball Runner"游戏 几分钟开发法语学习网络应用 [7] 产品特性 - 首席执行官山姆·奥特曼以教育阶段类比三代模型:GPT-3类似高中生 GPT-4类似大学生 GPT-5则如按需召唤的博士级专家 [5] - 健康医疗领域动态适应用户背景、知识储备及地域特征 健康指导精准度与可靠性达全新高度 [9] - 文本创作可将抽象概念转化为兼具文学性、情感共鸣与韵律节奏的优质内容 [9] - 改善奉承和谄媚倾向 减少不必要表情符号 引入批判者、分析者、倾听者和书呆子四种人格模式供用户选择 [9] 市场定价 - 免费用户每天可使用GPT-5"几个小时" 超过上限后自动切换至GPT-5mini模型 [10] - Plus用户拥有比免费用户"高得多"的使用额度 基本满足日常应用 [10] - 开发者API定价为每百万token输入1.25美元 输出10美元 价格低于GPT-4o 仅为Claude Opus4.1的1/15 且低于Gemini 2.5 Pro [10] 行业竞争 - 埃隆·马斯克在社交媒体表示GPT-5在ARC-AGI-2测试中未击败Grok4 [3] - 部分人工智能研究员认为GPT-5仅为渐进式优化 非颠覆性提升 因缩放定律放缓、高质量数据枯竭及训练资源面临瓶颈 [11] 资本运作 - OpenAI获得83亿美元新融资 估值达3,000亿美元 投资方包括黑石集团、得克萨斯太平洋集团资本公司、富达管理与研究公司和普徕仕公司等新老投资者 [12] - GPT-5发布将巩固技术领先优势 提振投资者信心 助力估值增长及股票二次出售计划实施 [12] - 融资部分目的为员工提供兑现机会 作为人才激励工具 增强员工忠诚度且不稀释公司控制权 [12]
前第四范式科学家创业AI玩具赛道,种子轮获阿米巴、商汤、第四范式数百万美元融资|早起看早期
36氪· 2025-08-08 00:07
公司融资与产品进展 - AI硬件公司"人工生产力"完成数百万美元种子轮融资 资方包括阿米巴资本、商汤国香资本及第四范式基金 源合资本担任独家财务顾问 [6] - 公司由前第四范式主任科学家涂威威创立 初代AI陪伴机器人产品熊猫机器人已对外交付 [6] - 首款面向儿童的量产智能玩具计划于下月上市 [4][6] 行业现状与挑战 - 2024年全球传统玩具市场规模近万亿元 但头部企业面临增长压力 [7] - 电子游戏快速抢占儿童时间 如网易《蛋仔派对》日活峰值超5000万 未成年人用户占比超70% [7] - 传统玩具因交互方式单一缺乏吸引力 电子设备存在视力损伤和注意力分散等健康风险 [7] 技术解决方案与产品优势 - 采用大模型技术实现人机交互革命 使玩具摆脱传统"遥控器"束缚 [7] - 熊猫机器人测试显示猜拳和动作模仿功能最受欢迎 儿童停留超两小时 复玩率超80% [7] - 自研"人工生产力"自主硬件中台(AP Agentic Hardware Platform) 包含多模态交互感知、用户行为预测、决策执行等核心能力 [8] - 产品定价具有明显优势 部分型号下探两位数区间 能依据儿童情绪动态调整AI决策 [10] 商业模式与渠道布局 - 与顶级IP合作植入内容 单硬件可承载数十种玩法 [10] - 与国际知名玩具代工厂合作优化外观设计与成本控制 自主研发电子模块降低成本 [10] - 已与绝大多数线上线下顶级渠道合作 覆盖电商、抖音、新零售系统、商超百货等 [11] 团队背景 - 创始人涂威威为南京大学人工智能学院博士 曾任第四范式主任科学家、百度风巢架构师 [11] - 核心研发团队来自清华、北大、复旦等顶尖高校 曾任职华为、阿里、字节等头部企业 [11]
GPT-5,重磅来袭!
证券时报· 2025-08-07 23:23
GPT-5发布核心亮点 - GPT-5被OpenAI首席执行官山姆·奥特曼评价为"此前所有模型的巨大飞跃",从"大学生"水平的GPT-4升级为"专家级别"的集成模型 [5][6] - 首次采用内嵌式三位一体架构:包含常规问题处理的GPT-5-main、复杂任务解决的GPT-5-thinking深度思考模型、实时决策路由机制及额度用尽后的mini版本 [8] - 在LMArena大模型竞技场所有细分类目排名第一,Arena Score达1,481分,领先第二名Gemini 2.5 Pro(1,460分)和第三名оз(1,450分) [10] 技术性能突破 - 多领域性能超越前代:数学领域2025年AIME测试无辅助达94.6%,编程可快速创建完整游戏(如"Jumping Ball Runner"),健康领域表现全面超越GPT-4o/o1/o3等 [7][8][10] - 幻觉率显著降低:相比GPT-4o事实错误率下降45%,深度思考模式比o3降低80%;LongFact和FActScore测试中幻觉率比o3减少约6倍 [7][12] - 集成模型优势:融合GPT系列(语言)与o系列(推理),自动调度子模型,无需用户手动切换 [6][7] 商业化与定价策略 - 提供四版本:GPT-5(基础)、GPT-5-mini(额度用尽后自动切换)、GPT-5-nano(轻量)、GPT-5-pro(仅Pro订阅用户) [12] - API定价:输入/输出每百万token价格分别为1.25/10美元(GPT-5)、0.5/5美元(GPT-5-mini)、0.15/1.5美元(GPT-5-nano),成本与Anthropic/谷歌相当或更低 [12] 研发背景与行业影响 - 研发过程波折:因Meta挖角导致核心团队流失,内部曾无模型符合GPT-5命名标准,技术突破被质疑仅为"渐进式优化"(如缩放定律边际收益减弱、高质量数据枯竭) [14][15] - 简化产品线目标:奥特曼称将终结o4-mini-high等混乱命名,未来通过GPT-5/6等整数版本简化用户体验 [13] - 资本运作关联:发布前一周完成83亿美元融资(估值3000亿美元),正推进员工股票二次出售计划(估值5000亿美元),或通过技术发布提振估值 [17][18] 人才激励措施 - 计划两年内为每名员工提供150万美元奖金,应对硅谷抢人大战并增强忠诚度 [19]
银行业人工电话客户满意度达99.46%
人民日报· 2025-08-07 22:40
服务效率与质量 - 2024年银行客服中心与远程银行人工电话平均接通率达94.18% 较2023年提高1.3个百分点 [1] - 人工电话客户满意度达99.46% 已连续4年高于99% [1] - 服务范围覆盖手机APP、电话、微信、短信、视频、邮件、微博等全渠道 [1] 技术应用与创新 - 2024年客服中心与远程银行智能技术综合使用率提升至93% 较2023年提高1个百分点 [1] - 已有31%的客服中心与远程银行开始探索应用大模型技术 [1] - 数智技术成为推动银行业服务消费者和自身高质量发展的重要动力 [1]
金山办公百度等联合发布多项教育解决方案
北京商报· 2025-08-07 11:05
战略合作 - 金山办公与百度智能云、麒麟软件、沐坤科技、麦盟科技达成战略合作,联合发布多项教育解决方案 [1] 高教领域解决方案 - 金山办公与百度智能云共建AI实训体系,融合大模型技术与实训平台,通过阶梯课程、虚拟仿真及企业项目对接,解决理论与产业脱节问题 [1] - 联合麒麟软件推出信创人才培养方案,整合协同生态与操作系统基座,通过实验室建设和职业认证培养国产软件适配能力 [1] 基教领域解决方案 - 金山办公与沐坤科技合作智慧教学方案,构建"工具-内容-管理-数据"闭环,推动个性化协同教学 [1] - 同麦盟科技开发教学评价方案,通过课堂行为量化分析实现数据驱动的精准评价 [1]