大语言模型

搜索文档
中金《秒懂研报》 | AI赋能玩具:开启情感陪伴新纪元
中金点睛· 2025-08-10 01:08
AI玩具的演进:情感交互与陪伴 - AI玩具通过大语言模型和多模态交互技术实现自然对话和情感互动,能根据用户情绪调整互动方式并提供个性化陪伴 [7] - 产品形态多样,包括AI挂件、毛绒玩具和陪伴机器人,覆盖儿童教育、老年人陪伴及年轻人情感慰藉等场景 [7] - 全球发展历程从1999年索尼AIBO机器狗起步,后续涌现Lovot、Moflin等产品,中国虽起步较晚但凭借技术突破实现多客群覆盖且性价比更高 [7] AI玩具的驱动力:需求与技术共振 - 需求端:城市家庭儿童陪伴时间不足、老龄化社会情感需求及年轻人减压需求催生市场缺口 [8] - 技术端:大语言模型实现自然对话,多模态交互支持语音/图像处理,AI芯片小型化与成本下降推动技术集成,云计算助力持续学习 [8] - 政策端:人工智能产业扶持措施为技术研发创造有利环境 [8] AI玩具的市场前景与核心竞争力 - 技术基础:大语言模型和多模态交互能力决定产品竞争力,直接影响对话流畅度与用户体验 [11] - 持续学习能力:个性化功能提升用户长期黏性 [11] - IP价值:知名IP如"AI喜羊羊玩偶"可降低推广难度并提高溢价,但需注重与产品的契合度 [13] - 商业模式:硬件销售+内容订阅、教育机构合作等多元化变现模式成为趋势,2033年全球市场规模预计达600亿美元 [15] AI玩具未来:技术突破与风险挑战 - 技术突破方向:多模态交互流畅度提升、硬件性能与成本优化、AI模型合规性与有效性增强 [17] - 儿童信息安全:摄像头/麦克风数据采集存在隐私滥用风险,需严格保障措施 [17] - 社交影响:过度使用可能削弱儿童真实人际互动能力与情感认知发展 [17] - 技术挑战:响应延迟、硬件设计平衡(低功耗/过热风险)及价值观引导问题需解决 [17]
刘若鹏称形成5大超材料生产基地 光启制造大纲字数多达38亿
深圳商报· 2025-08-09 18:33
公司发展历程与成就 - 公司在超材料领域攻克了从实验室到大规模量产的世界级难题,并在先进航空装备中实现全方位、深层次应用[1] - 15年来累计完成11.72万张设计图纸、54.5万个数字仿真模型、7.74亿字超材料设计技术文档、38.28亿字工艺制造大纲,开发1331万行源代码,打造4641套专用设备和161款定制化基础材料[1] - 从研究院发展为"1总部+5基地+7大能力平台+8大专业公司+1919家上下游配套"的全产业链布局,实现技术自主可控[2] 技术创新与知识产权 - 累计申请专利超6000件,授权4000余件,超材料领域专利申请总量全球第一[4] - 完成四代超材料技术迭代,第四代技术在我国先进航空装备上实现跨代性能领先[4] - 自主研发全球首款低成本可量产超材料无人机,从团队组建到首飞仅耗时3.5个月[4] 发展战略与产业布局 - 2017年提出"深度垂直"战略,系统推进超材料产业链垂直整合,覆盖上中下游全链条[3] - 通过"深度创新+成本革命"双轮驱动,实现从实验室成果到产业化的跨越式发展[2] - 形成深圳总部及佛山、洛阳、株洲、天津、乐山5大生产基地的全国布局[2] 人才体系与未来规划 - 自主培养13名产品技术大总师、134名博士后、649名研发设计人员,在职员工总数超4200人[6] - 计划成立新研究机构开发微观材料设计制造工具,探索超材料5.0与传感技术、新一代半导体的融合[6] - 未来15年将聚焦微观设计信息化、智能化及高分子结构的人为设计制造[6]
ARPO:智能体强化策略优化,让Agent在关键时刻多探索一步
机器之心· 2025-08-09 06:02
研究背景与动机 - 大语言模型在单轮推理任务中表现亮眼,但在开放式多轮交互场景中仍存在长程规划与工具交互能力不足的问题 [8] - 现有强化学习方法在平衡模型推理与多轮工具交互方面存在局限性,常因奖励稀疏和工具过用导致价值低估 [8] - 研究发现模型在工具调用后的初始生成阶段熵值显著升高,这一高熵现象未被现有方法充分利用 [14][16] ARPO方法创新 - 提出熵驱动的自适应rollout机制,在高熵工具调用步骤加大探索力度,增强推理路径多样性 [20][24] - 引入优势归因估计,优化策略更新方式,更好理解工具交互中各步骤的价值差异 [28][29] - 算法在保持计算复杂度可控的同时,实现不确定性感知的高效探索 [27] 实验设计与结果 - 在13个高难基准测试中,ARPO仅使用一半工具调用预算即显著优于主流RL方法 [3][21] - 在Qwen2.5-7B模型上,ARPO相比GRPO方法工具调用效率提升明显,同时准确率更高 [37][39] - 多任务测试显示ARPO在计算推理(AIME24 71.4%)、知识推理(HotpotQA 67.4%)和深度搜索(GAIA 61.2%)任务中均保持稳定优势 [35][41] 技术实现细节 - 采用分层奖励设计,综合考虑答案正确性、工具调用格式及多工具协作,最高可获得0.1额外奖励 [32] - 软优势估计方法在训练中表现更稳定,被设为默认优势估计方式 [31] - 工具生态覆盖搜索引擎、网页浏览智能体和代码解释器三类代表性工具 [22] 应用前景与展望 - 未来可扩展至多模态Agentic RL,探索图像、视频等多模态场景下的工具调用优化 [42] - 通过引入代码调试器、数据分析工具等扩展工具生态,提升复杂任务表现 [42] - 算法展示出良好的大规模部署潜力,可进一步优化实时动态环境中的适配性 [42]
给自动驾驶感知工程师的规划速成课
自动驾驶之心· 2025-08-08 16:04
自动驾驶规划技术演进 - 模块化系统中机器学习主要影响感知部分,下游规划组件变革较慢[3] - 传统系统易于解释和快速调整,但机器学习可扩展性更强[4] - 学术界和工业界推动下游模块数据驱动化,通过可微接口实现联合训练[4] - 生成式AI和多模态大模型在处理复杂机器人任务方面展现潜力[4] 规划系统核心概念 - 规划系统需生成安全、舒适、高效的行驶轨迹[11] - 输入包括静态道路结构、动态参与者、占用空间等感知数据[11] - 输出为路径点序列,典型为8秒视野内每0.4秒一个点共20个点[11] - 分为全局路径规划、行为规划和轨迹规划三个层级[12] 规划技术方法 - 搜索、采样和优化是规划三大核心工具[24] - 混合A*算法通过考虑车辆运动学改进A*算法[28] - 采样方法通过参数空间采样解决优化问题[37] - 优化分为凸优化和非凸优化,后者依赖初始解[41] 工业实践 - 路径-速度解耦方法解决约95%问题,耦合方案性能更高但实现复杂[52] - 百度Apollo EM规划器采用迭代期望最大化步骤降低计算复杂度[56] - 时空联合规划处理剩余5%复杂动态交互场景[59] - 特斯拉采用数据驱动与物理检查结合的混合系统[117] 决策系统 - 决策本质是注重交互的行为规划,处理不确定性和交互问题[68] - MDP和POMDP框架将重点从几何转向概率[69] - MPDM通过有限离散语义级策略集合简化POMDP问题[102] - 应急规划生成多条潜在轨迹应对不同未来情景[112] 神经网络应用 - 神经网络可增强规划器实时性能,实现数量级加速[130] - 端到端神经网络规划器将预测、决策和规划结合成单一网络[133] - 世界模型最终形式可能是由MCTS增强的原生多模态大模型[138] - 神经网络从树结构中提取知识,形成正反馈循环[142] 发展趋势 - 规划架构趋向"端到端",更多模块被整合到单一系统[151] - 机器学习组件在规划中应用比例持续增加[151] - 算法从理论完美向工程实用演进,如Value Iteration到MCTS[153] - 确定性场景规划成熟,随机性场景决策仍是挑战[153]
Meta合同工爆料:见过脸书用户向AI聊天机器人泄露隐私
财富FORTUNE· 2025-08-08 13:05
用户与AI交互行为 - 用户过度沉迷与AI对话 向Meta的AI分享个人隐私信息如真实姓名 电话号码和电子邮箱地址 [1] - 用户会在Facebook和Instagram等平台分享高度私密的细节 包括自拍照和露骨照片 [1] - 与其他硅谷公司相比 Meta项目中未经删减个人数据的频率更高 [1] 行业背景 - 人类与AI聊天机器人过度亲密现象早有纪录 苹果 亚马逊和微软均存在类似情况 [2] - 苹果合同工曾接触Siri用户极端敏感信息 亚马逊员工手动审听Alexa用户录音 微软合同工录制审听语音内容 [2] Meta数据治理问题 - 公司依赖第三方合同工的做法及数据治理屡次失误 [3] - 2018年剑桥分析事件中 Facebook开发者平台存在广泛缺陷 开放数据接口缺乏监管 [4][6] - 公司管理层常将业务增长和用户参与度置于隐私安全之上 [6] - 2019年Facebook付费让合同工转录用户音频聊天 录音获取途径不透明 [7] 公司回应 - Meta表示制定了严格政策约束员工和合同工访问个人数据 [8] - 公司限制合同工可获取的个人信息范围 设置流程和安全防护措施处理敏感数据 [9] - 合同工根据公开隐私政策及AI条款可访问特定个人信息 未经授权数据共享将受处置 [9] 公司形象重塑 - 2021年公司更名为Meta 宣称面向元宇宙战略转型 但数据管理黑历史持续存在 [7] - 当前使用人工审核员优化大语言模型是行业惯例 但Meta最新爆料再度引发质疑 [7]
OpenAI重磅发布GPT-5!性能大幅提升至“专家级别”
证券时报网· 2025-08-08 10:57
GPT-5发布核心亮点 - 集成模型架构:GPT-5首次整合大语言模型GPT系列与推理模型o系列,采用内嵌式三位一体架构(GPT-5-main常规处理、GPT-5-thinking深度思考、实时路由机制),用户无需手动切换模型 [2][3] - 性能全面超越前代:数学领域AIME测试达94.6%(无工具辅助),健康领域表现超越所有前代模型,LMArena竞技场所有细分类目排名第一 [2][4] - 幻觉率显著降低:事实错误率较GPT-4o下降45%,深度思考模式较o3降低80%,LongFact和FActScore测试中幻觉率减少约六倍 [2][5] 技术架构与能力突破 - 智能调度系统:路由机制根据对话类型、复杂度等自动匹配子模型,自主决定是否进入深度思考模式 [3] - 多模态应用案例:可快速开发游戏(如"Jumping Ball Runner")、法语学习应用、财务分析模板等,编码能力突出 [4] - 版本分层设计:提供GPT-5、GPT-5-mini、GPT-5-nano和GPT-5-pro四版本,免费用户超额后自动降级至mini版 [5] 商业化与定价策略 - API服务定价:输入/输出价格分别为每百万token 1.25美元/10美元(GPT-5)、0.5美元/5美元(mini)、0.15美元/1.5美元(nano),成本低于或持平Anthropic和谷歌 [6] - 资本运作背景:发布前夕以5000亿美元估值推进员工股份出售,较近期3000亿美元融资估值增长66%,或为提振投资者信心并巩固人才激励 [10][11] 研发挑战与行业瓶颈 - 技术迭代争议:内部曾无模型符合GPT-5命名标准,Meta挖角导致研发混乱,最终成果被评"渐进式优化"而非颠覆性突破 [8][9] - 训练资源瓶颈:缩放定律边际收益减弱,全球高质量数据枯竭制约性能提升 [9] 公司战略与人才竞争 - 简化产品线目标:CEO称将终结复杂命名体系(如o4-mini-high),未来聚焦GPT-5/6等统一版本 [7] - 人才保留措施:计划两年内为每名员工提供150万美元奖金,应对硅谷抢人大战 [11]
新网银行积极开展2025年全国金融科技活动周宣传活动
中国经济网· 2025-08-08 07:22
(责任编辑:华青剑) 与此同时,新网银行策划主题直播,两位AI专家在直播间细致讲解科技实践应用,生动展示 AIGC、大语言模型等前沿技术,多维度呈现人工智能带来的科技成果,营造热爱科学、崇尚创新的浓 厚氛围,并提高了公众对金融科技的认识和兴趣。直播中,嘉宾们还结合当前网络安全热点话题,提醒 观众在体验AI技术便捷性的同时,也要警惕各类"AI投毒""AI幻觉"。新网银行视频号、微博号、抖音号 多平台现场直播,累计观看人数实现10万+。 新网银行深化数字化战略布局,依靠自身力量,深度融合大数据、隐私计算与人工智能等数字技 术,构建起贯通多场景的开放生态平台,形成了全在线、全实时、全客群的银行业务模式。面向未来, 新网银行将深化前沿技术与金融业务场景的融合创新,通过打造多元化数字普惠金融产品,满足大众多 层次金融需求,以数字技术培育新质生产力,扎实做好五篇大文章的时代答卷。 近期,新网银行以全国金融科技活动周为契机,围绕"矢志创新发展,建设科技强国"主题,精心策 划并开展了一系列丰富多彩的金融科技宣传活动,积极面向公众宣传科普各类知识,为建设科技强国贡 献金融力量。 在全国金融科技活动周期间,新网银行充分利用线上渠 ...
探路数字金融,零售之王“智变”的求索与未来
中国经济网· 2025-08-08 07:22
核心观点 - 人工智能推动技术竞技 数字化成为银行必答题 招商银行是行业排头兵 [1] - 数字金融是技术金融创新叠加的高级形态 提升金融供给效率 促进普惠便捷智能服务 [2] - 公司完成全面上云 成为国内前7家系统性重要银行中首家实现该目标的银行 [2] - 智算平台成为第二大科技投入方向 专注金融垂直领域大模型开发 [3] - 数据获取与风控体系领先 依托AI机器学习实时计算 构建全生命周期风险管理 [4] - 小微金融风控创新 通过数字化纯信用贷款产品解决融资难题 [5][6] - 大语言模型已在120多个场景应用 显著提升效率并降低边际成本 [7] - 技术应用仍面临资源消耗 数据隐私 可解释性等挑战 需政策市场协同 [8] 数字化建设 - 2022年底完成全面上云工程 覆盖全部借记卡信用卡对公账户及所有应用系统 [2] - 基础能力跃迁体现于业务数据:招企贷累计放款超500亿元 服务5万小微企业 其中76%首次获得信用贷款 [2] - 在云南咖啡产区等场景 数字化授信使融资成本下降30% [2] 人工智能布局 - 2024年初将智算平台列为第二大科技投入方向 包括大语言模型训练与推理平台 [3] - 探索目标为金融垂直领域大模型而非通用模型 [3] - 采用FinTech基金方式 以有限容错成本撬动大模型潜能 [7] 数据风控体系 - 零售智慧风控生态体系依托AI机器学习实时内存计算引擎 迅速识别风险数据并精准拦截 [4] - 整合客户账户交易等多维度数据 结合账户分级AI语音外呼等手段 构建事前事中事后全周期管理 [4] - 反欺诈系统日均侦测交易风险千万次 [7] 小微金融创新 - 推出基于大数据模型的数字化纯信用贷款产品招企贷 实现数据业务终端"一体化" [5] - 累计发放超500亿元纯信用免抵押贷款 实现"一台手机秒级审批" [6] 大模型应用成效 - 全行超120个场景应用大语言模型 [7] - 超2000万用户享受手机银行智能服务 [7] - RPA机器人替代50%人工操作 [7] - 前端客服流程从5分钟缩短至秒级 营销文案生成效率大幅提升 [7] - 天秤风控平台利用神经网络算法精准识别风险 [7] 发展挑战 - 面临数字资产计量确权 大模型黑箱风险 数据隐私伦理等挑战 [3] - 存在资源消耗巨大 数据隐私保护要求高 答案生成可解释性较弱等问题 [8] - 呼吁政务企业个人数据权属建立分级授权机制 [8]
SuperX首发全栈式多模型一体机,开创多模态智能体协同新纪元
中国产业经济信息网· 2025-08-08 07:17
产品发布核心信息 - Super X AI Technology Limited于8月7日正式发布多种规格的多模型一体机[1] - 该产品是继7月30日推出SuperX XN9160-B200 AI服务器后的又一重大创新AI产品[1] - 产品预搭载OpenAI最新发布的GPT-OSS-120B和GPT-OSS-20B大语言模型,并可选择下载其他热门开源模型[1][2] 产品特性与技术创新 - 产品开创性地实现多模型协同架构,具备“开箱即用、多模融合、场景穿透”三大特征[1] - 首次实现推理模型、通用模型、多模态模型、语言合成/识别模型、嵌入模型、重排模型、文生图模型的预设、调用、加速、管理和迭代[3] - 通过认知跃迁功能实现多种智能体协作,支持文本描述直接定位视频片段等复杂业务场景[3] - 依托内置门户助手与知识库系统进行知识赋能,能够支持60+预置场景智能体[3] - 实现云端协同缓存模型赋能,通过本地与云端模型仓库联动让用户第一时间体验最新模型[3] 性能与成本优势 - GPT-OSS-120B在多项关键基准测试中表现已能媲美甚至超越部分业界顶尖闭源模型[2] - 产品融合软硬件深度优化技术,实现分钟级开机部署,无需额外配置服务器和运维团队[5] - 面向中大型企业的一体机可以集群方式提升吞吐性能,平替主流公有云MaaS API服务[5] 市场定位与定价策略 - 产品适合全球千行百业需要本地部署AI的行业客户,面向不同规模企业推出多种规格[1] - AI服务器B200标准版定价50万美元,集群版定价400万美元[5] - AI工作站标准版定价5万美元,旗舰版定价25万美元[5] - 标准版适配中小企业,集群版可覆盖全场景;工作站标准版适合企业级个人使用,旗舰版适合专业人员及团队[5] 行业背景与发展前景 - 以DeepSeek为代表的开源模型引发业界对算力需求发展变化的新一轮思考[2] - AI大模型需求正呈现指数级增长,在教育、科研、医疗、金融、汽车、泛工业等领域有广泛应用场景[5] - 多模型协同被视为AI通向AGI服务人类应用演进的关键一步[6]
亏到发疯,AI编程独角兽年入2亿8,结果用户越多亏得越狠
36氪· 2025-08-08 07:13
收入与估值表现 - AI编程公司年经常性收入表现突出:Windsurf达4000万美元[1]、Cursor达5亿美元[1]、Replit达1亿美元[1]、Lovable预计2025年6月达7000万美元[1] - 公司估值快速增长:Windsurf半年估值翻倍至30亿美元[1]、Cursor估值99亿美元[1]、Replit估值11.6亿美元[1] - Replit在18个月内实现收入增长10倍[1],Cursor创下SaaS行业最快达到1亿美元年经常性收入纪录(12个月)[1] 成本结构与盈利困境 - 行业普遍存在高运营成本问题,毛利率呈现显著负值[4],Windsurf运营成本远高于收入[4] - 大语言模型调用成本是主要支出项,按Token计价的可变成本随用户量增加而上升[5] - 模型供应商持续更新产品迫使公司跟进升级,进一步推高成本[5] - 所有代码生成产品利润率接近盈亏平衡或处于亏损状态[6],可变成本占比普遍在10%-15%之间[6] 市场竞争环境 - 行业面临多重竞争压力:包括Cursor、Replit、Bolt、Lovable等新兴公司[7] - 基础模型供应商如Anthropic和OpenAI直接进入市场参与竞争[7] - 行业存在重投入、高使用成本特性且难以形成有效护城河[7] - 用户对价格高度敏感,存在快速转向更优替代工具的可能性[12] 盈利改善尝试 - 通过自研模型降低对外部供应商依赖:Cursor母公司Anysphere于今年一月宣布自研计划[9],但七月份出现核心团队成员回流Anthropic的事件[9] - Windsurf因成本考量放弃自研模型计划[9] - 部分公司寄希望于大语言模型成本下降:预期新一代模型如GPT-5可能通过提升计算效率降低推理成本[10] - 直接调整定价策略:Anysphere将Claude模型新增成本转嫁给高活跃度用户,专业版订阅价格调整引发用户争议[12] 行业特性与挑战 - 商业模式存在根本性矛盾:用户增长导致模型调用量增加,进而推高可变成本,与传统软件行业的规模效应相反[5] - 当前推理成本处于历史最高水平[12],且最新AI模型因处理复杂任务需求增加,部分成本不降反升[12] - 公司面临战略选择困境:Windsurf选择通过出售公司在市场被巨头瓜分前锁定回报[9]