自然语言处理
搜索文档
Gemini2.5弯道超车背后的灵魂人物
虎嗅· 2025-06-05 03:14
Gemini 2.5 Pro崛起背后的底层逻辑 - 大语言模型训练的核心步骤包括预训练、监督微调和对齐阶段,过去一年行业重点转向对齐阶段,特别是强化学习方向的探索[2] - Google在Gemini系列迭代中积累了坚实的基座模型训练经验,并更加重视强化学习的作用,引入"让AI批判AI"的机制[3] - 编程能力成为各家模型竞争焦点,Anthropic在预训练阶段优先投入高质量代码数据,使其在代码生成质量上领先[4][5] - Google通过整合预训练和强化学习优势,在Gemini 2.5中实现编程和数学等高确定性任务的突破性表现[3][11] - 模型能力差异源于数据配比和训练优先级选择,Anthropic专注编程导致其他能力稍弱,OpenAI侧重人类偏好输出[5][10] Google技术团队与资源整合 - Google DeepMind由Jeff Dean、Oriol Vinyals和Noam Shazee三位专家形成技术铁三角,分别代表预训练、强化学习和自然语言处理能力[15] - Google Brain与DeepMind合并实现强强联合,前者擅长大规模资源调度和预训练,后者专精强化学习[16][17] - Sergey Brin回归带来"Founder Mode",显著提升团队士气和工作强度,推动Gemini快速迭代[19][20] - Google拥有全球最强计算资源、人才储备和近乎无限的资源投入能力,为Gemini快速反超奠定基础[20] Google的API价格优势 - Google十年前开始布局TPU生态,避免依赖NVIDIA GPU并节省"NVIDIA税"[22] - 基础设施能力远超同行,拥有动态调度大规模集群的独家优势,OpenAI等仍需依赖第三方云服务[22][23] - 软硬件一体化优化能力使Google在成本控制上具备天然优势,API定价策略具有显著竞争力[22][23] - 行业数据显示AI服务存在高溢价空间,Google凭借规模效应可承受更低利润率[23][24] 行业竞争格局演变 - OpenAI早期凭借人类偏好输出领先,Anthropic通过代码能力突破建立优势,Google最终以推理能力实现反超[10][11] - 模型能力发展呈现螺旋式上升,各家在不同领域轮流领跑:写作→代码→推理[10][11] - XAI的Grok在数学领域表现突出,反映创始团队背景对模型特化能力的影响[12] - 编程能力商业化成为焦点,Anthropic明确追求生成可直接投入生产的代码而不仅是解题[12]
消失的人工客服,“智障”的AI客服
36氪· 2025-06-04 10:33
AI客服行业现状 - AI客服在电商、金融、物流、教育、通信、医疗等行业广泛应用,但存在沟通不畅、答非所问、转接人工客服难等问题,损害消费体验[1] - 2024年电商售后服务领域与"智能客服"相关的投诉同比增长56.3%[2] - 30款互联网App实测显示40%无法接通人工客服,接通后超半数需12分钟以上响应[3] AI客服主要痛点 - 无法解决个性化问题、回答生硬机械、不能准确理解提问是用户最不满的三大缺点[2] - 30.98%用户反映智能客服无法照顾老年人、残障人士等特殊群体[2] - 用户需刻意调整说话方式(如咬字清晰)才能与AI客服沟通,稍有不慎即导致理解错误[2] 企业服务策略问题 - 部分企业将AI客服作为削减成本工具,背离"以用户为中心"宗旨[6] - 技术应用存在服务逻辑悖论:用户拨打语音客服时通常问题较复杂,而AI客服应对能力不足[7] - 缺乏有效人工客服转接通道,仅11%App能在4分钟内接通人工服务[3] 技术改进方向 - 需通过优化算法、扩充语料库、提升自然语言处理能力强化AI客服技术[7] - "智能体"技术可提升多系统串联能力(如旅游平台整合机票、酒店等数据)[7] - 应明确AI客服适用场景边界,标准化服务可通过App等渠道完成[7] 消费者行为反馈 - 实测显示消费者明显倾向选择纯人工客服(假设企业同时提供两种服务时)[2] - 中老年用户因操作困难已放弃使用客服热线[5] - 当前AI客服仅代表高效而非优质服务,实际能力与宣传存在差距[5]
微信ai客服怎么处理咨询?哪里查看记录?
搜狐财经· 2025-06-04 09:36
微信AI客服的核心功能 - 微信AI客服通过自然语言处理技术识别和理解客户问题,实现高度自动化咨询处理 [4] - 系统从知识库搜索相关答案并以友好方式回复,复杂问题可转接人工客服确保满意度 [4] - 全程记录咨询详情(时间/内容/结果)用于后续服务分析与改进 [4] 咨询记录管理 - ChatWave后台提供按时间排序的完整互动记录,支持客户名称/咨询日期/问题类型等多维度筛选 [5] - 记录分析可评估AI回答准确率,识别知识库优化需求及客户关注热点 [5] 服务优化策略 - 定期更新知识库内容以适应业务变化和客户需求演进 [6] - 通过数据分析工具挖掘咨询记录中的客户行为模式,指导服务策略调整 [6] - 结合用户反馈优化对话流程设计,提升应答自然度与需求贴合度 [6] ChatWave的差异化优势 - 具备多轮对话能力和精准意图识别的自然语言处理技术 [7] - 自动化功能显著提升效率,减少人工客服工作量 [7] - 深度咨询数据分析为企业提供产品服务优化洞察 [7] - 本地私有AI知识库与定制化语音回复强化数据安全与个性化服务 [1]
腾讯申请一种文本处理模型训练等专利,提升模型改写能力
金融界· 2025-05-28 04:44
公司专利技术 - 腾讯科技申请了一项名为"一种文本处理模型训练、文本处理方法、装置及电子设备"的专利,公开号CN120045650A,申请日期为2023年11月 [1] - 专利涉及自然语言处理技术领域,通过获取样本会话数据并输入第一文本处理模型,生成标注改写关联数据,进而构建改写训练集 [1] - 方案采用第二文本处理模型(数据量小于第一模型)进行训练,目标为提升改写训练集构建效率和质量,同时增强模型改写能力 [1] 公司背景信息 - 腾讯科技成立于2000年,位于深圳市,主营业务为软件和信息技术服务业,注册资本200万美元 [2] - 公司对外投资15家企业,参与招投标项目254次,拥有商标信息5000条,专利信息5000条,行政许可439个 [2] 数据来源 - 信息源自金融界,作者为情报员 [3]
以科技赋能传统文化,豆神动漫开拓传统文化交互体验新范式
齐鲁晚报网· 2025-05-23 16:19
数字文化产品《孔子数字人》2.0版本 - 济宁高新区企业豆神动漫自主研发的数字文化产品《孔子数字人》2.0版本,运用人工智能、3D建模和自然语言处理等前沿技术,打造可交互、可对话的"数字孔子" [1] - 体验者只需站在屏幕前,就能与"孔子数字人"进行跨越时空的对话 [1] - 该产品为传统文化传承与教育开辟了全新模式 [1] 技术特点与交互能力 - 《孔子数字人》不是简单的虚拟形象,而是具备高度智能交互能力的数字文化载体 [3] - 研发团队通过高精度3D建模技术,还原了孔子在历史文献中的形象特征 [3] - 结合三维虚拟技术和AI人工智能,数字孔子能够说话、点头、眨眼,做出各种表情,并进行深度交互 [3] - 用户可通过语音或文字输入提问,数字孔子能对《论语》经典名句和儒家思想哲理对答如流 [3] 应用场景与发展规划 - 《孔子数字人》可广泛应用于教育领域、文化展览、学术研究、文旅景区、博物馆等场景 [5] - 该产品还能担任文旅推荐官,讲述文旅故事,成为数字经济和旅游产业深度融合的有力抓手 [5] - 公司希望通过数字技术打破时空界限,让孔子从课本中"走"出来,成为触手可及的文化导师 [5] - 公司将持续进行技术升级,使《孔子数字人》服务更精细化和专业化,满足不同场景需求 [5] - 该产品将推动各领域产业数字化转型升级和创新性发展 [5]
人工智能专题:2025年中国人工智能与商业智能发展白皮书
搜狐财经· 2025-05-22 00:55
人工智能与商业智能融合(ABI)市场洞察 - 传统BI存在封闭架构、静态处理及技术壁垒等局限性,难以满足实时动态决策需求,而ABI通过自动化数据处理、智能算法及自然语言交互推动决策从被动响应转向主动预测 [1][21][24] - 中国ABI市场呈现爆发式增长,2023年市场规模3亿元,预计2024年达8亿元,2024-2028年CAGR达42%,核心驱动力包括企业数据依赖加深、AI技术突破及政策支持 [1][13] - ABI通过自然语言处理(NLP)、机器学习等技术实现对话式交互、多模态数据分析及复杂推理,例如Text2SQL/Text2DSL将自然语言转化为数据查询指令,RAG技术整合外部知识增强分析深度 [2][45][48] 行业应用场景与案例 - 金融行业通过智能风控与量化交易提升决策精度,如招商银行实现毫秒级反欺诈拦截 [2] - 零售业借助动态定价与库存优化提升运营效率,如京东供应链周转周期压缩至31.7天 [2] - 制造业通过预测性维护与生产流程优化降低停机成本,如富士康"灯塔工厂"人力精简88% [2] - 政务领域依托智能交通与城市治理提升服务效能,如深圳交通通行效率提升30% [2] - 能源行业通过设备诊断与电网调度实现智能化转型,如山东电网设备诊断周期从7天缩至毫秒级 [2] 技术架构与核心功能 - ABI技术分层包括基础层(工具升级)与战略层(决策链路重构),通过自动化数据流水线释放人力冗余,依托智能算法提供动态预测与战略决策支持 [11][13][41] - AI赋能BI四大核心路径:Text2SQL/Text2DSL实现自然语言交互、多模态数据整合、复杂推理(链式思维/多代理协作)、数据叙事(Storytelling)生成 [45][48][52][56] - 大语言模型(LLM)通过预训练内嵌数据分析知识,结合监督微调(SFT)消除非技术人员使用门槛,用户渗透率从传统BI的1%提升至近100% [32][37][38] 数据生命周期与市场规模 - 企业数据生命周期涵盖捕获/维护/使用/发布/归档/删除六大环节,2024年中国数据采集工具市场规模45亿元,数据治理市场198亿元,数据库市场598.5亿元 [16][18][19] - 数据使用环节支出最高,2024年中国数据仓库市场规模73亿元,数据安全市场148.84亿元,反映企业对数据合规与隐私保护的重视 [19] - 现代BI需求包括实时分析、非结构化数据处理、自助式可视化、预测性智能及多源数据整合,推动行业从静态批处理向开放智能分析范式转型 [27][28] 竞争格局与发展趋势 - 全球厂商如微软、Salesforce侧重生态整合,国内厂商如阿里云、帆软聚焦轻量化部署与本土化场景创新 [3] - 未来趋势包括边缘计算与实时分析、生成式AI渗透、隐私计算技术(如联邦学习)及行业深度适配 [3][11] - 行业挑战集中于数据治理滞后、算法黑箱、场景碎片化及技术成本壁垒,需解决"数据-技术-业务"三角失衡问题 [3][11]
一个「always」站在大模型技术C位的传奇男子
量子位· 2025-05-10 02:39
核心观点 - Noam Shazeer(沙哥)是Transformer八位作者中被公认贡献最大的一位,其工作奠定了当今大语言模型的基础[9][10] - 沙哥的技术预判能力极强,多次提前数年看到技术趋势并推动关键突破,如Transformer、MoE、Adafactor等[17][24][40] - 沙哥的职业生涯与谷歌深度绑定,期间主导了多项核心技术研发,如谷歌广告系统、垃圾邮件检测系统等[55][56][58] - 沙哥曾短暂创业Character.AI并获得10亿美元估值,后以27亿美元被谷歌收购并回归领导Gemini项目[67][69] 技术贡献 Transformer架构 - 沙哥在2017年加入Transformer项目后重新编写了整个代码,将系统提升到新水平,论文《Attention Is All You Need》引用量超17万次[18][21][23] - 该论文打破了学术界作者排序规则,八位作者随机排序并标注平等贡献,但沙哥的加入发挥了举足轻重的作用[23] MoE技术 - 沙哥早期与Geoffrey Hinton等合作的研究为MoE(专家混合)新范式埋下伏笔,提出1370亿参数的MoE架构[26][27] - 2020年参与GShard研究,将MoE模型扩展到6000亿参数[30][31] - 2021年Switch Transformers将参数规模推至1.6万亿,速度比T5-XXL快4倍[33][34] - 2022年ST-MoE-32B稀疏模型参数达2690亿,计算成本仅相当于320亿参数密集型模型[37] 其他关键技术 - 提出Adafactor优化器,早期谷歌大模型如PaLM都依赖该技术[43] - 发明Multi Query Attention(MQA)解决Transformer推理效率问题[44] - 提出Gated Linear Layer(GLU)改进Transformer架构的表达能力[46][47] 职业轨迹 谷歌生涯 - 2000年加入谷歌成为第200号员工,开发了谷歌广告系统PHIL和首个垃圾邮件检测机器学习系统[55][56] - 2012年加入Google Brain后转向深度学习,推动神经机器翻译落地[58] - 2023年回归谷歌担任Gemini联合技术主管[59] 创业经历 - 2021年因谷歌未发布LaMDA项目与同事创立Character.AI[62][63] - 公司以"AI角色"概念获得2000万用户,2023年以10亿美元估值融资1.5亿美元[67] - 2023年8月被谷歌以27亿美元收购,沙哥回归领导Gemini[69] 行业影响 - 当前主流模型架构(如GPT-4、DeepSeek、Qwen3等)均建立在沙哥奠定的技术基础上[12][41] - 2020年内部信预测语言模型将主导全球算力,这一判断已被验证[72][73] - 曾担任OpenAI早期顾问并推荐Sam Altman担任CEO[70][71]
海能投顾大数据中心打造精准投资决策支持系统
搜狐财经· 2025-05-08 11:57
金融大数据中心建设 - 公司投入逾2亿元建设分布式计算集群 具备每日处理10PB级金融数据的能力 [1] - "数据立方"系统整合传统金融数据、另类数据及卫星遥感信息等多元数据源 [1] - 独家开发的商业活力指数通过分析全国3800个商圈的手机信令数据 提前2-3个季度预测消费趋势变化 [1] 数据分析技术应用 - 自然语言处理引擎实时解析全球76种语言的财经资讯 情感分析准确率达92.4% [1] - 美联储议息会议纪要解读中 系统30秒内完成300页文档结构化处理 效率较人工提升400倍 [1] - "因子工场"平台沉淀超过1200个有效阿尔法因子 多因子模型在A股市场实现年化21.3%收益 [1] 投资决策支持系统 - 数据中台采用微服务架构 策略回测时间从3天缩短至2小时 [2] - 2023年平台支持产出187个有效投资策略 其中63个投入实战并取得优异表现 [2] - 正在测试量子计算在组合优化中的应用 预计将大规模资产配置求解时间从数小时压缩至分钟级 [2] 创新因子研发成果 - 独创"产业链传导因子"通过分析上下游企业订单数据 成功捕捉新能源行业三次重大拐点 [1] - 商业活力指数在2023年消费板块布局中取得超额收益达15.2% [1]
2025年中国智能呼叫服务平台行业发展现状及未来发展趋势研判:其于AI技术智能呼叫服务平台将逐渐成为主流,行业将更智能、更人性、更融合[图]
产业信息网· 2025-04-29 01:35
文章核心观点 - 全球及中国智能呼叫服务平台市场正经历快速增长,其中基于AI的解决方案是核心驱动力,市场正从“基础自动化”向“认知智能”演进 [1][5][7] - 中国已成为全球最大的基于AI的智能呼叫服务平台市场,受益于数字化转型、AI技术成熟和政策支持 [1][7] - 行业竞争格局呈现多元化,主要参与者包括云厂商、AI技术公司和垂直领域服务商 [12] 智能呼叫服务平台行业定义及分类 - 智能呼叫服务平台是基于人工智能(AI)、自然语言处理(NLP)、大数据分析和云计算等技术构建的智能化客户交互系统 [1][2] - 核心能力包括语音识别(ASR)、语义理解(NLP)、智能路由、自动外呼、数据分析等 [2] - 按技术架构可分为云呼叫中心、本地化部署系统、混合型呼叫平台 [2] - 按交互方式可分为语音呼叫、文本客服、视频客服、全渠道融合客服 [2] - 按功能定位可分为智能外呼系统、智能客服机器人、智能质检平台、预测式客服系统 [2] 智能呼叫服务平台行业发展现状 - **全球市场**:2024年全球智能呼叫平台市场规模为32.2亿美元,较2023年增加7.1亿美元 [1][5] - **全球AI市场**:2024年基于AI的智能呼叫服务平台市场规模为17.7亿美元,较2023年增加4亿美元 [1][5] - **全球市场预测**:预计2025年,全球智能呼叫平台市场规模将增长到40亿美元,基于AI的智能呼叫服务平台市场规模将增长到22.5亿美元 [1][5] - **中国市场**:2024年中国基于AI的智能呼叫服务平台市场规模为30.3亿元,从2022年的18.3亿元增长而来 [7] - **中国市场预测**:预计2025年中国基于AI的智能呼叫服务平台市场规模有望达到40亿元 [1][7] 智能呼叫服务平台行业产业链 - **产业链上游**:主要包括硬件设备(通信设备、服务器、芯片、智能终端)、软件(AI核心技术、大数据)、通信与网络服务商、数据安全服务商等 [9] - **产业链中游**:为智能呼叫服务平台解决方案提供商 [9] - **产业链下游**:应用于企业、政府及公共服务等领域,其中企业领域涉及金融、电商/零售、电信、政务、医疗等广泛范围 [9] 智能呼叫服务平台行业竞争格局 - **主要参与者类型**:主要包括云厂商(如阿里云、百度、腾讯云)、AI公司(如科大讯飞、思必驰)以及垂直服务商(如壹通道、诚立业、众投互联、智元汇、移数通电讯) [12] - **云厂商特点**:依托生态优势提供全链条解决方案 [12] - **AI公司特点**:专注语音交互等核心技术 [12] - **垂直服务商特点**:专注于特定行业的智能呼叫解决方案,相比通云厂商、AI公司更具有独特的市场竞争力 [12] - **代表企业案例**:深圳市壹通道科技有限公司是一家以5G消息服务为基础的“流量+科技”型公司,在数智政务、数字园区、数字工业、智慧文旅、文化传播等产业完成商用落地,经营成为行业领军企业 [14][17] 智能呼叫服务平台行业发展趋势 - 技术驱动行业从基础自动化向认知智能升级,并深度融入企业数字化运营 [18] - 未来行业将向更智能、更人性、更整合的方向发展 [18] - 垂直服务商将进一步与大模型结合,并通过生态合作扩大服务边界 [18]
中国工商银行申请基于自然语言处理的交易汇路匹配专利,解决金融交易中自动匹配汇路的问题
搜狐财经· 2025-04-02 04:52
文章核心观点 中国工商银行申请“基于自然语言处理的交易汇路匹配方法及装置、电子设备”专利,该专利可解决无成交单金融交易无法自动匹配汇路的问题 [1] 公司信息 - 公司成立于1985年,位于北京市,从事货币金融服务 [2] - 企业注册资本35640625.7089万人民币,实缴资本24800000万人民币 [2] - 公司共对外投资30家企业,参与招投标项目5000次 [2] - 公司有商标信息981条,专利信息5000条,拥有行政许可76个 [2] 专利信息 - 专利名称为“基于自然语言处理的交易汇路匹配方法及装置、电子设备”,公开号CN 119741107 A,申请日期为2024年12月 [1] - 方法包括检测新金融交易结果及摘要,未检测到成交单时启动汇路自匹配机制,提取交易要素集合,与现金汇路映射表匹配,选匹配饱和度最高且符合规则的汇路完成清算 [1] - 该专利解决了无成交单金融交易无法自动匹配汇路、影响处理效率和导致清算风险的问题 [1]