多模态模型

搜索文档
易鑫张磊:以全栈AI能力构建汽车金融“中国式方案” 推动行业迈向Agent智能时代
智通财经· 2025-08-30 16:46
公司AI技术投入与能力 - 公司累计在研发与AI领域投入超20亿元 年交易规模达700亿元[3] - 自研大模型是汽车金融行业唯一通过国家备案的模型 并实现DeepSeek-V3本地化部署与全面应用[3] - 构建覆盖预训练 后训练及多尺寸领域的全栈AI能力体系[3] AI技术融合业务场景演进 - AI技术融合分为三阶段:1.0判别式AI时期"人主AI辅" 2.0深层次AI阶段大模型参与判断 3.0 Agent AI代表"机主人数"动态业务流程[3] - 公司已实现从模型训练到业务应用的全链路AI产品化布局[3] - 产品布局包括自研AI原生话务系统 多模态模型 机器人平台和新媒体创作平台[3] AI在汽车金融全流程应用 - 融资前通过AI自动生成渠道分析报告和多模态资料提取[5] - 融资中依托端到端风控模型直接处理原始信息 减少人工干预[5] - 融资后借助语音情感分析预判客诉风险 制定个性化资产管理策略[5] Agent化业务重构与双轮驱动 - 公司以AI Agent业务面和风控智能链双轮驱动推进Agent化业务重构[7] - 外呼助手 IM助手 审批助手三类智能体通过协同与实时交互在零人工介入下完成全流程操作[7] - 智能体协同显著提升链路效率与决策精度[7] 技术竞争力与行业影响 - AI技术能力在国内市场获得验证 在全球范围展现出竞争力[7] - 中国在AI技术与场景结合的深度上具有独特优势[7] - 公司依托全栈AI能力和成熟业务验证模型持续输出汽车金融领域中国式方案[7]
易鑫(02858)张磊:以全栈AI能力构建汽车金融“中国式方案” 推动行业迈向Agent智能时代
智通财经网· 2025-08-29 11:44
公司AI战略与投入 - 公司作为国内领先金融科技上市企业 以AI为核心驱动力 累计研发与AI领域投入超20亿元 年交易规模达700亿元 [3] - 公司自研大模型是汽车金融行业唯一通过国家备案模型 并实现DeepSeek-V3本地化部署与全面应用 构建覆盖预训练 后训练及多尺寸领域的全栈AI能力体系 [3] AI技术演进路径 - AI技术与业务场景融合分为三阶段:1.0判别式AI时期人主AI辅 2.0深层次AI阶段大模型参与判断 3.0 Agent AI阶段机主人数动态业务流程 [3] - 公司已实现从模型训练到业务应用的全链路AI产品化布局 包括自研AI原生话务系统 多模态模型 机器人平台和新媒体创作平台 [3] 汽车金融业务应用 - AI能力深度嵌入融资前-中-后全流程:融资前通过AI自动生成渠道分析报告和多模态资料提取 融资中依托端到端风控模型直接处理原始信息减少人工干预 融资后借助语音情感分析预判客诉风险并制定个性化资产管理策略 [3] - 公司以AI Agent业务面与风控智能链双轮驱动推进Agent化业务重构 在进件预审批环节通过外呼助手 IM助手 审批助手三类智能体协同实现零人工介入全流程操作 [5] 行业竞争力与全球影响 - 公司AI技术能力在国内市场获得验证 并在全球范围展现竞争力 中国在AI技术与场景结合深度上具有独特优势 [5] - 公司依托全栈AI能力和成熟业务验证模型 持续输出汽车金融领域中国式方案 为AI时代金融科技的服务创新与全球竞争提供重要实践路径 [5]
中信建投阐述2025年AI投资策略:AIPC具备爆款应用诞生的可能性
智通财经网· 2025-07-29 08:30
大模型发展趋势 - 大模型向更强大、更高效、更可靠方向发展,呈现推理模型深化和智能体模型爆发格局[1] - 模型规模和数据量持续突破,大模型展现出显著"涌现能力",实现从量变积累到质变突破[1] - 更强大体现为Scaling Law跨域延伸、推理能力自主进化、多模态深度融合等六方面[1] - 更高效依托MOE架构优化、FP8低精度应用、Mamba新型架构探索及计算效率提升[1] - 更可靠通过Scaling Law降幻觉、实时事实验证、思维链等方法实现[1] 中美AI竞争格局 - 中美两国自研大模型数量占全球80%以上,中国大模型数量接近100款[2] - 中美顶级AI模型能力差距从20%缩小至0.3%,DeepSeek-R1迈出中国AI全面追赶关键一步[2] - 中国企业在算力受限情况下,在更高效方面做到全球领先[2] - 国产模型呈现百花齐放局面,包括豆包Seed1.6、阿里通义千问、KimiK2等[2] - 2025年是世界认知中国人工智能潜力第一年,未来有望走出国门[2] 商业化进展与收入 - OpenAI已实现百亿美金ARR,月度CAGR保持10%环比增速[2] - Claude4 ARR半年时间从10亿美金奔向30亿美金,月度CAGR超过20%环比增速[2] - 截至1Q25,34%美国成年人已采用ChatGPT,相当于PC互联网2003-04年渗透率水平[2] - AI应用下载量达14亿次,占据全球所有应用下载量约1.0%,付费比例超过下载比例[2] - AI应用内购收入占据整体应用(剔除游戏)比例约1.73%[2] 应用渗透趋势 - AI大模型对产业渗透速度超过此前互联网革命,商业化潜力和付费意愿超过传统应用[2] - 落地顺序由容错率与复杂度决定,从高容错、单一任务场景到低容错、高复杂度场景[1] - 本轮AI渗透较互联网时代大幅提速,B端落地进程或超预期[1] - 从行业限制角度看,生产环境与法规限制较少产业会快于限制较多产业[2] AI Agent发展 - AI Agent将成为2025年AI发展重要方向,正进入技术突破与商业化加速阶段[2] - Agent将大模型能力从"做题"延伸到"工作"中,执行任务准确率大幅提高[2][3] - 多智能体集群将带来AI群体智能涌现,进一步提升大模型性能[2] - Agent执行一次任务平均消耗token达到10万量级,大幅超过AI搜索单次问答消耗[3] - Agent发展依赖于数据和生态,具备数据优势、生态体系构建企业更具发展潜力[2] 多模态进展 - 多模态模型历经三阶段发展,当前以"语言为统一交互工具"实现跨模态对齐[3] - 25年上半年全球有超30款多模态模型更新或发布,其中超75%为国产模型[3] - 国产模型在时长上达2分钟,效果多次登顶全球榜单,多端可用且价格更低[3] - 多模态应用C端聚焦社交娱乐,B端侧重营销素材与商品图创作,专业领域降本增效显著[3] - 一分钟视频生成token消耗在10万token至百万token量级[3] 算力需求变化 - AI算力消耗从训练转向推理,带来显著增量需求[1][3] - 增量需求主要来自四方面:互联网大厂AI与业务结合、Agent推理、多模态商业化、主权AI[3] - 谷歌搜索AI模式将带来日均27万亿token消耗,超过其Gemini模型目前日均16万亿token消耗[3] - 超过50%广告主在生成创意内容时使用AIGC,AI营销内容占比超过10%[3] - 快手可灵四五月连续两月付费金额超过1亿,多模态加速渗透带来算力需求提升[3] 算力基础设施投资 - 推理占比提升带动云计算厂商投入产出比清晰化,超卖率有望继续提升[4] - 散热成为AI算力领域核心技术升级方向,单卡功耗从700瓦迭代至2000瓦+[4] - 铜连接在短距数据传输成熟度更高,448G等新技术路线逐步面世[4] - 电源领域高功率带动单W价值提升,5.5KW电源已进入量产阶段[4] - PCB持续升级带动产业链上游升级,覆铜板从M6/M7升级到M8/M9[4] 光模块与先进封装 - 800G光模块2023年开始放量,2024-2026年保持高速增长[4] - 1.6T光模块2025年开始出货,2026年有望放量,产业链迎来量价齐升[4] - Chiplet设计+异构先进封装成为性能与成本平衡最佳方案[4] - 台积电CoWoS封装技术实现计算核心与HBM通过2.5D封装互连[4] - 先进封装市场快速增长,成为国内晶圆代工厂商与封测厂商新成长驱动力[4] 国内算力链发展 - 美国BIS政策持续收紧,国产芯片占比提升是必然趋势[4] - 国内算力消耗快速增长,字节跳动每三个月token消耗接近翻一倍[4] - 5月底字节跳动token消耗为16.4万亿token,预计30万亿token时出现算力紧张[4] - 国内增速斜率更陡峭,国产芯片今年将迎来发展大年[4] C端应用发展 - AI应用普及程度相当于美国PC互联网2003-04年水平,且增速迅猛[5] - AI原生应用以AI为架构核心,软件开发范式从代码、权重到提示词转变[5] - 海外AI应用数量自2023年1月起每月新增超1000款,2024年超4000款[5] - 内容创作工具商业化进度领先,通用助手、垂直领域智能体等多类应用并存[5] B端应用渗透 - 美国企业采用AI技术比例为9.2%,低于C端,大型企业采用率最高[5] - 容错率与复杂度决定B端各场景AI应用落地顺序[5] - 模型推理能力决定复杂任务场景突破速度,模型幻觉率决定容错率场景突破进度[5] - 从AI+搜索/AI+编程场景到具身智能/AI+制药场景尚需一定时间周期[5] 教育领域应用 - 教育因场景清晰性、数据丰富性和需求刚性,成为AI技术落地黄金赛道[5] - AI+教育软件通过算法分析学情数据、动态定制学习路径,实现教学流程智能化重构[5] 医疗制药领域应用 - AI算法在临床前药物发现阶段有深入应用,完全由AI研发新药有望在1-2年内上市[5] - 海外头部临床CRO公司在临床试验中已布局AI多年[5] - AI有望重塑药物发现模式,为制药行业带来降本增效[5] - AI医疗在医疗器械功能、检查检验结果解读、辅助临床决策等多个领域应用价值较大[5] 工业领域应用 - AI+工业沿两条主线突进:增量市场构建AI原生工厂,存量改造解决关键瓶颈[5] - 新能源汽车、光伏等新兴制造领域从零构建AI原生工厂[5] - 传统重工业通过渐进式部署解决关键瓶颈,如钢铁企业用参数优化模型降低能耗[5] - 当AI将分散专家经验凝练为可复用工业智能,传统制造效率边界被重新定义[5] 军事领域应用 - AI正加速落地,广泛用于无人作战系统与战场决策支持[5] - 美军构建三层级作战架构,实现从感知到打击的闭环式智能决策[5] - 系统性赋能无人系统、网络攻防、战场感知、战争推演与后勤保障等五大领域[5] - 未来军事竞争重点关注低轨卫星、AI平台与边缘智能、智能无人系统三大方向[5] 机器人发展 - 机器人大模型训练方式向端到端大模型+世界模型发展[6] - Gemini Robotics已实现视觉-语言-动作三模态深度融合[6] - 具身智能大模型存在数据集不够、思考跟不上运动、缺乏生态等痛点[6] - 多家人形机器人产品已在下游工业客户展开实训[6] - 预计人形机器人市场规模将远超汽车、3C行业,带动相关产业链旺盛需求[6] 智能驾驶进展 - 特斯拉FSD Beta V12.3为第一个使用端到端神经网络版本[6] - 端到端大模型具有数据驱动、上限高、计算效率提升、驾驶体验逼近人类四大优势[6] - VLA通过融合视觉、语言等多模态数据构建"多模态世界模型"[6] - 2025年成上车元年,元戎启行、理想等车企加速布局低速场景试点[6] - 比亚迪将高阶智驾下沉至10万级,带动城市NOA渗透率提升[6] 端侧AI发展 - 端侧硬件多元化高度契合人工智能技术交互需求[6] - 模型分级分工是当前端侧AI阶段性特色,无法承载千亿参数规模大模型[6] - 不同场景下端侧硬件展现不同技术需求:AI眼镜追求轻薄高续航,AI手机追求隐私高效[6] - 技术路线呈现容量更大、电量更足、模型更强、声光屏交互更便捷发展趋势[6] AI PC发展 - AI PC是AI终端重要落地应用场景,产业龙头已明晰新一代AI PC标准[6] - 处理器包含NPU模块的电脑即为AI PC,多数任务能够在PC本地运行[6] - 联想推出ThinkPad X1 Carbon Aura AI元启版,AI算力高达120TOPS[7] - 联想推出全球首款部署Deepseek端侧大模型AI PC,实现70亿参数端侧模型流畅运行[7] - 边缘AI应用示例已从去年1-2个增长至数百个,预计2024年将达到上千个[7]
21对话|联汇科技CEO赵天成:具身智能演进方向的“非常答”
搜狐财经· 2025-07-28 04:37
行业趋势 - 2025世界人工智能大会(WAIC)异常火爆 一票难求 反映出行业热度持续攀升 [1] - 行业周期变化明显:2023年大模型最热门 2024年机器人最热门 2025年进入技术融合后AI落地应用百花齐放的阶段 [1] - 具身智能成为2025年最大热点之一 技术正从实验室走向物理世界实际应用 [1] 公司技术 - 联汇科技是全国最早研发多模态模型的企业 2022年获得工信部大模型检测001号证书 [1] - 多模态模型已从2021年第一代迭代至第五代 迭代速度约为一年一迭代 [2] - 发布全球首个"万物具身"智能体平台OmAgent 面向物理世界 可控制无人机、机器人等硬件载体 [1] - OmAgent具备两大核心能力:基于纯视觉的空间感知能力 以及基于任务的决策能力 [1] - 当前多模态模型技术特点:实时性要求高 低幻觉高准确率 能做深度视觉思考 [2] 技术发展路径 - 具身智能不限于人形 任何有智能的硬件载体都属具身智能 [2] - 不同载体发展阶段不同:人形机器人可能处于L1-L2 四足狗可能进入L3 摄像头/无人机可能达L3-L4 [2] - 具身智能将分载体成熟度、分阶段、分批次落地 [2] 公司战略布局 - 将国际总部落户上海张江 看重其智能终端与具身机器人产业聚集优势 [2] - 选择张江原因:能对接更多供应链企业 且物流/码头/工业制造等领域提供丰富应用场景 [2] - 多模态模型最佳应用场景是赋能智能终端 使硬件具备自主意识和任务完成能力 [1]
师兄自己发了篇自动驾大模型,申博去TOP2了。。。
自动驾驶之心· 2025-07-09 12:56
大模型在自动驾驶领域的应用趋势 - 大模型在自动驾驶功能上的落地逐渐清晰化,理想、华为等公司开始推行VLA、VLM方案 [2] - 下一代大模型需关注轻量化与硬件适配、知识蒸馏与量化加速、高效微调等方向 [2] - CoT方案和VLA+强化学习等高级推理范式成为行业重点 [2] 大模型优化技术研究方向 - 参数高效计算:研究剪枝稀疏化和量化加速等轻量化方法 [3] - 知识动态扩展:探索检索增强生成(RAG)和参数高效微调(PEFT)技术 [3] - 复杂推理优化:研究链式思维(CoT)和强化学习优化(GRPO)等范式 [3] 课程核心内容 - 系统探讨大模型前沿优化方法,包括参数压缩、知识扩展和推理优化 [3] - 关键技术涵盖结构化剪枝、低比特量化、动态检索、多跳推理等 [3] - 实验平台使用主流大模型如LLaMA、GPT,结合理论讲解与实践 [3] 课程目标与收获 - 帮助学员系统掌握大模型优化理论,形成清晰知识体系 [8] - 提升Coding能力,实现论文复现与模型开发 [8] - 提供论文写作方法论、修稿指导与投稿建议 [8] 课程招生与要求 - 招生对象:大模型方向本硕博、申硕申博、AI领域从业者 [9] - 招生人数:6人/期,至多8人 [5] - 要求:具备深度学习基础,熟悉Python和PyTorch,有研究热情 [10] 课程大纲与时间安排 - 12周在线科研+2周论文指导+10周论文维护期 [9] - 每周主题涵盖大模型剪枝、量化加速、PEFT、多智能体协作等 [20] - 最终产出论文初稿,具备投稿潜力 [9] 实验与资源支持 - 提供Baseline代码,涵盖剪枝、量化、多模态推理等方向 [19] - 数据集采用公开资源或垂类自定义数据 [17] - 硬件要求最低2张4090显卡,建议4张或租赁云服务器 [15] 学术支持与成果预期 - 导师提供定制化研究idea,目标SCI 1~4区或CCF A/B/C级别论文 [22] - 课程交付价值包括科研流程、写作方法、论文初稿 [22] - 答疑周期为6个月,确保后续研究支持 [22]
[大模型实践] 卡比人贵时代的深度学习经验
自动驾驶之心· 2025-06-20 14:06
大模型实验方法论 - 选准关键指标指导迭代方向,避免盲目追求表面指标而忽略真正区分SoTA能力的核心指标[1][4] - 识别实验真瓶颈,通过文献阅读和同行讨论排除低效调参,聚焦验证强假设而非网格搜索[1][5] - 平衡大小实验组合:大实验(10B-100B规模)用于发现问题,小实验快速筛选有效想法[1][6] 实验设计与效率优化 - 定性实验需揭示新现象(如长链思维o1/R1的应用突破),而非仅追求定量指标提升[4] - 自动化评测工具可提升效率,公司内部采用多榜单自动测试机制以发现潜在问题[4] - 避免低性价比实验,超参数微调或数据配比研究对大规模模型效果有限[5] 团队协作与资源整合 - 明确团队比较优势分工:卡资源充足者可主导大规模验证,资源有限者聚焦前期idea验证[8] - 通过高频交流与实验记录共享提升协作效率,优化资源分配(如卡调度)[8] - 大模型研发需跨角色协作,需结合社区定位调整团队研究方向[8] 行业技术动态 - 自动驾驶领域技术覆盖30+方向(BEV感知、多传感器融合、轨迹预测等),社区规模达4000+成员[9] - 前沿技术布局包括端到端自动驾驶、世界模型、大模型应用等,产学研结合紧密[9][11]
启明创投周志峰:AI的性能和成本已达到临界点,AI应用将在今年爆发
IPO早知道· 2025-04-29 03:01
AI行业投资框架 - AI行业投资分为三个层次:基础设施层、模型层、应用层 [7] - 基础设施层包括工具链、数据软件、AI安全、训练推理加速技术以及AI芯片和云算力平台等硬件基础 [7] - 模型层公司现阶段通过底层技术创新实现差异化,最终都将转型为应用企业 [7] - 应用层企业将占据AI市场主体地位,预计99%的企业属于应用层,捕获70%-80%的行业价值 [7] AI技术发展阶段 - 2025年将成为AI应用全面落地的关键年份,性能与成本将达到临界点 [4][7][8] - 科技浪潮发展规律显示,底层基础技术成熟后应用才会爆发,AI技术已临近这一阶段 [8] - 过去半年AI模型性能取得突破性进展,最新模型智能水平接近人类天才级别 [10] - 成本优化与性能突破同等重要,行业已进入"普惠成本"时代 [10][11] 启明创投AI布局 - 已投资14家大语言模型、多模态模型、具身智能模型或端到端智驾模型的领军企业,数量在亚洲位居前列 [5] - 协助管理规模达100亿元的北京市人工智能产业投资基金 [6] - 在模型层已布局10余个具备模型开发与创新能力的公司,覆盖大语言模型、3D模型生成、语音生成等新兴领域 [11] - 应用层重点布局AI硬件、AI教育、AI医疗、企业级AI、AI内容平台、具身智能等细分领域 [11] AI商业化路径 - AI商业化将遵循与互联网相似的发展路径,从单一工具向平台性产品转型 [10] - AI技术不仅创造全新产品形态,也能在传统产品中创造巨大价值 [11] - AI应用将渐进式改变生活,而非突然颠覆 [11]