大模型

搜索文档
万咖壹联盘中涨超7% 与阿里云签订全面合作备忘录 打造AI营销智能体生态矩阵
智通财经· 2025-09-05 02:33
股价表现 - 万咖壹联股价盘中上涨7.29%至1.03港元 成交额737.44万港元 [1] 战略合作 - 公司间接非全资附属公司苏州龙盈软件与阿里云签订全面合作备忘录 合作期限暂定三年 [1] - 合作依托阿里云通义千问大模型及全球云基础设施 结合公司移动广告及手机厂商生态积累 [1] - 共同打造AI营销智能体与AI手机智能体双引擎 推动全球营销行业智能化升级 [1] 合作推进阶段 - 基建期(2025年):公司独有行业数据与阿里云通义千问大模型完成融合训练 [1] - 扩张期(合作1至2年内):各类AI智能体产品研发及应用 [1] - 生态期(合作2至3年内):打造AI营销智能体生态矩阵 形成AI底座→AI智能体矩阵→场景商业应用的飞轮闭环 [1]
港股异动 | 万咖壹联(01762)盘中涨超7% 与阿里云签订全面合作备忘录 打造AI营销智能体生态矩阵
智通财经网· 2025-09-05 02:21
股价表现 - 万咖壹联股价盘中上涨超过7% 截至发稿时涨幅达7.29% 报1.03港元 成交额737.44万港元 [1] 战略合作 - 公司间接非全资附属公司苏州龙盈软件与阿里云正式签订全面合作备忘录 合作期限暂定为三年 [1] - 合作将依托阿里云通义千问大模型及全球云基础设施 结合公司在移动广告及手机厂商生态的积累 [1] - 双方将共同打造"AI营销智能体"与"AI手机智能体"双引擎 推动全球营销行业智能化升级 [1] 合作实施阶段 - 基建期(2025年):公司独有行业数据与阿里云通义千问大模型完成融合训练 [1] - 扩张期(合作1至2年内):各类AI智能体产品研发及应用 [1] - 生态期(合作2至3年内):打造AI营销智能体生态矩阵 形成"AI底座→AI智能体矩阵→场景商业应用"的飞轮闭环 [1]
传 DeepSeek AI 代理新模型年底发布;马斯克「金色擎天柱」首曝;比亚迪不回应销量下调传闻 | 极客早知道
搜狐财经· 2025-09-05 01:29
AI模型与智能体发展 - DeepSeek正在开发具备多步操作执行及自我学习能力的AI智能体模型 目标第四季度发布 旨在与OpenAI等美国竞争对手竞争 [1] - OpenAI向免费用户开放ChatGPT Projects服务 该服务可整合对话至主题文件夹并支持文件添加和自定义指令 [2] - 字节跳动为Seed部门AI大模型技术员工发放期权津贴 按月归属 每月价值9万/11万/13.5万元 首批连续发放18个月 总价值约170万至256万元 [6] - 字节Seed团队研究方向涵盖LLM、语音、视觉、世界模型等 其豆包大模型已支持超50个应用场景 [7] 人形机器人技术突破 - 特斯拉Optimus人形机器人展示全新金色外观和拟人手部设计 具备带路导航能力 被评价为可替代20万-50万美元人类工作的生产力突破 [4][5][6] - Figure机器人展示餐具整理能力 可处理杂乱堆叠物品并完成厘米级精度操作 此前已具备物流分拣和衣物折叠能力 [8][10] 企业战略与人力资源 - 小米集团今年接收7000名应届生 并为其提供月租1999元的青年公寓2600套 公司将应届生培养视为未来十年发展的战略性工作 [7][8] 新能源汽车动态 - 比亚迪被传将2025年销量目标从550万辆下调16%至460万辆 公司未予回应 前8月累计销量286.39万辆 同比增长23% [10] - 保时捷纯电卡宴将支持11kW无线充电 通过空气悬挂自动调节实现10-15厘米充电间距 特斯拉Cybercab亦计划支持该技术 [11] 消费电子新品 - 华为发布24999元三折叠屏手机Mate XTs非凡大师 配备手写笔并在智能、影像方面升级 目前占据中国三折叠屏市场100%份额 [13] - 华为同步推出MatePad Mini等产品 覆盖多尺寸屏幕市场 [13] 游戏产业热点 - 《空洞骑士:丝之歌》正式发售 售价76元 该游戏为2019年公布的动作游戏续作 长期位居Steam愿望单榜首 [17] 汽车产品创新 - 奔驰预告将推出G级敞篷版皮卡车型 采用四门设计配货箱 车顶可部分开启 预计在慕尼黑车展首发并全球发售 [15]
李飞飞的答案:大模型之后,Agent向何处去?
虎嗅· 2025-09-05 00:34
论文核心观点 - 李飞飞领衔的14位专家团队发布80页Agent AI综述 提出统一的多模态智能体认知框架 为行业提供前瞻性发展蓝图 [1][2][3][5][6][61] 技术架构 - 建立感知-决策-行动加记忆与学习的五模块认知闭环架构 形成动态迭代的智能交互系统 [9][10][26] - 感知模块支持多模态信息输入 包含视觉听觉文本传感器数据 并具备任务规划与技能观察能力 [12][13][14] - 认知模块由大语言模型和视觉语言模型驱动 负责多步推理与策略制定 [16][17] - 行动模块生成物理世界或虚拟世界的操作指令 通过控制器改变环境状态 [18][19] - 学习模块支持预训练/零样本/强化学习/模仿学习等多种机制 通过环境反馈持续优化 [20][21][22] - 记忆模块实现持久化结构化存储 保留知识逻辑推理路径 支持经验复用 [23][24][25] 基础模型作用 - 大语言模型和视觉语言模型为智能体提供世界知识库与零样本规划能力 显著降低任务规则编写成本 [28][29][31] - 模型存在幻觉问题 Agent通过环境交互获得物理规律反馈 倒逼模型与现实世界对齐 [32][33][34][35] - 基础模型可能继承社会偏见 需通过多元化训练数据和偏见检测机制确保包容性 [36][37] - 在医疗等敏感领域需建立数据隐私保护框架 通过提示工程和人类监督层确保安全可控 [38][39] 应用场景 - 游戏领域可创建具备记忆情感的NPC 支持自然语言交互与动态行为调整 显著提升开放世界沉浸感 [41][42][43][44] - 作为AI副驾驶自动生成游戏关卡道具及3D场景 大幅提高开发效率 [45] - 机器人领域实现自然语言指令解析 自主规划复杂物理操作序列 [47][48] - 通过GPT-4V理解人类演示视频并转化为可执行任务 简化编程流程 [49] - 采用领域随机化技术增强模拟到现实的迁移能力 提升环境适应性 [50] - 融合视觉语言触觉等多模态信息实现精细环境交互 如根据"易碎"指令调整抓取力度 [51] - 医疗领域作为聊天机器人进行初步问诊病史收集 提升初级诊疗覆盖率 [54] - 连接实时医学数据库实现事实核查与来源引用 抑制模型幻觉保障诊断准确性 [55] - 处理分流患者信息并监控慢性病体征数据 实现高效个性化健康管理 [57] 发展挑战 - 需突破视觉语言听觉动作等多模态深度融合技术 而非简单拼接 [59] - 需开发跨游戏机器人医疗等不同领域的通用智能体 而非定制化模型 [60] - 建立科学评测体系如CuisineWorld多智能体协作基准和VideoAnalytica视频理解基准 [61]
苹果沉默一年,终于亮出AI底牌
虎嗅· 2025-09-04 14:21
苹果开源视觉语言模型FastVLM和MobileCLIP2 - 苹果在HuggingFace上全面开源视觉语言模型FastVLM和MobileCLIP2 构成端侧AI小模型战略核心 [1][3] - FastVLM在部分任务响应速度比同类模型LLaVA-OneVision-0.5B快85倍 视觉编码器规模缩小3.4倍 [2][6] - FastVLM-7B版本与Cambrian-1-8B对比时性能更优 生成首个token响应速度快7.9倍 [6] 技术架构与性能表现 - 采用新型混合视觉编码器FastViTHD 结合卷积网络和Transformer 输出更少但更精华的tokens [7][9] - 支持高分辨率图像快速编码 在iPhone等个人设备实现实时任务处理 [5][14] - 提供0.5B/1.5B/7B多个版本 实测单帧画面分析时间仅1-2秒 8帧解读在几秒内完成 [13][17] 端侧AI战略定位 - 苹果通过小模型战略强化隐私保护 数据处理完全在设备端完成 避免云端传输敏感信息 [43][49] - 端侧AI保障用户体验可靠性 摆脱网络依赖 在无信号环境下保持核心智能功能在线 [50] - 利用A系列/M系列芯片边际性能 将计算任务分配至本地设备 形成经济可持续的商业模式 [51][53] 行业背景与战略布局 - 苹果面对AI竞争压力 内部组建AKI团队瞄准ChatGPT 同时推进端侧小矩阵模型开发 [40][41] - 2024年7月发布DCLM-7B开源模型 性能逼近Mistral-7B/Llama3等同级模型 [41] - WWDC 2024宣布Apple Intelligence由多专业小模型组成 处理邮件整理/文稿润色等日常任务 [41] 行业趋势与差异化路径 - 英伟达等企业重视小模型作为Agent未来 初创公司聚焦医疗/金融等垂直领域微调应用 [54] - 苹果端侧战略与其硬件生态/隐私承诺深度绑定 区别于行业主流云端大模型路径 [43][56] - 行业普遍追求参数规模时 苹果通过专才型小模型在细分场景实现更精准性能表现 [50]
盘后,DeepSeek,传出重磅消息!
券商中国· 2025-09-04 12:58
DeepSeek AI代理模型开发进展 - 中国AI公司DeepSeek正在开发具备更先进代理功能的人工智能模型,目标是在用户极少指示下执行多步骤操作并能根据先前操作学习改进,计划于今年第四季度发布新款软件 [1][2] - 新型代理模型反映科技行业更大转变,OpenAI、Anthropic和微软近几个月已各自启动代理软件以简化个人和专业任务,新服务旨在完成从研究度假到编写调试计算机代码等复杂任务 [2] - DeepSeek和行业公司目标是构建越来越自主的人工智能系统,可在几乎不需要人为干预情况下启动和执行复杂现实世界操作,但目前AI代理通常需要相当多人工监督 [2] DeepSeek技术迭代与性能提升 - DeepSeek于5月28日发布R1推理模型升级版本DeepSeek-R1-0528,实测表现在推理能力、编程性能、长文本处理和写作质量等方面均有显著提升 [3] - 8月21日发布DeepSeek-V3.1,重点增强代码理解与Agent任务执行能力,采用UE8M0 FP8精度设计并面向下一代国产芯片优化 [3] - 新模型采用混合推理架构,同时支持思考与非思考双模式,可根据任务复杂度智能切换实现高效推理 [3] - DeepSeek-V3-Think相比DeepSeek-R1-0528响应速度显著提高,在输出token数减少20%~50%情况下表现持平或更快 [3] - 经过Post-Training优化,新模型在工具调用与智能体任务中表现更加出色,执行复杂指令更稳定可靠 [4] 人工智能代理行业前景与政策支持 - 人工智能代理被视为继大模型后的重点赛道,具备自主决策、任务拆解与跨应用协同能力 [5] - 国务院提出到2027年实现人工智能与6大重点领域广泛深度融合,新一代智能终端、智能体等应用普及率超70%,智能经济核心产业规模快速增长 [5] - 到2030年人工智能全面赋能高质量发展,智能终端、智能体应用普及率超90%,智能经济成为经济发展重要增长极 [5] - 政策提出培育人工智能应用服务商,发展模型即服务、智能体即服务等,打造人工智能应用服务链 [5] - 政策有望加速AI应用落地,催动未来五年AI应用及Agent渗透率快速提升,加速在SMB企业中的普及 [6] 行业分析与市场展望 - AI正迈向L3智能体时代,实现从思考到行动的质变,在ChatGPT、DeepSeek等大模型支持下,AI代理正从工具附庸升级为智能协作者,有望重塑人机协作方式 [6] - 海内外科技巨头快速落地相关产品与解决方案,行业竞争趋于白热化,2025年有望成为AI代理商业爆发元年 [6] - 侧重场景属性的企业服务类SaaS厂商有望在AI代理浪潮中率先受益,建议关注国内布局AI代理的协同OA/ERP/CRM/HRM等企业服务类SaaS厂商 [6] - AI代理作为大模型商业化落地核心形态,处于政策驱动与技术突破双重红利期,市场空间广阔且成长确定性强 [6] 市场表现与资金动向 - 在连涨四个多月后,AI概念股最近持续回调,本周一至周四万得DeepSeek指数、AI算力指数、AIGC指数分别累计下跌8.94%、9.25%、7.16% [1] - 近期AI概念股降温主要是资金获利回吐导致,但从长期看AI产业链发展前景依旧广阔 [1]
中美 Agent 创业者闭门:一线创业者的教训、抉择与机会
Founder Park· 2025-09-04 12:22
文章核心观点 - Agent行业在2025年成为AI领域最热话题 但实际落地产品稀少 面临技术、商业化和交互设计等多重挑战 行业正从通用化转向垂直深耕 核心竞争壁垒将围绕环境理解、学习记忆和场景优化能力构建 [5][8][36] 技术实施挑战 - 新一代Agent Model的规划与工具调用能力提升 取代了大量基于规则的工作流编排等外围工程 导致早期工程化工作被大模型能力迭代淹没 [6][10] - 隐性知识获取是核心挑战 包括默会知识(如广告创意规则)、组织共识性知识(如字节各小组Golang使用差异)和企业自定义规则(如ACV计算标准) [11][12] - 环境构建成为实施重点 包含三要素:执行能力(Computer Use)、业务连接(企业系统工具化)和上下文载体(领域术语与企业知识) 其中Context质量决定实际落地效果 [13][14][15] 技术路线选择 - Workflow-based与Agentic技术路线将长期并行 Workflow适用于规则驱动型任务(如订单处理可节省10多人人力) Agentic更适合多步骤灵活任务(如数据分析) [16][17][19] - 企业过往积累的流程机器人和系统集成(如RPA资产)可转化为Agent工具 实现技术路线平滑过渡 [18] 商业化路径 - 大客户(KA)市场预算充足但实施成本高、决策链长 中小客户(SMB)市场呈现民主化机遇 AI将大组织专属运营能力标准化赋能中小企业 [21] - 分层并进策略:通过SMB市场验证产品价值和商业模式 用标准化案例撬动KA市场建立标杆 [21] - 巨头对AI推进持谨慎态度 因生产力提升难以量化 且更关注实际收入而非创新 [22] 产品战略方向 - 通用Agent留存率仅约10% 因场景深度不足(仅60分水平) 垂直Agent留存率可达20%以上 需从通用转向垂直深耕 [23][27] - PPT Agent案例显示 通过专用模型训练(内容检索与排版视觉)、工作流补齐(美化/按大纲制图)和企业知识库对接 可显著提升输出质量 [26][27] 人机交互设计 - GUI操作价值存在争议 但短期内难以绕过现有GUI应用体系 且GUI承载丰富上下文信息 若视觉理解能力提升可能重新凸显价值 [28][29] - 交互颗粒度设计需平衡用户偏好询问与自主推进 关键是通过学习机制记忆用户修正反馈(如LemonAI旅游规划案例) [30] - 借鉴管理学情境领导理论 需建立共享上下文机制使Agent理解权限边界和协作规则 最先进AI产品正尝试让Agent主动提出建议和请求协助 [31][32] 多Agent协作 - 多Agent落地核心矛盾在于上下文共享精度:共享过多退化为单体Agent 抽取不准导致交接失败 [33] - 有效路径采用任务分解加专家模型组合(类似MapReduce模式) 并引入异步协作机制平衡一致性、延迟和成本 [34] 模型能力演进 - Claude Code代表"模型即Agent"路径 Cursor代表"Agent下沉环境"路径 长期护城河在于环境操作、学习闭环、场景优化和多Agent协作标准 [36][37] - 需关注四大技术拐点:长期规划与连续行动能力(如Claude Code)、多模态深度融合、界面自动生成、Context Engineering与记忆机制 [38][39] - 多模型分工比单一超级模型更务实 各模型能力侧重不同:ChatGPT强于战略思考 Gemini覆盖面广 Claude规划与代码能力最强 [40][41][43] 学习记忆机制 - 学习能力是核心挑战 需从认知科学角度构建三类记忆:Semantic Memory(概念记忆)、Episodic Memory(情景记忆)和Procedural Memory(程序记忆) [42][44][45] - 当前AI缺乏Episodic Memory 因企业过程数据稀缺 需通过过程数据收集、人机协作轨迹学习和场景化学习机制建立情景记忆 [44][46] - 前沿探索包括LemonAI通过记录用户修改反馈改进推荐算法 实现从结果导向到过程导向的转变 [47]
万亿蚂蚁帝国的芯片版图
36氪· 2025-09-04 11:04
蚂蚁集团投资芯片公司概况 - 蚂蚁集团近期密集投资多家芯片企业 包括端侧AI芯片创企烨知芯科技和ReRAM新型存储创企昕原半导体[1] - 通过旗下上海云玡等投资主体 已布局清微智能 墨芯人工智能 云合智网 沐创集成电路等多家芯片公司[1] - 投资领域覆盖AI算力芯片 新型存储技术 网络通信芯片和安全加速芯片等多个前沿方向[1][14] 端侧AI芯片投资:烨知芯科技 - 2025年8月29日入股烨知芯科技 上海云玡持股14.2857%成为第三大股东[2] - 公司成立于2025年5月 注册资本129.6296万元 专注于端侧AI算力芯片研发[2] - 产品覆盖4TOPS至80TOPS算力场景 应用于智能眼镜 手机 机器人和自动驾驶等领域[2] 新型存储技术投资:昕原半导体 - 2025年8月26日投资昕原半导体 上海云玡持股1.8692%[3] - 公司成立于2019年10月 注册资本5029.73万元 专注于ReRAM新型存储技术[3] - 业务涵盖AI存算一体IP 系统级存储芯片和嵌入式存储三大领域 已实现商用出货[3] - 字节跳动旗下公司持股超13% 为第五和第六大股东[3] 微显示芯片投资:Jade Bird Display - 蚂蚁独角兽基金参与2025年8月数亿元B1轮融资[4] - 上海云玚2024年6月参投Pre-B轮融资 持股0.5874%[4][5] - 公司成立于2015年10月 注册资本5822.2825万元 专注于0.3英寸以下MicroLED研发[5] - 技术覆盖集成电路设计 MOCVD材料生长和封装测试等全产业链环节[5] - 产品已应用于近50款AI眼镜 客户包括Rokid 影目科技和阿里巴巴等[5] - 股东包括阿里云 吉利汽车 比亚迪和三星等产业巨头[6] 可重构计算芯片投资:清微智能 - 2025年1月入股清微智能 上海云玡持股3.9237%[7] - 公司成立于2018年7月 为国内可重构计算芯片代表企业[7] - 已量产十多款智能计算芯片 应用于智能安防 机器人和航空航天等领域[7] - TX8云端芯片系列完成与DeepSeek V3.1模型适配 支持MXFP8和MXFP4格式[7] - 国家大基金二期持股5.3855%为第五大股东 SK海力士和兆易创新也是股东[7][8] 网络芯片投资:云合智网 - 2024年12月入股云合智网 上海云玡持股3.6765%[9] - 公司成立于2020年11月 注册资本4318.65万元 从事高端网络芯片设计[9] - 已研发两款高端超大容量芯片 拥有近150项专利和自主操作系统CuOS[9] - 腾讯旗下公司持股6.7010%为第四大股东[10] 云端AI芯片投资:墨芯人工智能 - 2024年4月领投数亿元B轮融资 上海云玡持股6.0976%[11] - 公司2018年创立于硅谷 总部深圳 注册资本4390.39万元[11] - 为稀疏计算代表企业 拥有40余项全球专利和双稀疏算法[11] - 首款芯片Antoum支持32倍稀疏率 已推出S4 S10和S30系列AI计算卡[11] 安全芯片投资:沐创集成电路 - 2023年11月参与数亿元B轮融资 上海云玡持股11.0000%为第三大股东[13] - 公司成立于2018年12月 注册资本1000万元 专注于可重构安全加速芯片[13] - 核心团队来自清华大学 已开发密码安全和网络控制两大产品系列[13] 投资战略方向 - 投资重点聚焦大模型 具身智能和AI算力等前沿科技领域[14] - 通过"投资—支持—退出—再投资"循环推动科技创新[14] - 同时布局多家AI公司和机器人企业 包括智谱AI 秘塔科技和极智嘉等[15]
“清华系”VS“阿里系”:中国大模型创业的“隐形门派”之争
36氪· 2025-09-04 10:47
中国大模型行业格局演变 - 中国大模型赛道从"百模大战"转向应用生态落地 竞争从巨头与创业公司对垒演化为以技术传承、人才网络和资本图谱为纽带的"隐形门派"博弈 [1] - 清华系(智谱、月之暗面)与阿里系(通义系出走创业者)成为国内AI产业两股最主要新生力量 共同定义行业未来走向 [1] 清华系技术源流与特征 - 技术轨迹起源于清华大学计算机系知识工程实验室(KEG) 唐杰教授团队数十年深耕知识图谱、图神经网络与预训练模型领域 [1] - 智谱为KEG实验室嫡传弟子 北京智谱华章科技有限公司CEO张鹏为清华计算机系博士 坚持GLM架构差异化技术路线 [3] - 月之暗面创始人杨植麟为Transformer-XL与XLNet核心作者 团队兼具清华学派理论深度与硅谷创新节奏 2023年10月发布Kimi智能助手支持20万汉字上下文 2024年3月开启200万字上下文内测 [5] 阿里系产业根基与战略 - 阿里自2017年设立达摩院将AI作为战略方向 通义系列大模型投入海量数据、一流算力集群和复杂商业应用场景 [7] - 2021年推出M6多模态模型 2023年4月发布通义千问(Qwen)系列 迭代至Qwen-3版本 参数量级覆盖0.6B-235B 通过钉钉、淘宝形成"模型+平台+业务"一体化战略闭环 [7] - 阿里系创业者携带独特商业基因 如前阿里副总裁贾扬青创办Lepton I专攻AI架构与GPU云服务 前蚂蚁首席AI科学家漆远创办无限光年深耕金融场景应用 [9] 技术路线分野 - 清华系呈现理论驱动创新特质 智谱GLM系列迭代至GLM-4.5坚持模型结构探索 月之暗面聚焦长文本技术突破 [10] - 阿里系偏向场景驱动工程 围绕业务需求优化模型部署策略 强调推理成本、产品化效率及产业适配能力 擅长构建高可靠AI中台系统 [12] 创业风格与资源获取 - 清华系创始人多为学者或研究员 人才网络围绕清华校友圈构建 智谱融资获国家级基金和产业资本 月之暗面吸引红杉、小红书及阿里等顶级投资方 [13] - 阿里系创始人为实战型将才 决策迭代速度快 依托阿里校友生态 擅长讲述明确商业回报故事吸引财务投资者 [13] 竞合关系分析 - 双方争夺顶尖AI人才、GPU算力和企业级服务市场 深层竞争在于下一代AI应用范式定义权 [14] - 阿里通过战略投资同时布局月之暗面与智谱 形成生态位战略 既保障自研技术又对冲创新风险 [16] - 全行业共同依赖上游芯片供应商和云服务平台 竞争客观上共同教育市场并催熟产业链 [16] 行业发展趋势 - 未来竞争是理论驱动与场景驱动两种路径融合能力的比拼 清华系需加速技术商业化转化 阿里系需构建更深技术护城河 [17] - 最终可能催生兼具理论深度与商业敏锐度的新一代AI企业 推动中国科技产业向长期主义与系统能力回归 [17]