Workflow
智能体
icon
搜索文档
腾讯首次完整披露大模型战略,各业务全面拥抱AI
21世纪经济报道· 2025-05-21 06:40
腾讯大模型战略发布 - 腾讯首次完整披露大模型战略 在2025腾讯云AI产业应用峰会上全面升级大模型矩阵产品 包括自研混元大模型 AI云基础设施 智能体开发工具 知识库及场景应用等 [1] - 公司高管表示AI持续落地将使每家企业成为AI公司 每个人成为AI加持的超级个体 过去一年腾讯各项业务已全面拥抱AI 并观察到产业对大模型的庞大需求 [1] - 未来将加大AI投入力度 重点加速大模型创新 智能体应用 知识库建设 基础设施升级 目标打造"好用的AI" [1] 混元大模型技术进展 - 混元T1自年初上线元宝App后持续迭代 基于TurboS基座新推出视觉深度推理模型T1 Vision和端到端语音通话模型混元Voice 近期将推出实时视频通话AI体验 [2] - 混元已实现图像 视频 3D 文本等全模态开源 未来计划推出多尺寸混合推理模型 包括0.5B到32B的dense模型和激活13B的MoE模型 [2] - 将持续开源多模态基础模型及配套插件模型 包括图像 视频 3D等方向 [2] AI产业发展趋势 - 生成式AI已跨过"可用性"门槛 正从"可用"向"好用"转变 从"部分人用"向"人人能用"发展 [1] - 产业对大模型API调用量和算力需求快速增长 需在交互体验 执行能力 内容准确性 落地成本等方面持续升级 [1] - 优化模型可提升性能与交互体验 智能体赋予独立执行能力 知识库减少模型幻觉 基础设施优化降低训推成本 [1]
2025 全球产品经理大会正式官宣,聚焦 AI 产品实战,全景呈现未来产品图谱!
AI科技大本营· 2025-05-21 06:10
大会核心主题 - 聚焦AI时代产品设计理念,强调"用户体验至上"的乔布斯式原则,探讨如何将技术转化为可感知的用户价值[1] - 提出AI重塑的不仅是技术栈,更是产品构建方法论,需重构体验流与用户心智[36][14] 大会专题架构 - 12大专题覆盖AI产品全生命周期,包括: - **技术实现层**:生成式AI全链路构建(1-5专题)[4][6] - **行业应用层**:金融/教育/制造等垂类场景落地(4专题)[6] - **全球化维度**:中国企业出海策略与挑战(6专题)[7] - **商业闭环**:可持续商业模式设计(11专题)[10][15] 嘉宾阵容亮点 - **技术专家**: - 李建忠提出"范式转换立方体"理论,专注大语言模型软件应用[16] - 胡腾宇拥有12年全栈产品架构经验,主导AWE智能引擎获奖项目[28] - **产品实践者**: - 王保平(玉伯)曾打造语雀/Ant Design等亿级产品,现专注AI创作应用[20] - 杨一溪实现快手DAU增长117PP,美团B端半年拓客500万[21][22] - **跨界创新者**: - 芦良超整合游戏与AI产品经验,主导腾讯gameloop产品[29][30] - 隋哲深耕人机交互领域,拥有游戏/O2O电商多赛道经验[31][32] 内容价值定位 - 强调实战方法论:要求嘉宾分享从0到1及1到N的真实路径[37][40] - 覆盖关键增长环节:包括冷启动策略(9专题)、规模化运营(10专题)、用户价值发现机制(12专题)[9][15] - 突出数据驱动:如支付宝体验度量体系(31)、合成数据算法应用(34)[31][34] 行业趋势洞察 - 技术融合方向:具身智能硬件强调感知-动作闭环部署能力(5专题)[6] - 企业级需求:工具型/平台型AI构建路径受重点关注(3专题)[6] - 生态协作模式:开放品牌合作与内容共创机制[39][40]
腾讯大模型战略首次全景亮相:自研混元大模型、知识库、智能体开发、工具箱一应俱全
新浪科技· 2025-05-21 05:30
腾讯AI战略升级 - 公司全面升级大模型矩阵产品,包括混元大模型、AI云基础设施、智能体开发工具、知识库及场景应用,致力于打造"好用的 AI" [1] - 公司高层提出"每个企业都将成为AI公司"、"每个人将是AI加持的超级个体"的愿景 [1] - 业务已全面拥抱AI,未来将加速大模型创新、智能体应用、知识库建设和基础设施升级 [3] 混元大模型技术进展 - 混元TurboS在Chatbot Arena排名全球前八(国内第二),代码/数学能力进入全球前十 [3] - 推出视觉深度推理模型混元T1 Vision和端到端语音通话模型混元Voice,即将推出实时视频通话AI [3] - 混元图像2.0实现"毫秒级"生图,混元3D v2.5采用稀疏3D原生架构实现代际飞跃,Hugging Face下载量超160万 [3] - 实现全模态开源(图像/视频/3D/文本),计划推出0.5B-32B dense模型和13B MoE模型 [4] 智能体平台发展 - 大模型知识引擎升级为"腾讯云智能体开发平台",整合RAG技术和Agent能力 [4] - 平台支持零代码多Agent协同、工作流模式拖拉拽,降低智能体搭建门槛 [5] - 智能体具备自主任务拆解、工具调用能力,成为企业执行复杂任务的助手 [5] 知识库产品布局 - 升级知识库系列产品(腾讯乐享和ima),服务企业/组织/个人用户 [5] - 乐享知识库累计服务超30万客户,覆盖比亚迪、友邦保险、清华大学等行业标杆 [5] - 提供知识整合、AI问答等功能,提升企业知识流转效率 [5] 行业应用落地 - 代码助手CodeBuddy升级为Craft软件开发智能体,支持自然语言需求到代码全流程生成 [6] - 企点营销云发布"营销云智能体",实现从人群洞察到效果追踪的全链路智能决策 [6] - 办公协同产品全面AI化:腾讯文档支持AI生成内容、腾讯会议接入DeepSeek双模型、电子签实现AI合同管理 [6]
2025 全球产品经理大会来袭,聚焦 AI 产品实战,全景呈现未来产品图谱
钛媒体APP· 2025-05-21 04:20
大会核心内容 - 2025全球产品经理大会将于8月15-16日在北京威斯汀酒店举办 聚焦生成式AI与智能体产品设计、商业落地与用户体验创新等12大专题方向 [1] - 大会主题为"产品与AI如何共创未来" 旨在探索技术转化为用户价值的路径 强调"智能可感、体验可用"的产品理念 [1] 专题板块 - 12大核心专题包括:生成式人工智能产品(GenAI Products)、企业级AI产品与应用(Enterprise AI Products)、Agent智能体产品设计(AI Agents)等 [1][2] - 专题覆盖全产业链:从AI+行业应用落地实践(金融/教育/制造)到具身智能硬件产品 从全球化出海实践到商业模式设计 [2][3][21] - 特别关注产品全链路构建:包括用户研究、交互体验设计、产品战略创新及运营增长方法论 [2][8][21] 演讲嘉宾阵容 - 汇集互联网头部平台与AI创业公司专家:包括CSDN高级副总裁李建忠(大语言模型应用专家)、久痕科技CEO汪源(前网易副总裁)、YouMind创始人王保平(前字节跳动产品副总裁) [4][5][18] - 实战派代表:WPS高级产品总监赵九州(腾讯P12专家)、火星电波CEO冯雷(MiniMax前产品负责人)、索云AI联合创始人胡腾宇(前昆仑万维AI首席架构师) [6][19] - 增长运营专家:快手前增长负责人(主导DAU增长117PP)、美团前高级产品经理(半年实现B端商家钱包用户从0到500万) [5] 大会亮点 - 深度解析生成式AI与智能体产品的设计方法 分享从模型能力到交互体验的全链路构建 [16] - 揭秘中国企业出海策略与AI行业应用最佳实践 包含金融、教育、制造等垂类场景案例 [2][16] - 探讨AI驱动的运营增长方法论 覆盖冷启动到规模化阶段 强调数据驱动与用户价值重构 [8][17] 其他信息 - 大会开放演讲议题征集 截止时间为2025年6月15日 要求分享者具备AI产品从0到1的实战经验 [10][11][15] - 参会者可领取产品人专属礼包 官网提供最新嘉宾与议题动态更新 [13][16]
一文读懂Google I/O 2025 开发者大会:“降低门槛、加速创造”,谷歌开启 “模型即平台” 的 AI 生态新时代
硬AI· 2025-05-21 03:29
Google I/O 2025核心发布 - Gemini 2 5 Pro被定位为公司最强大的通用AI模型 在LLM Arena所有类别排行榜名列前茅[22][24] - Gemini系列模型每月处理token数量从9 7万亿激增至480万亿 增长近50倍 每月活跃用户超4亿[24] - 公司推出Gemini 2 5 Flash轻量版模型 效率提升22% 支持"思考预算"机制控制输出质量与响应速度[6][39][40] 跨平台AI引擎整合 - Android平台深度整合Gemini Nano 提供summarize等轻量功能 同时推出Androidify应用生成机器人形象[17][19] - 新UI系统Material 3 Expressive增强界面趣味性 Android 16引入live updates等性能优化工具[20] - 智能眼镜Moohan支持沉浸式地图和交互式Gemini AI 合作伙伴包括Gentle Monster和Warby Parker[63][64][65] AI开发工具升级 - AI Studio新增原生语音模型支持24种语言 增强函数调用与搜索推理功能[9][11] - Stitch实验项目实现文本提示自动生成App UI设计 可导出至Figma或IDE继续开发[7][8] - Cloud Run支持一键部署应用到线上 集成至VS Code等IDE[16] 多模态与创作突破 - Imagine 4图像模型细节捕捉能力提升 支持中英文复杂字体识别 生成速度快10倍[56] - Veo 3视频模型实现角色一致性控制 可自动合成环境音与对白 口型同步[56][57] - Lyria音频模型结合Music AI Sandbox可生成专业音乐 Flow平台支持AI视频全流程制作[61] 搜索与智能体革新 - 搜索新增AI模式标签页 支持数百字复杂查询 采用Deep Research模型提供结构化答案[46][47][51] - 智能体模式可同时管理10个任务 实验版将向Gemini订阅用户开放[27][29][30] - AI概览功能月活达15亿 推动部分查询量增长10%[46] 订阅与商业化 - Google AI Ultra套餐月费249 99美元 包含Gemini模型最高使用权限及30TB存储空间[69][70][71] - Google Beam视频通信平台采用六摄像头阵列实现毫米级精度3D渲染 将与惠普合作商业化[37]
直击谷歌I/O 2025:谷歌AI眼镜剑指主流市场,未来拍电影全靠“打字”?
钛媒体APP· 2025-05-21 00:35
Gemini模型技术突破 - Gemini 2.5 Pro性能飙升且单位计算成本较前代下降40% [3] - 第七代TPU芯片性能较前代提升10倍,单计算仓算力达42.5 ExaFLOPS [3] - 轻量化模型Gemini 2.5 Flash推理速度提升22%,计划6月开放开发者接入 [9] - 原生多模态能力落地,支持文本、图像、音视频联合推理 [9][15] - 引入"深度思考"能力,实现复杂任务下的延时思考 [12][15] 开发者与用户增长 - 每月处理的AI Token数量从9.7万亿激增至480万亿,增幅超50倍 [3] - 超过700万开发者通过Gemini API等平台构建应用,较去年增长5倍 [3] - Vertex AI平台上的Gemini使用量飙升40倍 [3] - Gemini应用月活用户突破4亿,2.5 Pro版本使用量增长45% [4] - AI概览功能每月覆盖15亿用户,成为最大生成式AI应用场景 [4] 智能体生态与项目 - Project Starlight落地为Google Beam平台,支持3D视频通讯 [8] - Project Astra实现实时语音翻译,支持英语与西班牙语互译 [8] - Project Marina具备多任务处理和教学-重复学习能力,可同时管理10项任务 [8] - 智能体互联计划推动不同智能体共享数据与工具 [9] - AI编程代理"Rose"支持全流程自动化开发 [11] 搜索与交互革新 - AI模式通过Query Decomposition技术实现查询拆解与结构化报告生成 [23] - 推出"个人情境"功能,结合用户偏好数据提供个性化推荐 [25] - Google Lens月活跃用户超15亿,引入实时视觉交互功能 [25] - 搜索引擎从"信息检索工具"升级为"思考伙伴" [20] 生成式内容与创意工具 - Imagen 4强化图文混排与细节表现,可生成高质量海报 [25] - Veo 3实现原声音频生成,画面与背景音效同步生成 [25][27] - 发布AI视频制作工具Flow,集成Veo、Imagen和Gemini [31][33] - Flow支持从灵感萌芽到成片输出的完整内容生产 [33] - SynthID水印技术覆盖超100亿条生成内容,新增多模态检测器 [29] XR与硬件生态 - 发布Android XR平台,支持沉浸式头显与智能眼镜 [36] - 首款搭载Android XR的设备为三星Project Moohan头戴装置 [36] - 新款智能眼镜支持全语音交互与"所见即搜索"能力 [38][39] - 与Gentle Monster等合作推出消费级智能眼镜 [39] 行业影响与趋势 - 技术突破正转化为触手可及的产品体验 [3] - AI从被动工具进化为能自主规划、串联任务的"数字伙伴" [19] - 生成式AI正在重塑影视制作的整个流程 [27] - 人工智能与物理世界的深度融合进程加速 [40]
腾讯研究院AI速递 20250521
腾讯研究院· 2025-05-20 16:01
微软智能体生态布局 - Coding Agent将GitHub Copilot升级为自主编程助手,实现bug修复、代码维护全流程自动化 [1] - NLWeb开源项目支持自然语言交互网站,Agent Factory平台可构建Grok等智能体应用 [1] - Copilot Tuning允许企业用自有数据微调智能体,适配独特语言风格 [1] - Microsoft Discovery具备生成科研想法、模拟结果和自主学习能力 [1] 谷歌AI编程助手动态 - 发布基于Gemini 2.5 Pro的Jules编程助手,每日提供5次免费额度并直连GitHub仓库 [2] - Jules可自主完成代码编写、Bug修复及测试运行,支持生成详细计划并在云虚拟机验证代码 [2] - 即将推出Codecast功能生成代码库音频摘要 [2] 腾讯AIGC游戏引擎突破 - 发布工业级AIGC游戏内容生产引擎"混元游戏",基于百万级游戏动漫数据集训练 [3] - 提供AI美术管线、实时画布、2D美术生成和角色多视图生成功能,后者耗时从12小时缩短至30分钟 [3] - 包含四大图像模型和五大视频模型,首创游戏特效生成模型并支持多种风格实时交互 [3] AI音频工具创新 - ListenHub支持链接/文档转2-3分钟对话式播客,生成速度优于谷歌NotebookLM且中文语音更自然 [4][5] - 产品已开放公测,支持网页/App/浏览器插件,但存在内容长度不可调等限制 [5] 智源向量模型技术领先 - BGE-Code-v1支持14种编程语言,在CoIR和CodeRAG-Bench基准超越商业/开源模型 [6] - BGE-VL-v1.5针对多模态检索优化,BGE-VL-Screenshot在MVRB基准达60.61分SOTA成绩 [6] 谷歌知识管理工具升级 - NotebookLM推出iOS/安卓APP,支持离线听书、实时互动提问和跨平台分享 [7] - 当前支持网页/PDF/视频链接转播客,但仅限海外用户使用 [7] AI科研平台突破 - Microsoft Discovery无需编程即可用超算能力,200小时内发现新型环保冷却剂 [8] - 平台结合基础/专业模型构建AI博士后团队,支持医药/芯片设计等领域研发 [8] 开源机器人进展 - UC伯克利BHL机器人总成本低于5000美元,采用3D打印模块化设计且机械效率达90% [9] - 配备英特尔N95迷你PC和手机级IMU,实现双足行走和遥操作功能 [9] AI编程行业预测 - Anthropic CEO预测AI将在3-6个月内编写90%代码,谷歌已有25%代码由AI生成 [10] - 未来程序员角色或转向AI系统架构师和训练师,人类专注创造性工作 [10] 腾讯知识管理战略 - ima产品定位为AI驱动的"搜读写"工作台,已积累近1000万篇内容 [11] - 通过知识库/知识号/知识库广场三层架构实现从个人管理到生态共建的演进 [11]
京东云总裁曹鹏:大模型正在企业级市场加速爆发
中国金融信息网· 2025-05-20 13:53
大模型应用发展现状 - 大模型应用迎来临界点,基础模型持续升级,深度应用正在开启,企业级市场加速爆发 [1] - 数字员工上岗率将成为衡量未来企业先进性的标准,人工智能完成的工作量决定企业未来发展速度 [1][3] - 行业正加速迈向深度应用阶段,大模型及智能体技术持续升级,渗透到需要大量人力重复劳动的场景 [3][4] 京东云产品发布与成果 - 京东云发布AI算力平台、大模型开发计算平台、JoyAgent智能体2.0等九大产品,以及医疗、工业、金融三大垂直行业一体机 [1][3] - 过去三个月京东云大模型一体机全国规模化落地突破500台,采用"开箱即用"模式助力企业快速部署 [3] - 近三个月京东大模型服务调用量环比增长200%,超1.4万个智能体在内部运行,覆盖零售、物流、医疗等场景,服务超50万商家和38万快递小哥 [4] 智能体技术进展 - 智能体是人工智能深度应用最具代表性的方向,从被动响应需求进化为主动聚焦问题、精准运算、智能决策和执行 [4] - 京东云智能体平台在企业应用场景方面相比通用智能体更具优势 [4] 基础设施挑战与解决方案 - 大模型应用对基础设施提出新要求,需从CPU为中心转向GPU为中心架构,并应对激增的推理计算资源需求 [5] - 京东云提供多场景、多形态、多规格的解决方案,支持企业大模型应用部署需求 [5] - 公司基于内部场景深度应用经验,打造高性价比技术与产品,助力企业重塑AI生产能力 [5]
微软Build大会宣告进入AI智能体时代 Microsoft 365 Copilot、GitHub编码升级,马斯克xAI模型纳入微软云
华尔街见闻· 2025-05-19 23:18
微软Build 2025开发者大会核心发布 - 公司宣布将Windows转变为AI智能体核心平台 原生支持Model Context Protocol协议并推出Windows AI Foundry [2] - 公司展示如何将"AI助理"升级为"AI开发伙伴" 推动AI应用开发与企业运营进入"代理时代" [2] - 公司推出多项AI开发者平台包括Copilot Studio Windows AI Studio等 [4] GitHub Copilot升级 - GitHub Copilot从代码编辑器助手进化为具备Agentic能力的AI智慧伙伴 新增异步代码代理功能 [2] - GitHub Models新增提示管理 轻量级评估机制与企业级控管功能 [2] - 公司开源GitHub Copilot Chat in VS Code 覆盖1.5亿开发者 [3] Microsoft 365 Copilot增强 - 引入Copilot Tuning能力 允许企业用自有数据训练模型 [5] - 新增multi-agent orchestration功能 支持多智能体协同处理复杂任务 [5][7] - 智能体可在Microsoft 365服务内安全执行领域专业任务 [5] Azure AI Foundry更新 - 新增xAI的Grok 3和Grok 3 mini模型 由微软直接托管和计费 [6] - 平台提供超过1900种AI模型 包括OpenAI Meta和DeepSeek的模型 [6] - 推出Model Leaderboard和Model Router工具 自动选择最佳AI模型 [9] Windows AI Foundry平台 - 重新品牌化Windows Copilot Runtime服务 成为本地AI开发统一平台 [10] - 自动检测硬件并获取必要软件组件 保持组件最新状态 [10] - 支持完整AI开发者生命周期 可管理开源LLM或导入专有模型 [10] Edge浏览器AI能力 - 推出新API允许开发者整合AI功能到Web应用 使用内置模型 [10] - 提供Phi 4 mini模型访问 该模型拥有38亿参数且在数学表现优异 [11] - 新增PDF翻译工具支持70多种语言 下月全面可用 [11] NLWeb项目 - 简化构建AI聊天机器人过程 通过几行代码实现对话界面 [13] - 允许网站选择AI模型和自有数据创建语义化交互体验 [15] - 支持MCP协议 使内容可被AI平台发现和访问 [15] MCP协议整合 - 将Anthropic的MCP协议整合到Windows系统 实现AI应用深度交互 [16] - MCP服务器可访问文件系统 窗口管理等功能 [16] - 目标使智能体成为操作系统工作负载的一部分 [16] 开源举措 - 开源命令行文本编辑器Edit 今夏通过Windows Insider计划安装 [18] - 开源GitHub Copilot in VS Code和Windows Linux子系统 [19] - 允许开发者访问源代码并根据用例进行修改 [19]
Jeff Dean:一年内 AI 将取代初级工程师,网友:“Altman只会画饼,Jeff说的话才致命”
新浪财经· 2025-05-18 22:46
AI技术发展预测 - 谷歌首席科学家Jeff Dean预测一年内将出现具备"初级工程师"能力的24/7全天候AI系统[1][13] - AI工程师不仅能够编写代码,还具备人类工程师难以比拟的持续性与规模化潜力[4] - 多模态成为重要趋势,AI输入输出可涵盖音频、视频、图像、文本或代码等多种形式[6] AI行业格局 - 构建最先进AI模型需要大量投资,最终市场可能仅保留少数几个主流模型[8] - 知识蒸馏技术可将强大模型压缩成轻量级模型,适配更多应用场景[9] - 谷歌通过Pathways系统实现单一Python进程控制上万设备,显著提升开发者体验[19][20] 硬件发展趋势 - 专用机器学习硬件如TPU对AI发展至关重要,谷歌已推出多代TPU产品[16] - 模拟计算在功耗效率方面具有优势,可能成为未来推理硬件发展方向[18] - AI计算需求变化推动硬件创新,需要针对训练和推理不同负载优化设计[22] 技术突破方向 - 稀疏模型和混合专家架构可带来10-100倍的效率提升[24] - 动态扩展模型结构比固定模型更具潜力,可优化资源分配[25] - AI正在改变科研方式,神经网络可加速科学模拟达30万倍[17] 产品应用前景 - AI助手可观察用户操作并协助完成任务,如浏览器标签管理[11] - 教育领域可能成为AI杀手级应用场景,可自动生成互动教学内容[10] - 物理机器人智能体在未来几年可能完成数十种实际工作任务[7]