Workflow
Agent时代
icon
搜索文档
豆包大模型日均token用量破50万亿后,火山引擎将主战场押注Agent
钛媒体APP· 2025-12-19 10:05
图片由AI生成 在历经"卷"价格争议、DeepSeek冲击波、Agent元年、端侧AI爆发后,豆包大模型又迎来了一次重要更 新。 12月18日,火山引擎正式发布豆包大模型1.8及音视频创作模型Seedance 1.5 pro。 据火山引擎总裁谭待介绍,截至今年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长 超过10倍;目前已有超过100家企业客户累计token使用量超过一万亿。 火山引擎称,权威评测数据显示,最新版大模型在Agent能力、多模态理解等方面已跻身全球第一梯 队。 针对日益增长的视频创作需求,火山引擎推出了Seedance 1.5 pro音视频创作模型。据其介绍,该模型具 备影视级的叙事张力,能够精准捕捉运动细节并细腻呈现人物情绪,更在音画同步技术上取得了突破性 进展。 目前,个人用户已可在豆包、即梦AI等平台体验该模型;企业用户则可通过火山引擎API接入Seedance 1.5 pro模型服务。 多模态能力增强,Agent进入"真干活"阶段 尽管多模态大模型需求旺盛,但行业仍处于早期,技术限制尚未完全突破,谭待也在会后的媒体采访中 表示,需保持耐心,模型会持续进化并逐步解锁新 ...
“AI才女”罗福莉小米首秀
新浪财经· 2025-12-17 16:16
小米自研AI大模型开源与战略发布 - 公司宣布自研AI大模型Xiaomi MiMo-V2-Flash正式开源上线 将其定位为迈向Agent时代的全新语言基座 [1] - 公司已推出包括MiMo-7B、MiMo-VL、MiMo-Audio、MiMo-VL-Miloco、MiMo-Embodied在内的系列大模型 [1] - 公司2025年前三季度收入同比增长32.5%至超过3400亿元 经调整利润同比增长73.5% [1] - 公司手机销量在中国市场2024年1-10月排名第二 [1] - 公司未来五年研发投入预计将超过2000亿元 其中2026年预计研发投入约400亿元 [1] 小米人车家全生态战略 - 公司首次拆解“人车家生态” 产品涵盖个人设备、出行设备、家庭设备 核心技术包括芯片、OS、AI 智能制造覆盖手机、汽车、大家电工厂 [2] - 公司互联网业务已构筑全局生态 覆盖全球100+国家 拥有10亿+终端活跃设备 以及100+独特场景 [3] - 公司在短剧内容领域拥有1000部S级短剧 用户人均短剧消费时长达70分钟 [3] - 公司旗下独立短剧App“围观短剧”主打无广告、全免费、轻量化模式 [3] 核心人才引入与团队建设 - 原DeepSeek核心成员罗福莉首次亮相小米发布会 现任小米MiMo大模型负责人 [1] - 罗福莉此前在朋友圈发文 宣布已加入小米并致力于构建从语言迈向物理世界的AGI未来 [2] - 罗福莉宣布MiMo-V2-Flash发布即开源 模型权重与技术报告均开源 API限时免费 [2] - 罗福莉认为下一代智能体系统应是真正理解世界并与之共存的“智能体” 而非“语言模拟器” [2] - 罗福莉现场为小米大模型Core团队进行招募 称其为研究、产品与工程深度耦合的年轻团队 [2] - 罗福莉拥有北京师范大学计算机本科及北京大学计算语言学硕士学历 曾任职于阿里巴巴达摩院和DeepSeek [3]
小米自研大模型MiMo-V2-Flash正式开源上线,卢伟冰:迈向Agent时代的全新语言基座
新浪财经· 2025-12-17 02:34
新浪科技讯 12月17日上午消息,在今日的2025小米人车家全生态合作伙伴大会上,小米集团合伙人、 集团总裁卢伟冰发表《一路同行,澎湃未来》的主题演讲。 他宣布小米自研AI大模型Xiaomi MiMo-V2-Flash已正式开源上线,他将其称为迈向Agent时代的全新语 言基座。 根据卢伟冰公布的小米自研MiMo系列的时间表,目前小米已经推出推理大模型MiMo-7B,视觉推理大 模型MiMo-VL,原生端到端音频生成模型MiMo-Audio,端侧视觉语言大模型MiMo-VL-Miloco,具身 大模型MiMo-Embodied。 新浪科技讯 12月17日上午消息,在今日的2025小米人车家全生态合作伙伴大会上,小米集团合伙人、 集团总裁卢伟冰发表《一路同行,澎湃未来》的主题演讲。 他宣布小米自研AI大模型Xiaomi MiMo-V2-Flash已正式开源上线,他将其称为迈向Agent时代的全新语 言基座。 根据卢伟冰公布的小米自研MiMo系列的时间表,目前小米已经推出推理大模型MiMo-7B,视觉推理大 模型MiMo-VL,原生端到端音频生成模型MiMo-Audio,端侧视觉语言大模型MiMo-VL-Milo ...
豆包和OpenAI,都在押注同一个未来
钛媒体APP· 2025-12-04 01:00
豆包手机助手预览版发布与市场反应 - 豆包于12月1日发布豆包手机助手预览版,基于豆包大模型能力,通过与手机厂商合作获得授权,用户可通过语音指令让其完成跨平台商品比价下单、查车位、订餐厅、打开汽车前备箱等复杂操作[3] - 官方售价为3499元,官方渠道售罄后,第三方渠道出现加价转售,二手价格普遍达到3999元至4999元,部分卖家以约300元价格转售购买资格F码[3] - 豆包公司强调没有开发手机的计划,正在与多家手机厂商推进手机助手的合作落地计划[3] AI助手对移动互联网流量入口的潜在颠覆 - 当用户习惯用对话交代AI任务后,移动互联网最核心的App流量入口地位将大幅下降,淘宝、美团等App可能沦为被AI调用的工具[3] - AI助手作为用户与服务的唯一中介,在后台自主完成比价、跳转、下单等动作,使传统App作为流量入口的价值面临瓦解[5][7] - 新的交互模式可能使当前的流量广告失去价值,AI手机助手作为新入口可能催生如直接收取“Agent佣金”等新的商业模式[7] 系统级AI应用落地的挑战与竞争 - 豆包手机助手通过与手机厂商合作,渗透操作系统底层,获得了跨应用的调度权限,这是Agent时代软件驱动硬件的典型案例[4][9] - 系统级AI的落地面临与现有流量生态利益分配者的直接冲突,头部手机厂商可能不愿将关键入口让给其他公司,因其自有语音助手(如小米小爱、华为小艺)是嵌入操作系统、服务生态闭环的核心枢纽[7] - 豆包手机助手的跨应用调度能力威胁到微信、淘宝等超级App的核心流量,目前其操作手机功能已不再支持操作微信[3][8] 全球科技巨头在AI与硬件融合领域的竞争 - AI与硬件的深度融合被视为下一轮革命级机会,甚至被视作下一次“iPhone时刻”,正在成为全球科技巨头角逐的下一战场[9] - 苹果公司计划于明年春季推出升级版Siri,将使用定制版谷歌Gemini人工智能模型驱动部分新功能,为此苹果每年将支付约10亿美元以获得谷歌的技术使用权[10] - 谷歌正将Gemini深度整合进Android操作系统,期望让其成为系统级AI助手[10] - OpenAI则试图跳出手机和PC的既有框架,从零开始定义下一代以人工智能为核心的革命性设备,并邀请了初代iPhone的设计师艾维参与研发[11] AI原生终端的发展前景与行业影响 - 在手机行业存量竞争背景下,AI原生手机是少有的增量故事;对互联网行业而言,入口之争从浏览器到App,现在转向AI[12] - 豆包押注系统级入口,踩中了行业结构性机遇:当用户习惯从查阅APP转向发出语音指令,移动互联网的游戏规则可能彻底改变[12] - 未来竞争终局充满变数,焦点在于AI助手是会在现有手机或PC终端内逐步进化,还是会出现一个原生AI终端彻底颠覆人机交互[12]
产品经理的工作可能要反过来做了
36氪· 2025-11-24 02:23
软件产品范式演变 - 过去几十年软件产品底层逻辑是系统不理解用户,必须设计界面、流程和功能来教会用户如何操作[5][11] - 这一逻辑导致产品必然走向臃肿化,为满足不同客户需求而不断增加定制化功能,最终产品变得同质化[6][7][8][9] AI技术带来的根本性变革 - 大语言模型的出现吞并了传统产品设计中需要手工设计的界面、流程和功能等核心要素[10][12] - 技术底层更换导致整个产品世界需要重新构建,AI具备理解上下文、自主规划步骤和跨工具执行任务的能力[12][13] 当前AI产品发展路径 - 从底层基础设施重构开始,文档、表格、操作系统等最通用底层的"土壤"最先生长出智能能力[17][19][21][22] - 通过Chatbot对现有系统进行渐进式改造,这是一种风险较低的软着陆方式,让用户逐步适应无界面交互[23][25][26][28][29] 未来产品形态展望 - 软件将从"工具"演变为"生命体",具备持续性、感知能力和意图理解,形成新的"意图层"[30][31][33][35] - 未来产品设计核心是定义场景中的角色和交互方式,为Agent装配意图理解、情绪感知、推理行动等能力[37][38][39][40] - 产品经理角色将转变为设计具备性格、本能和行为边界的智能Agent,而非传统功能按钮[41]
马斯克:5-6 年后手机大变样!科创人工智能ETF华夏(589010) 午后弱势整理,市场情绪趋于谨慎
每日经济新闻· 2025-11-04 06:43
科创人工智能ETF市场表现 - 截至13:52,科创人工智能ETF报1.386元,跌幅2.39%,全天维持震荡下行格局,分时均线呈持续压制态势 [1] - 开盘价1.418元,最高1.42元,最低触及1.386元,逼近日内低位 [1] - 成分股方面,仅1只上涨、29只下跌,奥比中光、星环科技、凌云光等跌幅居前,最大跌幅超7% [1] - 近五日资金净流入较前期显著收窄,11月3日流入约1271万元,较此前六千万级水平明显降温 [1] AI行业技术发展前景 - 特斯拉CEO马斯克预测未来5-6年传统手机与App将消失,人类消费的大多数内容将由AI生成 [2] - 未来手机将作为AI推理的边缘节点,配备无线电模块,服务器端AI将与设备上的AI通信并实时生成用户想要的视频 [2] - 银河证券指出Transformer架构带来三大结构性红利:研发侧规模效应成立、部署侧边际成本递减、数据侧出现飞轮效应 [3] - Transformer作为通用引擎将持续吞噬剩余模态孤岛,为Agent时代提供"一个模型、任意任务"的底层支撑 [3] 科创人工智能ETF产品特征 - 科创人工智能ETF紧密跟踪上证科创板人工智能指数,覆盖全产业链优质企业 [3] - 该产品兼具高研发投入与政策红利支持,20%涨跌幅与中小盘弹性助力捕捉AI产业"奇点时刻" [3]
DeepSeek:UE8M0 FP8是针对即将发布的下一代国产芯片设计
智通财经网· 2025-08-21 08:23
模型技术升级 - DeepSeek-V3.1采用UE8M0 FP8 Scale参数精度[1] - 对分词器及chat template进行较大调整,与DeepSeek-V3存在明显差异[1] - UE8M0 FP8精度针对即将发布的下一代国产芯片设计[1][2] 产品部署与更新 - 当前官方网页端、App、小程序及API开放平台调用模型均已同步更新至新版本[2] - 新模型具备更新的自我认知能力[2] 用户反馈与期待 - 用户期待尽快解锁图片和视频功能[2] - 用户表达对产品进一步优化的期待,并称其为国产之光[2]
DeepSeek-V3.1正式发布,迈向 Agent 时代的第一步
华尔街见闻· 2025-08-21 06:39
产品升级 - 公司发布DeepSeek-V3.1版本 引入混合推理架构 支持思考模式与非思考模式 [1] - 新模型思考效率显著提升 相比DeepSeek-R1-0528版本 能在更短时间内给出答案 [1] - 通过Post-Training优化 模型在工具使用与智能体任务中的表现有较大提升 [1] 定价策略 - 公司调整API接口调用价格 输入费用为0.5元至4元/百万tokens 根据缓存命中情况区分 [1] - 缓存命中情况下输入费用为0.5元/百万tokens 缓存未命中情况下为4元/百万tokens [1] - 输出费用统一调整为12元/百万tokens [1] 实施时间 - 新价格政策将于北京时间2025年9月6日凌晨起正式实施 [1]
马斯克疯狂点赞,Lovart凭什么是世界上第一个设计智能体?
搜狐财经· 2025-07-12 05:18
Lovart的核心定位与市场表现 - 产品在海外科技圈迅速引爆 官方视频播放近百万 推特引发5000条讨论 马斯克点赞 24小时内超2万名用户申请试用邀请码 [3] - 区别于现有AIGC工具 定位为"创意团队"而非单一工具 重构AI时代创意工作生产关系 [3][8] - 创始人陈冕提出"SaaS本质是服务由人提供 而AI成为服务主体" 商业价值在于提升甚至替代特定职业生产效率 [8] 产品创新与交互设计 - 采用"画布+对话框"交互范式 左边无限大画布(桌子) 右边对话框 支持自然语言指令修改作品 [9][10] - 交互设计复刻"甲方站在设计师旁指点"场景 将复杂工作流封装为自然沟通方式 [9][11] - 不同垂直领域AI需要不同交互界面 设计领域需共享视觉空间 纯对话交互不足 [11] 竞争策略与行业洞察 - 避开与Adobe、Midjourney等巨头正面对抗 聚焦创意个体户和Prosumer群体 [14] - 选择"价值链条最长、最痛苦、最依赖人工协作"领域 用AI Agent端到端打通 [13] - 判断Midjourney代表1.0时代已成熟 ComfyUI的2.0时代门槛过高 果断下注Agent代表的3.0时代 [15][16] 行业变革与未来展望 - 从取代单一工具到取代个体职业 最终可能取代具有协作能力的团队 重构生产关系 [19] - 让顶尖设计能力突破价格壁垒 向所有人平权开放 [19] - 创始人经历互联网行业大战后 认为AI浪潮是创业者的救赎机会 [19]
HDC2025丨华为发布鸿蒙智能体框架白皮书,全面迈入Agent时代
搜狐财经· 2025-06-23 07:20
鸿蒙智能体框架发布 - 公司发布鸿蒙智能体框架(HMAF)及《Agent时代,鸿蒙应用生而智能白皮书》,定义操作系统、应用与智能体的交互协同范式 [1][3] - 框架构建智能体价值网络,核心包括交互升级、协议升级、高效开发、安全可信,通过通信协议打破应用与智能体协作壁垒 [6] - 智能体与系统深度融合,通过小艺语音、导航条等入口精准分发用户需求,缩短操作路径 [8] 小艺智能体开放平台 - 平台提供全周期开发解决方案,支持LLM、工作流、A2A等多元模式,适配不同业务逻辑 [9] - 开发者可调用50+鸿蒙系统插件,通过意图框架兼容MCP工具,实现多智能体协同并一键发布至市场 [12] 首批鸿蒙智能体生态进展 - 50+先锋鸿蒙智能体即将上线,华为天气、音乐助手、浏览器AI摘要等自有应用智能体已实现场景化服务 [13] - 生态伙伴如深圳航空、喜马拉雅、微博、大众点评等智能体快速跟进,讯飞、海底捞、京东等也在开发中 [15] 鸿蒙AI能力开放现状 - 11类AI控件被4000+应用接入,240+标准意图接入470+项服务,小艺升级为系统智能体,提升规划推理、智慧问答等能力 [17] - AI能力融入系统后,小艺支持真人感对话、AI修图、小艺慧记等功能,覆盖手机、电脑、手表等多设备 [17]