Workflow
多模态数据湖解决方案
icon
搜索文档
火山引擎具身智能闭门研讨会:大模型驱动具身智能产业新未来
财富在线· 2025-07-29 09:15
数据显示,生成式人工智能支出在2024年较2023年增长了6倍以上,其中垂直AI领域更是实现了12倍的 增长,充分印证了大模型产业落地的加速趋势。 从技术演进角度看,具身智能正在经历从Robot 1.0到Robot 3.0的跨越式发展。当前的Robot 3.0阶段,大 模型与机器人的融合有望对感知、决策、控制的整体系统能力带来全面重构。以谷歌的RT-2和Figure发 布的大模型加持机器人为例,端到端神经网络已经能够让机器人理解并执行人类指令,实现真正的人机 对话交互。 火山引擎副总裁张鑫在会上指出,随着技术红利与人工智能的快速发展,我们正在经历从感知AI、生 成式AI到物理AI的演进历程。"2025年是智能体落地的元年,具身智能作为AI技术联通机器人进入真实 物理世界的重要载体,正在成为行业关注的焦点。" 多模态数据湖:破解具身智能数据难题 火山引擎数智平台产品总监王彦辉深入剖析了具身智能发展面临的数据挑战。"数据异构性、高质量数 据获取困难、奖励信号难度量以及缺乏专业数据基础设施,是当前具身智能领域普遍面临的痛点。" 为解决这些挑战,火山引擎推出了专为AI设计的多模态数据湖解决方案。该方案通过统一数据采集 ...
一口气发布4个大模型,火山引擎这次真的杀疯了!
搜狐财经· 2025-06-17 09:09
火山引擎AI产品发布 - 火山引擎发布豆包大模型1.6、豆包・视频生成模型Seedance 1.0 pro等新模型,支持多模态交互、复杂任务处理、内容生成等功能 [2] - 豆包大模型1.6在多模态理解和图形界面操作方面表现突出,能高效处理真实世界问题 [2] - Seedance 1.0 pro可生成1080P高品质视频,在Artificial Analysis评测榜单上文生视频、图生视频两项任务排名首位 [4] - 豆包大模型家族已形成丰富矩阵,涵盖基础语言模型、视觉模型、语音模型等,适用于智能交互、内容创作、数据分析等多元场景 [3] 产品技术优势 - 豆包大模型1.6在复杂推理、竞赛级数学、多轮对话和指令遵循等测试集上表现跻身全球前列 [3] - 豆包1.6系列模型支持自动操作浏览器完成酒店预订、识别购物小票并整理成Excel表格等复杂任务 [3] - Seedance 1.0 pro的主体运动稳定性与画面自然度达到行业领先水平 [4] - 豆包・实时语音模型支持方言演绎、悄悄话、唱歌等特色效果,语音播客模型让双人对话更加自然 [4] 行业应用案例 - 在汽车行业,梅赛德斯-奔驰利用豆包大模型提升智舱信息检索能力及系统反应速度 [8] - 在金融行业,海尔消金构建消费金融垂直大模型,满足90%以上智能化场景需求,解决95%的质量问题 [8] - 在教育行业,火山引擎与超五成985高校合作,浙江大学7天落地"浙大先生"大模型应用体系 [9] - 字节跳动内部AI编程产品TRAE月活用户超过100万,80%工程师使用该产品辅助开发 [12] 技术发展趋势 - 智能Agent将呈现多模态融合深化、边缘智能协同加强、自主学习与决策能力提升等趋势 [14] - 到2028年,至少15%的日常工作决策将借助Agentic AI自主完成 [12] - 边缘智能技术使智能Agent能在边缘设备上完成数据处理与决策,预计2026年全球75%数据在边缘侧处理 [14] - 新一代智能Agent将结合强化学习、元学习等技术,实现动态环境下的自主学习与策略优化 [14]