AI Agent技术发展 - AI Agent经历符号Agent、反应Agent、基于强化学习的Agent、具有迁移学习和元学习的Agent、基于大型语言模型(LLM)的Agent五大发展阶段[6] - 基于LLM的Agent使用LLM作为大脑组件或控制器,通过多模态感知和工具利用等策略扩展感知和行动空间[6] - 基于LLM的Agent通过思维链(CoT)和问题分解技术展示与符号Agent相当的推理和规划能力,并能从反馈中学习获得环境交互能力[6] AI Agent技术框架 - AI Agent整体框架分为感知、定义、记忆、规划、行动五类模块,技术框架与智能语音助手存在相似性[10] - 感知模块从单一模态向多模态延伸,涉及文本、图像、视频、3D等多种模态[14] - 规划模块包括子目标分解、反思及提炼等核心功能,其能力来自于底层模型的推理能力[21] - 行动模块输出形式包括文本、工具使用、具身动作等,工具使用主要通过调用外部API实现[23] 多模态感知技术突破 - 端到端原生多模态模型逐步落地,2023年11月Google推出原生多模态模型Gemini,实现在文字、音频、图片、视频、PDF文件等多模态数据训练的突破[16] - 2024年5月OpenAI发布GPT-4o,跨文本、视觉和音频端到端训练,所有输入输出由同一神经网络处理[16] AI Agent与AGI发展路径 - 基于LLM的Agent是通向通用人工智能(AGI)的路径之一,据Google DeepMind分级,当前AGI处于L1阶段,典型代表为ChatGPT、Bard和Llama[25] - 通向AGI的具体路径包括模态丰富、具身智能、多Agent协同、系统优化等[25] - Agent具有语料库-互联网-感知-具身-社会五个层级,多数LLM建立在互联网层级,未来有望通过多Agent协同产生涌现的社会现象[27] Agent工作流优化 - 斯坦福大学测试显示,在HumanEval数据集中,GPT-3.5(Zero-shot)正确率为48.1%,GPT-4(Zero-shot)为67.0%,而与Agent workflow配合后GPT-3.5正确率达到95.1%[30] - Agent workflow包括反思、工具使用、规划、多智能体协作四种模式,通过对LLM应用流程优化提升任务准确性[30] AI在科学研究中的应用(AI4S) - AI4S在数学、物理学、生物医学、材料科学等领域取得成绩,如DeepMind开发机器学习框架帮助数学家发现新定理,AlphaFold将蛋白质结构预测误差缩小到原子尺度,计算时间从数年缩减到数分钟[35] - 材料基因组计划借助高通量计算、大数据、AI等技术,有效缩短材料研发周期、降低研发成本[35] AI赋能材料科学 - 传统材料研发周期长达10-20年,我国高端新材料自给率较低,关键材料依赖进口率达到84%[42] - AI技术能够加速材料研发所有子流程,通过构建行业大模型对齐各环节目标,优化生产流程[43][46] - 材料数据库是AI+材料科学的核心,国内外主要数据库包括Materials Project、AFLOW、OQMD等,中国建立全球首个材料基因工程通则标准[53][57] AI Agent在科研中的具体应用 - AI Agent for Science是AI4S的下一代核心技术,通过构建研发全流程智能体填补研发人员短板[51] - 智能科研平台实现数据、模型、实验效果端到端管理,提升全流程交付效果[62] - 材料领域主要发布模型包括GNOME(生成38万种热力学稳定晶体材料)、MatterGen(无机材料设计)、DARWIN 1.5(材料属性预测和发现)等[58] 2025年AI应用趋势 - 2025年AI应用方向包括端侧Agent、营销技术(Mar-tech)、企业方案决策、CRM、实时互动(RTE)[72] - 端侧Agent功能初步实现,如Anthropic的Claude 3.5 Sonnet显示出色Computer Use能力,智谱AutoGLM展示线上购物及点外卖等Phone Use能力[72] - 企业方案决策受益于AI工具支持,如Palantir的AIP平台推动2024年第三季度美国商业收入同比增长54%[72] AI Agent创投趋势 - 企业数字化转型推动AI Agent开发需求爆发,70%的CEO认为未来3年AI Agent将改变其经营模式[75] - 创投资金从头部通用型Agent向金融、医疗等垂直场景分散,初创企业通过解决细分需求构建壁垒[75] - 多智能体协同成为趋势,AI Agent从单一任务执行向多智能体协作演进[75] - Gartner将AI Agent列为2025年十大战略技术趋势之首,预计2025年成为其商业化元年,2030年市场规模超千亿美元[75]
大模型在小红书推荐的应用 2025