Workflow
RAG
icon
搜索文档
终于,NotebookLM 和 Gemini 合体了。这是什么神之更新?
新浪财经· 2025-12-21 06:21
产品功能整合 - 谷歌Gemini App现已支持用户直接上传NotebookLM中的笔记本作为参考数据源 用户可通过输入框左侧的加号添加一个或多个NotebookLM笔记本 [6] - 该功能目前仅限Gemini Web版本且需Pro会员使用 App版本暂不支持 [4] - 整合后 Gemini可将NotebookLM的笔记本作为外部RAG数据源 旨在使回答更精准 减少幻觉 输出更聚焦和有价值 [9] 应用场景与能力互补 - Gemini可利用上传的笔记本内容执行多种任务 包括根据笔记本生成信息图 进行深度研究 以及编写程序和文档等 [6][7] - NotebookLM自身难以完成的任务 如深度研究 出图 做视频 写程序等 可由Gemini代劳 形成能力互补 [9] - 此次整合被视作从经典RAG到智能体RAG的演进 模型参与从仅限生成答案扩展到检索决策 路由和自我评估等全链路 [12] 当前整合效果与未来展望 - 当前整合效果尚未完善 Gemini有时无法准确识别用户所指的“笔记本”是NotebookLM文件还是普通概念 复杂高级功能仍需在NotebookLM控制台内完成 [10] - 尽管存在不足 但能在Gemini中直接挂载个人知识库被视为一项便利功能 未来体验有望提升 [12] - 有第三方知识库案例显示 其由1300条笔记和260万字构成 具备经典RAG的完整工作流程 而升级为智能体RAG仍需在系统中引入可持久记忆与多源工具等 [12]
安联锐视(301042):深耕安防视频监控产品 加码机器人投资布局新增长曲线
新浪财经· 2025-12-10 04:35
公司核心业务与市场地位 - 公司深耕安防视频监控产品软硬件的研发、生产与销售,核心产品包括前端摄像机和后端硬盘录像机 [1] - 公司以ODM模式为主,为全球科技和消费电子行业的领先客户提供服务,凭借强大的研发和生产能力,已累计开发新产品超过10000个款型 [1] - 产品销往全球六大洲,在全球各地拥有近500家客户,具备完善的全球化产业布局 [1] 机器人产业投资布局 - 公司于11月25日通过两项机器人领域投资议案,加码机器人产业投资,旨在布局新的增长曲线 [1] - 投资800万元参与设立新机器人公司元启联安,持股40%,该公司将专注于具身智能机器人业务 [1] - 斥资256.5万元增资联营公司安兴宇联,增资后持股比例由38%提升至47.5%,成为其第一大股东,该公司经营范围涵盖工业机器人制造、特殊作业机器人制造等 [1] 机器人子公司产品与技术 - 安兴宇联专注特种机器人赛道,核心团队实力雄厚,首席科学家负责AI研发及技术前瞻,总经理深入研究AI语言行业大模型 [2] - 已开发出相对成熟的导览机器人、攀爬机器人、无人机清理机器人等产品,并开始得到市场认可 [2] - 导览机器人接入AI大脑,实现RAG实时检索和多语言讲解,采用多元融合SLAM方案,实现厘米级定位、动态避障及自主移动 [2] - 无人机+产品系列包括:应用于分布式光伏环境的无人机+光伏清扫机器人,用于电力巡检运维的无人机+带电作业工具,以及用于无人区电力建设的重载无人机+吊装工具 [2] 财务预测与增长前景 - 预计公司2025-2027年分别实现营收4.38亿元、6.23亿元、8.77亿元 [2] - 预计同期归母净利润分别为0.32亿元、0.74亿元、1.07亿元 [2] - 预计同期EPS分别为0.46元、1.07元、1.54元 [2] - 公司正积极申请移出SDN清单,安防设备主业明后年有望恢复较快增长,同时持续加码机器人赛道投入,有望打造新增长曲线,未来成长空间广阔 [2]
离谱!裁员裁出新高度了。。。
猿大侠· 2025-12-05 04:11
行业人才市场动态 - 传统后端技术岗位出现裁员优化现象,包括拥有十年经验的资深员工也被裁撤 [1] - 与此同时,市场对AI大模型工程师的需求极为旺盛,出现“一将难求”的局面,有猎头职位持续三个月未招到合适人选 [2] - 技术圈呈现“冰与火”的残酷反差,一边是传统岗位加速淘汰,另一边是大模型人才极度紧缺 [2] - 有行业资深人士指出,市场饱和与内卷加剧导致传统技术岗将失去竞争力,而AI是技术人近几年最好且可能是最后的破局机会 [2] AI大模型岗位需求与薪资 - AI大模型工程师岗位年薪起薪可达120万元 [2] - 招聘岗位月薪范围广泛,例如大模型应用开发工程师月薪为20-40K(15薪),AI应用开发工程师月薪为50-70K(16薪) [2] - 企业急需的大模型工程师必须掌握三大核心技术:检索增强生成(RAG)、AI智能体(Agent)和模型微调 [2] - 具体岗位职责包括:利用AI技术和大模型构建迭代公司AI服务、深入研究大模型技术并评估方案、使用框架开发基于大模型的智能体和RAG产品 [2] - 岗位要求涉及技术包括:RAG、智能体、Java、Agent、深度学习、大模型算法、Python、自然语言处理、多模态算法、机器学习、MySQL、Redis、MongoDB等 [2] 大模型核心技术应用 - 检索增强生成(RAG)技术用于融入外部信息以修正模型输出,可应用于法律文档分析、医疗诊断辅助、金融报告生成等垂类场景,实现精准信息提取 [2][8] - AI智能体(Agent)技术旨在让AI自主工作,通过工具调用和环境交互进行多步推理以完成复杂任务,例如智能客服,可构建用于设备故障诊断或投资分析等场景的智能助手 [2][8] - 模型微调技术针对特定任务优化模型,使其适配业务,需掌握主流大模型(如DeepSeek、Qwen等)的微调技术,并利用制造、医药、金融等领域数据进行模型定制以提升性能 [2][8] 培训课程内容与卖点 - 相关培训课程旨在通过2节直播课,帮助开发者系统掌握RAG、Agent、微调三大核心,并完成企业级项目实战 [3] - 课程内容涵盖从大模型微调到AI Agent智能体搭建,剖析AI技术应用场景,并包含从GPT到最火开源模型的技术覆盖 [6] - 课程提供热门项目拆解以积累实战经验,例如拆解金融行业的“支小助”和“知乎直答”等产品的技术架构 [14] - 课程完课后赠送求职大礼包,包括经典面试题库、高薪岗位解读、企业内推和直聘权益 [3][14] - 额外赠送资料包括《大模型应用案例集》和《AI商业落地白皮书》 [6][14] - 课程由AI大模型领域大佬联合研发,分享丰富的商业化AI应用项目,旨在帮助学员打通技术、原理与实战能力 [14] - 课程还会剖析大厂招聘行情、就业岗位、薪资、技术迭代方法及发展空间,并从面试官角度帮助规划职业发展路径 [17] - 课程声称已开班58期,为超过20,000名学员服务,且很多学员已获得高薪工作机会 [9] - 课程本期提供限时免费预约,名额仅限100人,并预计在24小时后关闭报名通道 [11][20]
确认裁员了,很严重,所有人做好准备吧!
菜鸟教程· 2025-12-04 03:30
行业人才市场现状 - 传统后端技术岗位出现裁员优化,包括拥有十年经验的资深员工也被裁撤 [1] - 与此同时,市场对AI大模型工程师的需求极为旺盛,出现“一将难求”的局面,有岗位持续三个月未招到合适人选 [2] - 技术圈呈现“冰与火”的残酷反差,传统技术岗位市场饱和、内卷加剧,而AI大模型是技术人近几年的关键破局机会 [2] 企业招聘需求与薪资水平 - AI大模型工程师岗位年薪起薪可达120万元 [2] - 招聘岗位月薪范围广泛,例如大模型应用开发工程师月薪20-40K(15薪),AI应用开发工程师月薪50-70K(16薪) [2] - 企业急需的大模型工程师必须掌握三大核心技术:RAG(检索增强生成)、Agent(智能体)和模型微调 [2] - 具体岗位职责包括:利用AI技术和大模型构建迭代公司AI服务、研究评估不同大模型技术方案、开发基于大模型的智能体和RAG相关产品 [2] - 任职要求通常包括计算机等相关专业本科以上学历,并需要掌握Python、Java、深度学习、自然语言处理、多模态算法等技术,有时还要求有优秀开源项目经历 [2] 大模型核心技术应用 - RAG技术用于融入外部信息修正模型输出,可应用于法律文档分析、医疗诊断辅助、金融报告生成等垂类场景,实现精准信息提取 [2][8] - Agent智能体技术让AI能通过工具调用和环境交互进行多步推理,自主完成复杂任务,例如构建智能客服、设备故障诊断Agent、投资分析Agent等 [2][8] - 模型微调技术针对特定任务和场景优化模型,例如利用制造、医药、金融等领域数据进行模型定制,以提升任务准确性和效率 [2][8] - 需要掌握主流大模型(如DeepSeek、Qwen等)的微调技术,并学习SFT、RLHF、提示词工程等方法提升模型性能 [2][8] 培训课程内容与价值主张 - 相关培训课程旨在通过理论结合实战,系统教授RAG、Agent、微调三大核心技术,并完成企业级项目实战 [3] - 课程内容涵盖从大模型原理、核心技术到各种AI工具使用、产品开发实操的全流程,旨在培养全栈开发能力 [13] - 课程提供热门商业化应用案例拆解,例如金融行业的“支小助”、知乎直答等,帮助学员积累实战项目经验并写入简历 [13] - 课程由AI大模型领域专家研发,无偿分享丰富的商业化AI应用项目,帮助学员打通技术、原理与实战能力 [14] - 课程还提供行业招聘行情风向、就业岗位、薪资、技术迭代方法及职业发展路径的剖析 [16] 课程附加福利与成果 - 完成课程后可获得求职大礼包,包括经典面试题库、高薪岗位解读、企业内推及直聘权益 [3][16] - 赠品包括《大模型应用案例集》和《AI商业落地白皮书》 [6][21] - 该课程已开班58期,累计为超过20,000名学员服务,许多学员已借此获得高薪工作机会 [9] - 课程声称能帮助开发者构建技术壁垒、参与前沿项目、避开职业风险并延长未来20年的职业发展 [11] - 课程名额有限,本期仅限100人,并营造紧迫感促使立即行动 [11][19]
大模型技术学习过程梳理:Agent、RAG、通用大模型等......
自动驾驶之心· 2025-11-23 02:04
社区定位与目标用户 - 社区旨在为大模型技术领域的学习者提供交流平台,解决其在学术、应用和工程上遇到的问题 [5] - 目标用户包括从刚入门的研究生到已有基础希望进一步提升的学习者,社区内容设计可帮助小白快速入门,并支持进阶者系统性学习 [2][6] - 社区已构建包含技术路线分享、直播、问答、求职、赛事等多版块的闭环生态,致力于培养行业人才并提供展示机会 [3] 社区资源与合作伙伴 - 社区嘉宾团队正在快速扩张,已邀请来自上海交通大学、清华大学、北京大学、上海人工智能实验室、香港科技大学、香港大学等顶尖高校及科研机构的专家 [5][67] - 工业界合作伙伴涵盖阿里通义千问、美团LongCat、深度求索DeepSeek、字节豆包、百度文心一言、月之暗面Kimi等头部公司 [5][67] - 社区内部已汇聚40多位学术界和工业界专家,未来计划打造为大模型前沿技术聚集地 [67] 核心技术路线覆盖 - 社区提供全面的大模型全栈学习路线图,核心领域包括RAG(检索增强生成)、AI Agent和多模态大模型 [5][6][12] - RAG技术路线细分为Graph RAG、Knowledge-Oriented RAG、多模态RAG、Reasoning RAG等子领域,并提供BenchMark、综述及开源仓库等资源 [13][19][21][22][24][26] - AI Agent技术路线涵盖前沿综述、Agent评测、强化学习、多模态Agent、Agent通讯、基座Agent汇总、自进化Agent及Multi-Agent等方向 [28][30][33][35][37][39][40][42][44] 多模态与模型优化技术 - 多模态大模型训练内容包含多模态大模型(MLLM)、视觉语言模型(VLM)、大模型微调、强化学习与RLHF、MoE(混合专家模型)等关键技术点 [46][49][51][52][53][54] - 模型部署方面提供大模型量化、推理及部署的详细技术路线,满足学习者部署自有模型的需求 [60][61][62][64] - 扩展技术领域包括VLM的提示适配器学习、LLM在3D世界中的应用以及科学大语言模型学习路线图 [55][56][58] 社区服务与未来规划 - 社区福利包括第一时间掌握学术进展与工业应用、与行业专家交流工作求职问题、获得岗位推荐及产业投资与项目对接机会 [10] - 未来计划通过不定期邀请国内外顶尖学术界和工业界专家进行直播分享,并允许内容反复观看 [66] - 社区将持续分享独家岗位招聘信息,赋能成员职业发展 [67]
离谱!裁员裁出新高度了。。。
程序员的那些事· 2025-11-17 03:59
行业人才需求趋势 - 传统后端技术岗位出现裁员情况,包括拥有十年经验的资深员工[1] - AI大模型工程师人才需求旺盛,有岗位开出年薪120万起仍持续三个月未招到合适人选[2] - 技术圈出现传统岗位加速淘汰与大模型人才一将难求的冰火两重天现象[2] 大模型技术核心技能 - 企业急需的大模型工程师必须掌握三大核心技术:RAG(检索增强生成)、Agent智能体和微调[2] - RAG技术用于融入外部信息修正模型输出,应用于法律文档分析、医疗诊断辅助、金融报告生成等垂类场景[2][8] - Agent智能体通过工具调用和环境交互实现多步推理完成复杂任务,如智能客服、设备故障诊断、投资分析等[2][8] - 微调技术针对特定任务优化模型,需掌握主流大模型如DeepSeek、Qwen等的微调技术[2][8] 大模型应用开发培训市场 - 相关培训课程已开班58期,服务超过20000名学员,部分学员已获得高薪工作机会[9] - 课程内容涵盖AI技术原理、实战应用和职业发展,通过5个步骤培养全栈开发能力[13] - 培训后提供企业内推和直聘权益,简历可直接送达大厂面试官[16] - 课程限时免费提供,名额仅限100人,预计24小时后关闭报名通道[11][19]
一篇论文,读懂上下文工程的前世今生
36氪· 2025-11-07 07:11
上下文工程的定义与本质 - 上下文工程被定义为设计和优化上下文的收集、管理、使用,以提升机器理解和任务表现的努力 [4] - 其本质是通过建立更丰富有效的上下文,弥合人类高熵表达与机器低熵理解之间的认知鸿沟,达成系统性的熵减过程 [3] - 该学科并非全新概念,在AI技术出现前已发展超过20年,目前处于上下文工程2.0时代 [5] 上下文工程的发展阶段 - **1.0时代 (1990年代-2020年)**:核心是翻译,通过图形界面和编程语言将人类自然语言意图工程化为机器可理解的交互流程 [7] - **2.0时代 (2020年至今)**:随着GPT-3发布,用户可直接用自然语言对话,但熵减需求转移至用户身上,催生了提示词工程 [11][13] - 2.0时代典型系统包括ChatGPT、LangChain、AutoGPT,核心机制为提示工程、RAG、CoT、记忆代理,上下文容忍度和类人程度相对更高 [12] AI与人沟通的理解差距根源 - AI感官残缺,仅能获得用户明确输入,无法像人类一样接收文字外的大量环境信息 [14] - AI理解能力有限,难以处理和整合复杂逻辑及图像中的关系信息 [14] - AI存在记忆缺失,Transformer架构有长上下文性能瓶颈,缺乏长期记忆系统,难以捕捉长距离依赖关系 [14] - AI注意力涣散,面对海量信息时存在“上下文选择困难”,不知该关注何处 [14][15] 上下文工程的核心构件 - **构件一:上下文收集与记忆系统**:通过多模态融合和分布式收集修复感官残缺,通过分层内存架构解决记忆缺失 [16][18][21] - **构件二:上下文管理**:通过上下文抽象实现“自我烘焙”,将高熵上下文预处理为AI能理解的低熵结构,方法包括自然语言摘要、模式化提取、在线蒸馏 [23][24] - **构件三:上下文使用**:构建高效上下文选择机制,通过理解逻辑依赖、平衡新近度与频率、主动需求推断来解决注意力涣散问题 [25][26] 上下文工程的未来演进 - **3.0时代**:机器智能达到人类水平,能处理情绪等复杂上下文,主动理解场景并与人类协作,但长期记忆问题仍未完全解决 [30] - **4.0时代**:机器智能达到“超人智能”,人机交流的熵被彻底消除,上下文工程本身将消失或融入核心架构 [30][31] - 当前的技术如工具使用能力正从外挂演变为标准协议并融入模型核心,遵循脚手架最终融入基础架构的普遍技术发展模式 [32][33][34]
大模型方向适合去工作还是读博?
具身智能之心· 2025-10-16 00:03
文章核心观点 - 文章探讨了大模型领域从业者面临的职业发展选择问题 即继续深造读博还是参与AI Agent创业潮 [1] - 决策需基于个人是否具备扎实的大模型基础以及是否适合扮演“开拓者”的研究角色 [1][2] - 大模型之心Tech知识星球被定位为一个综合性的学习与交流平台 旨在为不同阶段的从业者提供系统化支持 [2][4] 大模型行业现状与人才需求 - 大模型技术范围广泛 涉及生成、多模态、微调、强化学习、基准测试及多个下游应用领域 [1] - 通用大模型研发存在高壁垒 主要由顶级公司主导 [1] - 行业存在导师半路出家、学生基础不扎实的现象 凸显了系统性学习的重要性 [1][2] 大模型之心Tech知识星球资源 - 社区形式为视频、图文、学习路线、问答与求职交流的综合体 [2] - 已邀请40余位来自国内外顶尖高校(如清华、北大、上交、港科大等)和头部公司(如阿里、百度、字节、月之暗面等)的嘉宾 [4][66] - 提供大模型全栈学习路线图 覆盖RAG、AI Agent、多模态大模型等核心方向 [4] 技术路线覆盖详情 - RAG技术路线细分为Graph RAG、Knowledge RAG、多模态RAG、Reasoning RAG等8个子领域 [9][10][16][18][20][22][24][25] - AI Agent技术路线包括前沿综述、评测、强化学习、多模态Agent、通讯协议等7个细分方向 [26][27][29][31][33][35][36][38][40][42] - 多模态大模型训练涵盖MLLM、VLM、微调、RLHF、MoE等9个技术模块 [44][47][49][51][53][54][55][56][58] - 大模型量化、部署及推理被列为独立的技术板块 [60][61][62][63] 社区附加价值 - 提供大模型学术进展与工业应用的最新信息 [7] - 具备工作岗位推荐功能 可第一时间对接企业需求 [7][68] - 计划通过行业大佬直播分享和独家岗位招聘信息进一步赋能社区成员 [64][65][67][68]
即将开课!自动驾驶VLA全栈学习路线图分享~
自动驾驶之心· 2025-10-15 23:33
自动驾驶VLA行业趋势 - 自动驾驶VLA是学术界和工业界在端到端之后聚焦的核心方向,提供了类人思考能力并通过思维链形式展现决策过程,以实现更可靠和安全的自动驾驶[1] - 行业将自动驾驶VLA划分为三个子领域:模块化VLA、一体化VLA和推理增强VLA[1] - 传统的BEV感知、车道线、Occupancy等方向相对成熟,学术界和工业界关注度逐渐下降,自动驾驶VLA成为各家企业急需攻克的方案[4] - 主流自动驾驶企业,包括智驾方案供应商和车企,均在发力自研自动驾驶VLA[4] 自动驾驶VLA技术核心 - 自动驾驶VLA涉及视觉感知、大语言模型、Action建模、大模型部署、数据集制作等核心内容[6] - 最前沿算法包括CoT、MoE、RAG、强化学习[6] - 模块化VLA强调多阶段pipeline(感知→语言→规划→控制),语言模型为规划决策提供信息[16] - 一体化VLA直接连接动作解码器,实现感知→控制的端到端映射,通过单次前向传播将传感器输入映射为控制动作[16] - 推理增强VLA新增推理模块(如Chain-of-Thought、记忆体、工具调用),同步输出控制信号和自然语言解释,支持长时序规划和因果解释[17] 课程内容与结构 - 课程第一章介绍VLA算法概念、发展历史、开源BenchMark和常见评测指标[12][13] - 第二章讲解VLA算法基础,涵盖Vision、Language、Action三个模块基础知识及大模型结合,并以Qwen 2.5VL-72为例讲解开源大模型部署[14] - 第三章讲解VLM作为自动驾驶解释器的经典及最新算法,包括DriveGPT4、TS-VLM、DynRsl-VLM、SENNA,重点分析算法动机、网络结构和核心[15] - 第四章聚焦模块化与一体化VLA,配套实战代码学习选取华科和小米最新提出的ReCogDrive,涵盖预训练、模仿学习、强化学习GRPO、扩散模型轨迹输出等技术栈[16] - 第五章聚焦推理增强VLA,讲解ORION、OpenDriveVLA、DriveMoE、DiffVLA、S4-Driver、FutureSightDrive、AutoVLA、Drive-R1等算法,并配套清华AIR和博世提出的Impromptu VLA实战代码[17][18][19][23] - 第六章设置大作业,要求学员基于ms-swift框架自定义数据集和加载模型,进行训练任务微调,并提供V-L-A各部分代码解读[20] 行业人才培养 - 课程由清华大学教研团队联合开展,旨在推动自动驾驶VLA在学术界和工业界的发展[6][22] - 讲师团队包括在ICCV/IROS/EMNLP/Nature Communications等顶级会议发表论文的清华大学硕士生、QS30高校博士在读研究员,具备丰富的自动驾驶、大模型研发和实战经验[8][9] - 学员需自备GPU,推荐算力在4090及以上,并具备自动驾驶领域基础、transformer大模型、强化学习、BEV感知等技术概念,以及概率论、线性代数、Python和PyTorch基础[24] - 课程为国内首个自动驾驶VLA进阶实战教程,预计两个半月结课,采用离线视频教学配合VIP群内答疑及三次线上答疑的模式[22][23]
湖南发布“古籍修复知识库系统” 打造古籍修复“数字百科”
中国新闻网· 2025-10-14 09:26
行业动态 - 古籍修复行业面临知识传承难、修复经验共享不足、修复过程不易追溯、人才培养周期长等难题,传统模式亟待新技术破局 [1] - 行业将古籍修复技艺与人工智能、RAG等现代科技深度融合,构建多模态知识库系统以应对挑战 [1] - 行业举办“古籍保护课程进校园”活动,旨在让更多年轻人参与古籍保护,使中华优秀传统文化生生不息 [2] 公司举措 - 湖南图书馆创新推出“古籍修复知识库系统”并上线试运行,该系统服务于全国古籍修复从业者并面向全社会免费开放,未来将持续优化功能 [1] - 公司靶向发力,充分依托本馆及业界古籍修复专业资源,构建了汇聚修复案例、修复用纸、专业参考书目、专家经验等的核心知识库 [1] - 该系统构建的核心知识库涵盖200余个修复案例、200多种修复纸谱类型、300多种专业图书、800余篇专业论文及100余种修复技法,打造古籍修复的“数字百科” [1]