Workflow
百度文心一言
icon
搜索文档
具身领域的大模型基础部分,都在这里了......
具身智能之心· 2025-09-20 16:03
随着具身和自驾领域的发展,基于大模型方案的各类算法层出不穷,占据了各大工作的头条。我们也收到 了很多具身领域同学的诉求,希望把大模型相关内容汇总学习下,学习大模型也是适应大趋势的必然。 『大模型之心Tech知识星球』目前集视频 + 图文 + 学习路线 + 问答 + 求职交流为一体,是一个综合类的大 模型社区。旨在为大家打造一个交流+技术分享的社区,是许多初学者和进阶的同学经常逛的地方。 国内最全的大模型技术栈社区:大模型之心Tech 社区创建的出发点是给大家提供一个大模型相关的技术交流平台,交流学术、应用和工程上的问题。星球 内部的嘉宾正在快速扩张中,我们邀请了来自国内外知名高校实验室、大模型/互联网相关的头部公司,其 中高校和科研机构包括但不限于:上交、清华、北京大学、上海人工智能实验室、港科大、港大等等!公 司包括但不限于阿里千问、美团LongCat、深度求索DeepSeek、字节豆包、百度文心一言、月之暗面Kimi等 等。未来我们会打造一个大模型的前沿技术聚集地~ 我们为大家汇总了大模型全栈学习路线图,包括但不限于: | RAG学习路线 | AI Agent学习路线 | 多模态大模型学习路线 | | - ...
但我还是想说:建议个人和小团队不要碰大模型训练!
自动驾驶之心· 2025-09-20 16:03
这个暴论需要叠加很多buff,但我想说的确实就是这个标题。也算是和大家对齐一下认知。 这个暴论自然引申出一个问题: 不训练大模型怎么办? 为什么不要微调?因为没有模型的原始数据配比,更有可能原始的训练数据都没有,微调之后极有可能损失掉大 部分的性能。 那如果开源模型在特定领域的效果非常差,怎么办? 如果是很垂类的领域模型,可以先试试RAG,不行就试试In-context Learning,在上下文中,教LLM一些领域知 识。能尝试的低成本方案都尝试后,再考虑垂类领域模型的微调训练! 一些实际使用过程中的经验,将最需要脑子的任务交给o1系列模型,比较需要脑子的任务,交给4o这一梯队的 模型。 除了付费的模型,还可以考虑国产的大模型,点名表扬DeepSeek、豆包、Qwen等等开源大模型。 这其实就是Agentic AI的思路。 如果你的业务在上面的方案中都跑不通,那么自己训练模型大概率也是白瞎。大模型时代,基础模型能力的每一 次提升,都算是一次地球Online的版本更新。 距离大厂基座模型团队之外的AI人,需要先了解现有LLM的性能边界,敏锐的分辨出现有模型能力和过去方案 的差异,能否给当前的业务带来新的变化, ...
真的花了好久才汇总的大模型技术路线......
具身智能之心· 2025-09-16 00:03
大模型技术发展趋势 - 大模型已成为推动社会生产的重要工具,广泛应用于日常办公、自动驾驶、具身智能和AIGC生成等领域 [2] - 大模型产业正经历技术普惠化、应用垂直化和生态开源化的深度变革 [2] - RAG和AI Agent技术成为AI从业者核心竞争力,相关岗位需求旺盛且算法岗位年薪领先行业 [2] 技术社区建设 - 创建了集视频、图文、学习路线、问答和求职交流为一体的综合型大模型社区 [2] - 社区已邀请40+来自国内外知名高校和头部企业的专家,包括上交、清华、北大、上海AI实验室、港科大、阿里、美团、深度求索、字节、百度和月之暗面等机构 [4][66] - 社区提供学术进展追踪、工业应用交流、求职对接和行业机会挖掘等服务 [7] RAG技术体系 - 提供完整的RAG学习路线,包括Graph RAG、Knowledge-Oriented RAG、Reasoning RAG等子领域 [4][9] - 汇总了最新综述、开源仓库和BenchMark,涵盖RAG在视觉理解和AIGC中的应用 [11][12][14][16][18][21][23] - 包含个性化RAG工作汇总和专业技术资料,适合从入门到进阶的系统性学习 [4][11] AI Agent技术体系 - 详细解析AI Agent核心技术,包括前沿综述、强化学习、多模态应用和通讯协议 [25][27][29][31][32] - 汇总基座Agent、自进化Agent和Multi-Agent的最新研究成果 [34][36][38] - 提供Agent评测框架和开源工具链,覆盖工业界与学术界需求 [4] 多模态大模型训练 - 涵盖多模态大模型(MLLM)和视觉语言模型(VLM)的训练方法,包括微调、RLHF和MoE技术 [40][44][45][47][49][50] - 汇总开源数据集和提示适配器学习方案,支持3D世界应用开发 [42][51][53] - 持续扩展强化学习与模型优化模块,满足科研和工业落地需求 [40] 模型量化与部署 - 提供大模型量化、推理和部署的完整技术方案 [55][56] - 涵盖参数优化、推理加速和部署实践,助力模型高效落地 [58][60][62] - 扩展社区内容至工程应用领域,满足开发者对模型部署的需求 [56] 社区发展计划 - 计划邀请国内外顶尖学术界和工业界专家进行直播分享,内容可回放 [64] - 持续扩展专家网络,打造大模型前沿技术聚集地 [66] - 提供独家岗位招聘信息,赋能社区成员职业发展 [67]
虚拟数字人:在技术迭代中进化
经济日报· 2025-09-14 21:53
行业演变历程 - 虚拟数字人行业从2021年资本追捧阶段转入理性调整期 初期因虚拟美妆数字人"柳夜熙"爆红引发品牌虚拟代言人热潮 A股概念股轮番涨停 [2] - 行业曾流行"3个月造星 6个月回本"口号 但高昂成本逐渐显现 单条短视频制作成本达数十万元 前期研发投入达百万元级别 [2] - 用户新鲜感退潮导致虚拟代言人大量撤下 虚拟主播GMV不足真人主播1/5 抖音平台虚拟主播平均观看时长从15分钟降至5分钟 粉丝流失率超40% [3] 技术发展与成本结构 - 早期数字人依赖动作捕捉与图形渲染技术 存在表情僵硬 交互延迟等技术同质化问题 [3] - 高质量3D数字人制作成本居高不下 2D数字人因模板泛滥陷入价格战 [3] - 生成式人工智能推动产品升级为"数智人" 运用自然语言处理 语音识别 图像识别与情感分析等技术实现智能交互 [4] 商业化应用转型 - 行业从C端偶像经济转向B端实用场景 包括金融 医疗 教育 企业服务等领域 通过SaaS平台降低制作门槛 [4] - 罗永浩数字人直播吸引超1300万人次观看 GMV突破5500万元 部分品类带货单量超真人首秀数据 [4] - 京东618期间数字人带货能力超越80%真人主播 1.7万家品牌商家使用数字人直播 百度二季度数字人收入环比增长55%达约5亿元 [5] 市场规模与资本动态 - 2025年中国虚拟数字人核心市场规模预计突破480亿元 带动相关产业规模超6400亿元 [6] - 截至2025年7月7日虚拟数字人领域发生23起投融资 总金额达35.07亿元 平均每起融资超1.5亿元 [6] - 上海等地出台政策支持数字人关键技术攻关 多地政府部门上线数字人提供公共服务 [6] 法律规范与平台治理 - 虚拟数字人形象被认定为具有独创性的美术作品 受著作权法保护 技术内核中的代码可作为计算机软件受保护 [7] - 抖音平台累计处理超17万个录播直播间 封闭3万多个账号 打击2800多个黑商团伙以治理AI主播冒充真人问题 [7] - 行业需应对数据隐私 版权争议等伦理法律问题 北京互联网法院已出现虚拟数字人著作权侵权判例 [6][7] 技术演进方向 - 多模态大模型发展推动虚拟数字人效果优化 未来需实现从功能复刻到情感共鸣的技术跨越 [4][5] - 数字人直播通过技术驱动重构电商价值链 竞争核心在于场景化创新与用户体验优化 [5] - AI大模型如GPT-5 百度文心一言为虚拟数字人注入智慧灵魂 未来5年将向智能制造 文娱消费领域深度赋能 [7]
从算力到应用:港股“科技七巨头”如何接棒AI浪潮第三阶段?
搜狐财经· 2025-08-18 11:46
横向对比:显著低估 - 恒生科技指数动态市盈率约25.8倍,较纳斯达克100指数折让约20%,中美科技龙头估值差达10-20倍,腾讯和阿里动态PE不足20倍远低于美股同类企业 [5] - 恒生指数整体PE为10.2倍,低于标普500的22.3倍和日经225的18.6倍,科技板块估值优势更为突出 [5] - 港股科技股因稀缺性和流动性差异,估值普遍低于A股同类型企业,存在跨市场套利空间 [5] 纵向历史:处于低位区间 - 恒生科技指数PE处于近五年分位数的8%,显著低于历史中位数,互联网板块估值泡沫已充分消化 [5] - 部分龙头股如阿里巴巴和百度因AI业务转型,估值中枢正从消费股向科技成长股切换,但股价尚未充分反映技术升级潜力 [5] 驱动因素:修复与成长双逻辑 - 2025年Q2腾讯和联想等企业财报超预期,显示降本增效成果,AI商业化加速有望打开第二增长曲线 [5] - 国内经济温和复苏叠加政策支持,科技企业基本面边际改善 [5] - 南向资金2025年累计净买入超3000亿港元,港股科技ETF年内涨幅近40%,反映资金配置需求 [5] - 美联储降息预期下美元走弱,推动全球资金增配新兴市场,港股作为离岸中国资产直接受益 [5] 结论:战略性配置窗口已至 - 港股科技板块兼具低估值、高成长和政策催化三重优势,是中长期资金布局的理想选择 [5] - 当前估值水平隐含较高安全边际,若盈利增速兑现,板块有望迎来戴维斯双击 [6] - 建议关注恒生科技ETF和港股通科技指数基金,以及AI算力、平台经济和硬科技细分龙头 [6]
全国工商联人工智能委员会常务秘书长范丛明:智能体相关新工种有望问世
证券时报网· 2025-08-06 12:41
8月6日举办的第十三届互联网安全大会(ISC.AI2025)上,全国工商联人工智能委员会常务秘书长范丛 明接受了包括证券时报记者在内的媒体采访。他表示,智能体等相关工种有望明年诞生。对于数据资产 入表话题,其认为,应该区别对待,数据属性是可复制性,最终还是要发挥数据价值。 范丛明介绍,全国工商联人工智能委员会从去年12月底开展走访代表城市重点企业调研,了解各企业关 于"产业+AI"的布局,目前围绕AI领域已经形成了多个提案和建议。委员会将立足地方产业优势,借助 AI技术的新质生产力实现降本增效,并推动产业智能化升级。 "今年2月,我们专程走访了杭州DeepSeek等企业,观察到智能产业蓬勃发展的趋势,也见证了通用人工 智能(AGI)产业的兴起,今年,人社部也发布了生成式人工智能系统测试员等相关工种,在人社部的 统一部署下,明年有望迎来相关新工种的诞生,继而逐步建立标准,开展职业鉴定、考试及认定工 作。" 人工智能的发展要素之一是数据。但现阶段好多企业数据比较分裂,而且涉及不同企业之间的数据流通 比较困难,范丛明进一步指出,为解决数据要素流通难题、充分释放其价值,需要建立科学的数据资产 管理和确权机制。 "近年 ...
AI专业:百万年薪神话,还是新“天坑”?
创业邦· 2025-08-01 03:24
AI专业就业市场现状 - AI专业首次进入2025年高考热门专业Top10,工学专业热度断层领先,考生对AI就业前景期待较高[3] - AI人才呈现两极分化:985高校硕士毕业生年薪可达45万-70万,顶尖者获百万年薪;而二本院校毕业生投递300份简历难获面试[6][8][10] - 行业存在结构性矛盾:国内AI技术人才缺口达500万,但41.07%头部AI公司员工处于求职状态,企业更倾向招聘有经验的社招人才[13][14] AI行业人才需求特征 - 2025年上半年AI技术新发职位增长36.82%,算法工程师和机器人工程师岗位增速超50%,平均年薪32.35万元[13][16] - 互联网大厂主导人才争夺:字节跳动上半年人才流入/流出比达1.71,曾以八位数年薪挖角顶级技术负责人[18] - 企业招聘门槛极高:要求顶尖985院校背景、大厂实习经历及论文发表,校招名额稀缺[14] AI教育与企业需求脱节 - 部分高校AI课程体系残缺,学生仅学习调包和跑demo,缺乏完整项目经验,竞争力不足[10][20] - 高校资源分配不均:双非院校实验室设备匮乏,如仅有两张3090显卡难以支持计算机视觉研究[20] - 专家建议分层培养:校企联合设课、本硕博贯通培养,用算法成果替代论文,缩短专利审批周期至6个月[21] AI技术岗位发展趋势 - 算法工程师岗位薪资持续上涨,但部分工作因调用现成模型导致门槛降低,可替代性增强[14][15] - 深度学习、数据建模等细分领域岗位需求显著增长,具身智能热潮催生机器人工程师需求[16][18] - 行业短期需求爆发可能不可持续,AI技术本身将通过提效减少用工,加剧就业不平等[14][15]
黄仁勋链博会演讲:中国的开源AI是推动全球进步的催化剂
北京日报客户端· 2025-07-16 06:52
中国供应链与AI发展 - 中国的供应链被描述为一个奇迹,中国的开源AI是推动全球进步的催化剂,让各国和各行业都有机会参与AI革命 [2] - 中国有超过150万名开发者在英伟达平台上开发,将创新变为现实 [3] - 由中国孕育并开源共享的DeepSeek、腾讯混元、MiniMax、百度文心一言等世界级大模型,正在推动全球AI快速发展 [3] 英伟达的发展与贡献 - 英伟达在2016年推出全球首台AI超级计算机DGX-1,并亲自将第一台DGX-1交付给OpenAI公司 [2] - 英伟达已成为驱动全球AI生态的计算平台,AI正在改变每一个行业 [2] - AI为微信、淘宝、抖音等中国标志性平台提供动力,驱动小米的自动驾驶与智能手机,赋能百度的AI搜索和美团极速便捷的智能配送服务 [2] AI的未来趋势 - AI的下一次浪潮将是机器人系统,具备推理与执行能力,并能够理解物理世界 [3] - 未来十年,工厂将由软件和AI驱动,协调人机协作的机器人团队,生产由AI主导的智能产品 [3] - AI将成为每个行业、企业、产品和服务的核心,引发了一场新的工业革命,并为中国卓越的供应链生态系统带来新的增长机遇 [4] 英伟达的合作与愿景 - 英伟达将继续与长期合作伙伴以及众多新朋友携手,在AI时代共创繁荣未来 [4]
从“一码难求”到“账号清空”:Manus为何错失中国AI黄金窗口期?
搜狐财经· 2025-07-15 00:46
公司动态 - Manus清空微博、小红书官方账号内容,引发"跑路"猜测 [2] - 公司此前已对部分国内业务进行裁员,并将核心技术人员迁往新加坡 [2] - 官方回应称裁员是"基于经营效率考量,专注核心业务发展" [2] - 公司总部已从中国迁至新加坡,据称是因投资方Benchmark要求 [2][3] - 今年5月获硅谷风投Benchmark领投7500万美元B轮融资,估值达5亿美元 [2] 产品策略 - 初期采用邀请制导致"一码难求",邀请码在二手平台被炒至天价 [4] - 5月取消等待名单向所有人开放,但用户关注度已不及竞争对手 [4] - 错失通过应用抢占用户流量的关键窗口期 [4][5] - 与deepseek、腾讯元宝、百度文心一言等竞品相比缺乏多场景应用 [4][5] - 主要面向海外用户,初期发布内容均为英文 [6] 市场表现 - 流量来源Top5为巴西(12.52%)、美国(10.81%)、中国(9.56%)、印度(7.29%)和埃及(4.55%) [6] - 中国AI核心产业规模已突破1.2万亿元,应用渗透率达38% [10] - 中国AI在制造、医疗、农业等领域的应用落地速度较欧美快1.8倍 [10] 行业趋势 - 全球风投总额达2299亿美元(1.94万笔),较2024全年3867亿美元(4.27万笔)明显放缓 [7] - 投资活动呈现"马太效应",头部项目融资规模屡创新高 [7] - 后期投资激增超30%(环比)和147%(同比)至810亿美元 [7] - 早期投资下降至240亿美元,为至少五个季度以来最低水平 [7] - 种子轮融资同比下降14%至72亿美元 [7] 战略分析 - 过度依赖资本驱动,缺乏自我造血能力 [8] - 未能把握中国这一全球最大AI市场的机遇 [9][10] - 创始团队全华本土背景,但战略方向偏离中国市场 [10] - 与深耕中国市场的deepseek等竞品形成鲜明对比 [5][10] - AI行业竞争关键在于应用场景覆盖和用户流量获取 [5]
大模型“考生”破题全国一卷高考作文,听听人工智能专家怎么说
新京报· 2025-06-10 02:50
AI大模型高考作文测评表现 - 四款主流AI大模型(DeepSeek、百度文心一言、智谱清言、ChatGPT-4o)参与全国一卷高考作文测试,采用无提示词直接输入题目方式生成作文 [1][2] - 语文名师从切题性、语言表达、逻辑结构、认知匹配等维度评分:DeepSeek获50分(何郁)及潜在满分评价(王大绩),智谱清言获42分(何郁、贺老师),百度文心一言获46-48分,ChatGPT-4o获40分(何郁) [4][5][6][7][8][9][11][12][14] - 普遍问题包括对材料理解表面化(如未把握抗战胜利80周年核心背景)、逻辑层次薄弱、内容空洞及缺乏个性化思考 [2][3][15] AI大模型写作能力特征 - 优势体现为语法正确性、文本流畅性、体例完整性和逻辑严谨性,能灵活调用语料库中的典故诗词及名言 [16] - 议论文表现优于记叙文,评论类文体逻辑性强但文学性不足,情感表达和创新能力与人类写作者存在差距 [16] - 当前能力处于组合创新阶段(如素材重组),但在融合创新与颠覆式创新层面受限 [18] 教育应用潜力与实施路径 - 可促进教育公平(零门槛访问知识库)、推动教师角色转型(从传授者变为引导者)及学习方式变革(个性化辅导) [17] - 具体应用场景包括拓展知识边界、辅助阅读解析、提供写作反馈(语法/句式/逻辑检查)及生成训练素材 [17] - 需避免过度依赖导致认知外包,建议采用"人类创作-AI修改"或"AI生成-人类优化"的协同模式 [18] 行业技术发展关键因素 - 核心能力受算力、数据(语料库质量)及算法模型三大因素影响,当前竞争焦点集中于语料库针对性微调(如编程、文学、问答等垂直优化) [16][18] - 未来需突破方向包括提升情感表达真实性、深层逻辑推理能力及原创性内容生成水平 [16][18]