阿里千问

搜索文档
阿里千问更新3款大模型
格隆汇APP· 2025-09-23 06:29
大模型产品更新 - 公司近两日陆续更新3款大模型 包括开源全模态大模型Qwen3-0mni 开源图像编辑大模型Qwen3-lmage-Edit和不开源语音识别大模型Qwen3-TTS [1] 性能表现 - Qwen3-Omni在全方位性能评估中单模态任务表现与类似大小Qwen系列单模态模型持平 [1] - 该模型在音频任务中展现显著优势 [1]
具身领域的大模型基础部分,都在这里了......
具身智能之心· 2025-09-20 16:03
随着具身和自驾领域的发展,基于大模型方案的各类算法层出不穷,占据了各大工作的头条。我们也收到 了很多具身领域同学的诉求,希望把大模型相关内容汇总学习下,学习大模型也是适应大趋势的必然。 『大模型之心Tech知识星球』目前集视频 + 图文 + 学习路线 + 问答 + 求职交流为一体,是一个综合类的大 模型社区。旨在为大家打造一个交流+技术分享的社区,是许多初学者和进阶的同学经常逛的地方。 国内最全的大模型技术栈社区:大模型之心Tech 社区创建的出发点是给大家提供一个大模型相关的技术交流平台,交流学术、应用和工程上的问题。星球 内部的嘉宾正在快速扩张中,我们邀请了来自国内外知名高校实验室、大模型/互联网相关的头部公司,其 中高校和科研机构包括但不限于:上交、清华、北京大学、上海人工智能实验室、港科大、港大等等!公 司包括但不限于阿里千问、美团LongCat、深度求索DeepSeek、字节豆包、百度文心一言、月之暗面Kimi等 等。未来我们会打造一个大模型的前沿技术聚集地~ 我们为大家汇总了大模型全栈学习路线图,包括但不限于: | RAG学习路线 | AI Agent学习路线 | 多模态大模型学习路线 | | - ...
但我还是想说:建议个人和小团队不要碰大模型训练!
自动驾驶之心· 2025-09-20 16:03
这个暴论需要叠加很多buff,但我想说的确实就是这个标题。也算是和大家对齐一下认知。 这个暴论自然引申出一个问题: 不训练大模型怎么办? 为什么不要微调?因为没有模型的原始数据配比,更有可能原始的训练数据都没有,微调之后极有可能损失掉大 部分的性能。 那如果开源模型在特定领域的效果非常差,怎么办? 如果是很垂类的领域模型,可以先试试RAG,不行就试试In-context Learning,在上下文中,教LLM一些领域知 识。能尝试的低成本方案都尝试后,再考虑垂类领域模型的微调训练! 一些实际使用过程中的经验,将最需要脑子的任务交给o1系列模型,比较需要脑子的任务,交给4o这一梯队的 模型。 除了付费的模型,还可以考虑国产的大模型,点名表扬DeepSeek、豆包、Qwen等等开源大模型。 这其实就是Agentic AI的思路。 如果你的业务在上面的方案中都跑不通,那么自己训练模型大概率也是白瞎。大模型时代,基础模型能力的每一 次提升,都算是一次地球Online的版本更新。 距离大厂基座模型团队之外的AI人,需要先了解现有LLM的性能边界,敏锐的分辨出现有模型能力和过去方案 的差异,能否给当前的业务带来新的变化, ...
真的花了好久才汇总的大模型技术路线......
具身智能之心· 2025-09-16 00:03
大模型技术发展趋势 - 大模型已成为推动社会生产的重要工具,广泛应用于日常办公、自动驾驶、具身智能和AIGC生成等领域 [2] - 大模型产业正经历技术普惠化、应用垂直化和生态开源化的深度变革 [2] - RAG和AI Agent技术成为AI从业者核心竞争力,相关岗位需求旺盛且算法岗位年薪领先行业 [2] 技术社区建设 - 创建了集视频、图文、学习路线、问答和求职交流为一体的综合型大模型社区 [2] - 社区已邀请40+来自国内外知名高校和头部企业的专家,包括上交、清华、北大、上海AI实验室、港科大、阿里、美团、深度求索、字节、百度和月之暗面等机构 [4][66] - 社区提供学术进展追踪、工业应用交流、求职对接和行业机会挖掘等服务 [7] RAG技术体系 - 提供完整的RAG学习路线,包括Graph RAG、Knowledge-Oriented RAG、Reasoning RAG等子领域 [4][9] - 汇总了最新综述、开源仓库和BenchMark,涵盖RAG在视觉理解和AIGC中的应用 [11][12][14][16][18][21][23] - 包含个性化RAG工作汇总和专业技术资料,适合从入门到进阶的系统性学习 [4][11] AI Agent技术体系 - 详细解析AI Agent核心技术,包括前沿综述、强化学习、多模态应用和通讯协议 [25][27][29][31][32] - 汇总基座Agent、自进化Agent和Multi-Agent的最新研究成果 [34][36][38] - 提供Agent评测框架和开源工具链,覆盖工业界与学术界需求 [4] 多模态大模型训练 - 涵盖多模态大模型(MLLM)和视觉语言模型(VLM)的训练方法,包括微调、RLHF和MoE技术 [40][44][45][47][49][50] - 汇总开源数据集和提示适配器学习方案,支持3D世界应用开发 [42][51][53] - 持续扩展强化学习与模型优化模块,满足科研和工业落地需求 [40] 模型量化与部署 - 提供大模型量化、推理和部署的完整技术方案 [55][56] - 涵盖参数优化、推理加速和部署实践,助力模型高效落地 [58][60][62] - 扩展社区内容至工程应用领域,满足开发者对模型部署的需求 [56] 社区发展计划 - 计划邀请国内外顶尖学术界和工业界专家进行直播分享,内容可回放 [64] - 持续扩展专家网络,打造大模型前沿技术聚集地 [66] - 提供独家岗位招聘信息,赋能社区成员职业发展 [67]
吴世春:2025,AI重塑一切
FOFWEEKLY· 2025-09-12 10:01
导读: 2025年会成为一个时代的分水岭。 要把握趋势红利,就必须相信趋势,而AI正是当前最重要的 趋势。 "如果没有人开出第一支票,创业就无从谈起。"近日,在「2025母基金年度论坛暨第六届鹭江创 投论坛」上,梅花创投创始合伙人吴世春一开口,就道破了早期投资在一级市场中的根本价值。 2025年,机器人赛道投融资持续火热,有数据显示今年前8月机器人领域融资额已超过去年全年的 融资额,是去年全年的1.8倍。资本逻辑已从"技术故事"转向"量产能力",产业资本更看重机器人 的商业化落地。 作为一个高产且多标签的早期投资人,吴世春在现场直言:"2025年会成为一个时代的分水岭,无 论是投资,还是其他方面,我们 都会重塑一切, 包括原来的软件、硬件行业"。他指出,当前 绝 大多数产业"只有+AI或者AI+才有机会,否则只会陷入无限内卷"。 他坦言 ,"内卷的本质是同质化竞争下的利润萎缩"。 在AI价值重构的当下,能否抓住需求侧个性 化竞争、敢不敢在早期阶段开出支票,已成为决定投资机构能否活下去的关键分水岭。 9月6日,在FOFWEEKLY主办的 「2025母基金年度论坛暨第六届鹭江创投论坛」 上,梅花创投创 始合伙人吴 ...
济宁|1-7月新一代信息技术产业营收增速达22%
大众日报· 2025-09-05 00:52
数字经济发展成效 - 实施数字产业化十大工程与产业数字化八大行动构建数字经济发展体系 [1] - 1-7月全市新一代信息技术产业营收增速达22% [1] - 数据交易规模突破2亿元 [1] 数据要素价值化进展 - 推动4类核心数据纳入全省第一批国家公共数据资源登记平台 [1] - 打造130个高质量数据集其中10个获省级奖励 [1] - 44家企业完成数据资产登记9家完成评估评估金额共计5984万元 [1] - 5家企业获数据资产融资授信3082万元 [1] 数字政府建设成果 - 全方位推进政务运行惠企服务公共服务一网协同一网支撑一网通办 [2] - 部署阿里千问DeepSeek等大模型实现客服审批智能化应用 [2] - 全领域建设无证明城市减免材料162万件 [2] - 企业办事环节减少90%材料精简82%时限压减81% [2] - 校车使用许可审批效率提高85%以上 [2]
中国芯片企业的2025:光从裂缝中透过来 | 海斌访谈
第一财经· 2025-08-01 13:57
行业趋势 - 2025年上半年是国内人工智能算力企业的关键窗口期,国产算力出货量快速增长[2] - 人工智能在千行百业的应用正依次铺开,行业共识已形成[2][6] - 国外芯片受限导致AI算力市场出现裂缝,中国本土算力抓住机会[2] - 大模型推理侧对英伟达算力需求低于训练阶段,本土芯片得以进入市场[6] 公司动态 - 林致远所在企业AI算力收入同比跃升59%,核心能力基于国产算力构建[5] - 科大讯飞星火大模型100%基于全国产算力实现,中英同传效果提升20%[6] - 天数智芯董事长透露2025年芯片在大模型应用中出货量快速增长[7] - 阶跃星辰联合近10家芯片企业发起"模芯生态创新联盟"[9] 技术发展 - DeepSeek以高性能低成本模型引领开源潮流,扭转中国大模型应用晚于美国的局面[6] - 国产大模型半年迭代一次,但芯片从设计到生产需要两年,存在速度差异[9] - 芯片企业需针对超长文本、MOE架构等大模型特性调整设计[9] - 不同应用场景对芯片要求各异,如零售需高并发、教育需高精度[13] 生态建设 - 模芯联盟旨在打通芯片-整机-模型-应用场景链条,建立统一规范[10] - 燧原科技提出算力普惠概念,认为国产模型与芯片合作是重要契机[10] - 阶跃星辰邀请DeepSeek等模型加入联盟,共同建设国产生态[10] 市场前景 - 2025年是AI应用爆发年,也是国产算力企业兴衰存亡的关键之年[2] - 下半年预计出现更大规模的大模型推理落地,更多蒸馏版模型将出现[12] - 中国丰富的应用场景能带动经济发展,各行业快速部署AI应用[12][13] - 移动互联网时代的生态优势可能在AI时代重现,为芯片企业创造成长空间[13]
影响市场重大事件:上海支持人工智能等前沿方向技术创新,最高5000万元支持;国家育儿补贴方案公布
每日经济新闻· 2025-07-29 00:48
人工智能政策支持 - 上海提出支持人工智能基础理论、新一代通用人工智能、具身智能等前沿技术创新,按项目总投资给予最高30%、最高5000万元支持 [1] - 对参与国家重大项目、战略平台的创新主体给予最高5000万元支持,战略性项目经批准可获最高50%支持 [1] - 上海将发放6亿元算力券,降低智能算力使用成本,对租用智能算力的主体给予最高30%租金补贴,并推荐申报国家智能券补贴 [4] - 对自主智能算力设施部署项目给予最高10%建设支持,加速培育人工智能自主生态 [4] 人工智能投融资与产业生态 - 上海将发挥国家人工智能产业投资基金、市级人工智能先导产业母基金等引导作用,联合区级投资基金、社会资本投早、投小、投长期 [2] - 支持优质企业发展风险投资基金,聚焦算力、语料等关键要素及大模型、具身智能、科学智能等赛道,推动设立专题子基金 [2] - 钉钉CTO朱鸿指出AI已切换到下半场,企业专属模型将迎来爆发式增长,2025年将是行业大模型和企业专属模型落地元年 [7][8] 人工智能技术进展 - 阿里通义千问以10.4%的市场份额位列全球大模型API调用量第四,超越OpenAI的4.7% [5] - Qwen3-Coder调用量以近500亿Tokens高居全球成长最快大模型榜首 [5] - 全球首款多模态梦境脑机接口设备"梦邻"发布,具备脑电信号监测、睡眠状态调控、干预策略生成及AI数据分析四大功能 [10] 智能网联汽车与行业大会 - 2025世界智能网联汽车大会将于10月16-18日召开,聚焦自动驾驶、智能座舱、"车路云一体化"等重点领域 [11] 港股通ETF市场动态 - 港股通ETF年内净申购份额达1024亿份,合计净流入994亿元 [6] - 78只港股通主题ETF规模为2325亿元,较去年底增加1501亿元,7月以来规模增加469亿元 [6] - 资金净流入最多的挂钩指数为港股通互联网指数、港股通科技指数、港股通非银指数 [6] 育儿补贴政策 - 国家育儿补贴制度从2025年1月1日起实施,对3周岁以下婴幼儿按每孩每年3600元标准发放补贴 [3] - 对2025年1月1日前出生且不满3周岁的婴幼儿按应补贴月数折算计发补贴 [3] 养老服务设施规划 - 民政部、自然资源部联合部署加强养老服务设施布局规划编制工作,推动优化养老服务布局安排 [9] - 编制《养老服务设施布局规划编制技术指南(试行)》,提升布局科学性、合理性和精准性 [9]
工业AI+“出海”重塑“中国制造”竞争力
中国产业经济信息网· 2025-07-24 23:23
中国制造业出海与AI融合趋势 - 在年营收10亿元以上的中国制造企业中77.9%已有或正在规划海外业务,54%正探索将AI融入"研产供销服"全流程 [1] - 工业AI与出海战略共同驱动全球制造业版图变革,IDC将中国制造企业出海划分为产品(1.0)、供应链(2.0)、品牌服务(3.0)三阶段 [1][2] 出海1.0产品阶段 - 企业将出海作为业务增长新引擎,但需依赖云平台提供的合规解决方案(数据保护/隐私/行业合规)保障增长 [1] - 数字化工具需覆盖渠道投放、线索管理、客户转换、物流协作及售后等全链条 [1] 出海2.0供应链阶段 - 42%制造企业认为品质保证是建立海外品牌信任的关键,AI视觉质检方案已成熟应用 [2] - 大模型技术推动通用模型替代多个小模型,实现效率/成本/质量的"不可能三角"平衡 [2] 出海3.0品牌服务阶段 - 全球一体化创新平台通过正反向数字主线实现多地协同与本地化设计,建立敏捷产品开发模式 [2] - 产品/流程两类数字主线贯通助力企业结合区域市场特点 [2] AI+工业软件发展前景 - 国产大模型(DeepSeek/阿里千问/华为盘古/百度文心)开源降低AI开发门槛,加速工业渗透 [2] - 2024-2029年中国AI+工业软件市场CAGR达41.4%,远超传统工业软件(19.3%),渗透率将从9%升至22% [2] - 工业AI不会完全替代传统软件,后者仍占80%市场份额并作为AI应用基础设施 [3]
阿里千问在知名API平台调用量两天超500亿tokens
快讯· 2025-07-24 08:54
阿里Qwen3-Coder发布 - 阿里AI编程大模型Qwen3-Coder发布后引起全球AI圈广泛关注 [1] - 海外知名AI模型聚合平台OpenRouter发文强调阿里千问模型API调用量突破500亿tokens [1] - OpenRouter平台聚集了GPT、Gemini、Claude等全球多个顶尖大语言模型 [1] 技术突破与性能表现 - 阿里Qwen3-Coder在代码能力及Agent调用能力方面取得重大突破 [1] - 该模型在多个Agent能力评测中超越GPT4-1、Claude4等顶级模型 [1]