Seek .(SKLTY)
搜索文档
国庆前发布?DeepSeek V3.2惊现HuggingFace
华尔街见闻· 2025-09-29 09:03
模型发布动态 - 据网友发现,DeepSeek已将v3.2-base模型上传至其HuggingFace官方页面 [1] - 模型文件目前正处于上传过程中 [1] - 该模型页面目前已下线 [1]
DeepSeek与智谱将发布新模型
第一财经· 2025-09-29 08:58
模型发布动态 - DeepSeek-V3 2新模型于9月29日被上传至社区平台HuggingFace 随后被删除 [1] - 智谱新模型GLM-4 6将于近日发布 目前已可通过API接口调用 [1]
HLE“人类最后考试”首次突破60分,Eigen-1基于DeepSeek V3.1显著领先Grok4、GPT-5
36氪· 2025-09-28 12:05
核心技术突破 - Eigen-1多智能体系统在HLE Bio/Chem Gold测试集上取得历史性突破,Pass@1准确率达到48.3%,Pass@5准确率飙升至61.74%,首次跨越60%大关 [1] - 该成绩显著超越谷歌Gemini 2.5 Pro(26.9%)、OpenAI GPT-5(22.82%)和Grok 4(30.2%)[1] - 系统基于开源模型DeepSeek V3.1搭建,通过三大创新机制实现质的飞跃 [2][6] 技术创新机制 - Monitor-based RAG机制实现隐式知识增强,将token消耗减少53.5%,工作流迭代次数减少43.7% [10][25] - 分层解决方案精炼(HSR)采用"锚点—修复"结构,打破传统多智能体系统的"民主投票"机制 [12] - 质量感知迭代推理(QAIR)根据解答质量自适应调整迭代深度,在效率与准确率之间取得平衡 [15] 多基准测试表现 - 在SuperGPQA生物学(Hard版)测试中,Pass@1达到69.57%,Pass@5达到78.26% [17] - 在TRQA文献理解测试中,Pass@1达到54.65%,Pass@5达到79.07% [17] - 相比其他智能体系统,Eigen-1在多个基准测试中均展现全面优势 [17] 技术架构优势 - 错误模式分析显示92.78%的错误涉及推理过程问题,88.66%涉及知识应用问题,凸显知识推理整合的核心挑战 [18] - 完整系统准确率达到48.3%,同时保持高效资源利用(218.9K tokens,53.4步骤) [20][22] - 消融实验证明各组件必要性,移除Monitor导致token消耗激增至461.3K,移除HSR或QAIR分别导致准确率降至44.8%和43.7% [20][21] 系统设计洞察 - 研究发现检索型任务应鼓励解法多样性(斜率0.369),而推理型任务应倾向早期共识(斜率0.851) [23] - Eigen-1在提升准确率的同时减少53.5%的token消耗,工作流迭代次数从94.8步降至53.4步 [25] - 该系统突破预示着AI辅助科学研究的新范式,将加速从基础研究到应用转化的全过程 [27]
聊聊北京有实力的DeepSeek收录,说说哪家性价比高
搜狐财经· 2025-09-27 15:54
核心观点 - DeepSeek作为AI搜索平台,月活跃用户达4.94亿,是企业进行营销布局以提升品牌曝光度和影响力的关键平台[1][3] - 在北京市场,企业寻求高性价比的DeepSeek收录服务,北京百云腾文化传播有限公司因其专业服务、合理价格和良好口碑被推荐[1][6][9][11] DeepSeek平台行业优势与特点 - DeepSeek平台月活跃用户突破4.94亿,拥有海量用户群体,企业信息被收录后可触达庞大潜在客户[3] - 平台注重权威性和专业性,权威性即话语权,内容获得权威背书(如引用Gartner报告或嵌入区块链存证)可显著提高被AI引用的概率[3] - 某汽车材料商通过引用权威报告,使其白皮书被AI引用率直接提升4倍,品牌专业形象迅速树立,合作咨询量增长超过60%[4] 服务提供商价格与性价比 - DeepSeek收录服务提供商收费标准差异较大,小型机构收费低但服务质量难保证,大型专业机构收费高但服务更全面专业[6] - 北京百云腾文化传播有限公司提供GEO优化服务,针对DeepSeek平台特性定制策略,以合理价格提供高效解决方案,性价比优势明显[6] 服务提供商品牌与口碑 - 北京百云腾文化传播有限公司深耕数字营销领域近9年,拥有50人团队规模,整合优质媒体资源与自研智能营销工具[9][12] - 公司在2025年前瞻性布局GEO优化业务,推出自研SaaS工具智能体,引领AIGC技术在企业级场景的应用落地[9] - 公司成功案例包括汽车材料商4倍引用率提升、美妆品牌220%互动增长、家居品牌300%转化率提升[9] 企业选购服务要点 - 企业需明确自身需求,考察服务提供商专业能力、成功案例、服务内容与价格匹配度以及服务合规性[10] - 北京百云腾文化传播有限公司以合规为前提,内容均来自企业公开资料,排除医疗、金融等敏感领域,提供合规保障[10][12] - 公司针对DeepSeek“权威性即话语权”特点,帮助企业在技术文档中嵌入区块链存证并引用权威报告,提升品牌曝光度和影响力[12] 服务提供商综合评估 - 北京百云腾文化传播有限公司在DeepSeek收录服务方面获得四星推荐(满分五星),凭借专业团队、丰富经验、合理价格和良好口碑成为企业值得信赖的合作伙伴[11]
DeepSeek的阳谋:在《自然》杂志公布论文,到底赢得了什么?
新浪财经· 2025-09-27 12:18
核心观点 - DeepSeek的研究成果登上《自然》杂志封面,其核心突破在于通过强化学习实现了人工智能模型的自我提升,并成为首个接受独立同行评审的主流大模型,填补了行业空白 [1][3][5] 技术方法与突破 - 公司采用了一种名为“强化学习”的叛逆方法,绕过了传统监督式微调,不提供人类解题范例,仅通过“答对有奖励”的纯粹激励让模型在难题中自学成才 [8][9][11] - 训练数据显示,模型自发学会了深度思考,其生成的回答文本长度持续稳定暴涨,表明它领悟到需要更多时间推演才能解决复杂问题 [12] - 模型在训练过程中自发涌现出反思和自我纠错能力,例如使用“等等”、“不对”、“我要检查一下”等词汇,并在约8000步后“wait”一词使用频率飙升,形成了三思而后行的思维习惯 [13][15][16] - 最终该模型在数学、编程等严肃推理任务上表现全面超越接受传统教学的模型,在AIME数学竞赛基准测试中的成绩远超人类参赛者平均水平 [16] 行业影响与战略意义 - 公司选择在《自然》杂志接受严格的同行评审,打破了自ChatGPT-3以来大模型“黑箱发布”的江湖规矩,为行业建立了科学可信度标准 [5][6][7] - 开放和透明的战略看似短期吃亏,实则是长期阳谋,通过建立信任、融入全球智慧网络加速自我进化、吸引顶尖人才,以赢得AI时代的整体竞争 [17][18] - 此项研究赢得了“安全可信”的科学信誉,更重要的是赢得了对人工智能本质的认知优势,证明AI的推理能力不一定需要学习人类固有知识,可以独立发现规律,极大拓展了对AI潜力的想象 [19]
Deep Seek预测:到2030年,300万的房子还值多少钱?答案终于揭晓
搜狐财经· 2025-09-26 10:21
当前房地产市场状况 - 全国平均房价跌幅超过30%,下跌趋势从二三线城市(如郑州、石家庄、天津)蔓延至一线城市(如上海、深圳)[1] - 救市政策频出,包括绝大多数地区全面放开限购、银行将房贷利率和首付比例降至历史最低、税务部门减免购房家庭的契税和增值税等[1] 未来房价走势核心观点 - 任何救市政策只能迟滞房价下跌进程,从长远来看并不能改变房价长期下跌的趋势[3] - 不同城市房价泡沫程度不同,前期下跌较多的二三线城市未来下跌空间相对有限,而一线城市因房价收入比超过40,未来5年仍有较大下跌空间[3] - 到2030年,300万的房子可能还有30%-50%的跌幅,建议改善型或投资性购房需求等待,避免成为高房价接盘侠[12] 影响未来房价的核心因素 - 刚需购房数量越来越少,原因包括中国进入老龄化社会导致年轻人购房需求减少,以及90后、00后年轻人因不愿被房贷拖累而更倾向于租房[4][6] - 居民收入已无法支撑过高房价,实体经济不景气导致企业裁员降薪,居民收入增长放缓或下跌,且居民购房行为趋于理性[8] - 房地产市场长期处于供大于求状态,全国有6亿栋房子(按每栋住5人计算可容纳30亿人口),96%的家庭已拥有至少一套房产,41.5%的家庭拥有二套及以上房产,人均住房面积达41平米远超国际平均水平[10] - 房产税试点城市范围将扩大,未来5年内可能全面开征,持有多套房产的家庭持房成本将大幅上升,可能导致抛售进而加大房价下行压力[12]
DeepSeek线上模型已升级,AI人工智能ETF(512930)快速拉升盘中翻红
新浪财经· 2025-09-24 02:14
行业趋势 - DeepSeek线上模型升级至DeepSeek-V3.1-Terminus版本,AI应用驱动的算力需求持续高增长,海内外AI应用进入普及拐点时刻[1] - 国产算力产能瓶颈已突破,预计2026年将迎来放量,海外算力需求随应用铺开维持景气[1] 指数表现 - 中证人工智能主题指数(930713)截至2025年9月24日09:41上涨0.04%[1] - 指数成分股三六零上涨5.77%,科大讯飞上涨4.16%,同方股份上涨3.45%,全志科技上涨2.76%,神州泰岳上涨2.51%[1] - AI人工智能ETF(512930)上涨0.09%,报2.14元,近1周累计上涨1.47%[1] - 该ETF紧密跟踪中证人工智能主题指数,选取50只为人工智能提供基础资源、技术及应用支持的上市公司证券[1] 指数成分结构 - 中证人工智能主题指数前十大权重股合计占比60.82%[2] - 权重排名前三位为新易盛(6.52%)、中际旭创(6.71%)、寒武纪(6.45%)[2][3] - 科大讯飞权重5.72%且当日上涨4.16%,豪威集团权重5.62%且上涨2.24%[3] - 中科曙光权重5.32%且上涨1.48%,海康威视权重5.29%且上涨0.36%[3] - 澜起科技权重4.86%且上涨0.99%,金山办公权重3.34%且上涨1.91%,浪潮信息权重2.71%且上涨0.46%[3] - 中际旭创下跌3.30%,新易盛下跌2.83%,寒武纪微涨0.19%[3] 产品信息 - AI人工智能ETF(512930)设场外联接基金,包括平安中证人工智能主题ETF发起式联接A(023384)、C(023385)、E(024610)[5]
等不来DeepSeek-R2的246天:梁文锋的“三重困境”与“三重挑战”
36氪· 2025-09-23 10:13
核心观点 - DeepSeek-V3.1-Terminus版本发布 主要针对用户反馈问题改进 提升模型稳定性与一致性 [1] - 市场对DeepSeek-R2模型发布预期持续落空 自R1发布后246天内出现至少10次发布传言 反映公司面临技术、战略与市场竞争的多重压力 [2][5][6] - 公司通过开源策略推动技术普惠 开源包括通用模型V3.0324、多模态文生图模型Janus-Pro及底层工具链 但核心产品R2延迟暴露生态短板 [8][9][15] 技术更新与产品迭代 - DeepSeek-V3.1-Terminus版本更新 非例行迭代 重点改进用户反馈问题 提升稳定性与一致性 [1] - 开源通用模型DeepSeek-V3.0324 API成本为GPT-4的1/14 大幅降低使用成本 [8] - 开源多模态文生图模型Janus-Pro 但未在行业掀起波浪 [13][14] - 开源工具链包括FlashMLA解码内核、DeepGEMM矩阵运算库 推理速度提升约30% 并支持华为昇腾平台 [9] 市场预期与竞争环境 - 市场对DeepSeek-R2预期高涨 自2025年2月起多次传言发布 包括5月初、3月17日等 但均未实现 [5][6] - 竞争对手阿里巴巴通义千问、百度文心大模型已完成多轮功能迭代和模型升级 [6] - 公司估值因R1成功水涨船高 但R2延迟发布消耗用户耐心 导致市场预期管理失焦 [5][6][11] 技术挑战与算力限制 - R2延迟因技术突破难度大 需实现碾压级优势 但内部测试未达颠覆性提升 [6][11] - 算力供应问题突出 尝试迁移至华为昇腾芯片遇性能瓶颈和不稳定 被迫切回NVIDIA平台 [11] - 模型面临"幻觉"问题 在创意和事实性内容上表现不佳 影响用户信任 [15] 战略布局与生态构建 - 公司构建全栈开源技术体系 覆盖底层模型到上层工具链 推动国产AI算力落地 [8][9] - 缺乏内容生态优势 依赖外部数据集 无法像百度、字节跳动那样通过自有平台产生实时数据 [15] - 多模态能力缺位 技术路线单一 主要集中在文本和代码领域 限制商业化想象空间 [13][14] 行业影响与公司定位 - DeepSeek-R1开源策略降低AI技术应用成本 打破海外厂商垄断 推动行业创新 [17] - 公司面临创新者窘境 需在技术极致与市场时机间权衡 R2发布决策复杂化 [16] - 当前困境反映国内AI公司普遍挑战 包括技术瓶颈、战略短板和激烈竞争 [17]
DeepSeek成了硅谷最大的“不能说的秘密”
虎嗅· 2025-09-23 09:13
DeepSeek的行业影响 - DeepSeek模型完全免费且训练成本仅为西方模型的一小部分,性能更优价格更低,震撼了西方AI行业根基[14] - DeepSeek刚发布时几乎整个旧金山企业都在使用,包括非AI公司都在运行其本地化版本,成为硅谷“不能说的秘密”[1][14] - 企业悄悄在本地部署DeepSeek用于客服和后台等业务,因其成本极低且实用性强[14][15] 中国AI产业竞争力 - 中国在AI科技竞赛中具备超越美国的潜力,核心依据是顶级AI/ML期刊中中国学者高被引论文数量陡升而欧美近乎横盘[16] - 硅谷AI初创公司中中国籍员工比例很高,即使美国新冒头的AI初创公司骨子里也“很中国”[11][16] - 中国初创企业在面临芯片出口管制等限制条件下仍取得令人瞩目的技术突破,如DeepSeek绕过硬件限制实现创新[17] AI行业发展特征 - AI领域融资规模和增长速度史无前例,初创公司估值、融资额和年度经常性收入均创下纪录[11][21] - 欧洲增长最快的AI独角兽Lovable在8个月内达到1亿美元年经常性收入,速度超过美国同行[12] - 企业端对大模型应用热情有所降温,OpenAI数据显示企业日活下滑,个人使用量仍在攀升[21] 技术发展前景判断 - AI将像电力一样以近乎零边际成本普及,长期价值将集中在算力、带宽、存储、能源等基础设施领域[17] - 当前LLM和Transformer技术面临天花板,堆算力堆数据的边际收益递减现象开始显现[19] - 虽然中国AI公司更可能最终称雄,但距离真正的通用人工智能仍有很大差距[19] 中国企业出海机遇 - 中国AI公司出海面临的环境比想象中宽松,DeepSeek、华为、比亚迪已在西方年轻人心中建立品牌认知[22] - 中国文化软实力出口拐点已到,Labubu等IP产品在海外年轻人中形成潮流,为中国企业创造良好出海氛围[26][27] - 年轻海外用户通过TikTok等平台接触中国城市形象,对中国产生全新认知,有利于中国企业国际化[22] 创业生态观察 - AI浪潮中媒体偏好报道年轻创业者故事,但统计数据显示42岁首次创业成功率最高[23] - 更稳妥的创业路径是先进入优秀公司积累行业经验和领导能力,再独立创业[23] - 欧洲AI公司为与中国竞争采取“997”工作文化,认为必须比中国人更拼才能跑赢[12][19]
仅一个月 DeepSeek再升级!单项测试最大提升超36%
21世纪经济报道· 2025-09-23 08:44
公司技术升级 - DeepSeek-V3.1-Terminus版本于9月22日发布 输出效果相比前一版本更加稳定[1] - 新版本在Humanitys Last Exam测试中得分从15.9分提升至21.7分 提升幅度超过36%[1] - BrowseComp测试得分较上一代提升28.3% 官方API价格保持百万tokens输入0.5元 输出12元[1] 技术优化方向 - 重点针对用户反馈优化语言一致性 缓解中英文混杂和偶发异常字符现象[2] - 增强Agent能力 进一步优化Code Agent与Search Agent表现[2] - 距V3.1发布仅一个月 快速修复Bug成为留住开发者的关键[2] 技术架构创新 - 使用UE8M0 FP8 Scale参数精度 针对下一代国产芯片设计[1] - 提出多项算法创新 打破海外算力堆砌的传统大模型提升路径[2] - 具备高性能、低成本、蒸馏有效、开源等核心优势[2] 行业影响 - DeepSeek展示中国在AI领域具备与全球顶尖水平竞争的实力[2] - 促使全球投资者对中国科技企业技术创新能力塑造新认知[2] - 推动对中国科技资产重新进行价值评估[2] 产业链受益环节 - 大模型训推带动AI算力需求增长[2] - GB300、Vera Rubin等新一代算力架构将推出[2] - AI芯片、服务器整机、铜连接、HBM、液冷、光模块、IDC等环节持续受益[2] 市场反应 - 8月21日DeepSeek-V3.1发布当日 DeepSeek概念板块火热[1] - 国产芯片产业链企业股价大涨[1] - 开源模型竞争趋于白热化[2]