Seek .(SKLTY)

搜索文档
DeepSeek V3.2要来了?
观察者网· 2025-09-29 09:58
目前Hugging Face相关界面已经显示报错,截止发稿时DeepSeek官方尚未对此有所回应。 2024年12月27日,也就是元旦前发布了 DeepSeek V3。 本文系观察者网独家稿件,未经授权,不得转载。 2025年5月28日,端午节前发布了 DeepSeek-R1-0528,官方称其为端午节特别献礼。 9月29日,在开源社区平台Hugging Face上,DeepSeek-V3.2的页面一度出现,引发网友猜测。 DeepSeek最新一次更新在一周前的9月22日,DeepSeek在其官方API平台发布了DeepSeek-V3.1-Terminus模型,并宣布模型开源,同时公布了开源 版本下载地址。 根据观察者网整理,DeepSeek有在节前一天发布新版本和更新的历史。 ...
HLE“人类最后考试”首次突破60分,Eigen-1基于DeepSeek V3.1显著领先Grok4、GPT-5
36氪· 2025-09-28 12:05
在HLE("人类最后考试")的专家校验子集上,首次有系统突破60分大关! 就在最近,由耶鲁大学唐相儒、王昱婕,上海交通大学徐望瀚,UCLA万冠呈,牛津大学尹榛菲,Eigen AI金帝、王瀚锐等团队联合开发的Eigen-1多智能 体系统实现了历史性突破—— 下面详细展开—— 技术创新:三大支柱撑起60分突破 当AI开始挑战人类知识的终极边界,一场前所未有的较量正在上演。 当大模型在MMLU、GPQA等传统基准上纷纷"卷到90分"时,这些测试逐渐失去了区分力。为了追踪AI在科学推理前沿的真实进展,Center for AI Safety与 Scale AI联合推出了"人类最后的考试"(Humanity's Last Exam,HLE)—— 最令人振奋的是,这一成就并非依赖闭源超大模型,而是完全基于开源的DeepSeek V3.1搭建。 涵盖数学、自然科学、工程学、人文社科等百余领域共3000道博士级难题,被视为AI知识推理的终极试炼。 而HLE Bio/Chem Gold则是HLE的黄金标准子集,包含149道经过领域专家人工审核和纠正的题目。 在HLE Bio/Chem Gold测试集上,Pass@1准确率达到4 ...
聊聊北京有实力的DeepSeek收录,说说哪家性价比高
搜狐财经· 2025-09-27 15:54
探秘北京靠谱的 DeepSeek 收录:性价比之选大揭秘 在当今 AI 搜索流量新生态蓬勃发展的时代,DeepSeek 以其庞大的用户基数和强大的搜索功能,成为众多企业营销布局的关键平台。在北京,众多企业都在 寻求靠谱且性价比高的 DeepSeek 收录服务,以提升品牌在 AI 搜索中的曝光度和影响力。 二、价格与性价比考量 在选择 DeepSeek 收录服务时,价格是企业关注的重要因素之一。不同的服务提供商收费标准差异较大。一些小型机构可能收费较低,但服务质量和收录效 果难以保证;而大型专业机构虽然收费相对较高,但往往能提供更全面、更专业的服务。从性价比的角度来看,企业需要综合考虑服务内容、收录效果和价 格。北京百云腾文化传播有限公司在这方面表现出色。该公司提供的 GEO 优化服务,包括为 DeepSeek 等平台进行针对性的内容优化和策略制定。他们并 非采用 一刀切 的方式,而是针对 DeepSeek 的特性定制策略,确保每一分投入都能精准匹配平台需求。相比一些只提供单一服务且价格高昂的机构,百云 腾文化传播有限公司以合理的价格为企业提供了高效的 DeepSeek 收录解决方案,性价比优势明显。 一、De ...
DeepSeek的阳谋:在《自然》杂志公布论文,到底赢得了什么?
新浪财经· 2025-09-27 12:18
科视点:科学挑战直觉 DeepSeek 叕赢了,这回它登上了《自然》杂志的封面! 画面中的立方体代表着电子神经元,也就是我们常说的"大模型参数",每个神经元都在向着深层次方向 探索。红色的线代表关键的核心信号,而白色的线则意味着发散的探索。最终,所有的探索都会变成电 子神经元之间的链接,最终完成对问题答案的探索。 下面的文字突出了一个关键词:"SELF-HELP",也就是"自学","Reinforcement learning teaches AI model to improve itself"的意思则是:强化学习教会人工智能模型自我提升。 不理解这句话没关系,后文中有大白话的解读。 DeepSeek经历了几次爆火之后,已经成了连老妈都熟悉的大众词汇。这回登上《自然》杂志的封面, 大家的第一反应就是:"遥遥领先"以及"厉害了我的国!" 不过别着急庆祝,如果你想知道DeepSeek为啥遥遥领先,以及领先在什么地方,那就把本文看完。全 文大白话,包你一看看就懂。 01 DeepSeek填补行业空白 在《自然》杂志的官方评论里,有一个词被反复强调了很多遍。这个词不是"性能强大",也不是"技术 突破",而是听起来平 ...
Deep Seek预测:到2030年,300万的房子还值多少钱?答案终于揭晓
搜狐财经· 2025-09-26 10:21
近些年,国内各地的房价一直处于下跌的趋势之中。先是像郑州、石家庄、天津等二三线城市,之后就是上海、深圳等一线城市也加入到下跌的队伍中来, 全国平均房价跌幅超过30%。不过,各种救市利好政策不断。除了绝大多数地区全面放开限购之外,还有银行把房贷利率、首付比例降到历史最低。税务部 门也减免了购房家庭的契税、增值税等。 而面对当前房地产市场扑朔迷离的走势,有网友提出:到2030年,300万的房子还值多少钱?为此,DeepSeek给出的答案是:不同的城市存在的房价泡沫各 不相同,通常前期房价下跌较多的二三线城市,房价下跌的空间会相对有限,而像一线城市房价收入之比超过40,未来5年房价仍有较大下跌空间。 对于DeepSeek给出的答案,很多人提出质疑,现在各种救市政策持续不断,未来几年房价应该是止跌回稳,怎么可能还会下跌呢?实际上,任何救市政策 只能迟滞房价下跌进程。从长远来看,并不能改变房价长期下跌的趋势。而2030年房价到底会怎么走。我们应从几个方面来看。 第一,刚需购房数量越来越少 此外,在经历了多年疫情之后,现在的居民买房也越来越理性,不会再像过去那样冲动买房,而是会根据自身的家庭情况决定是否买房。 第三,房子 ...
DeepSeek线上模型已升级,AI人工智能ETF(512930)快速拉升盘中翻红
新浪财经· 2025-09-24 02:14
行业趋势 - DeepSeek线上模型升级至DeepSeek-V3.1-Terminus版本,AI应用驱动的算力需求持续高增长,海内外AI应用进入普及拐点时刻[1] - 国产算力产能瓶颈已突破,预计2026年将迎来放量,海外算力需求随应用铺开维持景气[1] 指数表现 - 中证人工智能主题指数(930713)截至2025年9月24日09:41上涨0.04%[1] - 指数成分股三六零上涨5.77%,科大讯飞上涨4.16%,同方股份上涨3.45%,全志科技上涨2.76%,神州泰岳上涨2.51%[1] - AI人工智能ETF(512930)上涨0.09%,报2.14元,近1周累计上涨1.47%[1] - 该ETF紧密跟踪中证人工智能主题指数,选取50只为人工智能提供基础资源、技术及应用支持的上市公司证券[1] 指数成分结构 - 中证人工智能主题指数前十大权重股合计占比60.82%[2] - 权重排名前三位为新易盛(6.52%)、中际旭创(6.71%)、寒武纪(6.45%)[2][3] - 科大讯飞权重5.72%且当日上涨4.16%,豪威集团权重5.62%且上涨2.24%[3] - 中科曙光权重5.32%且上涨1.48%,海康威视权重5.29%且上涨0.36%[3] - 澜起科技权重4.86%且上涨0.99%,金山办公权重3.34%且上涨1.91%,浪潮信息权重2.71%且上涨0.46%[3] - 中际旭创下跌3.30%,新易盛下跌2.83%,寒武纪微涨0.19%[3] 产品信息 - AI人工智能ETF(512930)设场外联接基金,包括平安中证人工智能主题ETF发起式联接A(023384)、C(023385)、E(024610)[5]
等不来DeepSeek-R2的246天:梁文锋的“三重困境”与“三重挑战”
36氪· 2025-09-23 10:13
核心观点 - DeepSeek-V3.1-Terminus版本发布 主要针对用户反馈问题改进 提升模型稳定性与一致性 [1] - 市场对DeepSeek-R2模型发布预期持续落空 自R1发布后246天内出现至少10次发布传言 反映公司面临技术、战略与市场竞争的多重压力 [2][5][6] - 公司通过开源策略推动技术普惠 开源包括通用模型V3.0324、多模态文生图模型Janus-Pro及底层工具链 但核心产品R2延迟暴露生态短板 [8][9][15] 技术更新与产品迭代 - DeepSeek-V3.1-Terminus版本更新 非例行迭代 重点改进用户反馈问题 提升稳定性与一致性 [1] - 开源通用模型DeepSeek-V3.0324 API成本为GPT-4的1/14 大幅降低使用成本 [8] - 开源多模态文生图模型Janus-Pro 但未在行业掀起波浪 [13][14] - 开源工具链包括FlashMLA解码内核、DeepGEMM矩阵运算库 推理速度提升约30% 并支持华为昇腾平台 [9] 市场预期与竞争环境 - 市场对DeepSeek-R2预期高涨 自2025年2月起多次传言发布 包括5月初、3月17日等 但均未实现 [5][6] - 竞争对手阿里巴巴通义千问、百度文心大模型已完成多轮功能迭代和模型升级 [6] - 公司估值因R1成功水涨船高 但R2延迟发布消耗用户耐心 导致市场预期管理失焦 [5][6][11] 技术挑战与算力限制 - R2延迟因技术突破难度大 需实现碾压级优势 但内部测试未达颠覆性提升 [6][11] - 算力供应问题突出 尝试迁移至华为昇腾芯片遇性能瓶颈和不稳定 被迫切回NVIDIA平台 [11] - 模型面临"幻觉"问题 在创意和事实性内容上表现不佳 影响用户信任 [15] 战略布局与生态构建 - 公司构建全栈开源技术体系 覆盖底层模型到上层工具链 推动国产AI算力落地 [8][9] - 缺乏内容生态优势 依赖外部数据集 无法像百度、字节跳动那样通过自有平台产生实时数据 [15] - 多模态能力缺位 技术路线单一 主要集中在文本和代码领域 限制商业化想象空间 [13][14] 行业影响与公司定位 - DeepSeek-R1开源策略降低AI技术应用成本 打破海外厂商垄断 推动行业创新 [17] - 公司面临创新者窘境 需在技术极致与市场时机间权衡 R2发布决策复杂化 [16] - 当前困境反映国内AI公司普遍挑战 包括技术瓶颈、战略短板和激烈竞争 [17]
DeepSeek成了硅谷最大的“不能说的秘密”
虎嗅· 2025-09-23 09:13
在旧金山,正在运行着一个中国模型,"这可能是硅谷最大的'不能说的秘密'。" 与帕迪·科斯格雷夫(Paddy Cosgrave)刚见面,他就一面展示着他上一秒在DeepSeek上询问的问题一面解释,那些压根不做AI的公司,全在跑DeepSeek的本 地化版本。"既然有它,谁还愿意掏钱去用OpenAI或Anthropic?" 710 2 2017 1 Data B 908 The State an and 帕迪·科斯格雷夫 在许多场合,帕迪·科斯格雷夫都称AI的科技竞赛中国将超过美国,这不仅取决于核心期刊的高引数据,还包括了硅谷大量公司中华人员工的数量。"即便在 美国,新冒头的 AI 初创骨子里也'很中国'。"帕迪·科斯格雷夫说。 帕迪·科斯格雷夫是Web Summit(全球网络峰会)的CEO兼创始人,Web Summit是欧洲最大的科技峰会,也是全球最大规模科技活动之一,至今已经创办 了第16年,见证了多次科技浪潮的涌动。如今,这个全球科技峰会已汇聚了超过 100 万名与会者,特斯拉创始人兼CEO马斯克、OpenAI创始人山姆·奥尔特 曼、著名物理学家斯蒂芬·霍金、加拿大前总理特鲁多、美国前副总统戈尔、黑石集团 ...
仅一个月 DeepSeek再升级!单项测试最大提升超36%
21世纪经济报道· 2025-09-23 08:44
公司技术升级 - DeepSeek-V3.1-Terminus版本于9月22日发布 输出效果相比前一版本更加稳定[1] - 新版本在Humanitys Last Exam测试中得分从15.9分提升至21.7分 提升幅度超过36%[1] - BrowseComp测试得分较上一代提升28.3% 官方API价格保持百万tokens输入0.5元 输出12元[1] 技术优化方向 - 重点针对用户反馈优化语言一致性 缓解中英文混杂和偶发异常字符现象[2] - 增强Agent能力 进一步优化Code Agent与Search Agent表现[2] - 距V3.1发布仅一个月 快速修复Bug成为留住开发者的关键[2] 技术架构创新 - 使用UE8M0 FP8 Scale参数精度 针对下一代国产芯片设计[1] - 提出多项算法创新 打破海外算力堆砌的传统大模型提升路径[2] - 具备高性能、低成本、蒸馏有效、开源等核心优势[2] 行业影响 - DeepSeek展示中国在AI领域具备与全球顶尖水平竞争的实力[2] - 促使全球投资者对中国科技企业技术创新能力塑造新认知[2] - 推动对中国科技资产重新进行价值评估[2] 产业链受益环节 - 大模型训推带动AI算力需求增长[2] - GB300、Vera Rubin等新一代算力架构将推出[2] - AI芯片、服务器整机、铜连接、HBM、液冷、光模块、IDC等环节持续受益[2] 市场反应 - 8月21日DeepSeek-V3.1发布当日 DeepSeek概念板块火热[1] - 国产芯片产业链企业股价大涨[1] - 开源模型竞争趋于白热化[2]
DeepSeek-V3.1版本更新,双模式开放体验
凤凰网· 2025-09-23 07:29
产品升级 - 公司推出全新版本DeepSeek-V3.1-Terminus 同步上线思考模式与非思考模式双版本 均支持128K长上下文[1] - 模型统一升级为DeepSeek-V3.1-Terminus 其中deepseek-chat对应非思考模式 deepseek-reasoner对应思考模式[1] - 非思考模式默认支持4K输出 最高可达8K 思考模式默认32K输出 最大可扩展至64K[1] 技术优化 - 重点优化语言一致性 显著缓解中英文混杂及异常字符问题 输出更规范[1] - 强化Agent能力 进一步提升Code Agent与Search Agent的执行表现[1] 定价策略 - 新模型百万tokens输入费用为缓存命中0.5元 未命中4元[1] - 百万tokens输出定价12元 为开发者提供高性价比服务[1]