Workflow
开源
icon
搜索文档
创业者请警惕:把脑子交给AI,是天下最愚蠢的事
创业邦· 2025-03-09 03:27
AI对社会组织方式的冲击 - AI的普及将导致社会组织方式剧烈变化,可能使普通人"植物化",减少人际互动需求[7][8] - 掌握军事、政治、经济、智力四种力量的人群可能通过AI加剧社会两极分化[8] - 技术必须与恰当的社会组织方式结合,否则会带来系统性风险[9][10] AI在专业领域的应用表现 - DeepSeek在文学创作和诗词生成方面表现优于国内其他大模型[11] - 处理哲学专业问题时表现较弱,尤其在指导学术论文等深度内容上存在局限[11] - 医学保健类问题的回答质量处于中等水平[11] 应对AI幻觉的方法论 - 三重验证法:信息源可靠性核查、逻辑自洽性检验、元认知方向评估[12] - 全知可能带来决策瘫痪,适度保持无知有助于维持探索欲望[13][14] - 信息过载会导致注意力分散,需聚焦核心问题[19][20] 突破信息茧房的策略 - 跨平台对比法:同时使用不同AI系统和小红书/抖音等差异化平台[17] - 反向操作法:在单一平台主动搜索非偏好内容打破算法推荐惯性[18] - 管理实践启示:避免仅听取身边人意见,需主动接触一线未过滤信息[18] 苏格拉底提问法的商业应用 - 管理沟通三步骤:引导员工表达→植入观点→差异化处理合伙人关系[62][64] - 产品开发哲学:通过减法思维凸显核心价值,类似雕刻去冗余的过程[32][34] - 赛道创新逻辑:用新提问方式开辟"小而美"细分市场,如宠物店卖诗集[45][46] 近代精神对企业家的启示 - 马斯克模式:通过技术开源保持持续创新而非依赖专利保护[67][68] - 教育范式转变:梁文锋等创新者多成长于非功利性提问的家庭环境[73][76] - 分配制度挑战:AI普及可能需配合全民基本收入(UBI)保障创新生态[70][72] AI内容生产的本质特征 - 概率计算本质:仅掌握文字相关性而缺乏真实世界指向性[57][58] - 迭代共生关系:人类与AI相互促进演化,类似农耕/工业文明转型[49][50] - 二手思考辩证:有效思考不应拘泥于原创性而应注重问题解决实效[51]
爱建证券电子行业周报:DeepSeek开源周发布五大技术
爱建证券· 2025-03-03 10:10
行业投资评级 - 电子行业评级为"强于大市" [1] 核心观点 - DeepSeek开源周发布五大技术,包括FlashMLA、DeepEP、DeepGEMM、Optimized Parallelism Strategies和3FS,显著提升AI模型训练和推理效率 [6][9][11][16][19][23][28] - OpenAI发布GPT-4.5,计算效率较GPT-4提升10倍,但API成本高达75美元/百万tokens输入、150美元/百万tokens输出 [34][35] - 三星与长江存储签署3D NAND混合键合专利许可协议,计划2025年下半年量产420-430层V10 NAND [40] - 英伟达2025财年Q4营收393亿美元,同比增长78%,数据中心业务收入356亿美元,同比增长93% [30][32] - 阿里巴巴宣布未来三年投入3800亿元建设云和AI硬件基础设施 [36] - 台积电先进封装订单激增,英伟达包下七成CoWoS-L产能,预计全年出货量突破200万颗 [37] 目录分组总结 1 DeepSeek开源周发布五大技术 - **FlashMLA**:为Hopper架构GPU设计的高效MLA解码内核,在H800平台上实现3000GB/s数据吞吐与580 TFLOPS算力,性能较FlashAttention-2提升2倍 [6][8] - **DeepEP**:优化MoE模型训练和推理,节点内通信带宽达153GB/s(NVLink),节点间稳定在43-46GB/s(RDMA) [11][12] - **DeepGEMM**:FP8矩阵运算库,计算性能达1358 TFLOPS,加速比最高2.7倍 [16][17] - **Optimized Parallelism Strategies**:包含DualPipe和EPLB技术,优化并行计算和负载均衡 [19][21] - **3FS**:分布式文件系统,聚合读取吞吐量6.6 TiB/s,GraySort基准测试吞吐量3.66 TiB/分钟 [23][26] 2 全球产业动态 - **英伟达财报**:2025财年收入1305亿美元,同比增长114%,数据中心业务收入1152亿美元,同比增长142% [30][32] - **OpenAI GPT-4.5**:SimpleQA基准测试准确率62.5%,幻觉率37.1%,API成本为GPT-4o的30倍 [34][35] - **三星与长江存储**:合作开发420-430层V10 NAND,采用W2W混合键合技术 [40] - **阿里巴巴**:未来三年投入3800亿元建设云和AI基础设施 [36] - **台积电**:英伟达包下七成CoWoS-L产能,预计全年出货量200万颗 [37] - **SiC AR眼镜**:天科合达与慕德微纳合作,利用碳化硅衬底实现80°全彩视场角 [41][42] 3 本周市场回顾 - **SW一级行业**:钢铁(+3.2%)、房地产(+2.2%)、食品饮料(+1.8%)领涨,电子行业下跌4.9%,排名28/31 [44][47] - **SW三级行业**:半导体材料(+0.4%)、数字芯片设计(-2.1%)、半导体设备(-3.4%)表现较好 [47][48] - **海外市场**:费城半导体指数下跌11.7%,恒生指数上涨1.6% [51][53]
直线拉升!刚刚,深圳重大发布!
券商中国· 2025-03-03 07:22
深圳人工智能终端产业发展行动计划 - 深圳市发布《深圳市加快推进人工智能终端产业发展行动计划(2025—2026年)》,目标到2026年全市人工智能终端产业规模达8000亿元以上、力争1万亿元 [1][4] - 计划提出集聚不少于10家现象级人工智能终端企业,人工智能终端产品产量突破1.5亿台,推出50款以上爆款产品,打造60个以上典型应用场景 [4] - 重点发展人工智能手机、计算机、平板电脑、大模型一体机、可穿戴设备等品类,推动智能手机从"智能工具"向"智能助理"升级 [1][5] - 在可穿戴设备领域,重点布局智能眼镜、智能手表、智能耳机、AR/VR设备等细分赛道,聚焦空间感知、实时翻译、健康监测等场景 [5] 人工智能终端产业重点任务 - 加快发展端侧大模型,鼓励企业通过模型压缩、蒸馏等技术提高部署效率,建立高质量数据库优化模型 [6] - 提升基础软硬件水平,包括操作系统功能架构优化、芯片核心技术攻关、下一代显示技术发展等 [6] - 推动形成强大企业梯队,培育"隐形冠军",吸引全球企业在深设立创新总部和研发中心 [6] - 拓展应用场景,在政务服务、城市治理、智慧教育、医疗等领域开放场景,支持工业机器人、智能检测等制造业应用 [7] 智谱AI融资动态 - 智谱AI宣布完成新一轮超10亿元人民币战略融资,投资方包括杭州城投产业基金、上城资本等 [8] - 融资将用于国产基座GLM大模型技术创新和生态发展,服务长三角地区数字产业转型升级 [8] - 公司在2024年12月刚完成30亿元融资,用于GLM大模型系列研发,提升复杂推理和多模态任务能力 [8] - 智谱源自清华技术成果,已推出GLM-130B预训练模型、ChatGLM对话模型等产品矩阵 [9] 行业开源趋势 - DeepSeek举办"开源周"连续开源五个软件库,涵盖AI基础设施多个领域 [9] - 智谱表示将发布全新开源大模型产品,包括基座模型、推理模型、多模态模型等 [10] - 2025年以来字节豆包、阿里通义千问等企业纷纷加入开源行列,促进AI产业生态繁荣 [10] - 开源模式推动大模型从"重资本军备竞赛"转向"合作共创平台",降低研发成本提高创新效率 [11] 金融领域AI应用 - AI大模型在金融机构非核心决策环节已有较多落地应用,如智能客服、业务助理等 [11] - 奇富科技ChatBI与Deepseek-R1融合可优化营销效率,实现复杂数据分析任务拆解 [11] - DeepSeek-R1开源模型有望促进AI在金融机构核心决策/风控环节的加速探索 [11]
速递|腾讯声称超过DeepSeek,发布快速思考模型Turbo S继续点燃AI竞赛
Z Potentials· 2025-03-01 03:53
图片来源:腾讯 腾讯在其官方渠道表示,推出快速思考模型Turbo S , 被设计为尽可能快速地思考并且做出响应 , 与 DeepSeek 的深度推理方法有所不同,其部署成本也大 幅下降。 阿里巴巴在腾讯发布的一个月前,其最新的 Qwen AI 模型做了基准测试,以针对 DeepSeek 。周四, 微信运营商分享了数据表明其自身的 Turbo S 在常用 的 AI 测试中与 DeepSeek 的 V3 模型具有竞争力。 百度公司在周五表示将在 3 月 16 日推出其最新的 "Ernie" 平台。而字节跳动公司正在测试一个类似 DeepSeek 的 R1 的新模型。 图片来源: DeepSeek 许多公司和政府机构都在使用 DeepSeek 。其受欢迎程度居高不下 , 以至于由于服务器容量不足 , 一度暂停了某些服务。为了应对需求激增 , 它在非高峰时 段大幅降低了应用程序接口的价格。 上周 , 该公司承诺向公众发布关键代码和数据 , 这是一个不同寻常的举措 , 比以往竞争对手如 OpenAI 所做的更多地分享其核心技术。 通过这一举措 ,DeepSeek 正在更积极地推动 AI 开发的开源方法 , 这已经赢得了 ...
RISC-V高性能时代已来,玄铁再亮剑
半导体行业观察· 2025-03-01 00:57
RISC-V行业发展趋势 - RISC-V已完成从新兴势力到中坚力量的蜕变,大厂如高通出货6.5亿个RISC-V内核[1],英伟达累计量产30亿颗基于RISC-V内核的芯片[1] - RISC-V在MCU和AI芯片市场取得突破,消费电子、汽车、工业、PC及服务器市场均开辟新天地[1] - 行业进入高性能时代,阿里巴巴达摩院玄铁团队率先布局服务器级CPU[2] 玄铁处理器技术进展 - 玄铁处理器家族涵盖C、E、R三大系列,覆盖智能终端、网络通讯、AI智算及服务器等场景[5] - 玄铁处理器出货量超40亿颗,成为国内最受欢迎RISC-V处理器IP之一[5] - 新一代旗舰处理器C930采用15级乱序超标量流水线设计,SPECint 2006达15分/GHz以上,支持PC、边缘服务器和自动驾驶场景[7] - 新增AI专用处理器C908X(支持4096bit超长数据位宽)、车载处理器R908A及高速互联解决方案XL200[8] 生态建设与合作 - 玄铁构建以RISC-V为核心的软硬一体化生态,与劳特巴赫、兆松科技、Arteris等伙伴协同推动工具链、操作系统及解决方案发展[12] - 中国科学院软件所基于玄铁C910推出首款开源RISC-V笔记本"如意BOOK甲辰本",并量产64核C920处理器的"如意BOOK乙巳本",AI算力提升3.8倍[13] - 玄铁联合新思科技、Arteris等成立"无剑联盟",推出"无剑300"芯片设计平台,助力芯片厂商缩短开发周期[15] - 西门子EDA、Cadence等头部企业加入联盟,推动车规级解决方案(如经纬恒润)、教育硬件(网易有道)及电网(国网南瑞)领域落地[16] AI与开源战略 - DeepSeek开源模型成功验证低算力大模型可行性,打破传统架构依赖[19][20] - 玄铁C930集成8 TOPS Matrix引擎,AI算力较前代Vector引擎实现飞跃[21] - RISC-V作为唯一"生而开源"指令集架构,潜力受期待,玄铁率先提出Matrix扩展指令[18][22] 未来发展方向 - 玄铁持续迭代处理器产品线,聚焦高性能与AI两条技术路线[22] - 联合国际合作伙伴完善软件生态,贡献标准建设,推动RISC-V在服务器及AI场景渗透[18][22]
对谈 98 年就做开源的章文嵩:要像维基百科那样,开源共建大模型数据集丨开源对话#1
晚点LatePost· 2025-02-27 14:03
大模型开源趋势与行业影响 - DeepSeek重塑全球大模型格局,扭转行业对开源的理解,推动百度、MiniMax、阶跃星辰等公司转向开源[2][3] - DeepSeek计划开源5个训练、推理相关的代码库,超越多数公司仅开放模型权重的做法[4] - 开源大模型通过降低创新成本、建立生态可能形成"事实标准",如DeepSeek模型推理成本低推动生态自然形成[5][17] 开源数据集与模型性能 - 激进主张认为真正的大模型开源需包含训练数据集,类似维基百科由非营利机构牵头共建[6][9] - 开源模型串接(Llama/Mistral/Qwen)评测表现优于GPT-4o近10个百分点,证明开源数据集潜力[10][11] - 模型能力核心依赖训练数据质量,建议采用GPL类传染性许可证强制商业公司回馈数据集[13][14] 开源商业化路径 - DeepSeek未融资使其能专注技术追求,但未来需探索开源生态商业化如Red Hat的订阅服务模式[23][24] - 开源成功案例显示商业化可通过API服务、技术支持实现,生态需允许其他玩家盈利[28][39] - 中国开源受限于企业定制化需求强、软件采购方强势,但工程师规模全球第二[25][26] 公司开源策略差异 - Meta因错过云计算选择开源AI构建生态,阿里开源驱动因素包括技术品牌建设与云计算业务协同[29][30] - 阿里通过开源委员会流程化管理,将开源贡献纳入职级评审,推动外部贡献者占比提升[35] - 字节闭源、阿里部分开源、DeepSeek全开源的分化源于商业化路径选择差异[28] 开源生态建设经验 - 阿里早期开源tair缓存系统提升技术声誉,工程师因代码公开更注重质量[34] - 开源虽可能被竞品利用(如京东使用阿里开源软件),但能积累不可复制的数据资产与人才吸引力[38] - 中国大模型开源将持续,需多方共建生态形成正反馈,类似Linux成功模式[27][37] 技术演进与行业竞争 - OpenAI闭源因商业化压力难以回头,其有限开源o3-mini模型被视作挽回关注度的举措[19][21] - 芯片禁运背景下,DeepSeek开源策略为中国大模型发展提供关键路径启示[18] - 未来行业可能并存开源非营利巨头与闭源商业巨头,中等规模玩家共存[39]
中金:从规模经济看DeepSeek对创新发展的启示
中金点睛· 2025-02-27 01:46
核心观点 - DeepSeek的出现打破了AI大模型研发需要巨额资金和技术积累的固有认知,由一家中国金融领域的初创企业开发出性能卓越的开源大模型[1][4][5] - DeepSeek的成功在于通过算法优化提升算力的边际产出,以技术进步突破规模定律的约束,这背后体现了中国在数字基础设施和人才规模方面的优势[1][8][11] - AI发展同时受规模定律和规模效应影响,规模定律带来后发优势,规模效应带来先发优势,中美在AI领域各有比较优势[15][16][22] - DeepSeek选择开源模式有利于构建更大规模的创新生态,加速AI应用层的渗透,发挥中国在应用端的规模优势[24][26][28] - 金融与科技存在天然联系,金融领域的创新本就是数字科技创新的一部分,金融科技与科技金融需要协同发展[36][38][39] AI经济学:规模定律与规模效应 - 规模定律指在给定算法框架下,增加数据、参数、算力投入可提升AI性能但边际收益递减,规模效应指规模扩大带来单位成本下降和效率提升[8][9][10] - DeepSeek通过算法优化提升算力边际产出,以技术进步突破规模定律约束,在算法框架改善下AI性能可呈现规模报酬递增[11][12][14] - 算法创新依赖于规模经济构建的创新生态,包括企业内部规模经济和上下游协同的外部规模经济[14] - 中国在数字基础设施和人才规模方面的优势为算法创新提供了支撑,体现大国规模经济效应[1][14][15] AI经济学:后发优势与先发优势 - 规模定律隐含后发优势,落后者要素投入边际产出更高,有利于差距收敛;规模效应隐含先发优势,规模报酬递增强化领先者地位[15][16][22] - 中美AI发展指数显示两国在研发端和应用端均具规模优势,美国研发端略强,中国应用端略强[16] - 中美发展路径分化:美国侧重算力优势,中国侧重算法优化和人才规模,2022年中国培养的AI优秀人才占比已达47%[18][19][21] - 美国限制算力出口可能促使中国更聚焦算法优化,强化比较优势,算法技术进步是AI发展的核心驱动力[19][22] 开源促进外部规模经济 - DeepSeek开源模式降低应用层商业壁垒,有利于加速"人工智能+"进程,2025年1月其APP在157个国家和地区下载排名第一[24][26] - 开源系统更依赖外部规模经济,闭源系统更依赖内部规模经济,如Android用户数近iOS三倍但开发者收入更低[25][28] - AI应用层潜在市场规模是算力层和模型层总和的两倍,开源加速渗透可释放大国规模优势,促进经济增长[27][28] - 开源将规模经济收益更多分配给生态伙伴,实现创新社会正外部性,弱化技术进步的贫富分化效果[28] 创新发展模式 - 科技创新与产业创新需要融合发展,中国需摆脱重供给轻需求、重资产轻人才的路径依赖[31][32] - 大市场需求优势是产业创新根本驱动力,如《黑神话悟空》《哪吒之魔童闹海》等成功案例[32] - 大企业擅长渐进式创新,小企业更具颠覆式创新活力,CVC模式可实现两者优势互补[33][34] - 知识产权保护与个人破产制度对激励人才创新创业至关重要[34] 金融与科技关系 - 金融活动尤其是资本市场关键在解决信息不对称,金融领域创新本就是数字科技创新的一部分[36][39] - 量化基金等金融科技是科技工具在金融领域的重要应用场景,AI大模型要素也是其竞争力所在[38] - 资本市场通过外部规模经济支持创新生态,与多样化创新生态更契合,大国资本市场更具优势[37] - 需平衡金融科技监管与包容"动物精神",重点防范不当行为而非限制超额收益本身[39]
微软CEO纳德拉最新访谈:开源是对赢者通吃的最大制约
IPO早知道· 2025-02-25 02:39
微软量子计算突破 - 微软发布全球首款拓扑量子芯片Majorana 1,采用半导体砷化铟和超导体铝材料,基于全新"拓扑"物质状态构建[3][4] - 该芯片历时近20年研发,目标在2030年前上市并实现百万量子比特规模,被视为量子计算的"晶体管时刻"[3][15][16] - 技术突破在于验证了马约拉纳零能模在新物相中的存在,使量子信息可被可靠隐藏和测量[15][16] 量子计算战略布局 - 微软采用软硬件分离策略,同时与中性原子、离子阱团队合作开发多种量子计算机类型[17] - 计划2027-2029年推出容错量子计算机,预计可容纳百万物理量子比特和数千逻辑量子比特[17] - 量子计算将专注于化学物理、生物学等非数据密集型但需探索指数级状态空间的领域[17][18] AI与量子计算协同 - AI可作为"模拟器的模拟器",量子计算则作为"自然模拟器",两者结合可生成合成数据训练更优模型[18] - 量子计算不会取代经典计算,但能增强高性能计算能力,尤其在材料科学等领域的模拟应用[17][18] AI市场格局判断 - 超大规模云服务(如Azure)和模型层将共存,但AI市场不会形成赢者通吃格局,企业客户会要求多供应商并存[7][8] - 开源模型将制约闭源垄断,政府监管也将介入防止私营公司主导AI领域[7] 计算基础设施需求 - AI工作负载(如ChatGPT)推动计算需求指数级增长,训练和推理阶段均需大规模计算集群[6][9] - 全球分布式计算集群成为刚需,需就近部署存储与计算资源以突破"光速限制"[9] AGI经济影响标准 - AGI实现的真正标志是全球经济增长率达到10%(当前发达国家平均2%),而非技术基准炒作[10][20] - 若实现10%增长,全球年新增价值将达10万亿美元(基于100万亿美元全球经济规模)[10] 智能成本与普及 - 遵循"杰文斯悖论",智能成本下降将刺激需求弹性,尤其在发展中国家医疗等领域的应用[14] - 智能需同时提升能力并降低成本,类似云计算通过弹性付费模式扩展市场的历史路径[14] 技术投资方法论 - 公司选择进入TAM(潜在市场总量)大且能容纳多个赢家的赛道,避免押注赢者通吃领域[8] - 研发需平衡短期需求与长期相关性,保持对失败的高容忍度以探索未来技术[23] 认知劳动演变 - 当前认知劳动可能被自动化,但会催生更高层次的认知任务,形成动态平衡而非完全替代[23][24] - AI工具应作为人类认知增强器,例如开发具备长期记忆的会议协调代理提升决策效率[25] 材料科学革命愿景 - 量子计算+AI有望加速新材料研发,目标在25年内实现传统需250年完成的工业革命级突破[25]
DeepSeek Inside:彻底的技术开放,成就的商业奇观
晚点LatePost· 2025-02-17 15:35
文丨贺乾明 张家豪 制图丨黄帧昕 编辑丨程曼祺 黄俊杰 中国正在经历自己的 "ChatGPT 时刻"。过去三周,DeepSeek 的官方应用永远被人流挤到瘫痪边缘,与此 同时数百家公司正式接入了它研发的大模型。MiniMax、阶跃星辰等与它有竞争关系的 AI 创业公司接入 了,元宝、文心一言这样的大公司 AI 产品也接入了。 高潮是上周末,微信,这个几乎从不追赶任何潮流的国民级应用也在搜索页面接入了 DeepSeek-R1。根据 我们了解,腾讯最高层在近期曾与 DeepSeek 创始人梁文锋见面。除了微信以外,QQ 浏览器、QQ 音乐、 腾讯文档等腾讯的十几个产品也都接入 DeepSeek。 一个没花一分钱营销的技术公司实现了 "DeepSeek Inside" 的品牌奇迹。 这个奇迹只能诞生在中国: 互联网渗透最彻底的人口,每天 6 小时泡在数字世界里,抖音、小红书、微信、微博等平台接力将 DeepSeek 送到每个人眼前。 先在全球技术社区引发热议,后在国内发酵,完美贴合在全球 AI 竞赛激发的情绪。 春节假期造就社交裂变温床,被子女 "安利" 的长辈们点开小鲸鱼图标,完成 AI 在中国的首次全民 级破圈 ...
我所见过的梁文锋
投资界· 2025-02-07 07:54
量化投资行业发展 - 2018年量化市场初现格局,幻方量化当时管理客户资金约45亿,自营盘约10亿,已是行业第一梯队 [5] - 2019年幻方规模超过百亿,稳居国内量化私募"四巨头" [8] - 量化私募行业进步符合摩尔定律,每18个月投资能力翻一倍 [14] - 量化投资使命是提高中国二级市场有效性 [8][14] 幻方量化发展历程 - 2015年成立幻方科技,目标是打造世界一流量化私募团队 [11] - 2019年投入近2亿自研深度学习训练平台"萤火一号",2021年"萤火二号"投入达10亿 [9] - 萤火一号机房面积约1个篮球场,萤火二号预计达10个篮球场 [9] - 采用独特报酬计提方式:客户赎回时才提成,对客户友好 [5] 梁文锋个人特质与理念 - 技术理想主义者,专注编程开发,生活简朴 [5] - 愿景是建立不收业绩报酬和管理费的公司 [6] - 2019年提出想做开源策略平台让普通投资人使用 [8] - 2023年成立人工智能研究公司深度求索,推进"最终梦想" [6] 人工智能领域布局 - 认为开源是文化行为而非商业行为,给予是额外荣誉 [8][15] - 中国AI发展需要原创而非模仿,需建立技术生态 [15] - DeepSeek定位基础模型和前沿创新,希望业界在其技术上构建业务 [15] - 团队选人标准是热爱和好奇心,专注解决世界最难问题 [15][16] 量化投资方法论 - 金融市场公平透明,人类与计算机模型站在同一起跑线 [13] - 市场有效时直接买指数就是价值投资 [14] - 需要大量程序员和研究员支持量化投资发展 [13] - 引用西蒙斯理念"一定有办法对价格建模" [10][13] 技术创新理念 - 硬核创新需要信心和高密度人才组织 [15] - 创新驱动不仅靠商业,还需好奇心和创造欲 [15] - 颠覆性技术面前闭源护城河短暂 [15] - 价值沉淀在团队成长和组织文化上 [15]