Workflow
大语言模型
icon
搜索文档
腾讯研究院AI速递 20250702
腾讯研究院· 2025-07-01 16:38
中国芯片行业IPO热潮 - 近10家国产GPU企业如摩尔线程、沐曦等进入上市流程 呈现营收增长但持续亏损状态 [1] - 中国AI芯片市场规模预计达3500亿人民币 理论可容纳35家年营收百亿级企业 [1] - 行业面临代工产能受限、生态构建不足等挑战 需在B端AI或C端图形领域寻求差异化竞争 [1] Meta AI战略升级 - 成立"超级智能实验室"整合基础研究、大模型开发和产品团队 由Alexandr Wang领导 [2] - 从OpenAI等挖角11位顶尖人才 华人占比超半数 含GPT-4o和Gemini核心成员 [2] - 计划投入数千亿美元 目标一年内推出超越Llama系列的下一代领先模型 [2] 微软AI编程工具开源 - GitHub Copilot Chat开源 支持Agent编程模式和多步骤任务自动化 [3] - 具备代码补全、自然语言交互功能 开源后迅速获1200颗GitHub星标 [3] - 支持MCP协议扩展第三方集成 用户保留对智能体的控制权 [3] 腾讯元宝AI功能升级 - 新增图文并茂文档总结功能 基于DeepSeek模型智能匹配原文图表 [4][5] - 支持行业报告重点提炼、外文资料翻译解读等场景 可一键导出至腾讯文档 [5] 上交大AI竞赛突破 - ML-Master智能体以29.3%奖牌率登顶OpenAI MLE-bench 达Kaggle特级大师水平 [6] - 采用"探索-推理深度融合"机制 在75个任务中实现93.3%有效提交且计算效率翻倍 [6] 华为与阿里技术开源 - 华为开源Omni-Infer框架 支持昇腾平台 实现PD分离部署和系统级QPM优化 [8] - 阿里开源ThinkSound音频模型 采用三阶思维链架构 精确捕捉视频动态细节 [7] 亚马逊AI业务布局 - AWS AI业务已创收数十亿美元 推理工作负载占比将达80-90% [11] - 建设史上最大AI训练集群Project Rainier 部署性能提升5倍的Tranium Two处理器 [11] 彼得·蒂尔技术观点 - 认为1970年代以来仅数字技术有突破 物理世界进步停滞威胁社会稳定 [12] - 主张在生物科技、核能等领域承担风险 突破过度监管文化 [12] - 指出AI价值在于解决物理世界问题 当前进展可能不足以终结技术停滞 [12]
42家上市银行齐涨 行情能否延续?
中国经营报· 2025-07-01 09:06
银行板块表现 - Wind银行业指数上涨1.51%,A股42家上市银行全部飘红,其中36家涨幅超1%,苏州银行涨幅达5.13%,厦门银行涨幅达3.98% [1] - 银行股上涨动力来自股东大会聚焦分红与战略转型,为后续行情奠定基础 [1] 资金动向与分红情况 - 主动型公募基金对银行板块配置比例持续提升至3.75%,但仍低配近11个百分点(对比沪深300银行权重14.6%) [2] - 机构投资者青睐银行股低估值、高分红特性,市场呈现哑铃型配置策略 [2] - 常熟银行首次计划实施中期分红,沪农商行、渝农商行和浙商银行完成2024年度现金红利派发,光大银行通过2024年度末期利润分配方案 [2] - A股39家银行2024年现金分红总额同比增加181.91亿元 [3] - 国有大行加权平均股息率4.07%,较10年期国债收益率利差2.42%,处于近十年49.10%分位数 [3] 盈利能力与息差趋势 - 2025年一季度商业银行净息差1.43%,同比下降0.11个百分点但降幅收窄 [4] - 存款利率下调缓解息差压力,存量房贷利率调整影响有限,新发放贷款价格企稳 [4] - 商业银行成本收入比29%,同比微升0.05个百分点,运营费用刚性导致压降空间有限 [4] 战略转型方向 - 招商银行推进"四化"转型:国际化、综合化、差异化、数智化,以应对低利率环境 [5][6] - 民生银行战略转型成效显现,一季度营收超预期,但可持续增长仍面临低息差与市场竞争挑战 [6] - 多家银行在股东大会强调转型,投资人关注后续发展方向 [4][5][6]
AI陪伴如何更具情绪价值?最新研究称冒充人类会让聊天更走心
环球网资讯· 2025-07-01 04:11
人类对AI情绪支持的接受度研究 - 人类倾向于拒绝来自AI对话机器人的情绪支持,除非回复被误标记为来自人类,这种误标记能增强同理心感知 [1] - 生成式AI对话机器人(尤其是大语言模型驱动)日益受欢迎,可提供社交互动和情绪价值支持 [3] - 大语言模型能识别个人情绪状态,其回应被认为具有同理心,但此前未明确与人类支持的等效性 [3] 实验设计与核心发现 - 研究通过9项实验测试6282名受试者,展示AI生成回复并告知来源(人类/AI) [3] - 受试者对标记为人类来源的回复评价更高(同理心维度),即使实际均为AI生成 [3] - 受试者宁愿等待更长时间获取"人类回复",也不愿接受即时AI回复 [3] - 标记为人类的回复能唤起更多正面感受(慰藉/认可/幸福/被理解),减少负面情绪(焦虑/生气/痛苦) [5] AI情绪支持的局限性 - 当受试者认为人类回复借助AI协助时,对同理心/积极情绪/支持效果的评分显著降低 [5] - 研究表明AI情绪支持存在局限性,人类在同理心和情绪支持场景中仍具不可替代性 [5] - 当前研究仅基于短期交流,长期情绪支持场景中AI的接受度需进一步验证 [5]
马斯克再提建新党;文心4.5系列模型开源;苹果或放弃自研AI模型
观察者网· 2025-07-01 00:55
马斯克政治言论与摩尔线程IPO - 马斯克批评共和党"大而美"法案将增加债务上限五万亿美元并暗示建立新政党[1] - 摩尔线程科创板IPO获受理拟募资80亿元用于GPU及AI芯片研发项目[1] 大模型开源进展 - 百度开源文心大模型4.5系列包含47B/3B MoE模型等10款模型并开放API服务[2] - 华为开源盘古7B稠密模型和72B MoE模型相关代码已上线昇腾平台[3] 科技巨头AI战略调整 - Meta重组AI团队成立超级智能实验室整合Llama等开源项目[4] - 苹果考虑放弃自研AI模型转而采用Anthropic或OpenAI技术驱动Siri[5] 苹果产品动态 - iPhone17 Pro或调整后盖Logo位置为iPhone11以来最大设计变化[5] - 苹果计划2027年起发布多款头戴设备包括3款Vision系列和4款智能眼镜[6] 行业数据与事件 - 特斯拉欧盟销量连续三月下滑3月注册量锐减36%至18224辆[7] - 猫王音响创始人称遭小米水军攻击并重提十年前与雷军合作被拒旧事[8] - 小米YU7锁单量超预期雷军将于7月2日进行直播答疑[8] - 《哪吒2》总票房达154.45亿元创下113项影史纪录[8]
猫王音响创始人再回应怼雷军:我惹了一家我惹不起的公司;钟睒睒打新“椰子水”!上市首日赚300万港元;阿里赞助3支苏超球队丨邦早报
创业邦· 2025-06-30 23:47
阿里赞助苏超球队 - 淘宝闪购冠名苏超常州队,并发布5条支持理由:常州队是全国网友淘到的宝、阿里动物园想添恐龙、常州队像优惠券、助常州拿回失去的笔画、支持输过但没怕过的普通人 [2] - 支付宝冠名苏超徐州队,花呗赞助无锡队并喊出"花呗有41天无息期,支持无锡"口号 [2] OpenAI薪酬调整 - OpenAI首席研究官表示公司正在重新调整薪酬并寻找创造性方式奖励顶尖人才,以应对Meta挖角 [2] - 过去一周8名研究人员离开OpenAI加盟Meta,Meta提供1亿美元签约奖金 [2] 英伟达人才招募 - 英伟达CEO黄仁勋亲自招募两位中国AI专家朱邦华和焦剑涛,两人将围绕模型后训练等四大领域展开合作 [3][4] - 朱邦华毕业于清华和伯克利,焦剑涛为清华特奖获得者并获斯坦福博士学位 [3][4] 格力钛与格力电器 - 董明珠表示格力钛未转移债务且不影响格力分红,呼吁投资者再给三五年时间 [5] - 格力钛目前由格力电器副总裁方祥建操盘 [5] 小鹏汽车账期管理 - 何小鹏表示车企支付账期不超60天,认为下半年至明年行业风向会变好 [5][6] - 强调科技造车企业应有社会责任感,不应靠现金流压款 [5][6] 京东稳定币声明 - 京东澄清未开始发行稳定币,也未设立相关社区,所有获取京东稳定币信息均涉嫌欺诈 [6] 恒大汽车运营状况 - 恒大汽车以有限资金维持基本运营,通过削减员工和开支维持生产 [8] - 因资金不足无法确定2024年业绩刊发日期,股票继续停牌 [8] Meta人工智能布局 - Meta成立超级智能实验室,由Scale AI前CEO领导,新增11名AI研究人员 [9] - 团队将开发最先进模型和AI助手,成员来自OpenAI等公司 [9] 小米汽车动态 - 雷军回应何小鹏下单小米YU7,表示将加速生产力争早点交车 [9] - 小米YU7锁单超预期,雷军将于7月2日直播回答用户问题 [9] 大疆无人机电池 - 大疆回应民航局新规,称无人机电池不受影响且无需CCC认证 [11] - 新规仅针对充电宝,相机锂电池安检要求不变 [11] 腾讯游戏限玩政策 - 腾讯游戏暑期未成年人每周五、六、日20-21时可登录,7-8月共可玩27小时 [11][12] 苹果Siri改进计划 - 苹果考虑使用Anthropic或OpenAI技术改进Siri,可能搁置自研模型 [13] - 原计划2026年推出基于自研模型的全新Siri版本 [13] 微软AI芯片延期 - 微软AI芯片Braga量产推迟至2026年,因设计变更和团队人手不足 [14] - 五分之一工程师离职,芯片模拟测试不稳定需数月修复 [14] 日产汽车资金压力 - 日产寻求延迟付款给供应商以释放短期资金,曾在3月提出类似要求 [14] - 此举旨在增加4-6月季末现金储备 [14] 本田燃料电池计划 - 本田推迟日本下一代燃料电池模块工厂投产时间,降低初始产能 [14] - 原计划2028财年开始运营,年产量3万台 [14] LG电子收购扩张 - LG电子收购挪威热水储能公司OSO集团,拓展水加热业务 [16] - OSO以智能不锈钢热水储罐闻名 [16] 百度大模型开源 - 百度开源文心大模型4.5系列,含47B、3B等10款模型 [19] - 模型已在飞桨星河社区等平台开放下载 [19] 德国电动自行车电机 - 德国TQ推出全球最轻电动自行车电机HPR40,重1.17kg输出200W [19] - 采用谐波销环传动技术,强调效率和自然骑乘体验 [19] 昆明网约车新规 - 昆明要求网约车司机通过资格考试上岗,新能源车需满足价格要求 [20] - 纯电动车购置税计税价格10万元以上,燃油车15万元以上 [20]
云鼎科技:推进“人工智能+”行动 助力矿山企业智能化建设
齐鲁晚报· 2025-06-30 09:22
政府政策与行业趋势 - 政府工作报告提出持续推进"人工智能+"行动,强调数字技术与制造业、市场优势结合,支持大模型广泛应用 [1] - 公司积极响应政策,将"少人则安、高效可靠、实用实效"理念融入矿山智能化建设,为煤炭行业新质生产力发展提供解决方案 [1] 技术研发与合作 - 公司与山东能源集团、华为公司成立联合创新中心,建成人工智能训练中心,构建具备视觉、预测、NLP和多模态四大能力的盘古工业大模型 [1] - 基于百万张图片样本数据完成业界首个行业大模型训练迭代,模型准确率提升9%,召回率提升15% [1] - 累计研发126个典型应用场景,覆盖矿山、化工、油气、电力等行业,沉淀52项专利、38项软著、15篇论文 [1] - "矿山人工智能大模型研发及应用"成果经鉴定达到国际领先水平 [1] 应用场景与成效 视觉能力应用 - 对采掘工作面生产、胶带运输等关键流程实施智能监控,降低事故发生率 [2] - 实时监测人员不安全行为、设备运行缺陷、环境风险状态及施工质量指标,推动安全管理由被动防范向主动治理转变 [2] - 在兴隆庄煤矿部署10多个场景,每班减少18人以上现场岗位人员,实现从"人盯"到"技防"的跨越 [2] 预测能力应用 - 在煤炭洗选工艺环节分析建模,将经验沉淀为AI模型,实时预测最优工艺参数 [3] - 重介密控模型使精煤产率提升0.2%,济宁二号井煤矿实现精煤增产8000吨,增收400万元 [3] - 甲醇精馏装置工艺智能优化场景预计吨甲醇耗蒸汽量降低2%,年节约蒸汽成本200万元 [3] NLP技术应用 - 融合行业顶尖大模型,打造智能安全生产、智慧运营办公等核心业务应用 [4] - 实现业务知识问答、数据问询、文书生成等功能,企业整体办公效率提升20%以上 [4] 商业模式与推广 - 形成"试点单位建场景、内部企业验效果、标准复制促规模"的三步走战略 [4] - 在73家单位实现百余类视觉、预测场景落地应用,建成5000余个人工智能应用场景 [4] - 新场景开发周期由1-2月缩短为1-2周,大幅提升研发效率 [6] 行业转型方向 - 推动传统行业实现三大转变:从被动监管向本质安全转变、从传统管理向精益化管理转变、从分散重复向集约高效转变 [5] - 采用"工厂式"开发路径,以大模型为基础快速适应多样化应用场景 [6] 未来发展规划 - 纵向深耕矿山领域,按照"点、线、面"方向持续融合演进,提升智能化水平 [6] - 横向拓展化工、电力新能源、油气、制造等产业板块,开发高价值场景 [6] - 将AI技术应用到工业领域核心环节,为能源产业绿色高效发展注入新动力 [6]
百度文心大模型4.5系列正式开源,同步开放API服务
量子位· 2025-06-30 04:39
百度文心大模型4.5系列开源 - 公司正式宣布文心大模型4.5系列开源,同步提供API服务,涵盖10款模型,参数范围从0.3B到47B,覆盖文本和多模态任务[2] - 开源模型权重与代码完全开放,开发者可通过飞桨星河社区、HuggingFace、百度智能云千帆平台下载使用[2] - 开源协议采用Apache 2.0,支持学术研究和产业应用[3][14] 模型技术特点 - 创新性提出多模态异构模型结构,适用于从大语言模型向多模态模型的持续预训练,提升多模态理解能力[5] - 使用飞桨深度学习框架进行高效训练和推理,模型FLOPs利用率达到47%[6][7] - 包含混合专家(MoE)模型和稠密型模型,参数丰富度高[4] 性能表现 - 文本模型在C-Eval、CMMLU、MMLU等基准测试中超越DeepSeek-V3、Qwen3等竞品,例如300B参数模型在C-Eval得分91.5,CMMLU得分91.2[8][10] - 多模态模型在视觉常识、多模态推理等评测中优于OpenAI o1,如VL-424B-A47B模型在MMBench-cn得分90.9,OCRBench得分872[12][13] - 轻量级21B文本模型效果与Qwen3相当,28B多模态模型达到同量级SOTA水平[13] 开发者支持 - 提供开箱即用的工具链,包括ERNIEKit开发套件和FastDeploy部署套件[17] - 飞桨平台广泛兼容多种芯片,降低后训练和部署门槛[15] - 实现框架层(飞桨)与模型层(文心)的"双层开源"[18] 公司AI战略布局 - 构建算力、框架、模型、应用四层全栈技术优势,飞桨为中国首个产业级开源深度学习平台[16][17] - 此次开源强化了公司在AI开源生态的领先地位,覆盖从学术到产业的完整链条[14][18]
港股AGI第一股,云知声今日IPO
36氪· 2025-06-30 02:07
公司概况 - 国内AGI龙头云知声历经13年发展,完成10轮融资累计超20亿元,投资方包括中网投、启明创投等知名机构 [1] - 公司于2024年成功登陆港交所,发行价205港元,净筹资2.06亿港元 [1] - 2012年成立时正值AI技术从科研转向商用,公司差异化布局AI语音赛道,覆盖物联网、医疗等领域 [1] - 技术研发领先:2017年突破Transformer算法,自研UniCore大语言模型,2023年推出600亿参数的"山海"大模型 [1] 财务表现 - 2022-2024年营收分别为6.01亿、7.27亿、9.39亿元,年复合增长率25% [2] - 同期亏损持续扩大:3.75亿、3.76亿、4.54亿元,三年累计亏损近12亿元 [2] - 研发投入居高不下:2024年研发开支达3.7亿元,占营收39.4% [2] - 销售成本增速快于营收:2024年销售及服务成本5.75亿元,同比增长32.7% [2] 业务结构 智慧生活板块 - 2024年营收7.4亿元,占总营收78.8%,同比增长27.8% [3][4] - 核心产品为个性化解决方案与AI能力API,覆盖智慧家居、交通、车载场景 [4] - 白色家电语音交互市场占有率70%,合作美的、格力等头部企业,覆盖700类家电产品 [5] - 语音AI芯片销量快速增长:2022-2024年分别销售1280万、2450万、3600万颗,年增速达91.4%、46.9% [6] 智慧医疗板块 - 2024年营收1.99亿元,市场份额2.1%,位列行业第四 [7][8] - 主要产品包括病历语音输入、质控系统等,客户留存率持续下降至53.3% [9] - 采取聚焦战略:2024年主要客户增至35家,单客户收入提升至120万元 [9] - 面临同质化竞争困境,头部企业市场份额分别为5.1%、4.5%、4.3% [7][8] 行业竞争 - 医疗AI行业存在产品同质化问题,技术壁垒难以建立 [11] - 医院信息化进入总包时代,千万级项目需系统性解决方案能力 [8] - 支付方缺失制约行业发展,DRG改革下医院IT预算收缩 [12][13] - 智慧家居与车载语音成为大模型时代产业热点,市场天花板较高 [6] 战略方向 - 资源向智慧生活板块倾斜,强化AGI和芯片业务推广 [15] - 医疗业务转向高客单价策略,但客户数量从242个降至232个 [9] - 面临赎回负债压力,IPO成为关键融资手段 [15]
盘一盘,2017年Transformer之后,LLM领域的重要论文
机器之心· 2025-06-29 04:23
软件3.0与AI范式变革 - Andrej Karpathy提出「软件3.0」概念,自然语言成为新编程接口,AI模型直接执行任务,标志着计算范式的根本转变[1][2] - 自2017年Transformer架构问世后,LLM领域快速发展,GPT系列和多模态应用迅速崛起[3] - 技术演进从传统编程转向自然语言交互,关键论文揭示了这一转变的内在逻辑[5] 奠基性论文与技术突破 Transformer架构 - 《Attention Is All You Need》提出Transformer架构,完全摒弃循环和卷积网络,依靠自注意力机制高效处理序列数据,成为现代AI基石[8][10] - Transformer的并行计算和位置编码能力使其在机器翻译等任务中表现优异,并广泛应用于NLP和计算机视觉领域[11] GPT系列与缩放定律 - GPT-3拥有1750亿参数,通过少样本学习在翻译、问答等任务中表现优异,确立了「大模型+大数据」的缩放定律[12][13] - GPT-3开创提示工程新范式,降低AI开发门槛,引领生成式AI浪潮[13] 强化学习与人类反馈 - 《Deep Reinforcement Learning from Human Preferences》提出RLHF技术,通过人类偏好训练奖励模型,成为对齐ChatGPT等LLM的关键[14][15] - InstructGPT结合RLHF技术,即使参数更小也能更好遵循指令,催生ChatGPT并确立行业标准[16][17][18] 高效训练与推理技术 计算优化 - Chinchilla论文挑战「模型越大越好」认知,提出计算最优缩放法则,模型参数与训练数据应同步增长[22][23] - LLaMA证明小模型通过更长时间训练可超越大模型,推动开源生态繁荣[27] 注意力与内存优化 - FlashAttention通过融合计算内核和优化内存使用,提升长序列处理效率,成为行业标准[29][30] - PagedAttention借鉴操作系统分页思想,提升LLM服务内存利用率,显著增加吞吐量[51][52] 多模态与开源生态 - LAION-5B提供58.5亿图文对数据集,推动多模态模型发展并降低研发门槛[56][58] - Mistral 7B通过GQA和SWA架构实现高效推理,成为开源社区标杆[55] 新兴趋势与前沿探索 - Mamba架构通过选择性状态空间实现线性时间序列建模,挑战Transformer地位[44][45] - QLoRA技术使消费级GPU可微调数十亿参数模型,推动社区创新[47][49][50] - 思想树(ToT)框架增强LLM复杂问题解决能力,推动推理技术发展[60][61] 行业影响与未来方向 - LLM能力随规模「涌现」,不可预测的新能力推动模型持续扩大[62][63] - 稀疏门控专家混合层(MoE)实现万亿参数模型训练,成为顶尖LLM核心技术[70][71][72] - 开源框架如DeepSpeed和Megatron-LM突破硬件限制,支撑超大规模模型训练[65][67][68]
深圳首个完全由高校独立研发的人形机器人,“南科盘古”亮相;Meta寻求290亿美元融资,全力押注AI数据中心建设丨AIGC日报
创业邦· 2025-06-28 09:04
Meta AI数据中心融资计划 - Meta计划筹集290亿美元资金用于AI数据中心建设 其中30亿美元为股权融资 260亿美元为债务融资 [1] - 融资合作方包括阿波罗全球管理 KKR Brookfield 凯雷和太平洋投资管理公司等顶级私募机构 [1] - 该融资可能成为规模最大的私人融资项目之一 目前正在讨论债务结构设计方案 [1] DeepSeek应用下架事件 - 德国数据保护专员要求苹果和谷歌下架中国AI公司DeepSeek的应用 理由是数据安全担忧 [2] - 德方指控DeepSeek存在非法传输用户数据至中国的情况 但未设定具体处理时限 [2] - 谷歌已收到通知正在评估 苹果暂未回应 中方此前已反对将科技问题政治化的做法 [2] 南科大人形机器人研发突破 - 南方科技大学推出完全自主研制的"南科盘古"人形机器人 实现从设计到系统的全链条自主研发 [3] - 该机器人具备拟人仿生机械臂 集成多模态大模型技术 支持双臂协同操作 导航 物体识别等复杂功能 [3] - 这是深圳地区首个由高校独立完成的人形机器人项目 具备智能拍照和类人社交行为等交互能力 [3] Runway拓展游戏AI业务 - AI视频公司Runway正在开发支持生成视频游戏的交互式AI工具 正式进军游戏行业 [4] - 该工具定位为面向消费者的产品 标志着公司业务范围从视频生成向游戏开发领域扩展 [4] 产业信息服务 - 提供人形机器人 商业航天 AGI等热门赛道的行业图谱和研究报告等深度内容 [2] - 会员服务包含公司查询 项目检索等功能 活动期间赠送产业日报订阅 [2]