Workflow
自然语言处理
icon
搜索文档
智慧树母公司获上市备案,教学数字化市场第二,市场份额3.4%
搜狐财经· 2025-10-21 17:03
公司上市备案与背景 - 中国证监会正式同意上海卓越睿新数码科技股份有限公司赴香港主板上市及境内未上市股份全流通 [1] - 公司是知名教育数字化品牌智慧树的母公司 成立于2008年 并于2013年推出智慧树品牌 [4] - 公司曾于2021年启动A股上市辅导 后于2024年4月终止 转而选择港股 并在2024年5月及12月两次向港交所递交招股书 [4] - 农银国际担任公司此次上市的独家保荐人 [4] 公司市场地位与业务 - 公司业务覆盖教 学 练 考 评 管全流程 [4] - 以3.4%的市场份额位列2023年中国高等教育教学数字化市场第二 [4] - 在细分的数字化教学内容制作市场中以6.2%的份额排名行业首位 [4] - 服务网络已渗透至全国多数高等院校 [4] 募资用途与战略方向 - 拟将上市募集资金主要投向AI技术 云计算及自然语言处理等前沿技术研发 [4] - 资金将用于提升全国范围内的客户服务及支持能力 [4] - 计划设立知识图谱开发中心 同时补充营运资金 [4] 行业格局与市场环境 - 高等教育数字化市场呈现高度分散格局 前五大企业总市场份额仅12.6% [5] - 证监会对企业境外上市呈现差异化导向 赴港上市通道基本处于放行状态 [4] - 2025年以来港股IPO募资额已重回全球第一 证监会截至4月底已完成242家境内企业境外上市备案 其中83家为科技企业 [5] - 监管层表示将持续为科技企业境外上市提供透明 高效 可预期的监管环境 [5] 行业影响与趋势 - 公司的上市尝试或将加速行业整合 [5] - 头部企业通过资本力量强化技术研发与服务能力 有望推动行业从内容供给向智慧教学生态构建升级 [5]
报名倒计时 | 量化洞察上海专场:从微观交易到宏观经济
Refinitiv路孚特· 2025-10-21 06:02
文章核心观点 - 金融市场中准确及时的宏观经济情报与微观交易数据是卖方研究与投资决策的关键驱动力 [1] - LSEG的解决方案结合宏观经济预测与市场微观结构分析 帮助专业人士在海量信息中精准识别信号并提升研究效率与投资回报 [1] - LSEG将举办量化专题活动"从微观交易到宏观经济:LSEG量化洞察上海交流会" 与行业专业人士共话数据驱动的投资未来 [1] LSEG量化解决方案 - LSEG与XTech联合推出预测模型 通过前沿指标提前洞察全球经济趋势并提供可操作的市场信号 [1] - 借助分钟级别股票交易数据和机器学习算法 投资者能实时识别聪明资金的建仓或减仓时机 [1] - LSEG文本分析解决方案运用自然语言处理和机器学习技术 将非结构化数据转化为可操作的洞察以发掘新的阿尔法收益机会 [13][14] - 新闻分析服务可量化企业情绪分析 文本相关性与新颖性 数据覆盖超过40,000家企业且可追溯至2003年 [19] - MarketPsych转录分析通过自然语言处理技术解析企业电话会议内容 洞察情绪倾向和相关企业 [20][21] 全球宏观预测服务 - LSEG携手Exponential Technology推出全球宏观预测服务 为机构投资者提供全球经济趋势洞察 [16] - 预测服务涵盖美国消费者物价指数CPI变动影响 美国零售销售数据 美国经济咨商局消费者信心指数及密歇根大学消费者信心指数等关键指标分析 [16] 活动与嘉宾信息 - 活动将于2025年11月6日在上海陆家嘴举行 包含主题分享 行业讨论和晚宴交流等环节 [3][4] - 主讲嘉宾包括LSEG亚太区Front Office解决方案总监Arman Sahovic博士 其负责高频交易 量化分析和人工智能等复杂解决方案 [8] - 行业讨论嘉宾包括锐天投资创始人徐晓波 其管理规模超过百亿 以及FFT Investment合伙人李怡康 拥有人工智能研究背景 [9][10] - LSEG量化和数据科学业务主管王旭东将参与活动 其擅长构建高效数据分析体系与复杂数据模型 [11]
国庆长假充电指南:Ilya Sutskever's Top 30 论文阅读清单
锦秋集· 2025-10-01 13:25
文章核心观点 - 文章推荐了一份由Ilya Sutskever精选的30篇AI领域前沿论文合集,该合集覆盖了近15年AI发展的里程碑成果,以"技术底层-能力突破-场景落地"为主线,串联了AI从感知智能到认知智能的关键跃迁 [4] - 该论文合集旨在帮助投资者、从业者与研究者系统梳理AI技术演进脉络,深刻理解当前AI产业落地的机遇与挑战,实现专业能力的高效提升 [1][5] - 合集内容不仅清晰拆解了残差映射、动态指针网络等专业术语的技术逻辑,还通过论文中的实验数据和架构设计,为从业者提供从理论到落地的参考路径 [5] 论文合集技术框架 - 合集涵盖奠定深度学习基础的CNN、RNN,重构自然语言处理领域的Transformer与自注意力机制,以及推动RAG、多步推理等前沿方向的核心研究 [4] - 每篇论文都是对应技术领域的奠基之作,直接关联当前AI产业落地的核心能力底座,包括《GPipe》中的并行训练方案如何降低大模型算力成本,《Retrieval-Augmented Generation》如何解决AI幻觉问题以适配金融、医疗等高精度场景 [4][5] 代表性论文技术要点 深度学习基础架构 - ImageNet Classification with Deep Convolutional Neural Networks论文提出的CNN架构包含5个卷积层和3个全连接层,在ILSVRC-2010数据集上top-5错误率为17.0%,显著优于此前方法 [48][52] - Deep Residual Learning for Image Recognition提出的残差网络通过残差块简化了深层网络训练,152层ResNets在ImageNet等数据集上性能优于VGG nets [73][77] - Recurrent Neural Network Regularization提出将dropout技术应用于LSTM的新方法,在Penn Tree Bank数据集上词级困惑度显著降低 [21][24] 注意力机制与Transformer - Attention is All You Need完全依赖自注意力机制提出Transformer架构,在WMT 2014 English-to-German翻译任务中BLEU分数达到28.4,比当时最先进模型高出2个多BLEU点 [105][117] - Neural Machine Translation by Jointly Learning to Align and Translate引入注意力机制解决固定长度向量瓶颈问题,在WMT '14 English-to-French翻译任务上BLEU分数显著提升 [119][126] 模型扩展与优化技术 - GPipe通过微批量流水线并行技术实现大型神经网络高效训练,支持训练包含60亿参数、128层的Transformer模型,在ImageNet-2012数据集上top-1准确率达到84.4% [62][72] - Scaling Laws for Neural Language Models发现模型性能与参数规模遵循幂律关系,更大规模模型具有更高样本效率,在固定计算预算下训练极大型模型是最优策略 [212][218] 特定应用领域突破 - Neural Message Passing for Quantum Chemistry提出的MPNNs框架在QM9数据集上13种性质中有11种达到化学精度,为分子性质预测提供强大工具 [94][101] - Deep Speech 2端到端语音识别模型在英语和普通话上均实现高准确率,在WSJ、LibriSpeech等基准测试中性能超过人类转录员 [203][209] - Pointer Networks提出新型神经架构解决输出词典大小可变问题,在计算平面凸包、德劳内三角剖分等几何问题上性能显著优于传统序列到序列模型 [37][45] 技术演进趋势 - 从传统神经网络到残差网络、注意力机制的演进表明,通过架构创新可有效解决梯度消失、长期依赖关系等核心挑战 [73][105] - 模型规模与性能关系研究为大规模神经网络训练提供理论指导,计算效率最优策略推动行业向极大型模型方向发展 [212][224] - 多令牌预测等新型训练方法重新定义LLMs处理文本方式,通过并行预测多个未来令牌提升模型效率和速度 [259][264]
所有知识型岗都要被AI “吞了!清华大学教授刘嘉:未来大学分化猛烈,软件公司靠 “几人 + Agent” 就够
AI前线· 2025-09-29 04:28
AI发展现状与趋势 - 2025年AI已进入几乎包围人类的时代,2024年诺贝尔物理学奖和图灵奖均授予AI领域,2025年初DeepSeek大模型和Manus完全自主AI引发广泛关注[5] - 大模型正从“你问我答”的对话模式向服务人类、与人类进行实体及工作层面交互转变,2025年是大模型走向实际应用的开端[10] - 人形机器人领域和智能体(Agent)领域是当前两大重要进展方向,代表AI向物理世界和虚拟世界的延伸[8] AI技术能力评估 - 2024年9月OpenAI推出o1推理大模型后,大模型已从单纯对话转向具备推理能力,能够模仿人类“慢思维”进行逻辑链思考[13] - 推理大模型的出现催生了智能体技术爆发,智能体核心是规划能力,能够调用各种工具完成实际任务[14] - 大模型在智商层面已经达到甚至超过人类顶尖水平,在国际奥林匹克数学竞赛中表现优异[14] - 但在感知和运动能力方面,当前基于Transformer架构的大模型存在串行加工缺陷,无法实现人类式的并行信息处理[33] AGI实现路径与挑战 - 真正的AGI需要具备两个关键能力:从0到1的颠覆式创新能力(OOD问题)以及完整的感知和运动能力[32][33] - 实现AGI的三条可能路径包括强化学习、脑模拟和自然语言处理,但目前都缺乏类似Transformer在NLP领域的突破性时刻[36] - AGI的实现可能需要向脑科学学习,开发受生物大脑启发的新架构,突破现有神经元模型的简单性限制[17][18][35] AI对行业的影响 - 垂直类Agent已在编程领域产生显著影响,如Cursor、Copilot等工具导致初级和中级程序员面临失业风险[24] - 通用类Agent如字节的“扣子”(Coze)具有广阔发展前景,未来将改变社会的工作方式和组织架构[24] - 所有知识密集型职业包括律师、程序员、会计、医生、教师等都会受到AI巨大冲击,传统教育模式面临根本性质疑[48] - 顶尖创意人才的价值反而会提升,如在AI生成音乐泛滥背景下,原创音乐人的客单价不降反升[49] 企业竞争格局 - AI发展具有不可阻挡的竞争特性,国与国、公司与公司之间的竞争使得暂停研发不切实际[40][41] - 类似核武器竞赛的格局正在形成,主要经济体都在加速AI研发以避免落后[41] 未来应用场景 - 物理世界机器人如马斯克的Optimus、OpenAI投资的Figure01重点关注“眼手合一”,用大模型驱动肢体适应环境[22] - 虚拟世界智能体将大模型与各类工具结合,能够完成购票、订房、行程规划等实际操作[23] - 未来手机可能不再需要多个APP,各种需求可通过大模型驱动的统一接口完成[23] 教育改革方向 - 大学教育必须从知识传授转向创造力培养和跨学科融合,推动通识教育发展[43][44] - “AI+学科”是所有学科的必然选择,但需要避免简单的“袋装土豆”式叠加,实现真正融合[45][46] - 未来大学分化将加剧,能够成功推行通识教育和跨学科融合的院校将占据优势[44] 个人应对策略 - 当前竞争是“会用AI的人”与“不会用AI的人”之间的差距,而非人与AI的直接竞争[53] - AI可作为助手、老师、批评者和情感支持伙伴,全方位提升个人能力[54] - 人类需要发挥零到一颠覆性创新的独特优势,这在相当长时间内仍是AI难以企及的[51]
中康科技“卓睦鸟医疗大模型”斩获MedBench 2025新榜医学语言理解单项榜首
格隆汇· 2025-09-29 03:09
公司产品表现 - 中康科技"卓睦鸟医疗大模型"在MedBench 2025年度测评中综合排名第2,医学语言理解单项排名第1 [1] - 模型参数量达700亿,通过大规模预训练与多阶段指令微调提升能力 [1] - 模型依托公司近二十年数据积累,训练资源覆盖百万级医学文献及千万级脱敏临床数据 [1] 产品技术基础 - 模型构建使用了高质量训练资源,包括公开语料和非结构化病历 [1] - 结合数据清洗、去重、增强等先进工艺,提升在真实医疗场景中的泛化能力与响应精度 [1] 行业应用方案 - 公司于2025年3月发布"医疗健康全场景智能体",依托天宫一号和卓睦鸟医疗中台两大引擎 [1] - 解决方案覆盖商用、医疗、药店、健康管理和研发多场景,实现智能决策、敏捷行动的业务闭环 [1] - 智能体旨在帮助医疗健康行业提升效率与服务质量 [1]
陈丹琦新作:大模型强化学习的第三条路,8B小模型超越GPT-4o
量子位· 2025-09-28 04:56
文章核心观点 - 提出一种名为RLMT(基于模型奖励思维的强化学习)的新方法,该方法结合了RLHF和RLVR的优点 [4] - RLMT方法能使参数量仅8B的小模型性能超越GPT-4o,并媲美Claude-3.7-Sonnet [1] - 该方法支持在基础模型上直接使用,无需经过监督微调(SFT),可大幅降低后训练成本 [6] 技术方法与原理 - RLMT要求模型在回答前先生成思维链(CoT),然后使用经人类偏好训练的奖励模型对输出进行评价 [5] - 训练流程为:给定用户提示x,模型生成推理轨迹z,基于推理生成最终回答y,奖励模型r(x, y)对结果打分 [14] - 数学优化目标是最大化期望奖励 [15][16] - 使用人类偏好奖励模型(如Skywork-v2)在流畅性、相关性、逻辑性、创意等维度进行评分 [17] - 在优化算法上,实验了DPO、PPO、GRPO,其中GRPO效果最佳 [17] 性能表现与基准测试 - 在Wildbench等基准测试上,经过RLMT优化的Qwen2.5-7B模型大幅领先其他模型 [13] - 具体数据显示,L3.1-8B-I-RLMT模型在综合评测(Avg)中得分为54.1,超越了GPT-4o的53.2和L3.1-70B-Instruct的32.1 [7] - 在CWv3评测项上,L3.1-8B-I-RLMT得分为22.9,虽低于Claude3.7-Sonnet的39.3和GPT-4o的32.1,但显著高于其他大模型 [7] - 消融实验表明,使用不同提示混合(Prompt mixture)和奖励模型(Reward Model)对最终效果有显著影响 [18] 训练方式与成本优势 - 提供两种训练方式:带SFT预热的Warm-start方式和无SFT直接训练的Zero方式 [21] - Zero方式可在基础模型上直接加入固定前缀提示,通过学习"思考+回答"结构,最终表现也能超过指令微调模型 [21] - 结果显示小模型经RLMT训练后可超越大模型,大幅简化后训练流程并降低成本 [22] - 训练数据来源于真实用户对话,避免了过度偏向数学/代码领域,提升了在开放任务上的泛化能力 [18] 对行业的影响与意义 - 该方法证明了RLVR范式在数学、代码等可验证领域之外的开放任务上同样有效 [11] - 对于非数学代码问题,模型能自然学会分步骤拆解,如回顾、综合、关键主题、核心准则、举例、结构化回答等人类思考方式 [12][19] - 网友认为该方法为通用强化学习设定了新基线,在后训练时代,谁定义了偏好,谁就掌握了新的评分标准 [8]
2025年9月荐书 | 三力协同 资本重估
第一财经· 2025-09-24 06:34
宏观投资环境 - 低利率环境持续,政府债务成本被经济增长动态稀释,为财政扩张提供自我偿付空间 [1][14] - 全球资本再配置推动风险溢价与治理溢价重估,资产边界随产业链地理重构而外移 [1] - 货币政策逼近零下限后,公共投资应主动补位,通过提升潜在产出率抬高中性利率 [14] 技术变革与投资机会 - 生成式人工智能可将非结构化文本即时转化为可计算因子,显著降低信息摩擦与策略开发门槛 [1] - 人工智能发展推动人类从石油驱动经济步入电力驱动经济时代,电力重要性将等同于过去的石油 [5] - 机器人普及将推动聚醚酮、镁合金、钛合金、碳纤维、钕铁硼磁材等高性能材料需求激增 [5] 资产配置与投资策略 - 全球资产轮动遵循货币、资源、人口、科技线索,资本流向等于财富流向 [3] - 在美元周期、地缘博弈与产业变迁中锁定稀缺标的,利用ETF等低门槛工具构建确定性组合 [3] - 投资需看清趋势转换过程中产生的巨大机会,原有力量与新生力量的重叠使转换过程显得模糊 [5][6] 金融科技应用 - 大语言模型是自然语言处理组成部分,可跨越计算机科学与语言学,用于理解和生成人类语言 [10] - 金融行业对高效处理大量自然语言数据需求增长,但中文的含蓄多义特性对机器处理构成挑战 [11] - 大模型技术可应用于投研、风控、监管等十二大金融场景,从文本中提炼金融决策信息 [9]
线下活动邀请 | 量化洞察上海专场:从微观交易到宏观经济
Refinitiv路孚特· 2025-09-18 06:03
文章核心观点 - LSEG通过结合宏观经济预测与市场微观结构分析,为卖方研究和投资决策提供关键驱动力,旨在帮助专业人士在海量信息中精准识别信号,提升研究效率与投资回报 [1] LSEG量化解决方案 - 解决方案将宏观预测与微观交易分析相结合,帮助投资者识别信号并规避噪音 [1] - 提供分钟级别的股票交易数据和机器学习算法,以实时识别聪明资金的建仓或减仓行为 [1] - 运用文本分析技术将非结构化数据转化为可操作的洞察,以发掘新的阿尔法收益机会 [7][8] - 文本分析解决方案融合自然语言处理、机器学习与新闻分析技术,提供企业情绪分析、文本相关性及新颖性评估等元数据 [8] 全球宏观预测服务 - LSEG与Exponential Technology合作推出全球宏观预测服务,为机构投资者提供全球经济趋势洞察 [9][10] - 预测服务涵盖美国CPI变动影响、零售销售数据、经济咨商局消费者信心指数及密歇根大学消费者信心指数等关键指标分析 [10] 新闻与转录分析 - 新闻分析服务采用自然语言处理技术,量化企业情绪、文本相关性与新颖性,增强量化策略的交易信号识别能力 [12] - 新闻分析数据覆盖股票、大宗商品与能源领域,数据可追溯至2003年,涵盖超过40,000家企业 [12] - MarketPsych转录分析运用自然语言处理技术解析企业电话会议内容,洞察情绪倾向、相关企业及提及话题 [13][14] - 转录分析专为机构及量化公司设计,为企业电话会议的深层含义提供数据驱动视角 [14] 专题活动信息 - LSEG将举办题为“从微观交易到宏观经济:LSEG量化洞察上海交流会”的量化专题活动 [1][2] - 活动将于2025年11月6日在上海陆家嘴举行,设有主题分享、行业讨论及交流环节 [2][3] - 主讲嘉宾包括LSEG亚太区Front Office解决方案总监Arman Sahovic博士、锐天投资创始人徐晓波以及FFT Investment合伙人李怡康 [2][5]
市场舆情监测供应厂家推荐:如何选择高性价比服务商
搜狐财经· 2025-09-18 02:55
行业背景与需求 - 市场舆情监测是企业决策的重要工具,关乎品牌声誉维护和行业趋势把握 [1] - 在纷繁复杂的网络环境中,选择专业可靠的服务商是企业关注焦点 [1] - 技术实力、数据覆盖范围和服务模式灵活性是选择服务商的关键考量维度 [1] 公司技术实力 - 公司为国家高新技术企业,深耕大数据领域多年,形成独特技术壁垒 [3] - 研发团队专注于数据挖掘、机器学习、自然语言处理与深度学习 [3] - 构建覆盖全国的监测网络,实现对互联网信息的高效采集与分析 [3] - 依托自建IDC数据中心,结合全国运营商资源,在国内外部署大量数据探测节点 [3] - 立体化数据采集体系使监测结果具备广泛覆盖面和高精确度 [3] - 智能分析引擎能捕捉金融领域市场情绪的细微变化信号 [3] 服务模式与解决方案 - 将大数据技术与移动互联网应用深度融合,推出多款定制化解决方案 [4] - 构建用户体检监测云服务中心,将数据转化为直观的可视化报告 [4] - 通过持续优化数据大模型,增强海量信息的解析能力 [4] - 技术积累帮助企业识别潜在风险并挖掘隐藏市场机遇 [4] - 在政务评估领域提供数据支持方案,帮助政府部门实现科学决策 [4] 公司发展优势 - 作为专精特新企业,始终保持对前沿技术的敏感度 [4] - 从最初网站数据采集发展到构建完整智能分析体系 [4] - 技术迭代速度快,行业深耕程度值得肯定 [4] - 持续创新能力使企业在快速变化的市场环境中拥有可靠技术支撑 [4]
谷歌反垄断案折射搜索行业变革
经济日报· 2025-09-14 21:46
谷歌反垄断案判决结果 - 谷歌在一场持续5年的反垄断案中取得阶段性胜利 成功避免被强制拆分其Chrome浏览器及安卓操作系统[2] - 法院裁定谷歌只需向竞争对手开放更多搜索结果数据 并设立反垄断技术委员会以监督公司运营[2] - 相对宽松的判决提振了市场信心 消息公布后谷歌盘后股价一度大涨超8%[2] 生成式AI对市场竞争格局的影响 - 法官在判决书中多次强调生成式AI的影响 指出越来越多的用户正通过ChatGPT等AI聊天机器人获取信息 显著加剧了搜索市场的竞争[2] - 生成式AI公司如OpenAI意外成为谷歌的"救命稻草" 其崛起削弱了对谷歌进行彻底拆分的必要性[2] - AI搜索引擎如Perplexity的"答案引擎"重新定义了信息获取方式 提供简洁答案并支持连续追问[3] 传统搜索引擎的竞争优势 - 传统搜索巨头已构建起坚实的生态"护城河" 例如谷歌的Chrome浏览器与YouTube、Gmail、地图等生态服务形成协同[3] - 传统搜索引擎掌握着生成式AI发展的关键资源 包括算力(谷歌云位居全球前三)与存储于其服务器中的海量数据[4] - AI公司自建数据索引库面临高技术门槛和巨额成本 难以跳过对传统巨头资源的依赖[4] 行业未来发展趋势 - 全球搜索业务站在转型十字路口 新兴AI搜索需突破成本与技术壁垒 传统搜索巨头需实现AI化转型[4] - 谷歌一案的判决被视为本世纪科技行业最具深远影响的法院裁决之一 将为面临类似诉讼的Meta、亚马逊和苹果提供重要参考[4] - 一批AI浏览器新品发布 如Perplexity的Comet和OpenAI即将发布的新款浏览器 让浏览器市场竞争再起[3]