Workflow
自然语言处理(NLP)
icon
搜索文档
金融科技“新风口”?多家企业竞逐稳定币赛道
搜狐财经· 2025-07-14 09:19
行业动态 - 金融科技领域稳定币成为企业竞相布局的关键领域 多家企业在稳定币相关业务上取得新进展或公布新举措 引发市场高度关注 [1] - 随着数字货币和稳定币市场不断发展壮大 相关技术和应用场景的创新成为企业竞争的核心要素 [5] - 企业积极布局有助于在金融科技领域拓展业务版图 提升核心竞争力 推动整个行业在稳定币领域的技术创新和业务模式探索 [5] 天阳科技 - 与一家港元稳定币发行机构进入合作后期阶段 有望在稳定币流通基础设施领域占据重要地位 [3] - 京东 蚂蚁等科技巨头已积极投身港元稳定币试点工作 秉持开放生态策略广泛寻求合作伙伴 [3] - 稳定币流通体系中自有生态外的流通环节至关重要 第三方机构需提供基础设施支持 U卡在流通环节蕴含明确合作机会 [3] 拓尔思 - 为加密货币和稳定币领域相关机构提供全方位AI赋能解决方案 [4] - 运用自然语言处理和知识图谱技术 为金融机构研究加密货币市场动态 稳定币运行机制及监管合规策略提供高效数据分析与挖掘能力 [4] - 依托融合另类大数据的金融风控大模型与智能预警能力 为数字货币及区块链应用业务构建实时风险监测与防范体系 [4] 伟仕佳杰 - 已开启合作洽谈 探索稳定币支付及结算解决方案 合作讨论紧密围绕东南亚地区ICT产品分销 供应链服务及数位生态业务展开 [5] - 合作讨论严格遵循合规合法原则 不涉及任何加密货币投机行为 确保业务探索在稳健框架内进行 [5] - 合作讨论仍处于初步阶段 尚未达成任何具有法律约束力的协定 若顺利推进有望在东南亚数字支付领域开辟新业务增长点 [5]
通往 AGI 之路的苦涩教训
AI科技大本营· 2025-06-26 11:10
核心观点 - Google DeepMind CEO Demis Hassabis预测未来5到10年内有50%概率实现通用人工智能(AGI)[1] - AI发展历程中最大的教训是过度依赖人类经验而非算力与数据规模[2][3] - 当前AGI探索面临技术路径的隐忧,包括强化学习的局限性、脑模拟的算力瓶颈以及NLP的认知边界问题[9][14] 技术路径分析 - **强化学习**:虽为早期突破性技术,但存在"短视"缺陷,需结合更宏观的智能框架[14] - **脑模拟**:受限于算力瓶颈与理论盲区,难以完全复现人类认知机制[14] - **自然语言处理(NLP)**:虽进展迅速,但语言能力不等同于认知能力,模型输出与真实思想存在本质差异[9][15] 行业趋势与反思 - **算力驱动**:历史表明AI突破的核心引擎是计算规模而非人类直觉[2][3] - **大模型争议**:Scaling Law下参数膨胀可能掩盖智能本质,引发"进化还是幻觉"的质疑[15] - **跨学科融合**:脑科学与AI交叉研究成为新方向,强调对世界理解与知识迁移的能力[7][13] 关键人物与事件 - **刘嘉教授**:从AI转向脑科学再回归,提出AGI需融合认知科学、心理学等多学科视角[7][13] - **AlphaGo事件**:标志性技术转折点,推动研究者重新审视智能的本质与构建路径[7] - **《苦涩的教训》**:Richard Sutton指出AI发展应放弃人类经验依赖,专注算力与数据扩展[2][3] 未来探讨方向 - AGI构建是否需突破语言模型的表层能力,实现真正的认知理解[9][15] - 技术路线选择如何平衡短期效果(如NLP)与长期智能本质(如脑模拟)[14] - 跨学科研究(脑科学+AI)对突破现有范式局限的潜在价值[7][13]
生物学的DeepSeek:阿里云发布LucaOne模型,首次统一DNA/RNA和蛋白质语言,能够理解中心法则
生物世界· 2025-06-19 09:44
核心观点 - 阿里云智能飞天实验室与中山大学联合开发了世界首个能同时理解核酸(DNA/RNA)和蛋白质序列的通用生物学基础模型LucaOne [3][4] - 该模型基于169861个物种的核酸和蛋白质序列进行预训练,参数规模达18亿,训练数据量相当于369.5亿个生物序列"单词" [4][16] - LucaOne通过统一编码39个生物分子"字符",首次实现对生命中心法则(DNA→RNA→蛋白质)的自发理解 [10][18] - 在7类生物信息学任务测试中表现超越专用模型,包括物种分类(GenusTax)、蛋白质相互作用(PPI)预测等,流感抗原预测准确率达100% [20][22][24] 技术突破 模型架构 - 采用Transformer架构构建统一基础模型,整合核酸和蛋白质序列处理能力 [11] - 设计包含39个字符的统一词汇表,覆盖4种核苷酸和20种标准氨基酸 [13] - 结合自监督学习与半监督学习,利用基因组注释等生物学先验知识加速训练 [14] 训练数据 - 整合RefSeq、UniProt、ColabFoldDB等权威数据库 [12] - 训练集涵盖16.9万种生物的核酸和蛋白质序列 [4] - 数据处理流程实现核苷酸与氨基酸表征的统一标准化 [15] 性能表现 核心能力 - 无监督条件下自发理解DNA→蛋白质翻译规则,Few-shot学习性能超越DNABert2+ESM2-3B组合模型 [18] - 生成的序列嵌入向量能有效聚类同源序列,反映深层生物学特征 [19] - 支持DNA/RNA/蛋白质的跨模态关联分析,突破传统单分子研究局限 [26] 任务表现 - 物种分类(GenusTax):分类准确率显著提升 [22] - 非编码RNA识别(ncRNAFam):优于基准模型 [22] - 流感抗原预测(InfA):达到100%准确率 [22] - 蛋白质相互作用(PPI/ncRPI):预测效果领先组合模型 [22] 行业影响 - 建立首个跨分子类型的生物计算统一框架,打破传统分析壁垒 [26] - 验证基础模型范式在生物信息学的适用性,降低下游任务开发成本 [24][26] - 为疾病机制研究、药物靶点发现等应用提供新型分析工具 [26] - 推动生物信息学进入通用大模型驱动的新发展阶段 [27]
给“开盒”上锁是平台的能力试金石
经济观察报· 2025-05-28 06:36
网暴治理与平台责任 - 平台需将网暴治理内化为自觉行动,而非仅应对监管要求,这关乎平台生态存亡[1][6] - 中央网信办专项治理"开盒"乱象,要求重点平台以"零容忍"态度打击,凸显整治决心[2] - "开盒挂人"形成完整黑产链条,包含人肉搜索、隐私泄露和群体围攻,破坏性远超传统网暴[2] 平台治理失责表现 - 信息推送机制偏好争议内容助长攻击性言论传播[3] - 用户身份审核漏洞为匿名攻击提供便利[3] - 投诉响应滞后导致违法信息清除不及时,部分平台或与"毒流量"存在利益共生[3] - 典型案例显示平台因处置不力被判赔8000元,3家大型平台因类似问题被处罚[3] 治理机制优化方向 - 需从运动式清理转向常态化治理,提升"开盒"防治优先级[3] - 平台应超越"通知-删除"义务,建立事前预防和事中干预机制,落实主体责任[4] - 中央网信办2022年提出建立网暴预警机制,相关法规明确平台需建立预警模型[4] 技术防御与用户保护 - 需采用NLP情感分析、异常行为监测等技术精准拦截隐晦攻击内容[5] - 建立平台间风险信息共享库提高黑产跨平台操作门槛[5] - 设置快速举报入口,提升受害者请求处理优先级,优化"一键防暴"功能设计[5] - 抖音已将可能诱发网暴的信息纳入争议热点处置,实施流量降热和冷静机制[5]
小红书高级副总裁汤维维: 从“文字转换”到“文化解码”的跨越
深圳商报· 2025-05-27 20:29
小红书国际文化交流与技术突破 - 2025年1月大量海外用户涌入小红书平台,引发跨文化交流现象,包括宠物互动、语言学习、中餐教学等内容 [1] - 语言障碍成为核心挑战,用户高频提出翻译需求,如"一键翻译"功能和文字识别需求 [1] - 公司迅速响应,数天内通过技术迭代上线"一键翻译"功能,实现英语评论自动转中文,减少用户跨应用操作 [1] 技术实现与文化解码 - 翻译功能采用多模态AI模型,整合NLP、OCR、CV技术,能解析文字及表情包谐音梗等非结构化内容 [1] - 建立动态学习机制,用户对译文的编辑行为持续优化模型,尤其在宗教符号、历史典故等文化敏感领域实现渐进式改进 [1] - 技术目标从"文字转换"升级至"文化适配",覆盖千年历史的阿姆哈拉语和网络热梗等多样性内容 [1] 平台战略与行业意义 - 公司将跨语言能力定位为基础设施级服务("水电煤"),通过技术+人文驱动构建无国界社交平台 [2] - 实践验证技术融合人文可突破文化边界,案例体现行业在AI社交领域的创新方向 [2]
揭秘财报会议中的选举密码:如何用AI工具预测美国总统大选结果
Refinitiv路孚特· 2025-05-22 08:21
美国总统选举预测方法 - 传统预测方法包括历史规律分析、经济指标评估、政治策略研究和民意调查,但存在系统性困难和突发因素影响[1] - 选举人团制度复杂性导致预测难度增加,如2020年宾州计票暂停后出现逆转结果[3] - 突发事件如政治暴力、丑闻和社交媒体假信息可能瞬间改变选民倾向,如2024年特朗普两次遇刺事件[4] 现有预测模型及其局限性 - "白宫钥匙"模型曾准确预测9次选举,但2024年基于8项"真"指标的预测失败[5] - 贝叶斯统计模型结合政治经济基本面和民调数据,通过弹性网技术减少过拟合风险[6] - 内华达风向标规律在2024年再次印证,特朗普以2.1%优势获胜[7] - 现有方法存在数据量大、模型复杂、时间滞后等问题,缺乏选举前有效指导作用[8] 民意调查的缺陷 - 样本偏差和设计缺陷导致统计陷阱,如电话采访与互联网调查群体差异[9] - 人为操纵现象普遍,基层部门通过奖励诱导受访者回答"满意"[10] 基于企业高管言论的另类预测方法 - LSEG与MarketPsych联合开发的AI情绪分析工具MTA可提前捕捉选举结果[10] - MTA运用NLP和情感分析技术,量化管理层情绪倾向和真实判断[10] - 企业高管的政治信息渠道优于普通选民,公开表态基于可靠政商网络[10] - 2024年大选前20天财报会议文本分析显示,胜选者名字被提及频率显著更高[11] - 特定行业政策讨论倾向准确反映支持的候选人,如能源企业讨论"放松监管预期"预示特朗普占优[11] 历史选举数据分析案例 - 2024年特朗普vs哈里斯会议文本分析[13] - 2020年拜登vs特朗普会议文本分析[14] - 2012年奥巴马vs罗姆尼会议文本分析[16] - 2016年特朗普vs克林顿会议文本分析[17] - 2008年奥巴马vs麦凯恩会议文本分析[18] - 2004年布什vs克里会议文本分析[20] AI文本分析技术的优势与前景 - 企业高管公开押注政治走向意味着掌握可靠内部信息[22] - AI技术进步使文本分析更精准,未来可通过语气变化和关键词组合提前预测结果[22] LSEG MarketPsych产品与服务 - 提供基于AI的NLP解决方案,包括数据源、预测分析和模型[25] - 服务涵盖情绪测量、金融语言分析和主题识别,应用于交易策略、风险管理和宏观经济预测等领域[27]
喜报!南方财经金融理财智能大模型算法通过国家网信办备案
21世纪经济报道· 2025-03-14 14:24
文章核心观点 2025年3月12日南方财经全媒体集团自主研发的南方财经金融理财智能大模型算法成功通过国家互联网信息办公室备案,该算法集成多种前沿技术,南财理财GPT——南小财能为用户提供智能便捷理财服务,拥有五大功能 [2][3] 分组1:算法备案情况 - 2025年3月12日国家互联网信息办公室发布第十批境内深度合成服务算法备案信息,南方财经全媒体集团自主研发的南方财经金融理财智能大模型算法成功通过备案 [2] - 国家网信办备案审核严苛全面,备案通过意味着企业技术能力、数据安全、模型合规性达一定标准,是AI大模型商业化落地“通行证” [2] 分组2:算法及模型介绍 - 南方财经金融理财智能大模型算法集成大模型技术、自然语言处理、检索增强生成、强化学习训练等多种前沿技术,为用户提供智能便捷理财服务体验 [3] - 南财理财GPT——南小财是专注财富管理领域的智能AI金融模型,在南财理财通自主构建的银行理财数据库基础上,融合先进大模型训练技术打造而成,用户与智能助手实时对话可获取理财投资信息、市场行情分析和产品信息 [3][4] 分组3:南小财功能 - 提供智能实时对话交流,凭借前沿自然语言处理技术精准捕捉领会用户疑问需求并给出智能准确回答 [5] - 提供理财投资参考信息,从海量金融数据和市场资讯中评估潜在投资风险,依据用户风险承受能力和投资偏好提供个性化理财投资策略建议 [5] - 实时分析市场行情,凭借实时数据接入与深度多维分析能力捕捉市场态势,前瞻性洞察市场风险 [5] - 提供理财排行榜单,通过接入南财理财通银行理财数据库,综合多维度分析与评价对理财产品分类排名 [5] - 实时提供政策资讯,凭借政策敏感性和广泛数据采集网络追踪汇聚财经政策动向与行业资讯,对政策信息深度剖析与速递解读 [6]
彭博数据洞察 | 透过AI看新闻,投资信号抓得准
彭博Bloomberg· 2025-03-14 03:08
AI驱动的新闻摘要功能 - 彭博旗舰产品"新闻标题与正文"覆盖全球上万个主题领域,遍及所有地区及主流企业,并配有丰富的标签体系,可标注话题、证券代码及人物信息 [3] - 利用大语言模型(LLM)和文本嵌入技术可计算不同新闻标题之间的相似度,有效识别重复信息,同一主题下的新闻报道数量可反映事件的市场影响力 [4] - 通过提示工程可提取关键特征如"WTI原油市场是否受影响"或"事件是否导致石油供应中断",这些特征值可生成市场信号与波动率预测 [6] 供应链数据与生物多样性风险 - 自然相关财务信息披露工作组(TNFD)发布建议帮助企业评估并披露自然资源依赖度、环境影响、风险与机遇,特别强调对上下游价值链的全面评估 [7] - 通过整合供应链数据与生物多样性数据库,可精确定位供应商在高水资源压力区域或生物多样性完整度区域的资产分布 [8] - 明治控股供应商位于高/极高水资源压力区域及生物多样性完整度区域的实体资产占比数据可供分析 [9] 欧洲汽车行业分析 - 欧洲汽车行业销售动能持续衰减,供应商业绩分析显示这一颓势早在市场普遍察觉之前便已现端倪 [12] - 分析覆盖欧洲汽车板块1500+供应商,遍布53个国家,结合标准化财务数据支持多维度关联分析 [12] - 欧洲汽车供应商的需求疲软迹象精准预示了行业拐点,印证财务数据与供应链信息整合对行业趋势预判的价值 [12]