Workflow
Google AI Edge Gallery
icon
搜索文档
100万token!全球首个混合架构模型M1开源了!近期AI新鲜事还有这些……
红杉汇· 2025-06-25 11:06
MiniMax-M1模型技术突破 - 开源全球首个混合架构模型M1 支持100万token输入和8万token输出 成为全球最长上下文窗口模型 [3] - 采用Lightning Attention混合注意力架构 通过分块技术降低计算复杂度 生成10万token时仅需DeepSeek R1 25%的算力 [5][6] - 在多项基准测试中表现优异 在工具使用和软件工程等复杂任务上超越OpenAI o3和Claude 4 Opus [4] - 训练成本仅380万元 耗时3周完成 性价比显著 [3] 企业级AI应用案例 - 微软发布700+智能体应用案例 覆盖金融/医疗/教育等各行业 埃森哲智能体降低客户销售未清天数20% 毕马威ComplyAI改善合规控制描述70% [10][12] - 智谱AI推出企业级助手CoCo 具备记忆能力 可集成企业知识库 支持全流程任务规划与修改 实现千人千面服务 [14] - XP使用AI节省9000小时 提高审计效率30% Architecht平台将原型制作时间从2天缩短至25分钟 [15] 行业技术进展 - OpenAI推出o3-pro模型 在AIME 2024数学测试超越Gemini 2.5 Pro 在GPQA Diamond科学测试击败Claude 4 Opus [17] - 智源开源Video-XL-2视频理解模型 支持万帧视频处理 编码2048帧仅需12秒 在多项评测中领先开源模型 [21][22][23] - 谷歌发布手机本地AI运行器Google AI Edge Gallery 可离线运行Hugging Face模型 支持图像生成/代码编辑等功能 [27]
谷歌突袭发布AI应用,无需Wi-Fi、手机就能跑大模型!网友实测两极分化
AI前线· 2025-06-03 07:18
整理|冬梅 近日,据 TechCrunch 报道,谷歌悄然推出了一款名为 Google AI Edge Gallery 的应用(谷歌 称之为"实验性 Alpha 版本"),用户无需 Wi-Fi 连接即可在设备上运行 AI 模型。这款应用目前 仅适用于 Android 系统,允许用户使用 Hugging Face 的几款"公开可用的 AI 模型",这标志着谷 歌在将先进的 AI 技术直接引入移动设备方面迈出了重要一步。 谷歌悄然发布一款新 AI 应用 这款全新 AI 应用允许用户搜索公开可用的 AI 模型,下载后无需连接 Wi-Fi 即可在本地运行。在 本地运行这些模型时,用户可以要求 AI 执行几乎所有连接 Wi-Fi 时通常会执行的操作,例如生 成图像、与 AI 聊天、浏览网页、编写代码以及提问。 总结起来,主要特点包括: 本地运行,完全离线:无需网络连接,所有处理都可直接在本地设备上进行。 智能模型选择:轻松在 Hugging Face 的不同模型之间切换并比较它们的性能。 图像问答:上传图片并提出相关问题。获取描述、解决问题或识别物体。 Prompt Lab:用户可以使用它来启动由模型驱动的"单轮"任务 ...
腾讯研究院AI速递 20250603
腾讯研究院· 2025-06-02 15:08
注意力机制优化 - Mamba核心作者提出GTA和GLA两种推理定制注意力机制,解码速度和吞吐量最高提升2倍 [1] - GTA可减少50% KV缓存使用,GLA比DeepSeek的MLA解码更快,优化内存和计算逻辑同时保持生成质量 [1] AI Agent技术突破 - Flowith的Agent Neo支持无限执行和产出,具备百万级token上下文能力,解决AI记忆问题 [2] - Agent Neo集成3D、语音、视频等多模态生成管理功能 [2] - Fairies通用AI Agent支持1000种操作,兼容GPT 4.1等主流模型,专业版每月20美元 [4][5] 多模态与图像处理 - FLUX.1 Kontext实现角色一致性保持,生成速度约10秒,支持物体修改和背景替换 [3] - 当前局限包括多轮编辑质量退化、无法参考多图像,需遵循明确保留内容的提示原则 [3] 语音交互与边缘计算 - ElevenLabs Conversational AI 2.0识别语气词意图,集成多语言和RAG技术,支持企业级应用 [6] - Google AI Edge Gallery开源手机本地AI运行器,支持离线图像生成和代码编写,性能依赖设备配置 [7] 机器人硬件与成本趋势 - Hugging Face发布250美元开源人形机器人Reachy Mini,全尺寸HopeJR含66个驱动自由度 [8] - AI推理成本两年内下降99.7%,中国模型成本或为GPT-4.5的0.2%,DeepSee等快速崛起 [9] 行业生态与战略布局 - OpenAI企业服务付费席位超300万(增长50%),推进国家级AI架构"Stargate" [9] - 下一代AI入口将转向全能智能体,OpenAI与Jony Ive合作开发环境化交互硬件 [9] 认知研究与技术瓶颈 - LeCun团队揭示LLM在精细语义任务中失效,与人类认知存在本质差异 [10] - 研究质疑单纯扩大模型规模实现AGI的路径,需重新设计优化目标 [10]
速递|谷歌低调上线AI Edge Gallery,开源本地AI运行器
Z Potentials· 2025-06-02 04:18
谷歌发布AI模型本地运行应用 - 谷歌发布名为Google AI Edge Gallery的实验性应用 支持Android平台并即将登陆iOS 允许用户离线运行Hugging Face平台的公开AI模型 [1] - 应用功能包括图像生成 问题解答 代码编写与编辑 用户可通过GitHub下载并按照说明操作 [5] - 主界面提供图片问答 AI聊天等快捷入口 点击后显示适配任务的模型列表 如谷歌Gemma 3n模型 [5] 离线AI模型的技术特点 - 所有模型均通过手机处理器离线运行 无需互联网连接 解决云端AI的数据隐私和网络依赖问题 [2] - 性能表现与设备硬件配置强相关 现代高性能设备运行速度更快 但模型大小直接影响任务耗时 大型模型处理相同任务所需时间更长 [5] 应用扩展功能与开发者生态 - 内置提示实验室功能 支持单轮任务如文本摘要和重写 提供任务模板和可配置参数用于模型行为微调 [5] - 采用Apache 2 0许可证 允许商业和非商业场景无限制使用 谷歌正积极收集开发者社区反馈以优化体验 [6]