Workflow
Gemini 2.5 Computer Use
icon
搜索文档
腾讯研究院AI速递 20251010
腾讯研究院· 2025-10-09 16:01
生成式AI模型发布与进展 - 谷歌DeepMind发布Gemini 2 5 Computer Use模型 使AI能直接控制浏览器执行点击 滚动和输入等操作 在相关基准测试中性能达到SOTA水平 使用效率高于竞品 [1] - 马斯克旗下xAI推出视频生成模型Imagine v0 9并向所有用户免费开放 视频生成时间不到20秒 能生成6秒左右视频 支持语音优先界面 [2] - 蚂蚁集团发布并开源万亿参数通用语言大模型Ling-1T 总参数达1T但推理时仅激活约50B参数 在编程与数学推理基准测试中表现亮眼 LiveCodeBench得分最高 数学相关评测双双突破74分 [3] - 腾讯推出混元图像3 0 具备更丰富的细节和更细腻的画质 支持生成表情包组图 四格漫画 图文设计等多种创作风格 [4] - 以色列AI21 Labs开源30亿参数轻量推理模型Jamba Reasoning 3B 采用混合SSM-Transformer架构 支持256K上下文窗口 效率比竞品提升2-5倍 在M3 MacBook Pro上每秒生成40个token [5][6] 前沿科技与材料科学 - 2025年诺贝尔化学奖授予三位科学家 表彰他们在金属有机框架材料发展方面的贡献 该材料能从水中分离PFAS 捕获二氧化碳 从沙漠空气中采集水分 [7] 行业战略与愿景 - OpenAI的愿景是构建垂直整合AGI帝国 由个人AI订阅服务 超大规模基础设施和前沿研究实验室三大支柱构成 预测未来2年内AI将在科学发现领域扮演关键角色 [7] - 具身智能公司Figure获得10亿美元C轮融资 估值达390亿美元 专家指出部署能力是行业卡脖子环节 预计家庭场景大规模部署至少需7-12年 [8] 开发工具与资源 - 谷歌资深工程主管发布《智能体设计模式》一书 系统总结AI Agent开发领域的21个关键设计模式 全书400多页 提供详实代码示例 [9][11]
谷歌发布Gemini 2.5 Computer Use模型,科创100指数ETF(588030)涨超1%,华虹公司领涨
搜狐财经· 2025-10-09 03:05
上证科创板100指数及ETF表现 - 截至2025年10月9日10:13,上证科创板100指数强势上涨1.26% [2] - 指数成分股中华虹公司上涨16.71%,国盾量子上涨11.71%,东芯股份上涨7.11% [2] - 科创100指数ETF(588030)上涨1.12%,最新价报1.44元,近2周累计上涨2.30% [2] - 该ETF盘中换手率为1.72%,成交额达1.38亿元,近1年日均成交4.38亿元,居可比基金第一 [2] - 科创100指数ETF最新规模达71.79亿元,创近1月新高,近2周份额增长3.54亿份,新增份额位居可比基金1/12 [6][7] - 近4个交易日内,该ETF合计资金净流入4.68亿元,但最新单日资金净流出4252.74万元 [7] - 上证科创板100指数前十大权重股合计占比24.32%,包括华虹公司、百济神州、东芯股份等 [7] 人工智能行业重大事件 - 10月1日,OpenAI发布视频生成模型Sora 2.0,其社交应用"Sora"登顶苹果免费应用榜单第一名 [3] - 10月2日,OpenAI与三星电子和SK海力士签署意向书,邀请其参与全球数据中心建设计划 [3] - 10月6日,OpenAI与AMD达成深度合作,将部署总计6吉瓦的AMD GPU算力以支持下一代AI基础设施 [3] - 10月8日,英伟达CEO黄仁勋证实对马斯克旗下xAI进行了投资 [3] - 10月8日,谷歌发布Gemini 2.5 Computer Use,是首个专为界面控制设计的大语言模型 [3] - Google计划在印度投资100亿美元,用于建设1吉瓦的数据中心及附属电力基础设施 [3] 科技行业政策与市场展望 - 机构解读认为,节后A股市场科技成长占优的风格可能延续 [5] - 10月下旬四中全会即将召开,"十五五"规划可能继续大力支持发展新质生产力和科技创新 [5] - 10月底APEC会议将于韩国召开,中美两国元首有望会晤,短期中美贸易谈判有望迎来积极进展 [5] - 在政策支持、外部环境改善及市场情绪积极的背景下,科技成长风格预计有较好表现 [5] 电力设备行业技术进展 - 中国科学院金属研究所科研团队在固态锂电池领域取得突破,为解决固态电池界面阻抗大、离子传输效率低的难题提供了新路径 [4]
谷歌加入CUA战场,发布Gemini 2.5 Computer Use:让AI直接操作浏览器
36氪· 2025-10-08 07:06
谷歌的 Computer Use 模型来了! 今天凌晨,谷歌 DeepMind 重磅发布了基于 Gemini 2.5 的计算机使用模型 Gemini 2.5 Computer Use。 考虑到前些天谷歌才刚刚发布了 Chrome DevTools (MCP),Gemini 2.5 Computer Use 的诞生倒不是特别让人惊讶。简单来说,与 OpenAI 的 Computer- Using Agent (CUA) 类似,DeepMind 的这个模型可让 AI 直接控制用户的浏览器 —— 在视觉理解和推理能力的基础上,该模型可以帮助用户在浏览器中执 行点击、滚动和输入等操作。 先来看两个官方演示。 提示词:From https://tinyurl.com/pet-care-signup , get all details for any pet with a California residency and add them as a guest in my spa CRM at https://pet-luxe- spa.web.app/. Then, set up a follow up visit a ...
谷歌加入CUA战场,发布Gemini 2.5 Computer Use:让AI直接操作浏览器
机器之心· 2025-10-08 03:18
机器之心报道 编辑:Panda 谷歌的 Computer Use 模型来了! 今天凌晨,谷歌 DeepMind 重磅发布了基于 Gemini 2.5 的计算机使用模型 Gemini 2.5 Computer Use 。 考虑到前些天谷歌才刚刚发布了 Chrome DevTools (MCP),Gemini 2.5 Computer Use 的诞生倒不是特别让人惊讶。简单来说,与 OpenAI 的 Computer-Using Agent (CUA) 类似,DeepMind 的这个模型可让 AI 直接控制用户的浏览器 —— 在视觉理解和推理能力的基础上,该模型可以帮助用户在浏览器中执行点击、滚动和输入 等操作。 先来看两个官方演示。 提示词: From https://tinyurl.com/pet-care-signup , get all details for any pet with a California residency and add them as a guest in my spa CRM at https://pet-luxe- spa.web.app/. Then, set up a ...