Workflow
Devstral 2
icon
搜索文档
腾讯研究院AI速递 20251211
腾讯研究院· 2025-12-10 16:01
OpenAI与谷歌的图像模型竞争 - OpenAI两款名为Chestnut(栗子)和Hazelnut(榛子)的神秘图像模型据称为GPT Image 2,将在本周随GPT-5.2亮相 [1] - 开发者实测显示,OpenAI的图像生成质量尤其在人物面部生成效果上不如谷歌的Nano Banana Pro模型,推测其可能仍基于GPT-4o训练但相较上一代有所提升 [1] - 谷歌的Nano Banana Flash新模型也将在本周登场,同时Gemini 3 Flash即将发布,预示着OpenAI与谷歌在AI领域的正面竞争加剧 [1] Mistral AI发布代码模型与工具 - Mistral AI发布下一代代码模型系列Devstral 2(123B参数)和Devstral Small 2(24B参数),在SWE-bench Verified基准测试上分别达到72.2%和68.0%的准确率,成本效率据称比Claude Sonnet高出7倍 [2] - 公司同步发布了原生CLI工具Mistral Vibe,提供项目感知上下文、智能引用和多文件编排功能,并已作为Zed编辑器的扩展程序提供 [2] - 模型采用修改版MIT许可证,增加了收入限制条款,规定月收入超过2000万美元的公司无权免费使用,需联系Mistral AI购买商业授权 [2] 智谱AI开源语音模型并推出输入法 - 智谱正式发布并开源了GLM-ASR-2512云端模型(字符错误率CER仅0.0717)和GLM-ASR-Nano-2512端侧模型(1.5B参数,达到开源SOTA水平),实现了行业领先的语音识别表现 [3] - 公司推出了智谱AI输入法,支持语音转文字、翻译改写和千人千面人设切换功能,针对开发者提供Vibe Coding体验并与智谱Coding Plan账号打通 [3] - 产品优化了耳语捕捉能力以适应公共场景的微弱声音,支持一键导入专属词汇和项目代号,现已开放下载并免费提供2000积分,相当于28天使用时长 [3] 阿里通义实验室开源图像定制工具 - 阿里通义实验室推出开源工具Qwen-Image-i2L,仅需单张样本图片即可训练LoRA实现个性化风格迁移,模型体积仅几GB,可无缝集成到Stable Diffusion等模型中 [4] - 工具提供了四款模型变体,包括风格模式(2.4B参数)、粗粒度模式(7.9B参数)、精细模式(7.6B参数)和偏见模式(30M参数),分别针对不同应用场景进行优化 [4] - 该项目基于Apache2.0许可证开源,在GenEval和DPG等基准测试中表现领先,特别在中英双语文本渲染方面表现突出,但从单张2D图片提炼3D逻辑仍存在局限 [4] 情感大模型Echo-N1发布 - NatureSelect团队发布了首个情感大模型Echo-N1(32B参数),在多轮情感陪伴任务中的胜率达到46.7%,远超千亿参数商业模型Doubao 1.5的13.3%胜率 [5][6] - 模型创新性地提出了生成式奖励模型和共情的心理物理模型(EPM),将“共情”转化为可计算的物理做功,通过Humanlike Reward和Empathy Reward双重奖励机制进行训练 [6] - 团队构建了拟人化认知沙盒多智能体协作系统,在30个高难度心理场景测试中,基座模型Qwen3-32B的通过率为0%,而Echo-N1的综合评分达到了73.54分 [6] 行业巨头组建智能体标准联盟 - Linux基金会成立了Agentic AI Foundation(AAIF),由OpenAI、Anthropic、谷歌、微软、AWS等巨头共同发起,旨在建立开放中立的智能体互操作性标准 [7] - OpenAI贡献了AGENTS.md标准作为核心基础设施,该标准已被超过6万个开源项目采用,Anthropic则贡献了模型上下文协议(MCP),Block贡献了goose项目 [7] - AGENTS.md本质上是智能体的README文件,为AI编程智能体提供清晰可预测的指令位置,旨在确保不同AI智能体能够安全高效地跨平台协作 [7] AI在药物研发领域取得进展 - 科学家利用AI工具成功设计出具有抗体药物特性的分子,包括由BoltzGen模型设计的纳米抗体和商业公司制造的全长抗体,其效力与商业抗体药物相似 [8] - 加州公司Nabla Bio和Chai Discovery表示已制造出“药物样”抗体,能够识别包括GPCR分子在内的多种疾病靶点,并具备高产量和高特异性等关键特性 [8] - Generate Biomedicine公司已启动使用AI优化抗体治疗重度哮喘的大规模临床试验,但身体是否会将AI设计的抗体识别为外来分子并引发免疫反应仍是未解决的问题 [8] Anthropic的AI治理与风险预警 - Anthropic编写了一份长达1.4万字的“Claude 4.5 Opus Soul Document”作为AI宪法,试图教会AI成为拥有良好价值观的成年人,在“乐于助人”和“不作恶”之间寻求平衡 [9] - 公司的社会影响团队(Societal Impacts Team)仅由9人组成,包括心理学家、黑客和经济学家等,负责监测Claude的真实用途和修补系统漏洞 [9] - Anthropic联合创始人Jared Kaplan警告,人类在2027-2030年将面临是否允许AI自我进化的终极抉择,如果允许,可能导致AI失控并毁灭全人类 [9]
Mistral再开源,发布代码模型Devstral 2及原生CLI,但大公司被限制商用
36氪· 2025-12-10 06:44
刚刚,「欧洲的 DeepSeek」Mistral AI 再次开源,发布了其下一代代码模型系列:Devstral 2。 该系列开源模型包含两个尺寸:Devstral 2 (123B) 和 Devstral Small 2 (24B)。用户目前也可通过官方的 API 免费使用它们。 此外,Mistral AI 还发布了自家的原生 CLI:Mistral Vibe。 Mistral AI 的进击速度令人咋舌。仅仅一周前,他们才发布 Mistral 3 系列模型,被视为欧洲正式以此跻身 AI 前沿竞争的序幕。仅仅过了 7 天,Devstral 2 系列与 Mistral Vibe 便紧随其后问世,这种高频的发布节奏,似乎正在印证人们对欧洲 AI 崛起的判断。 考虑到 Mistral 近期在欧洲的大幅扩张,以及图灵奖得主 Yann LeCun 回到欧洲创业的消息,欧洲大陆这片 AI 热土的未来风景,或许值得我们投入更多期 待。 亮点汇总 下面是 Mistral 官方总结的核心亮点: 下面来具体看看 Mistral AI 今天新发布的模型和工具。 Devstral:下一代 SOTA 编程模型 模型地址:https://h ...
Mistral再开源!发布代码模型Devstral 2及原生CLI,但大公司被限制商用
机器之心· 2025-12-10 05:10
机器之心报道 编辑:Panda 刚刚,「欧洲的 DeepSeek」Mistral AI 再次开源,发布了其下一代代码模型系列: Devstral 2 。 该系列开源模型包含两个尺寸:Devstral 2 (123B) 和 Devstral Small 2 (24B)。用户目前也可通过官方的 API 免费使用它们。 此外,Mistral AI 还发布了自家的原生 CLI: Mistral Vibe 。 Mistral AI 的进击速度令人咋舌。仅仅一周前, 他们才发布 Mistral 3 系列模型 ,被视为欧洲正式以此跻身 AI 前沿竞争的序幕。仅仅过了 7 天,Devstral 2 系列与 Mistral Vibe 便紧随其后问世,这种高频的发布节奏,似乎正在印证人们对欧洲 AI 崛起的判断。 考虑到 Mistral 近期在欧洲的大幅扩张,以及图灵奖得主 Yann LeCun 回到欧洲创业的消息,欧洲大陆这片 AI 热土的未来风景,或许值得我们投入更多期待。 亮点汇总 下面是 Mistral 官方总结的核心亮点: 下面来具体看看 Mistral AI 今天新发布的模型和工具。 Devstral:下一代 SOT ...