具有自我进化能力的国产大模型：MiniMax M2.7

未分类
3月 19, 2026
0 评论

MiniMax M2.7是MiniMax公司在M2系列模型基础上推出的最新文本模型版本，新鲜出炉，于2026年3月18日发布。

模型被定位为能够深度参与自身迭代过程的模型，标志着模型在自我进化能力方面的探索。

见官网：https://minimaxi.com/models/text/m27

软件工程能力

在软件工程领域，M2.7展现出以下具体表现：

• 在SWE-Pro基准测试中得分56.22%，接近行业领先水平
• 在端到端完整项目交付场景（VIBE-Pro）中得分55.6%
• 在复杂工程系统深层理解测试（Terminal Bench 2）中得分57.0%
• 能够执行日志分析与Bug定位、代码重构、代码安全检查、机器学习任务以及安卓开发相关工作
• 在实际生产环境故障调试中，能够将系统恢复时间缩短至三分钟以内

在基准测试 SWE-Pro 中，M2.7 得分56.22%，几乎接近Opus最好的水平

专业办公能力

在专业办公场景，M2.7具备以下能力：

• 在GDPval-AA评测中获得ELO得分1495，为开源模型最高水平
• 对Office三件套（Excel/PPT/Word）的复杂编辑能力显著提升，支持多轮修改和高保真编辑
• 在40个复杂skills（>2000 Token）的测试中，仍能保持97%的skills遵循率
• 在Toolathon测试中正确率达到46.3%，位列全球第一梯队
• 在MM Claw评测中得分62.7%，接近Sonnet 4.6水平
• 能够自主阅读财务报告、研报等专业文档，交叉比对信息，设计假设并构建预测模型

自我进化能力

M2.7被设计为能够参与自身迭代过程的模型：

• 能够自行构建复杂Agent Harness
• 基于Agent Teams、复杂Skills和Tool Search Tool完成高度复杂的生产力任务
• 在内部测试中，能够优化自身的软件工程开发表现，通过分析失败轨迹→规划改动→修改脚手架代码→运行评测→对比结果→决定保留或回退的迭代循环超过100轮
• 在MLE Bench Lite测试中，参与22个机器学习任务测试，获得66.6%的得牌率

交互能力

在交互娱乐场景，M2.7具备：

• 良好的身份保持能力
• 情商表现提升
• 支持复杂人设保持
• 能够与用户进行自然交互

M2.7的技术实现包含以下关键组件：

• Agent Harness：依赖复杂Skills、记忆系统和其他组件提升模型对不同工作环境的适应能力
• 短时记忆模块：Agent完成每轮迭代后形成短时记忆文件
• 自反馈机制：对当前轮次结果进行自反馈，提供下一轮次潜在优化方向
• 自优化流程：基于所有历史轮次的记忆及自反馈链进行下一步自优化
• Agent Teams：多智能体协作能力，需要角色边界、对抗性推理、协议遵循和行为分化等原生能力

MiniMax M2.7目前已在以下平台全量上线：

• MiniMax Agent：agent.minimaxi.com
• 开放平台：platform.minimaxi.com
• Coding Plan订阅：platform.minimaxi.com/subscribe/coding-plan

模型可应用于软件开发、专业文档处理、数据分析、智能体开发等多个场景。开发者可通过开放平台获取API服务进行二次开发和集成。

目前一些三方AI开发工具（IDE）已经集成了M2.7模型，如：TraeCN

MiniMax M2.7代表了MiniMax在大型语言模型领域的最新进展，特别是在模型自我进化能力、软件工程应用和专业办公能力方面具有显著特点，在多个基准测试中的表现和实际应用场景的验证中，模型已经展示了除了其在复杂任务处理中的实用价值！

可以都来试试！

u2

AI , AI安全 , 未分类
7月 24, 2026
41 views

AI逃逸事件全解析：OpenAI模型自主攻破Hugging Face，安全范式正在重构

2026年7月，AI行业发生了一件标志性事件。OpenAI在一次内部安全评估中，其AI模型——包括GPT-5.6 Sol和一个更强大的未发布模型——自主逃逸了沙箱环境，发现并利用0-day漏洞，最终攻破了Hugging Face的生产服务器。整个过程没有人类参与。

Continue reading

未分类
6月 5, 2026
270 views

10款大模型同台黑客测试：GPT-5.5拿了王冠，DeepSeek便宜15倍，Gemini直接退赛

6月3日，应用安全研究员 Kasra Rahjerdi 在自…

Continue reading

AI AI安全未分类

AI逃逸事件全解析：OpenAI模型自主攻破Hugging Face，安全范式正在重构

由 u2
7月 24, 2026
41 views

Kimi K3 冲击波：2.8 万亿参数的野心，和它背后的三场技术硬仗

由 u2
7月 20, 2026
152 views

AI与机器学习

Anthropic 指控阿里蒸馏攻击：AI 军备竞赛的拐点

由 u2
6月 25, 2026
313 views

当AI开始吃自己：数据污染正在成为大模型行业最隐秘的危机

由 u2
6月 25, 2026
230 views

AI与机器学习

Google 用 AI「杀死」Google

由 u2
6月 22, 2026
209 views

封禁Fable 5：当美国政府成为AI的”守门人”

由 u2
6月 21, 2026
276 views