
软件工程能力
在软件工程领域,M2.7展现出以下具体表现:
- • 在SWE-Pro基准测试中得分56.22%,接近行业领先水平
- • 在端到端完整项目交付场景(VIBE-Pro)中得分55.6%
- • 在复杂工程系统深层理解测试(Terminal Bench 2)中得分57.0%
- • 能够执行日志分析与Bug定位、代码重构、代码安全检查、机器学习任务以及安卓开发相关工作
- • 在实际生产环境故障调试中,能够将系统恢复时间缩短至三分钟以内
在基准测试 SWE-Pro 中,M2.7 得分56.22%,几乎接近Opus最好的水平

专业办公能力
在专业办公场景,M2.7具备以下能力:
- • 在GDPval-AA评测中获得ELO得分1495,为开源模型最高水平
- • 对Office三件套(Excel/PPT/Word)的复杂编辑能力显著提升,支持多轮修改和高保真编辑
- • 在40个复杂skills(>2000 Token)的测试中,仍能保持97%的skills遵循率
- • 在Toolathon测试中正确率达到46.3%,位列全球第一梯队
- • 在MM Claw评测中得分62.7%,接近Sonnet 4.6水平
- • 能够自主阅读财务报告、研报等专业文档,交叉比对信息,设计假设并构建预测模型
自我进化能力
M2.7被设计为能够参与自身迭代过程的模型:
- • 能够自行构建复杂Agent Harness
- • 基于Agent Teams、复杂Skills和Tool Search Tool完成高度复杂的生产力任务
- • 在内部测试中,能够优化自身的软件工程开发表现,通过分析失败轨迹→规划改动→修改脚手架代码→运行评测→对比结果→决定保留或回退的迭代循环超过100轮
- • 在MLE Bench Lite测试中,参与22个机器学习任务测试,获得66.6%的得牌率
![]()
交互能力
在交互娱乐场景,M2.7具备:
- • 良好的身份保持能力
- • 情商表现提升
- • 支持复杂人设保持
- • 能够与用户进行自然交互
M2.7的技术实现包含以下关键组件:
- • Agent Harness:依赖复杂Skills、记忆系统和其他组件提升模型对不同工作环境的适应能力
- • 短时记忆模块:Agent完成每轮迭代后形成短时记忆文件
- • 自反馈机制:对当前轮次结果进行自反馈,提供下一轮次潜在优化方向
- • 自优化流程:基于所有历史轮次的记忆及自反馈链进行下一步自优化
- • Agent Teams:多智能体协作能力,需要角色边界、对抗性推理、协议遵循和行为分化等原生能力

MiniMax M2.7目前已在以下平台全量上线:
- • MiniMax Agent:agent.minimaxi.com
- • 开放平台:platform.minimaxi.com
- • Coding Plan订阅:platform.minimaxi.com/subscribe/coding-plan
模型可应用于软件开发、专业文档处理、数据分析、智能体开发等多个场景。开发者可通过开放平台获取API服务进行二次开发和集成。
目前一些三方AI开发工具(IDE)已经集成了M2.7模型,如:TraeCN

MiniMax M2.7代表了MiniMax在大型语言模型领域的最新进展,特别是在模型自我进化能力、软件工程应用和专业办公能力方面具有显著特点,在多个基准测试中的表现和实际应用场景的验证中,模型已经展示了除了其在复杂任务处理中的实用价值!
可以都来试试!