具有自我进化能力的国产大模型:MiniMax M2.7

MiniMax M2.7是MiniMax公司在M2系列模型基础上推出的最新文本模型版本,新鲜出炉,于2026年3月18日发布。
模型被定位为能够深度参与自身迭代过程的模型,标志着模型在自我进化能力方面的探索。

见官网:https://minimaxi.com/models/text/m27

软件工程能力

在软件工程领域,M2.7展现出以下具体表现:

  • • 在SWE-Pro基准测试中得分56.22%,接近行业领先水平
  • • 在端到端完整项目交付场景(VIBE-Pro)中得分55.6%
  • • 在复杂工程系统深层理解测试(Terminal Bench 2)中得分57.0%
  • • 能够执行日志分析与Bug定位、代码重构、代码安全检查、机器学习任务以及安卓开发相关工作
  • • 在实际生产环境故障调试中,能够将系统恢复时间缩短至三分钟以内

在基准测试 SWE-Pro 中,M2.7 得分56.22%,几乎接近Opus最好的水平

专业办公能力

在专业办公场景,M2.7具备以下能力:

  • • 在GDPval-AA评测中获得ELO得分1495,为开源模型最高水平
  • • 对Office三件套(Excel/PPT/Word)的复杂编辑能力显著提升,支持多轮修改和高保真编辑
  • • 在40个复杂skills(>2000 Token)的测试中,仍能保持97%的skills遵循率
  • • 在Toolathon测试中正确率达到46.3%,位列全球第一梯队
  • • 在MM Claw评测中得分62.7%,接近Sonnet 4.6水平
  • • 能够自主阅读财务报告、研报等专业文档,交叉比对信息,设计假设并构建预测模型

自我进化能力

M2.7被设计为能够参与自身迭代过程的模型:

  • • 能够自行构建复杂Agent Harness
  • • 基于Agent Teams、复杂Skills和Tool Search Tool完成高度复杂的生产力任务
  • • 在内部测试中,能够优化自身的软件工程开发表现,通过分析失败轨迹→规划改动→修改脚手架代码→运行评测→对比结果→决定保留或回退的迭代循环超过100轮
  • • 在MLE Bench Lite测试中,参与22个机器学习任务测试,获得66.6%的得牌率

交互能力

在交互娱乐场景,M2.7具备:

  • • 良好的身份保持能力
  • • 情商表现提升
  • • 支持复杂人设保持
  • • 能够与用户进行自然交互

M2.7的技术实现包含以下关键组件:

  • • Agent Harness:依赖复杂Skills、记忆系统和其他组件提升模型对不同工作环境的适应能力
  • • 短时记忆模块:Agent完成每轮迭代后形成短时记忆文件
  • • 自反馈机制:对当前轮次结果进行自反馈,提供下一轮次潜在优化方向
  • • 自优化流程:基于所有历史轮次的记忆及自反馈链进行下一步自优化
  • • Agent Teams:多智能体协作能力,需要角色边界、对抗性推理、协议遵循和行为分化等原生能力

MiniMax M2.7目前已在以下平台全量上线:

  • • MiniMax Agent:agent.minimaxi.com
  • • 开放平台:platform.minimaxi.com
  • • Coding Plan订阅:platform.minimaxi.com/subscribe/coding-plan

模型可应用于软件开发、专业文档处理、数据分析、智能体开发等多个场景。开发者可通过开放平台获取API服务进行二次开发和集成。

目前一些三方AI开发工具(IDE)已经集成了M2.7模型,如:TraeCN

MiniMax M2.7代表了MiniMax在大型语言模型领域的最新进展,特别是在模型自我进化能力、软件工程应用和专业办公能力方面具有显著特点,在多个基准测试中的表现和实际应用场景的验证中,模型已经展示了除了其在复杂任务处理中的实用价值!

可以都来试试!

  • u2

    Related Posts

    当AI学会读心术:MindPower框架带来的震撼与思考

    吉林大学与微软研究院提出的MindPower框架让AI具备了心理理论推理能力,能够理解他人心理状态。本文深度分析这一技术突破的意义、潜在应用以及可能带来的风险,探讨AI读心术对普通人的影响。

    Read more

    当ChatGPT遭遇QuitGPT!

    2026年2月底,一场名为“QuitGPT”的抵制运动迅速发…

    Read more

    发表回复

    You Missed

    具有自我进化能力的国产大模型:MiniMax M2.7

    • u2
    • 3月 19, 2026
    • 7 views
    具有自我进化能力的国产大模型:MiniMax M2.7

    当AI学会读心术:MindPower框架带来的震撼与思考

    • u2
    • 3月 16, 2026
    • 31 views

    AI并没有简化软件工程:它只是让糟糕的工程更容易实现了

    • u2
    • 3月 14, 2026
    • 44 views

    当ChatGPT遭遇QuitGPT!

    • u2
    • 3月 13, 2026
    • 53 views

    AI安全护栏:保护还是束缚?一场不对称的战争

    • u2
    • 3月 11, 2026
    • 59 views

    从”养虾”到AI Agent爆发:2026年技术圈的新范式转移

    • u2
    • 3月 9, 2026
    • 107 views