近日吉林大学和微软研究院联合发布了一个叫MindPower的框架,简单说就是让AI具备”读心”的能力——不是比喻,是真的能让AI理解他人的心理状态。
惊喜不,意外不,恐怖不?
这简直超能力啊!
是我穿越了还是重生了?
啥玩意?这叫”心理理论”?
话说这是心理学上的一个概念:指的是你能够推断别人在想什么、想要什么、相信什么的能力。就是“读心”的能力!
读心能力听起来很简单?但这是正常人类成长到三到四岁才能发展出来的能力,这也恰恰是区分普通动物和智慧生命的重要标志。
而现在,AI竟然也要具备这种能力了~!
MindPower的核心思路是把AI的决策过程分成四步:感知、环境理解、心理推理、行动生成。简单说就是:先看看发生了什么,再想想别人在想什么,决定自己该怎么做。
研究人员做了个测试。让AI去纠正一个错误信念——就是那种”我知道你觉得是真的,但其实不是那么回事”的情况。结果,GPT-4o在这个测试上正确率只有五十多分,而MindPower可以到六十五分以上。
别小看这十几分的进步。这代表着AI开始具备”理解他人视角”的能力。
| 维度 | 传统 VLM / 具身智能 | MindPower 框架 |
|---|---|---|
| 心智视角 | 仅感知,无自我 / 他人心智建模 | Robot‑centric,同步建模自身 + 他人信念 / 意图 |
| 推理链路 | 感知 → 动作(端到端黑盒) | 感知 → 信念 → 意图 → 决策 → 动作(六层可解释链路) |
| 认知能力 | 被动响应、执行显式指令 | 主动推理、修正错误信念、完成隐式目标 |
| 优化目标 | 任务损失 / 动作匹配 | MindReward:心智状态 ↔ 动作一致性优化 |
| 适用场景 | 简单指令执行 | 复杂人机协作、家庭服务、陪护等高阶认知任务 |
那么让AI”读心”有什么用?
这用处可大了去了。
拿个最简单的场景来说。你让AI帮你买机票,它现在能做的只是执行命令。但如果有心理推理能力,它就能理解:你是想省钱,还是想省时间?是偏好红眼航班还是宁可多花钱?它甚至能根据你的沉默和犹豫,推断你可能对价格不满意,然后主动调整推荐。
在机器人领域,这个能力就更关键了。
一个真正有用的服务机器人,不能只执行命令,它需要理解:面前这个老人是真不需要帮助,还是只是在客气?那个小孩是真的在玩耍,还是已经遇到了麻烦?
它需要读懂人的意图,而不是只响应明确的指令。
但我们关注的不应该只局限于技术本身,
当AI能够”理解”人的心理状态时,一个根本性的问题就出现了:
它是会更好地为人服务,还是更好地操纵人?
这MindPower可以建模”自我”和”他人”两种视角。这让我想到:如果AI既能理解自己的”存在”,又能推断人的心理活动,那它能做的事情边界在哪里?
它会不会利用对人的理解,去更精准地说服你、引导你、甚至欺骗你?
技术本身没有善恶,但打开的方式决定了结果。
作为一名普通人,面对MindPower这种有超能力的AI,会有怎样一种复杂的情绪呢?
兴奋吗?因为AI真的在变得越来越聪明了;
也有担忧,这种聪明可能超出我们的控制;
小小期待:因为也许有一天,AI真的能理解我在想什么,然后帮我做更好的决策。
隔壁大爷用不好智能手机,因为每次界面变了他就就不会操作了。但如果有一个AI能”理解”他的窘境,能猜到他想做什么,不需要学新东西就能帮助他解决问题——那该多好。
这可能是心理推理能力最温暖的用途。
还是老生常谈的这句话:
AI不可怕,不懂人的AI才可怕。
当AI开始学习理解人的心理,这个过程本身就是一面镜子——我们在教AI理解人类的同时,也在重新审视什么是”理解”,什么是”意识”,什么是”智能”。
也许在这个过程中,我们对自己的认识也会更进一步。
本文参考来源:MindPower论文(arXiv:2511.23055)、相关技术报道
