当AI开始”黑箱操作”，你需要一双透视眼。

AI Agent的”信任危机”

在AI Agent技术飞速发展的今天，我们正面临一个尴尬的现实：AI越强大，我们越看不懂它在做什么。

你让AI助手帮你处理文件，它默默执行了一串命令，你不知道它是否越权访问了敏感目录
你授权AI自动运行脚本，它可能在后台悄悄修改了系统配置
你依赖AI完成复杂任务，却无法追溯它的每一步决策逻辑

这就是AI Agent的”黑箱困境”——我们赋予了AI强大的执行能力，却失去了对它的信任基础。

今天介绍的TraceClaw，正是为解决这一痛点而生：一个让AI Agent的每一步决策都透明可见、每一次执行都安全可控的企业级智能体框架。

TraceClaw是什么？

TraceClaw是一个基于Harness Engineering理念构建的企业级透明可控智能体。它不是一个全新的Agent框架，而是构建在LangGraph之上的可信执行层。

核心定位：在AI Agent和用户之间，建立一道透明、可控、可审计的安全屏障。

一句话概括：让AI Agent的决策过程像玻璃一样透明，让每一次执行都像手术刀一样精准可控。

三大核心特性：透明、安全、可控

1. 🔍 白盒化决策：5类事件审计，告别黑箱

TraceClaw内置了完整的审计系统，记录Agent决策链上的每一个关键节点：

# 5类事件审计
审计事件类型：
1. llm_input      - LLM接收到的完整提示词
2. tool_call      - 工具调用决策和参数
3. tool_result    - 工具执行结果
4. ai_message     - AI的最终回复
5. system_action  - 系统级操作（如心跳任务触发）

技术实现：采用生产者-消费者模式，主线程非阻塞写入队列，后台线程异步完成I/O，不影响主程序性能。

class JSONLEventLogger:
    def log_event(self, thread_id: str, event: str, **kwargs):
        log_item = {
            "ts": datetime.now(timezone.utc).strftime("%Y-%m-%dT%H:%M:%SZ"),
            "thread_id": thread_id,
            "event": event,
            **kwargs
        }
        self.log_queue.put(log_item)  # 非阻塞入队

可视化监控：配套Rich监控终端，用颜色和面板区分不同事件类型，实时观察Agent的决策过程。

2. 🛡️ 零信任执行：两段式调用，P0事故率降低80%

TraceClaw独创的两段式调用协议，彻底改变了AI执行危险操作的方式：

class DynamicSkillInput(BaseModel):
    mode: str = Field(description="必须是 'help' 或 'run'")
    command: Optional[str] = Field(default="", description="仅在 mode='run' 时需要")

def lazy_runner(mode: str, command: str = "") -> str:
    if mode == "help":
        # 第一段：查看说明书
        return f"========== 【技能完整说明书】 ==========\n{skill_content[:3000]}"
    elif mode == "run":
        # 第二段：确认后执行
        return execute_office_shell.invoke({"command": actual_cmd})

安全效果：

安全命中率：从50%提升至95%
P0级事故率：从50%暴降至5%
实际破坏性执行：0%

代价：平均决策耗时增加18.9%（从19.21s到23.69s），用微小的时间成本换来巨大的安全保障。

3. 🧠 双水位记忆：越用越懂你

TraceClaw的创新记忆系统，解决了AI Agent”健忘”的痛点：

长期画像：user_profile.md Markdown文件，记录用户偏好、习惯、工作模式

短期摘要：SQLite数据库 + LLM压缩摘要，自动处理长对话上下文

def trim_context_messages(messages, trigger_turns=8, keep_turns=4):
    """
    按对话回合裁剪上下文消息
    规则：遇到 HumanMessage → 开启新回合
    总回合数 < trigger_turns → 不裁剪
    否则保留最近 keep_turns 个回合，其余裁剪后标记为丢弃
    """

自动摘要：每20轮对话自动触发，保留最近10轮完整对话，历史对话压缩为摘要。

架构解析：7层纵深防御

TraceClaw采用7层架构设计，每一层都承担特定的安全职责：

┌─────────────────────────────────────────────────────────────────┐
│  输入层 (蓝色)                                                  │
│  ├── Heartbeat心跳任务 (后台进程)                                │
│  ├── 用户键盘输入                                               │
│  └── 飞书消息通道                                               │
│           ↓                                                    │
│  记忆层 (粉色)                                                  │
│  ├── 上下文裁剪 (按回合分组)                                    │
│  ├── 长期记忆 (user_profile.md)                                 │
│  └── 短期记忆 (SQLite + 摘要)                                   │
│           ↓                                                    │
│  智能决策层 (黄色)                                              │
│  ├── Agent Loop (LangGraph StateGraph)                         │
│  ├── LLM推理决策 (支持多提供商)                                 │
│  └── 工具绑定 (bind_tools)                                     │
│           ↓                                                    │
│  工具执行层 (紫色)                                              │
│  ├── 内置工具集 (12个工具)                                      │
│  └── 可插拔Skills (动态加载)                                    │
│           ↓                                                    │
│  Harness约束层 (橙色)                                          │
│  ├── 沙盒路径拦截 (跨平台)                                     │
│  ├── Shell命令过滤 (危险命令正则匹配)                           │
│  ├── 两段式安全调用 (help → run)                               │
│  └── 心跳反馈回路                                               │
│           ↓                                                    │
│  Trace透明监控层 (绿色)                                         │
│  ├── 4层审计: llm_input, tool_call, tool_result, ai_message    │
│  ├── thread_id可追溯                                           │
│  ├── JSONL日志 (非阻塞写入)                                    │
│  └── Rich监控终端 (实时UI)                                     │
│           ↓                                                    │
│  输出层 (底部)                                                  │
│  ├── 聊天终端 (Prompt Toolkit TUI)                             │
│  ├── 监控终端 (Rich终端UI)                                     │
│  └── 飞书回复通道                                               │
└─────────────────────────────────────────────────────────────────┘

关键设计：

沙盒路径拦截：Unix系统禁止..、绝对路径、用户主目录访问；Windows系统禁止驱动器路径、UNC路径
Shell命令过滤：危险命令正则匹配，阻止rm -rf、format等破坏性操作
心跳任务引擎：后台独立进程，每10秒检查任务队列，支持daily/weekly/monthly循环

生态兼容：一个框架，两大生态

TraceClaw最大的优势之一是完全兼容两大主流技能生态：

OpenClaw技能生态

直接使用OpenClaw生态系统的丰富技能资源
支持skill-creator：用自然语言让TraceClaw自己创建技能
支持skill-vetter：检查技能的安全性
支持mcporter：连接外部MCP服务

Claude Code技能生态

兼容Claude Code技能格式（SKILL.md规范）
支持mcp-builder：构建自己的MCP服务
支持tavily-search：AI优化网络搜索
支持harness-doctor：系统健康诊断

技能规范示例：

---
name: weather
description: 获取天气预报
---

# Weather Skill

## 功能
获取全球城市的实时天气预报。

## 命令示例
```bash
curl "wttr.in/Beijing?format=3"


## 五、实战场景：从企业到个人

### 场景1：企业合规审计
- **痛点**：AI Agent操作缺乏审计日志，无法满足合规要求
- **方案**：TraceClaw的5类事件审计，完整记录每一次LLM输入、工具调用、执行结果
- **价值**：满足GDPR、ISO27001等合规要求，审计日志可追溯

### 场景2：AI开发调试
- **痛点**：AI决策过程不透明，调试困难
- **方案**：Rich监控终端实时可视化，JSONL日志支持`tail -f`实时监控
- **价值**：快速定位问题，理解AI决策逻辑

### 场景3：个人效率工具
- **痛点**：AI助手"健忘"，每次对话都要重复说明偏好
- **方案**：双水位记忆系统，自动学习用户习惯
- **价值**：越用越顺手，真正的个性化助手

### 场景4：飞书团队协作
- **痛点**：AI助手无法融入团队工作流
- **方案**：深度飞书集成，双向消息通道，心跳任务推送
- **价值**：团队共享AI助手，自动化重复性工作

## 六、快速上手：5分钟部署

### 安装
```bash
# 克隆项目
git clone https://github.com/fubenshuo/TraceClaw.git
cd TraceClaw

# 创建虚拟环境
python3 -m venv venv
source venv/bin/activate

# 安装项目
pip install -e .

配置

# 启动交互式配置向导
traceclaw config

# 配置内容：
# 1. 选择LLM提供商（OpenAI/Anthropic/阿里云等）
# 2. 输入API Key
# 3. 配置飞书集成（可选）
# 4. 设置工作区路径

运行

# 启动主程序
traceclaw run

# 启动监控终端（另一个终端）
traceclaw monitor

使用示例

# 基础对话
> 现在几点了？

# 数学计算
> 帮我算一下 25 乘以 48

# 定时任务
> 每天早上 8 点提醒我喝水
> 每周一上午 10 点开团队会议

# 文件操作
> 看看 office 里有什么文件
> 读取 readme.txt

# 飞书集成
@TraceClaw 帮我看下现在几点了
@TraceClaw 每天早上9点提醒我站会

对比优势：为什么选择TraceClaw？

能力维度	TraceClaw	LangGraph	CrewAI	AutoGen
定位	可信执行层	编排框架	角色扮演	代码执行
透明度	5类审计+监控终端	需要LangSmith	基础日志	基础日志
安全机制	沙盒+两段式调用	需自定义	无内置	无内置
记忆系统	双水位记忆	需自定义	短期记忆	短期记忆
技能生态	兼容OpenClaw+Claude Code	需自定义工具	自定义工具	自定义工具
部署复杂度	开箱即用	需要配置	中等	较复杂
适用场景	企业生产环境	通用Agent开发	多Agent协作	代码执行

核心差异化：

透明度优先：所有决策可追溯，告别黑箱操作
安全约束：沙盒隔离+两段式调用，纵深防御
零信任执行：先看说明书再执行，P0事故率降低80%
开箱即用：内置飞书集成、心跳任务、监控终端
生态兼容：兼容两大主流技能生态，无需重新开发

接下来

TraceClaw的出现，标志着AI Agent技术从”能力竞赛”向”可信可控”的范式转变。它解决了当前AI Agent面临的三大核心问题：

透明性：通过5类事件审计，让AI决策过程完全可见
安全性：通过两段式调用和沙盒隔离，确保执行安全可控
可持续性：通过双水位记忆，让AI真正成为长期伙伴

未来展望：

支持更多LLM提供商和模型
增强多Agent协作能力
完善企业级权限管理
扩展更多垂直领域技能

正如项目理念所说：”当AI开始’黑箱操作’，你需要一双透视眼。” TraceClaw就是那双透视眼，让我们在享受AI强大能力的同时，保持对它的信任和控制。

项目地址：https://github.com/fubenshuo/TraceClaw

快速体验：

git clone https://github.com/fubenshuo/TraceClaw.git
cd TraceClaw
pip install -e .
traceclaw config
traceclaw run

运维速度

或者查看我们的热门类别...

运维速度

或者查看我们的热门类别...

TraceClaw：企业级透明可控智能体，全行为审计+零信任执行

当AI开始”黑箱操作”，你需要一双透视眼。

AI Agent的”信任危机”

TraceClaw是什么？

三大核心特性：透明、安全、可控

1. 🔍 白盒化决策：5类事件审计，告别黑箱

2. 🛡️ 零信任执行：两段式调用，P0事故率降低80%

3. 🧠 双水位记忆：越用越懂你

架构解析：7层纵深防御

生态兼容：一个框架，两大生态

OpenClaw技能生态

Claude Code技能生态

配置

运行

使用示例

对比优势：为什么选择TraceClaw？

接下来

u2

Related Posts

当AI开始吃自己：数据污染正在成为大模型行业最隐秘的危机

当AI开始”破坏”：Anthropic告诉我们，每个用户都该重新审视自己的使用方式

You Missed

Kimi K3 冲击波：2.8 万亿参数的野心，和它背后的三场技术硬仗

Anthropic 指控阿里蒸馏攻击：AI 军备竞赛的拐点

当AI开始吃自己：数据污染正在成为大模型行业最隐秘的危机

Google 用 AI「杀死」Google

封禁Fable 5：当美国政府成为AI的”守门人”

27亿美元没留住的人，奥特曼等了十年