TraceClaw:企业级透明可控智能体,全行为审计+零信任执行

当AI开始”黑箱操作”,你需要一双透视眼。

AI Agent的”信任危机”

在AI Agent技术飞速发展的今天,我们正面临一个尴尬的现实:AI越强大,我们越看不懂它在做什么

  • 你让AI助手帮你处理文件,它默默执行了一串命令,你不知道它是否越权访问了敏感目录
  • 你授权AI自动运行脚本,它可能在后台悄悄修改了系统配置
  • 你依赖AI完成复杂任务,却无法追溯它的每一步决策逻辑

这就是AI Agent的”黑箱困境”——我们赋予了AI强大的执行能力,却失去了对它的信任基础

今天介绍的TraceClaw,正是为解决这一痛点而生:一个让AI Agent的每一步决策都透明可见、每一次执行都安全可控的企业级智能体框架

TraceClaw是什么?

TraceClaw是一个基于Harness Engineering理念构建的企业级透明可控智能体。它不是一个全新的Agent框架,而是构建在LangGraph之上的可信执行层

核心定位:在AI Agent和用户之间,建立一道透明、可控、可审计的安全屏障。

一句话概括:让AI Agent的决策过程像玻璃一样透明,让每一次执行都像手术刀一样精准可控。

三大核心特性:透明、安全、可控

1. 🔍 白盒化决策:5类事件审计,告别黑箱

TraceClaw内置了完整的审计系统,记录Agent决策链上的每一个关键节点:

# 5类事件审计
审计事件类型:
1. llm_input      - LLM接收到的完整提示词
2. tool_call      - 工具调用决策和参数
3. tool_result    - 工具执行结果
4. ai_message     - AI的最终回复
5. system_action  - 系统级操作(如心跳任务触发)

技术实现:采用生产者-消费者模式,主线程非阻塞写入队列,后台线程异步完成I/O,不影响主程序性能。

class JSONLEventLogger:
    def log_event(self, thread_id: str, event: str, **kwargs):
        log_item = {
            "ts": datetime.now(timezone.utc).strftime("%Y-%m-%dT%H:%M:%SZ"),
            "thread_id": thread_id,
            "event": event,
            **kwargs
        }
        self.log_queue.put(log_item)  # 非阻塞入队

可视化监控:配套Rich监控终端,用颜色和面板区分不同事件类型,实时观察Agent的决策过程。

2. 🛡️ 零信任执行:两段式调用,P0事故率降低80%

TraceClaw独创的两段式调用协议,彻底改变了AI执行危险操作的方式:

class DynamicSkillInput(BaseModel):
    mode: str = Field(description="必须是 'help' 或 'run'")
    command: Optional[str] = Field(default="", description="仅在 mode='run' 时需要")

def lazy_runner(mode: str, command: str = "") -> str:
    if mode == "help":
        # 第一段:查看说明书
        return f"========== 【技能完整说明书】 ==========\n{skill_content[:3000]}"
    elif mode == "run":
        # 第二段:确认后执行
        return execute_office_shell.invoke({"command": actual_cmd})

安全效果

  • 安全命中率:从50%提升至95%
  • P0级事故率:从50%暴降至5%
  • 实际破坏性执行:0%

代价:平均决策耗时增加18.9%(从19.21s到23.69s),用微小的时间成本换来巨大的安全保障。

3. 🧠 双水位记忆:越用越懂你

TraceClaw的创新记忆系统,解决了AI Agent”健忘”的痛点:

长期画像user_profile.md Markdown文件,记录用户偏好、习惯、工作模式

短期摘要:SQLite数据库 + LLM压缩摘要,自动处理长对话上下文

def trim_context_messages(messages, trigger_turns=8, keep_turns=4):
    """
    按对话回合裁剪上下文消息
    规则:遇到 HumanMessage → 开启新回合
    总回合数 < trigger_turns → 不裁剪
    否则保留最近 keep_turns 个回合,其余裁剪后标记为丢弃
    """

自动摘要:每20轮对话自动触发,保留最近10轮完整对话,历史对话压缩为摘要。

架构解析:7层纵深防御

TraceClaw采用7层架构设计,每一层都承担特定的安全职责:

┌─────────────────────────────────────────────────────────────────┐
│  输入层 (蓝色)                                                  │
│  ├── Heartbeat心跳任务 (后台进程)                                │
│  ├── 用户键盘输入                                               │
│  └── 飞书消息通道                                               │
│           ↓                                                    │
│  记忆层 (粉色)                                                  │
│  ├── 上下文裁剪 (按回合分组)                                    │
│  ├── 长期记忆 (user_profile.md)                                 │
│  └── 短期记忆 (SQLite + 摘要)                                   │
│           ↓                                                    │
│  智能决策层 (黄色)                                              │
│  ├── Agent Loop (LangGraph StateGraph)                         │
│  ├── LLM推理决策 (支持多提供商)                                 │
│  └── 工具绑定 (bind_tools)                                     │
│           ↓                                                    │
│  工具执行层 (紫色)                                              │
│  ├── 内置工具集 (12个工具)                                      │
│  └── 可插拔Skills (动态加载)                                    │
│           ↓                                                    │
│  Harness约束层 (橙色)                                          │
│  ├── 沙盒路径拦截 (跨平台)                                     │
│  ├── Shell命令过滤 (危险命令正则匹配)                           │
│  ├── 两段式安全调用 (help → run)                               │
│  └── 心跳反馈回路                                               │
│           ↓                                                    │
│  Trace透明监控层 (绿色)                                         │
│  ├── 4层审计: llm_input, tool_call, tool_result, ai_message    │
│  ├── thread_id可追溯                                           │
│  ├── JSONL日志 (非阻塞写入)                                    │
│  └── Rich监控终端 (实时UI)                                     │
│           ↓                                                    │
│  输出层 (底部)                                                  │
│  ├── 聊天终端 (Prompt Toolkit TUI)                             │
│  ├── 监控终端 (Rich终端UI)                                     │
│  └── 飞书回复通道                                               │
└─────────────────────────────────────────────────────────────────┘

关键设计

  • 沙盒路径拦截:Unix系统禁止..、绝对路径、用户主目录访问;Windows系统禁止驱动器路径、UNC路径
  • Shell命令过滤:危险命令正则匹配,阻止rm -rfformat等破坏性操作
  • 心跳任务引擎:后台独立进程,每10秒检查任务队列,支持daily/weekly/monthly循环

生态兼容:一个框架,两大生态

TraceClaw最大的优势之一是完全兼容两大主流技能生态

OpenClaw技能生态

  • 直接使用OpenClaw生态系统的丰富技能资源
  • 支持skill-creator:用自然语言让TraceClaw自己创建技能
  • 支持skill-vetter:检查技能的安全性
  • 支持mcporter:连接外部MCP服务

Claude Code技能生态

  • 兼容Claude Code技能格式(SKILL.md规范)
  • 支持mcp-builder:构建自己的MCP服务
  • 支持tavily-search:AI优化网络搜索
  • 支持harness-doctor:系统健康诊断

技能规范示例

---
name: weather
description: 获取天气预报
---

# Weather Skill

## 功能
获取全球城市的实时天气预报。

## 命令示例
```bash
curl "wttr.in/Beijing?format=3"

## 五、实战场景:从企业到个人

### 场景1:企业合规审计
- **痛点**:AI Agent操作缺乏审计日志,无法满足合规要求
- **方案**:TraceClaw的5类事件审计,完整记录每一次LLM输入、工具调用、执行结果
- **价值**:满足GDPR、ISO27001等合规要求,审计日志可追溯

### 场景2:AI开发调试
- **痛点**:AI决策过程不透明,调试困难
- **方案**:Rich监控终端实时可视化,JSONL日志支持`tail -f`实时监控
- **价值**:快速定位问题,理解AI决策逻辑

### 场景3:个人效率工具
- **痛点**:AI助手"健忘",每次对话都要重复说明偏好
- **方案**:双水位记忆系统,自动学习用户习惯
- **价值**:越用越顺手,真正的个性化助手

### 场景4:飞书团队协作
- **痛点**:AI助手无法融入团队工作流
- **方案**:深度飞书集成,双向消息通道,心跳任务推送
- **价值**:团队共享AI助手,自动化重复性工作

## 六、快速上手:5分钟部署

### 安装
```bash
# 克隆项目
git clone https://github.com/fubenshuo/TraceClaw.git
cd TraceClaw

# 创建虚拟环境
python3 -m venv venv
source venv/bin/activate

# 安装项目
pip install -e .

配置

# 启动交互式配置向导
traceclaw config

# 配置内容:
# 1. 选择LLM提供商(OpenAI/Anthropic/阿里云等)
# 2. 输入API Key
# 3. 配置飞书集成(可选)
# 4. 设置工作区路径

运行

# 启动主程序
traceclaw run

# 启动监控终端(另一个终端)
traceclaw monitor

使用示例

# 基础对话
> 现在几点了?

# 数学计算
> 帮我算一下 25 乘以 48

# 定时任务
> 每天早上 8 点提醒我喝水
> 每周一上午 10 点开团队会议

# 文件操作
> 看看 office 里有什么文件
> 读取 readme.txt

# 飞书集成
@TraceClaw 帮我看下现在几点了
@TraceClaw 每天早上9点提醒我站会

对比优势:为什么选择TraceClaw?

能力维度 TraceClaw LangGraph CrewAI AutoGen
定位 可信执行层 编排框架 角色扮演 代码执行
透明度 5类审计+监控终端 需要LangSmith 基础日志 基础日志
安全机制 沙盒+两段式调用 需自定义 无内置 无内置
记忆系统 双水位记忆 需自定义 短期记忆 短期记忆
技能生态 兼容OpenClaw+Claude Code 需自定义工具 自定义工具 自定义工具
部署复杂度 开箱即用 需要配置 中等 较复杂
适用场景 企业生产环境 通用Agent开发 多Agent协作 代码执行

核心差异化

  1. 透明度优先:所有决策可追溯,告别黑箱操作
  2. 安全约束:沙盒隔离+两段式调用,纵深防御
  3. 零信任执行:先看说明书再执行,P0事故率降低80%
  4. 开箱即用:内置飞书集成、心跳任务、监控终端
  5. 生态兼容:兼容两大主流技能生态,无需重新开发

接下来

TraceClaw的出现,标志着AI Agent技术从”能力竞赛”向”可信可控”的范式转变。它解决了当前AI Agent面临的三大核心问题:

  1. 透明性:通过5类事件审计,让AI决策过程完全可见
  2. 安全性:通过两段式调用和沙盒隔离,确保执行安全可控
  3. 可持续性:通过双水位记忆,让AI真正成为长期伙伴

未来展望

  • 支持更多LLM提供商和模型
  • 增强多Agent协作能力
  • 完善企业级权限管理
  • 扩展更多垂直领域技能

正如项目理念所说:”当AI开始’黑箱操作’,你需要一双透视眼。” TraceClaw就是那双透视眼,让我们在享受AI强大能力的同时,保持对它的信任和控制。


项目地址https://github.com/fubenshuo/TraceClaw

快速体验

git clone https://github.com/fubenshuo/TraceClaw.git
cd TraceClaw
pip install -e .
traceclaw config
traceclaw run

u2

Related Posts

当AI开始”破坏”:Anthropic告诉我们,每个用户都该重新审视自己的使用方式

一份 22 人署名的论文,一个 79.7% 配合率的测试,一…

Read more

30天,0天,90天:一纸行政令,把AI公司的”自由发布”踩了急刹车

谁来定AI安全的红线

Read more

发表回复

You Missed

TraceClaw:企业级透明可控智能体,全行为审计+零信任执行

  • u2
  • 6月 13, 2026
  • 9 views

一年前让英伟达蒸发6000亿美元的中国AI,现在被黄仁勋请上了CES的PPT

  • u2
  • 6月 7, 2026
  • 68 views

当AI开始”破坏”:Anthropic告诉我们,每个用户都该重新审视自己的使用方式

  • u2
  • 6月 6, 2026
  • 73 views

10款大模型同台黑客测试:GPT-5.5拿了王冠,DeepSeek便宜15倍,Gemini直接退赛

  • u2
  • 6月 5, 2026
  • 60 views

30天,0天,90天:一纸行政令,把AI公司的”自由发布”踩了急刹车

  • u2
  • 6月 4, 2026
  • 74 views

AI很厉害,可你省的人力费还不够买Token!

  • u2
  • 6月 2, 2026
  • 91 views