GitHub 25K+星标！Onyx：开源可自托管的企业级AI聊天与RAG平台

一款名为Onyx的开源项目正在迅速走红——截至2026年4月，它在GitHub上已获得超过25,000颗星标，成为企业级AI聊天与RAG（检索增强生成）领域的标杆项目。本文将详细介绍这款热门开源项目的核心功能、安装部署和使用方法。

一、项目概述与背景

Onyx（原名Danswer）是由onyx-dot-app团队开发的开源AI平台，定位为“面向团队的可自托管AI聊天与RAG平台”。与普通的AI聊天工具不同，Onyx的核心价值在于它能够连接企业的各种知识源，让AI助手直接在企业私有数据上进行问答，从而实现真正的“企业级AI助理”。

该项目的GitHub仓库显示，Onyx目前已获得超过25,000颗星标、3,300多次Fork，活跃issues数量超过300个。更值得注意的是，项目拥有近200名贡献者参与代码贡献，社区活跃度非常高。这不仅证明了项目的技术实力，也反映出市场对企业级私有AI解决方案的强烈需求。

从技术栈来看，Onyx采用Python作为主要开发语言（占比约63%），前端使用TypeScript（约31%），并辅以少量Go和JavaScript。这种现代化的技术架构确保了项目具有良好的可维护性和扩展性。项目采用MIT开源许可证，允许企业和个人免费使用和二次开发。

二、核心功能特点

2.1 强大的多数据源连接能力

Onyx最核心的亮点之一是其丰富的数据连接器（Connector）支持。据统计，Onyx支持超过40种数据源的连接，涵盖了企业日常使用的绝大多数办公工具和知识管理系统：

文档类连接器：Google Drive、Notion、Confluence、SharePoint、百度网盘等。企业可以将分散在各个文档系统中的知识汇聚到统一的AI平台中。
通讯类连接器：Slack、Discord、Microsoft Teams、飞书等。这意味着AI可以读取群聊中的讨论内容，帮助新员工快速了解团队历史决策。
代码管理类连接器：GitHub、GitLab等。开发者可以直接向AI询问代码库中的特定实现细节，加速开发效率。
数据库类连接器：PostgreSQL、MySQL等。企业可以直接用自然语言查询数据库中的结构化数据。
其他连接器：Jira、Linear项目管理系统，YouTube视频内容，Web网页抓取等。

这种广泛的数据源支持让Onyx能够真正成为企业的“知识中枢”，而不是一个孤立的聊天工具。

2.2 灵活的大语言模型支持

Onyx的另一大优势是对主流大语言模型的广泛支持。它不绑定特定的AI模型，而是允许用户根据自己的需求选择合适的模型：

云端API模型：OpenAI GPT系列、Anthropic Claude、Google Gemini、DeepSeek等主流云端模型。只需配置API Key即可快速接入。
本地部署模型：支持Ollama、LM Studio等本地模型运行方案。对于数据安全要求极高的企业，可以选择完全离线部署。
企业自有模型：支持对接企业自行部署的LLM服务，满足特殊场景下的定制化需求。

这种灵活性意味着企业可以根据成本、隐私、性能等因素自由选择最合适的AI模型，而不会被工具绑架。

2.3 先进的RAG检索增强生成

作为一款RAG平台，Onyx在检索和生成两个环节都有深入优化：

智能文档处理：自动解析PDF、Word、PowerPoint、Markdown等各种格式的文档，提取文本内容并进行向量化处理。
混合检索策略：结合关键词匹配和语义搜索，确保结果既相关又全面。
引用来源追溯：回答中的每个事实都会标注来源，用户可以点击跳转到原始文档查看详情。
多轮对话支持：支持上下文记忆，能够理解对话历史中的指代和隐含意图。

2.4 团队协作与权限管理

Onyx专门为团队使用场景设计了完善的多人协作功能：

文档集（Document Sets）：可以将不同的数据源分组，创建面向不同团队的专属知识库。例如创建“技术支持知识库”、“产品文档知识库”等。
用户角色管理：支持管理员、普通用户、只读用户等多种角色，控制访问权限。
对话历史管理：团队成员可以查看共享的对话记录，避免重复提问。
搜索历史分析：管理员可以了解团队最常搜索的问题，优化知识库内容。

2.5 丰富的部署选项

Onyx提供了多种部署方式，满足不同规模企业的需求：

完整部署：完整的Onyx Stack，包含所有功能的Docker Compose部署，适合中大型企业。
轻量部署（Onyx Lite）：简化版本，资源需求更低，适合小团队或个人使用。
云原生部署：支持Kubernetes Helm Chart，适合在企业云基础设施上运行。

三、安装部署

Onyx提供了多种安装方式，以下介绍最常用的Docker Compose部署方法，这是官方推荐的快速入门方式。

3.1 环境准备

在开始安装之前，需要确保服务器满足以下基本要求：

硬件要求：至少4核CPU、8GB内存、50GB可用磁盘空间。如果要处理大量文档，建议配置更高。
软件要求：Docker 20.10+、Docker Compose v2+、至少20GB可用存储（用于存储向量数据库和文档内容）。

3.2 一键部署（推荐）

Onyx官方提供了便捷的安装脚本，这是最简单的部署方式：

# 克隆项目
git clone https://github.com/onyx-dot-app/onyx.git
cd onyx

# 运行安装脚本（需要root权限）
sudo ./onboarding.sh

安装脚本会引导完成以下配置：

选择部署模式：完整部署或轻量部署
配置域名：设置访问域名（可选）
配置LLM：输入API Key或配置本地模型
创建管理员账户：设置初始管理员账号密码
启动服务：自动启动所有容器

部署完成后，通过浏览器访问服务器IP或配置的域名，即可看到Onyx的登录界面。

3.3 手动Docker Compose部署

如果需要更细粒度的控制，也可以手动修改配置文件后启动：

# 复制环境配置模板
cp .env.example .env

# 编辑配置文件，设置关键参数
vim .env

主要配置项包括：

# 认证配置
AUTH_TYPE=google  # 或 email、basic等
DEFAULT_LLM=openai
OPENAI_API_KEY=your-api-key-here

# 必应搜索（可选）
BING_API_KEY=your-bing-key

# 邮件服务（可选，用于发送邀请链接）
MAIL_SERVER=smtp.gmail.com
MAIL_PORT=587

配置完成后启动：

docker compose up -d

查看服务状态：

docker compose ps

日志查看：

docker compose logs -f web

3.4 轻量版部署（资源有限场景）

如果服务器资源有限，可以使用Onyx Lite版本：

# 使用轻量配置
docker compose -f docker-compose.lite.yml up -d

Lite版本仅包含核心组件，内存占用约2GB，适合小团队或试用场景。

四、快速使用指南

4.1 首次登录配置

完成部署后，首次登录Onyx需要完成以下初始化步骤：

步骤一：使用安装时创建的管理员账户登录
步骤二：进入管理后台（Admin Panel）
步骤三：在”LLM Settings”中确认大语言模型配置正确
步骤四：开始添加第一个数据源

4.2 添加数据源

添加数据源是使用Onyx的核心操作，以下以添加Slack频道为例：

在左侧菜单点击”Connectors”
选择”Slack”连接器

填写配置信息：

# Slack连接器配置示例
App ID: xxxx-xxxx-xxxx
Bot Token: xoxb-xxxxx
Signing Secret: xxxxx

选择要同步的频道
点击”Sync”开始同步

其他数据源的添加流程类似，主要差异在于各平台提供的API凭证不同。详细的连接器配置指南可以在官方文档中查看。

4.3 创建文档集

为了更好地管理不同团队的知识，可以创建多个文档集：

进入”Document Sets”页面
点击”Create Document Set”
命名并添加描述
将相关的数据源添加到这个文档集

4.4 开始智能问答

配置好数据源后，就可以开始使用了：

基本问答：在对话框中输入问题，Onyx会自动检索相关文档并生成回答。每个回答都会标注引用来源。
指定文档集：如果需要只针对某个知识库提问，可以使用@命令指定文档集，如”@技术支持文档如何重置密码？”
搜索历史：左侧边栏可以查看历史对话，方便回溯之前的问答记录。

4.5 管理与优化

为了获得更好的使用效果，建议进行以下优化：

定期同步：配置定时同步任务，保持知识库内容与数据源同步更新。
查看分析：通过”Search Analytics”了解团队使用情况，优化知识库内容。
调整prompt：在”Prompts”中可以自定义系统提示词，让AI回答更符合企业风格。

五、应用场景示例

5.1 企业内部知识助手

某科技公司的IT部门使用Onyx搭建了内部知识库，将Confluence文档、Slack技术讨论、GitHub代码文档全部接入AI平台。员工遇到技术问题时，直接向AI提问即可获得准确答案，新员工入职培训时间从原来的两周缩短到三天。

5.2 客户支持知识库

一家SaaS企业将产品文档、常见问题、客服对话记录接入Onyx，打造了一个7×24小时的AI客服助手。AI可以准确回答80%以上的常见问题，人工客服只需处理复杂问题，大幅提升了服务效率。

5.3 研发团队代码助手

开发团队将代码仓库的技术文档、架构设计文档、API文档整合到Onyx。开发者可以通过自然语言查询特定功能的实现位置、接口调用方式等，加速了开发和问题排查效率。

5.4 HR文档助手

人力资源部门将员工手册、规章制度、FAQ等文档接入Onyx。员工可以快速查询请假流程、福利政策等问题，HR团队减少了大量重复咨询工作。

六、与同类产品对比

特性	Onyx	LangChain	Flowise	ChatPDF
自托管	✅ 支持	✅ 支持	✅ 支持	❌ SaaS
连接器数量	40+	需自行开发	20+	有限
团队协作	✅ 完善	❌ 基础	❌ 基础	❌ 基础
部署难度	⭐⭐ 简单	⭐⭐⭐ 复杂	⭐⭐ 简单	无需部署
社区活跃度	⭐⭐⭐⭐ 高	⭐⭐⭐⭐⭐ 非常高	⭐⭐⭐⭐ 高	一般

相比其他开源RAG方案，Onyx的优势在于开箱即用、团队协作完善、连接器丰富，非常适合想在企业内部快速落地AI知识库的企业。

七、总结与展望

Onyx作为2026年GitHub上最热门的开源AI平台之一，完美解决了企业私有化部署AI知识助手的需求。它不仅提供了丰富的企业应用特性——多数据源连接、团队协作、权限管理等，还保持了开源项目的灵活性，企业可以根据自身需求进行定制和扩展。

对于希望拥抱AI但又担心数据安全的企业来说，Onyx提供了一个两全其美的解决方案：既可以利用AI提升知识管理效率，又能把所有数据保留在自有基础设施中。随着企业对AI应用的认识不断深入，类似的私有化AI平台将越来越受到青睐。

如果你是技术决策者，正在为企业寻找AI知识管理解决方案，不妨给Onyx一个尝试的机会——只需几台服务器和一下午的时间，就能搭建起一个真正属于企业的AI助手。

运维速度

或者查看我们的热门类别...

运维速度

或者查看我们的热门类别...

GitHub 25K+星标！Onyx：开源可自托管的企业级AI聊天与RAG平台

一、项目概述与背景

二、核心功能特点

2.1 强大的多数据源连接能力

2.2 灵活的大语言模型支持

2.3 先进的RAG检索增强生成

2.4 团队协作与权限管理

2.5 丰富的部署选项

三、安装部署

3.1 环境准备

3.2 一键部署（推荐）

3.3 手动Docker Compose部署

3.4 轻量版部署（资源有限场景）

四、快速使用指南

4.1 首次登录配置

4.2 添加数据源

4.3 创建文档集

4.4 开始智能问答

4.5 管理与优化

五、应用场景示例

5.1 企业内部知识助手

5.2 客户支持知识库

5.3 研发团队代码助手

5.4 HR文档助手

六、与同类产品对比

七、总结与展望

u2

Related Posts

InternVL-U 统一多模态模型

Everything Claude Code：开源 Agent 性能优化框架

发表回复 取消回复

You Missed

GitHub 25K+星标！Onyx：开源可自托管的企业级AI聊天与RAG平台

InternVL-U 统一多模态模型

Everything Claude Code：开源 Agent 性能优化框架

MiroFish：群体智能预测引擎，让未来在数字沙盘中预演

OpenClaw爆火背后：一个值得深思的转折点

担心Todesk，向日葵有漏洞和数据泄露？跟我来体验下完美开源替代工具：RustDesk！

发表回复取消回复