2025-04-14-【大模型】个人通用知识库搭建

在信息爆炸的时代，构建一个属于自己的“第二大脑”——个人通用知识库，已成为提升效率的关键。本文将深入探讨个人知识库的搭建方案，对比主流工具，并提供一套基于 Cherry Studio + Ollama + DeepSeek + bge-m3 的最佳实践完整搭建指南。

为什么需要个人本地知识库？

传统的笔记软件只能存储信息，而基于 RAG（检索增强生成） 技术的 AI 知识库能让信息“活”起来。

维度	传统笔记/网盘	AI 个人知识库 (RAG)
检索方式	关键词匹配，难以理解语义	语义检索，理解上下文
信息处理	静态存储，需人工整理	动态生成，自动归纳总结
隐私安全	依赖云端，存在泄露风险	完全本地化，数据掌握在自己手中
知识更新	手动更新	实时导入 PDF、Markdown 等文档

第一部分：主流知识库方案深度对比

在搭建之前，我们测试了市面上主流的开源及免费知识库工具，从部署难度、功能丰富度、硬件要求等维度进行了对比。

工具	核心特点	适用人群	优点	缺点
Cherry Studio	全能客户端，支持多模型管理	个人用户/开发者	界面美观，支持 Ollama/OpenAI 多源，本地化体验极佳，开箱即用	主要是客户端，需配合 Ollama 使用
AnythingLLM	一站式桌面应用	小白用户	安装简单，内置向量数据库，功能稳定	二次开发能力弱，UI 交互相对传统
Dify	LLM 应用开发平台	开发者/企业	工作流编排强大，生态丰富，支持 API 发布	部署相对重，对配置有一定要求，主要面向应用开发
MaxKb	专注知识库管理	知识密集型用户	界面友好，检索效果不错	社区相对较小
FastGPT	快速构建 GPT 应用	快速原型设计	知识库检索逻辑清晰，可视化编排	依赖 GPT 系列模型较多（也可接本地）
RagFlow	深度文档理解	企业级/科研	对 PDF 解析能力极强（OCR），基于 RAG 深度优化	部署复杂，硬件资源消耗大

🏆 最佳实践选型：Cherry Studio + Ollama

综合考虑隐私性、易用性、成本和扩展性，我们推荐 Cherry Studio + Ollama 方案。

Ollama: 作为后端推理引擎，轻量级运行 DeepSeek 等开源模型。
Cherry Studio: 作为前端交互与知识库管理中心，UI 现代化，支持本地向量化，体验流畅。
DeepSeek-R1: 高性价比推理模型，逻辑能力强。
BGE-M3: 优秀的中文嵌入（Embedding）模型，支持多语言，检索精准。

第二部分：最佳实践搭建全流程

本教程将演示如何在 macOS/Linux/Windows 上搭建这套系统。

1. 环境准备：安装 Ollama

Ollama 是本地运行大模型的必备神器。

访问 Ollama 官网下载对应系统的安装包并安装。
验证安装：打开终端（Terminal/PowerShell），输入 ollama --version。

2. 模型部署：LLM 与 Embedding 模型

我们需要下载两个模型：一个是负责对话的 DeepSeek-R1，一个是负责将文档转化为向量的 bge-m3。

在终端中执行以下命令：

# 1. 下载并运行 DeepSeek-R1 (推荐 1.5b 或 7b 版本，视显存而定)
# 1.5b 适合 8G 内存以下电脑，7b 适合 16G+ 内存
ollama pull deepseek-r1:1.5b

# 2. 下载嵌入模型 BGE-M3 (用于知识库索引)
ollama pull bge-m3

(可选) 开启 Ollama 远程访问（如果需要局域网其他设备访问）：

# macOS/Linux 修改服务配置
# 1. 编辑服务文件
vi /etc/systemd/system/ollama.service (Linux)
# launchctl setenv OLLAMA_HOST "0.0.0.0" (macOS)

# 2. 设置环境变量
Environment="OLLAMA_HOST=0.0.0.0"
Environment="OLLAMA_ORIGINS=*"
# 3. 重启ollama服务
systemctl daemon-reload
systemctl restart ollama

3. 客户端配置：Cherry Studio

下载安装：访问 Cherry Studio 官网下载客户端。

CherryStudio 是一个支持多平台的 AI 客户端，支持 Win、macOS、Linux 平台,未来也会支持移动端。项目自 24 年 7 月至今已迭代数百个版本,我们致力于打造一个更加高效、安全、易用的客户端，让更多人能够享受到 AI 带来的便利。
连接 Ollama：
- 打开 Cherry Studio -> 设置 -> 模型服务 -> Ollama。
- API 地址默认为 http://127.0.0.1:11434。
- 点击“检查连接”，成功后在下方“模型列表”中点击“添加”，选择刚才下载的 deepseek-r1:1.5b。

4. 构建个人知识库

这是最关键的一步，我们将本地文档“喂”给 AI。

创建知识库：
- 进入 Cherry Studio 左侧“知识库”图标。
- 点击“新建知识库”，命名为“个人资料库”。
配置嵌入模型：
- 在知识库设置中，Embedding 模型选择 Ollama -> bge-m3。这是知识库检索准确性的关键！
导入数据：
- 点击“添加文件”，支持 PDF、Word、Markdown 等格式。
- 上传后，系统会自动进行切片（Chunking）和向量化。等待状态变为“已完成”。

5. 实战演示：与知识库对话

回到“对话”界面。
在输入框上方或侧边栏，开启/关联刚才创建的“个人资料库”。
提问测试：
- “根据我的笔记，总结一下项目 A 的核心风险点。”
- “帮我查找关于 Docker 部署的相关文档。”
观察结果：AI 会先进行“检索 ing…”，引用相关文档片段，然后结合 DeepSeek 的推理能力生成答案。

第三部分：进阶玩法与优化建议

1. 提升检索准确率

切片策略：在导入文档时，可以调整切片大小（Chunk Size）。对于逻辑连贯的长文，适当增大切片（如 500-800 tokens）；对于碎片化信息，减小切片。
混合检索：Cherry Studio 未来版本若支持重排序（Rerank）模型，建议开启，可进一步提升相关性。

2. 结合工作流 (n8n)

如果你需要更复杂的自动化（例如：每天自动抓取新闻存入知识库），可以引入 n8n。

利用 Docker 部署 n8n。
使用 n8n 的 LangChain 节点连接 Ollama，实现自动化的知识库更新与推送。

1 2	`# n8n 快速启动命令 docker run -it --rm --name n8n -p 5678:5678 -v n8n_data:/home/node/.n8n docker.n8n.io/n8nio/n8n`

总结

通过 Cherry Studio + Ollama + DeepSeek 的组合，我们用零成本在本地搭建了一套企业级的个人知识库系统。它不仅保护了数据隐私，更通过 BGE-M3 提供了强大的语义检索能力。无论是整理学习笔记、管理技术文档，还是构建个人第二大脑，这都是目前性价比最高的最佳实践方案。

快去试试吧，让 AI 帮你管理浩瀚的知识海洋！

大模型 > 知识库

#DeepSeek #RAG #Ollama #Cherry Studio

2025-04-14-【大模型】个人通用知识库搭建

https://zhangyingxuan.github.io/2025-04-14-【大模型】个人通用知识库搭建/

作者

blowsysun

更新于

2026年1月23日

许可协议

2025-12-17-【大模型】N8N-AI时代大更新深度解析上一篇

2025-12-13-【Chrome扩展】Chrome插件国际化下一篇