Langchain-Chatchat 部署教程!开源可免费商用,完全本地化推理的知识库增强方案!!

图片[1]-Langchain-Chatchat 部署教程!开源可免费商用,完全本地化推理的知识库增强方案!!-零度博客

Langchain-Chatchat 是一个可以实现:完全本地化推理的知识库增强方案, 重点解决数据安全保护,私域化部署的企业痛点。 开源方案采用Apache License,可以免费商用,无需付费。

支持市面上主流的本地大语言模型和Embedding 嵌入式模型,支持开源的本地向量数据库。

图片[2]-Langchain-Chatchat 部署教程!开源可免费商用,完全本地化推理的知识库增强方案!!-零度博客

图片[3]-Langchain-Chatchat 部署教程!开源可免费商用,完全本地化推理的知识库增强方案!!-零度博客

1. 环境配置

  • 首先,确保你的机器安装了 Python 3.8 – 3.11  (强烈推荐使用 Python3.11) 【点击前往
  • 安装CUDA Toolkit,建议安装 CUDA 12.1版本,因为开发者就是用的这个版本,点击前往官方下载
  • 需要注意的是,如果你不在海外,需要自行全局科学上网,否则无法正常安装。

2. 正式安装

大陆用户请选择本地安装包:网盘打包下载

拉取仓库项目文件:

# 拉取仓库
 git clone https://github.com/chatchat-space/Langchain-Chatchat.git

# 进入目录
 cd Langchain-Chatchat

# 安装全部依赖
 pip install -r requirements.txt 
 pip install -r requirements_api.txt
 pip install -r requirements_webui.txt  

# 默认依赖包括基本运行环境(FAISS向量库)。如果要使用 milvus/pg_vector 等向量库,请将 requirements.txt 中相应依赖取消注释再安装。

3.下载模型

git lfs install
git clone https://huggingface.co/THUDM/chatglm3-6b
git clone https://huggingface.co/BAAI/bge-large-zh

初始化配置

python copy_config_example.py
python init_database.py --recreate-vs

4.启动

python startup.py -a

第一次启动的时候需要输入一个邮箱,就可以打开 webUI 可视化界面进行使用!

GPU硬件推荐参数

7B的模型,显存14GB+,推荐 NVIDIA RTX4080 16G及以上
14B级模型,显存30GB+,推荐 NVIDIA Tesla V100 32G及以上
39B级模型,显存69GB+,推荐 NVIDIA A100 80G及以上
72B级模型,显存145GB+,需要专业级显卡或者多卡叠加

(默认安装的是 ChatGLM-6B 模型,中端型显卡可以直接本地运行)

本次演示环境系统: Windows 11   、GPU: RTX 4090 24GB、 CPU: i7-12700

当然如果你需要运行更大的模型,比如你想要顺利在GPU运行本地模型的 FP16 版本,你至少需要以下的硬件配置,来保证在我们框架下能够实现 稳定连续对话

  • ChatGLM3-6B & LLaMA-7B-Chat 等 7B模型
    • 最低显存要求: 14GB
    • 推荐显卡: RTX 4080
  • Qwen-14B-Chat 等 14B模型
    • 最低显存要求: 30GB
    • 推荐显卡: V100
  • Yi-34B-Chat 等 34B模型
    • 最低显存要求: 69GB
    • 推荐显卡: A100
  • Qwen-72B-Chat 等 72B模型
    • 最低显存要求: 145GB
    • 推荐显卡:多卡 A100 以上

5.安装过程中出现的常见错误和解决方法:

1.提示 ModuleNotFoundError: No module named ‘pwd’,这个模块是Unix系统上的,Windows 上并没有,所以我们需要进行降级:

pip install langchain-community==0.0.19

2.提示错误信息 | ERROR | stderr | AssertionError: Torch not compiled with CUDA enabled

说明你没有安装CUDA环境或者你安装的PyTorch版本不支持CUDA,解决方法:

pip uninstall torch torchvision torchaudio

通过上面的命令进行卸载后重新安装官方给出的正确版本,安装命令如下:

pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

3.安装依赖 wavedrom 时报错 (setuptools_scm)的解决方法:

pip install setuptools_scm

安装后再重新安装依赖环境

 

 

THE END
喜欢就支持一下吧
点赞2177 分享
MagnetW-最强BT种子搜索神器!-零度博客

MagnetW-最强BT种子搜索神器!

  (注意:非海外用户要特殊设置才可使用!点击设置-启用代理-IP和端口就填写和你VPN一致的ip和端口,否则无法连接) MagnetW官网:https://github.com/xiandanin/magnetW 下载地址:https...
免费下载官方正版 Windows 10系统,通过 Rufus、Ventoy 进行一键制作U盘系统-零度博客

免费下载官方正版 Windows 10系统,通过 Rufus、Ventoy 进行一键制作U盘系统

    1. Windows 10正版系统【官方下载】 2.Rufus 写盘工具 【点击下载】   3.Ventoy U盘制作工具 【点击下载】、【使用教程】 
admin的头像-零度博客admin
1.6W+1528
谷歌密码是一个明智的选择。你是否有这种想法?-零度博客

谷歌密码是一个明智的选择。你是否有这种想法?

密钥生态系统远未完成,但 Google 的实施现已准备就绪。 到目前为止,您可能已经听说无密码的 Google 帐户终于面世了。密码的替代品称为“密钥”。 与当前的身份验证方法相比,在可用性以及它们...
admin的头像-零度博客admin
1.3W+6539
GibberLink 神奇的两 AI 加密对话! 完全开源,本地部署教程!-零度博客

GibberLink 神奇的两 AI 加密对话! 完全开源,本地部署教程!

当2个AI 在常规对话的时候,发现互相都是AI机器人,随即从明文语音对话,切换到加密的音频通道,加密后的音频我们人类压根就听不懂,但是它们却能流畅的沟通,是不是非常有意思? 这个项目是 El...
admin的头像-零度博客admin
01.5W+1820
在 Windows 电脑上安装 最新版 macOS  14 系统 !(Sonoma) | 零度解说-零度博客
OpenAI Sora 文生视频体验入口!能够生成1分钟的视频,目前最强的AI视频生成技术-零度博客

OpenAI Sora 文生视频体验入口!能够生成1分钟的视频,目前最强的AI视频生成技术

OpenAI刚刚发布了 Sora,一种文字生成视频的技术,效果相当炸裂。请看下面的视频:   Sora是一个基于大规模训练的文本控制视频生成扩散模型。它能够生成长达 1 分钟的高清视频,涵盖广泛的视...
admin的头像-零度博客admin
01.4W+1527
自定义网页窗口大小,Window Resizer 插件-零度博客

自定义网页窗口大小,Window Resizer 插件

调整浏览器窗口的大小以模拟各种屏幕分辨率。 该扩展程序会重新调整浏览器窗口的大小以模拟各种分辨率。 它对于网页设计师和开发人员特别有用,可以帮助他们在不同的浏览器分辨率上测试布局。分...
admin的头像-零度博客admin
1.3W+1527
Flux.1 最强文生图!搭配Lora模型生成真实质感大片,附本地安装教程-零度博客

Flux.1 最强文生图!搭配Lora模型生成真实质感大片,附本地安装教程

https://youtu.be/HrnRCwoSSFk 1、Flux【Lora 真人模型】下载:https://www.freedidi.com/14643.html 2、ComfyUI + Flux.1主模型下载:https://www.freedidi.com/13266.html  
狗狗币最新挖矿教程!附挖矿软件,新手也能快速上手! 2024-零度博客

狗狗币最新挖矿教程!附挖矿软件,新手也能快速上手! 2024

自从特朗普成功竞选以后,各路加密货币应声上涨!作为深受马斯克影响的狗狗币突然又火了,价格暴涨。当然不仅仅狗狗币,其它任何加密货币也一样,比特币也在一周内涨了5000多美金,当然比特币普...
admin的头像-零度博客admin
07W+5780