百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

安装测试langchain-chatchat 0.3.1 版

liuian 2025-03-02 18:02 41 浏览

以前安装过langchain-chatchat 0.2.X,前一段时间langchain-chatchat发布了期待已久的大版本升级,升到全新构建的0.3.0。就重新安装了一下。

以下为升级内容:

0.3.x 版本功能一览

功能

0.2.x

0.3.x

模型接入

本地:fastchat
在线:XXXModelWorker

本地:model_provider,支持大部分主流模型加载框架
在线:oneapi
所有模型接入均兼容openai sdk

Agent

?不稳定

?针对ChatGLM3和QWen进行优化,Agent能力显著提升

LLM对话

?

?

知识库对话

?

?

搜索引擎对话

?

?

文件对话

?仅向量检索

?统一为File RAG功能,支持BM25+KNN等多种检索方式

数据库对话

?

?

多模态图片对话

?

? 推荐使用 qwen-vl-chat

ARXIV文献对话

?

?

Wolfram对话

?

?

文生图

?

?

本地知识库管理

?

?

WEBUI

?

?更好的多会话支持,自定义系统提示词...

0.3.x 版本的核心功能由 Agent 实现,但用户也可以手动实现工具调用:

操作方式

实现的功能

适用场景

选中"启用Agent",选择多个工具

由LLM自动进行工具调用

使用ChatGLM3/Qwen或在线API等具备Agent能力的模型

选中"启用Agent",选择单个工具

LLM仅解析工具参数

使用的模型Agent能力一般,不能很好的选择工具
想手动选择功能

不选中"启用Agent",选择单个工具

不使用Agent功能的情况下,手动填入参数进行工具调用

使用的模型不具备Agent能力

不选中任何工具,上传一个图片

图片对话

使用 qwen-vl-chat 等多模态模型

Langchain-Chatchat简介

项目地址:

https://github.com/chatchat-space/Langchain-Chatchat

Langchain-Chatchat利用 langchain 思想实现的基于本地知识库的问答应用,目标期望建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案。

支持市面上主流的开源 LLM、 Embedding 模型与向量数据库,可实现全部使用开源模型离线私有部署。与此同时,本项目也支持 OpenAI GPT API 的调用,并将在后续持续扩充对各类模型及模型 API 的接入。

实现原理如下图所示,过程包括加载文件 -> 读取文本 -> 文本分割 -> 文本向量化 -> 问句向量化 -> 在文本向量中匹配出与问句向量最相似的 top k个 -> 匹配出的文本作为上下文和问题一起添加到 prompt中 -> 提交给 LLM生成回答。

从文档处理角度来看,实现流程如下:

已支持的模型部署框架与模型

本项目中已经支持市面上主流的如 GLM-4-Chat 与 Qwen2-Instruct 等新近开源大语言模型和 Embedding 模型,这些模型需要用户自行启动模型部署框架后,通过修改配置信息接入项目,本项目已支持的本地模型部署框架如下:

模型部署框架

Xinference

LocalAI

Ollama

FastChat

OpenAI API 接口对齐

?

?

?

?

加速推理引擎

GPTQ, GGML, vLLM, TensorRT, mlx

GPTQ, GGML, vLLM, TensorRT

GGUF, GGML

vLLM

接入模型类型

LLM, Embedding, Rerank, Text-to-Image, Vision, Audio

LLM, Embedding, Rerank, Text-to-Image, Vision, Audio

LLM, Text-to-Image, Vision

LLM, Vision

Function Call

?

?

?

/

更多平台支持(CPU, Metal)

?

?

?

?

异构

?

?

/

/

集群

?

?

/

/

操作文档链接

Xinference 文档

LocalAI 文档

Ollama 文档

FastChat 文档

可用模型

Xinference 已支持模型

LocalAI 已支持模型

Ollama 已支持模型

FastChat 已支持模型

除上述本地模型加载框架外,项目中也为可接入在线 API 的 One API 框架接入提供了支持,支持包括 OpenAI ChatGPT、Azure OpenAI API、Anthropic Claude、智谱清言、百川 等常用在线 API 的接入使用。

安装部署

Langchain-Chatchat v0.3.0以上有3种部署方法: pip、docker、代码,本次选择pip方式,其他方式请参考文档。

1,安装包,直接运行:

pip install langchain-chatchat -U -i https://pypi.tuna.tsinghua.edu.cn/simple 

即可安装langchain-chatchat包。

2,进行初始化

chatchat init

该命令会执行以下操作:

  • 创建所有需要的数据目录
  • 复制 samples 知识库内容
  • 生成默认 yaml 配置文件

3,修改配置文件:

  • 配置模型(model_settings.yaml)
    需要根据步骤
    2. 模型推理框架并加载模型 中选用的模型推理框架与加载的模型进行模型接入配置,具体参考 model_settings.yaml 中的注释。主要修改以下内容:

我根据我的情况,将对应内容修改为:

platform_name: ollama
platform_type: ollama
api_base_url: http://127.0.0.1:11434/v1
api_key: EMPTY
api_proxy: ''
api_concurrencies: 5
auto_detect_model: false
llm_models:
  - qwen:7b
  - qwen2:7b
embed_models:
  - quentinz/bge-large-zh-v1.5
text2image_models: []
image2text_models: []
rerank_models: []
speech2text_models: []
text2speech_models: []

4. 初始化知识库

进行知识库初始化前,请确保已经启动模型推理框架及对应 embedding 模型,且已按照上述步骤3完成模型接入配置。

chatchat kb -r

5. 启动项目

chatchat start -a

效果如下:

如果需要其他地址进行访问,需要修改:basic_settings.yaml,按照注释,将3个HOST选项修改为:“0.0.0.0”

工具使用

如果需要使用工具,需要根据实际情况修改:tool_settings.yaml

已数据库工具为例,我根据我的情况,修改对应内容为:

# text2sql使用建议
# 1、因大模型生成的sql可能与预期有偏差,请务必在测试环境中进行充分测试、评估;
# 2、生产环境中,对于查询操作,由于不确定查询效率,推荐数据库采用主从数据库架构,让text2sql连接从数据库,防止可能的慢查询影响主业务;
# 3、对于写操作应保持谨慎,如不需要写操作,设置read_only为True,最好再从数据库层面收回数据库用户的写权限,防止用户通过自然语言对数据库进行修改操作;
# 4、text2sql与大模型在意图理解、sql转换等方面的能力有关,可切换不同大模型进行测试;
# 5、数据库表名、字段名应与其实际作用保持一致、容易理解,且应对数据库表名、字段进行详细的备注说明,帮助大模型更好理解数据库结构;
# 6、若现有数据库表名难于让大模型理解,可配置下面table_comments字段,补充说明某些表的作用。
text2sql:
  model_name: qwen2:7b
  use: true
  sqlalchemy_connect_str: mysql+pymysql://root:yourpasswd@127.0.0.1:3306/dbgpt_test
  read_only: true
  top_k: 50
  return_intermediate_steps: true
  table_names: []
  table_comments: {}

效果如下:

相关推荐

驱动网卡(怎么从新驱动网卡)
驱动网卡(怎么从新驱动网卡)

网卡一般是指为电脑主机提供有线无线网络功能的适配器。而网卡驱动指的就是电脑连接识别这些网卡型号的桥梁。网卡只有打上了网卡驱动才能正常使用。并不是说所有的网卡一插到电脑上面就能进行数据传输了,他都需要里面芯片组的驱动文件才能支持他进行数据传输...

2026-01-30 00:37 liuian

win10更新助手装系统(微软win10更新助手)

1、点击首页“系统升级”的按钮,给出弹框,告诉用户需要上传IMEI码才能使用升级服务。同时给出同意和取消按钮。华为手机助手2、点击同意,则进入到“系统升级”功能华为手机助手华为手机助手3、在检测界面,...

windows11专业版密钥最新(windows11专业版激活码永久)

 Windows11专业版的正版密钥,我们是对windows的激活所必备的工具。该密钥我们可以通过微软商城或者通过计算机的硬件供应商去购买获得。获得了windows11专业版的正版密钥后,我...

手机删过的软件恢复(手机删除过的软件怎么恢复)
手机删过的软件恢复(手机删除过的软件怎么恢复)

操作步骤:1、首先,我们需要先打开手机。然后在许多图标中找到带有[文件管理]文本的图标,然后单击“文件管理”进入页面。2、进入页面后,我们将在顶部看到一行文本:手机,最新信息,文档,视频,图片,音乐,收藏,最后是我们正在寻找的[更多],单击...

2026-01-29 23:55 liuian

一键ghost手动备份系统步骤(一键ghost 备份)

  步骤1、首先把装有一键GHOST装系统的U盘插在电脑上,然后打开电脑马上按F2或DEL键入BIOS界面,然后就选择BOOT打USDHDD模式选择好,然后按F10键保存,电脑就会马上重启。  步骤...

怎么创建局域网(怎么创建局域网打游戏)

  1、购买路由器一台。进入路由器把dhcp功能打开  2、购买一台交换机。从路由器lan端口拉出一条网线查到交换机的任意一个端口上。  3、两台以上电脑。从交换机任意端口拉出网线插到电脑上(电脑设置...

精灵驱动器官方下载(精灵驱动手机版下载)

是的。驱动精灵是一款集驱动管理和硬件检测于一体的、专业级的驱动管理和维护工具。驱动精灵为用户提供驱动备份、恢复、安装、删除、在线更新等实用功能。1、全新驱动精灵2012引擎,大幅提升硬件和驱动辨识能力...

一键还原系统步骤(一键还原系统有哪些)

1、首先需要下载安装一下Windows一键还原程序,在安装程序窗口中,点击“下一步”,弹出“用户许可协议”窗口,选择“我同意该许可协议的条款”,并点击“下一步”。  2、在弹出的“准备安装”窗口中,可...

电脑加速器哪个好(电脑加速器哪款好)

我认为pp加速器最好用,飞速土豆太懒,急速酷六根本不工作。pp加速器什么网页都加速,太任劳任怨了!以上是个人观点,具体性能请自己试。ps:我家电脑性能很好。迅游加速盒子是可以加速电脑的。因为有过之...

任何u盘都可以做启动盘吗(u盘必须做成启动盘才能装系统吗)

是的,需要注意,U盘的大小要在4G以上,最好是8G以上,因为启动盘里面需要装系统,内存小的话,不能用来安装系统。内存卡或者U盘或者移动硬盘都可以用来做启动盘安装系统。普通的U盘就可以,不过最好U盘...

u盘怎么恢复文件(u盘文件恢复的方法)

开360安全卫士,点击上面的“功能大全”。点击文件恢复然后点击“数据”下的“文件恢复”功能。选择驱动接着选择需要恢复的驱动,选择接入的U盘。点击开始扫描选好就点击中间的“开始扫描”,开始扫描U盘数据。...

系统虚拟内存太低怎么办(系统虚拟内存占用过高什么原因)

1.检查系统虚拟内存使用情况,如果发现有大量的空闲内存,可以尝试释放一些不必要的进程,以释放内存空间。2.如果系统虚拟内存使用率较高,可以尝试增加系统虚拟内存的大小,以便更多的应用程序可以使用更多...

剪贴板权限设置方法(剪贴板访问权限)
剪贴板权限设置方法(剪贴板访问权限)

1、首先打开iphone手机,触碰并按住单词或图像直到显示选择选项。2、其次,然后选取“拷贝”或“剪贴板”。3、勾选需要的“权限”,最后选择开启,即可完成苹果剪贴板权限设置。仅参考1.打开苹果手机设置按钮,点击【通用】。2.点击【键盘】,再...

2026-01-29 21:37 liuian

平板系统重装大师(平板重装win系统)

如果你的平板开不了机,但可以连接上电脑,那就能好办,楼主下载安装个平板刷机王到你的个人电脑上,然后连接你的平板,平板刷机王会自动识别你的平板,平板刷机王上有你平板的我刷机包,楼主点击下载一个,下载完成...

联想官网售后服务网点(联想官网售后服务热线)

联想3c服务中心是联想旗下的官方售后,是基于互联网O2O模式开发的全新服务平台。可以为终端用户提供多品牌手机、电脑以及其他3C类产品的维修、保养和保险服务。根据客户需求层次,联想服务针对个人及家庭客户...