gangyan

Files

liuguancen 846380879b fix(langchain-chat): R1 思考过程显示 + 选题推荐放宽 + RAG 诊断日志

三个独立修复 / 排查:

1. R1 思考过程不显示
   - 根因: chat_test.py 等 <think> 开标签出现才进思考态，但 R1
     流式输出本来就在 reasoning 态启动，永远不出 <think>，所有
     reasoning 全部当 text 走到答案区
   - 修法: 引入 r1_thinking_done 状态机，默认在思考态，
     看到 </think> 切换；R1-70B 直连本地代理 deepseek-r1
     （官方 deepseek-reasoner 把 reasoning 放独立字段，旧版
     callback 取不到）
   - 结果验证: "1+1" → 269 think + 40 text，思考与答案正确分流

2. 选题推荐场景拒答 + chat 模板标记泄漏
   - 根因: prompt 写死了 "你只能回答有关选题推荐的问题"
     + 直接嵌入 <|im_start|>/<|im_end|> Qwen chat 标记
   - 修法: 改写 Topic Recommend Assistant prompt，删 chat 标记，
     行为准则改为"沾边查询用工具回答"；agent_v2 增加 strip
     防守层
   - 结果验证: "钢铁行业研究重点方向" → agent 调工具，不再拒答

3. 知识库召回 0 排查（数据问题，未根治）
   - 根因: kb_config.py 把所有 KB（政策库/钢铁库/报告库等）
     都映射到 t_policy_total_bge_new_v2，但 Milvus 里根本没有
     这个 collection（实际只有 11 个 p_* 个人库 + 1 个
     t_journal_article_bge_v1）
   - 临时改: search_tool.py 加诊断日志 [RAG诊断] 输出每个 KB
     召回数；rag_search 内 for 循环里首个 KB 空就 return 的
     bug 改 continue
   - 待决策: kb_config 是否把默认 KB 映射到唯一存在的
     t_journal_article_bge_v1，或重建对应集合

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>

2026-05-07 15:44:05 +08:00

chains

[全量] 初始化项目代码、配置、文档及Agent协同harness

2026-04-02 11:36:05 +08:00

common

[全量] 初始化项目代码、配置、文档及Agent协同harness

2026-04-02 11:36:05 +08:00

configs

fix(langchain-chat): R1 思考过程显示 + 选题推荐放宽 + RAG 诊断日志

2026-05-07 15:44:05 +08:00

docs

[全量] 初始化项目代码、配置、文档及Agent协同harness

2026-04-02 11:36:05 +08:00

document_loaders

[全量] 初始化项目代码、配置、文档及Agent协同harness

2026-04-02 11:36:05 +08:00

embeddings

[全量] 初始化项目代码、配置、文档及Agent协同harness

2026-04-02 11:36:05 +08:00

img

[全量] 初始化项目代码、配置、文档及Agent协同harness

2026-04-02 11:36:05 +08:00

Langchain完整解决方案

[全量] 初始化项目代码、配置、文档及Agent协同harness

2026-04-02 11:36:05 +08:00

pdf_convert_service

[全量] 初始化项目代码、配置、文档及Agent协同harness

2026-04-02 11:36:05 +08:00

server

fix(langchain-chat): R1 思考过程显示 + 选题推荐放宽 + RAG 诊断日志

2026-05-07 15:44:05 +08:00

tests

[全量] 初始化项目代码、配置、文档及Agent协同harness

2026-04-02 11:36:05 +08:00

text_splitter

[全量] 初始化项目代码、配置、文档及Agent协同harness

2026-04-02 11:36:05 +08:00

webui_pages

[全量] 初始化项目代码、配置、文档及Agent协同harness

2026-04-02 11:36:05 +08:00

.gitignore

[全量] 初始化项目代码、配置、文档及Agent协同harness

2026-04-02 11:36:05 +08:00

.gitmodules

[全量] 初始化项目代码、配置、文档及Agent协同harness

2026-04-02 11:36:05 +08:00

copy_config_example.py

[全量] 初始化项目代码、配置、文档及Agent协同harness

2026-04-02 11:36:05 +08:00

init_database.py

[全量] 初始化项目代码、配置、文档及Agent协同harness

2026-04-02 11:36:05 +08:00

LICENSE

[全量] 初始化项目代码、配置、文档及Agent协同harness

2026-04-02 11:36:05 +08:00

proxies.txt

[全量] 初始化项目代码、配置、文档及Agent协同harness

2026-04-02 11:36:05 +08:00

README.md

[全量] 初始化项目代码、配置、文档及Agent协同harness

2026-04-02 11:36:05 +08:00

release.py

[全量] 初始化项目代码、配置、文档及Agent协同harness

2026-04-02 11:36:05 +08:00

requirements_api.txt

[全量] 初始化项目代码、配置、文档及Agent协同harness

2026-04-02 11:36:05 +08:00

requirements_lite.txt

[全量] 初始化项目代码、配置、文档及Agent协同harness

2026-04-02 11:36:05 +08:00

requirements_webui.txt

[全量] 初始化项目代码、配置、文档及Agent协同harness

2026-04-02 11:36:05 +08:00

requirements.txt

[全量] 初始化项目代码、配置、文档及Agent协同harness

2026-04-02 11:36:05 +08:00

startup.py

[全量] 初始化项目代码、配置、文档及Agent协同harness

2026-04-02 11:36:05 +08:00

test_upload.txt

[全量] 初始化项目代码、配置、文档及Agent协同harness

2026-04-02 11:36:05 +08:00

test.txt

[全量] 初始化项目代码、配置、文档及Agent协同harness

2026-04-02 11:36:05 +08:00

webui.py

[全量] 初始化项目代码、配置、文档及Agent协同harness

2026-04-02 11:36:05 +08:00

README.md

📃 LangChain-Chat

基于大语言模型与 Langchain 等应用框架实现，开源、可离线部署的检索增强生成(RAG)大模型知识库项目。

本项目基本框架自 Langchain-Chatchat 修改，里面整体逻辑已大部分根据业务进行优化调整

依托于开源 LLM 与 Embedding 模型，可实现全部使用开源模型离线私有部署。与此同时，也支持 OpenAI GPT API 的调用，并将在持续扩充对各类模型及模型 API 的接入。
实现原理过程包括加载文件 -> 读取文本 -> 文本分割 -> 文本向量化 -> 问句向量化 -> 在文本向量中匹配出与问句向量最相似的 top k个 -> 匹配出的文本作为上下文和问题一起添加到 prompt中 -> 提交给 LLM生成回答。

快速上手

1. 环境配置

首先，确保你的机器安装了 Python 3.8 - 3.11 (推荐使用 Python3.11)。

$ python --version
Python 3.11.7

接着，创建一个虚拟环境，并在虚拟环境内安装项目的依赖


# 拉取仓库
$ git clone https://git.ckcest.cn/machine-learning/Langchain-Chat.git

# 进入目录
$ cd Langchain-Chat

# 安装全部依赖
$ pip install -r requirements.txt 
$ pip install -r requirements_api.txt
$ pip install -r requirements_webui.txt  

# 默认依赖包括基本运行环境（FAISS向量库）。如果要使用 milvus/pg_vector 等向量库，请将 requirements.txt 中相应依赖取消注释再安装。

2，模型下载

如需在本地或离线环境下运行本项目，需要首先将项目所需的模型下载至本地，通常开源 LLM 与 Embedding 模型可以从 ModelScope 下载。

以Qwen3 LLM 模型 Qwen/Qwen3-8B 与 Embedding 模型 Qwen/Qwen3-Embedding-8B 为例：

下载模型需要先安装 Git LFS ，然后运行

$ git lfs install
$ git clone https://www.modelscope.cn/Qwen/Qwen3-8B.git
$ git clone https://www.modelscope.cn/AI-ModelScope/bge-large-zh.git

3. 初始化知识库和配置文件

按照下列方式初始化自己的知识库和简单的复制配置文件

$ python copy_config_example.py
$ python init_database.py --recreate-vs

4. 一键启动

按照以下命令启动项目

$ python startup.py -a

5. 启动界面示例

如果正常启动，将能看到以下界面

FastAPI Docs 界面
Web UI 启动界面示例：

Web UI 对话界面
Web UI 知识库管理页面

README.md Unescape Escape

目录

快速上手

1. 环境配置

2， 模型下载

3. 初始化知识库和配置文件

4. 一键启动

5. 启动界面示例

README.md

2，模型下载