liuguancen 846380879b fix(langchain-chat): R1 思考过程显示 + 选题推荐放宽 + RAG 诊断日志
三个独立修复 / 排查:

1. R1 思考过程不显示
   - 根因: chat_test.py 等 <think> 开标签出现才进思考态,但 R1
     流式输出本来就在 reasoning 态启动,永远不出 <think>,所有
     reasoning 全部当 text 走到答案区
   - 修法: 引入 r1_thinking_done 状态机,默认在思考态,
     看到 </think> 切换;R1-70B 直连本地代理 deepseek-r1
     (官方 deepseek-reasoner 把 reasoning 放独立字段,旧版
     callback 取不到)
   - 结果验证: "1+1" → 269 think + 40 text,思考与答案正确分流

2. 选题推荐场景拒答 + chat 模板标记泄漏
   - 根因: prompt 写死了 "你只能回答有关选题推荐的问题"
     + 直接嵌入 <|im_start|>/<|im_end|> Qwen chat 标记
   - 修法: 改写 Topic Recommend Assistant prompt,删 chat 标记,
     行为准则改为"沾边查询用工具回答";agent_v2 增加 strip
     防守层
   - 结果验证: "钢铁行业研究重点方向" → agent 调工具,不再拒答

3. 知识库召回 0 排查(数据问题,未根治)
   - 根因: kb_config.py 把所有 KB(政策库/钢铁库/报告库等)
     都映射到 t_policy_total_bge_new_v2,但 Milvus 里根本没有
     这个 collection(实际只有 11 个 p_* 个人库 + 1 个
     t_journal_article_bge_v1)
   - 临时改: search_tool.py 加诊断日志 [RAG诊断] 输出每个 KB
     召回数;rag_search 内 for 循环里首个 KB 空就 return 的
     bug 改 continue
   - 待决策: kb_config 是否把默认 KB 映射到唯一存在的
     t_journal_article_bge_v1,或重建对应集合

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-07 15:44:05 +08:00
2026-04-07 07:01:56 +00:00

钢研院智能问答平台gangyan111

面向冶金行业的 LLM 智能问答系统,提供智能对话、文档撰写、知识库管理、文献检索、翻译等功能。

系统架构

Vue前端(:3000/metalinfo)
    │  proxy /chat_web_backend
    ▼
Java后端(:8099/chat_web_backend)  ──→  Python RAG(:7861)
    │                                      │
    ├── MySQL(:33306)                      ├── Milvus(:19530)
    ├── Redis(:6379)                       ├── Embedding API(bge-m3)
    └── 科协SSO                            └── LLM API(deepseek-v3等)

模块说明

模块 路径 技术栈 说明
前端 chat_web_front/ Vue 3 + TypeScript + Element Plus + Vite 用户界面
Java 后端 chat_web_backend/ Spring Boot 2.3.7 + MyBatis-Plus + JDK 11 业务 API
Python RAG langchain-chat/ Python 3.11 + FastAPI + LangChain LLM 推理 + 知识库检索

功能模块

  • 智能对话 — 多模型对话DeepSeek、Qwen 等),支持流式响应、知识库增强问答
  • 文档撰写 — AI 生成大纲与正文,支持改写、润色、扩写、续写
  • 知识库管理 — 个人知识库,文件上传、文章综述、章节速览、文件对话
  • 文献检索 — 政策库、报告库、期刊论文库、冶金行业系列知识库
  • 翻译 — 文档翻译、文本翻译,多语种支持
  • 应用广场 — 智慧场景、助手收藏

基础设施

服务 端口 部署方式
MySQL 8.4.4 33306 Docker Compose (mysql/docker-compose.yml)
Redis 6379 宿主机 / Docker
Milvus 2.6.4 19530 Docker Compose (milvus/docker-compose.yml)
MinIO 9002/9003 DockerMilvus 依赖)

快速启动

cd /opt/download/oss_files/gangyan-deploy/gangyan

# 1. 启动数据层
cd mysql/mysql-8.4.4 && docker compose up -d && cd ../..
docker start redis-server 2>/dev/null || docker run -d --name redis-server -p 6379:6379 redis:7-alpine
cd milvus && docker compose up -d && cd ..

# 2. 启动 Java 后端
sudo bash backend/start_local.sh

# 3. 启动 Python RAG
source /opt/software/miniconda3/etc/profile.d/conda.sh && conda activate langchain-chat
cd langchain-chat && nohup python startup.py --all-api > langchain.log 2>&1 &

# 4. 启动前端
cd chat_web_front && npm run dev

或一键启动:bash start_all.sh

健康检查

curl -s -o /dev/null -w "Java %{http_code}\n"      http://127.0.0.1:8099/chat_web_backend/app/user
curl -s -o /dev/null -w "Langchain %{http_code}\n"  http://127.0.0.1:7861/docs
curl -s -o /dev/null -w "Frontend %{http_code}\n"   http://127.0.0.1:3000/

项目结构

gangyan/
├── chat_web_front/          # Vue 3 前端
├── chat_web_backend/        # Java Spring Boot 后端
├── langchain-chat/          # Python RAG 服务
├── backend/                 # 后端部署jar + 启动脚本)
├── mysql/                   # MySQL Docker Compose + 数据
├── milvus/                  # Milvus Docker Compose + 数据
├── scripts/                 # 各服务运维脚本
├── docs/                    # 项目文档
├── logs/                    # 运行日志
├── .harness/                # Agent 协同开发上下文
└── start_all.sh             # 一键启动脚本

Agent 协同开发

.harness/ 目录包含 Agent 协同开发所需的项目上下文文件,详见 .harness/CLAUDE.md

Description
No description provided
Readme 54 MiB
Languages
JavaScript 41.5%
Python 26.7%
Java 15.9%
Vue 5.8%
HTML 5%
Other 5.1%