update action

pdf parse doc (#3990 )
fix: link (#3987 )
2025-03-05 18:45:24 +08:00 · 2025-03-05 18:33:53 +08:00 · 2025-03-05 17:08:18 +08:00 · 2025-03-05 15:55:02 +08:00 · 2025-03-05 15:09:49 +08:00 · 2025-03-05 15:09:48 +08:00
36 changed files with 229 additions and 597 deletions
--- a/.github/workflows/docs-deploy-kubeconfig.yml
+++ b/.github/workflows/docs-deploy-kubeconfig.yml
@@ -6,6 +6,8 @@ on:
      - 'docSite/**'
    branches:
      - 'main'
+    tags:
+      - 'v*.*.*'

 jobs:
  build-fastgpt-docs-images:
--- a/.github/workflows/docs-deploy-vercel.yml
+++ b/.github/workflows/docs-deploy-vercel.yml
@@ -7,6 +7,8 @@ on:
      - 'docSite/**'
    branches:
      - 'main'
+    tags:
+      - 'v*.*.*'

 # A workflow run is made up of one or more jobs that can run sequentially or in parallel
 jobs:
--- a/.github/workflows/docs-preview.yml
+++ b/.github/workflows/docs-preview.yml
@@ -4,6 +4,8 @@ on:
  pull_request_target:
    paths:
      - 'docSite/**'
+    branches:
+      - 'main'
  workflow_dispatch:

 # A workflow run is made up of one or more jobs that can run sequentially or in parallel
--- a/README.md
+++ b/README.md
@@ -130,7 +130,6 @@ https://github.com/labring/FastGPT/assets/15308462/7d3a38df-eb0e-4388-9250-2409b

 ## 🌿 第三方生态

- [AI Proxy：国内模型聚合服务](https://sealos.run/aiproxy/?k=fastgpt-github/)
 - [SiliconCloud (硅基流动) —— 开源模型在线体验平台](https://cloud.siliconflow.cn/i/TR9Ym0c4)
 - [COW 个人微信/企微机器人](https://doc.tryfastgpt.ai/docs/use-cases/external-integration/onwechat/)

--- a/deploy/docker/docker-compose-milvus.yml
+++ b/deploy/docker/docker-compose-milvus.yml
@@ -114,15 +114,15 @@ services:
  # fastgpt
  sandbox:
    container_name: sandbox
-    image: ghcr.io/labring/fastgpt-sandbox:v4.9.0 # git
-    # image: registry.cn-hangzhou.aliyuncs.com/fastgpt/fastgpt-sandbox:v4.9.0 # 阿里云
+    image: ghcr.io/labring/fastgpt-sandbox:v4.8.23-fix # git
+    # image: registry.cn-hangzhou.aliyuncs.com/fastgpt/fastgpt-sandbox:v4.8.23-fix # 阿里云
    networks:
      - fastgpt
    restart: always
  fastgpt:
    container_name: fastgpt
-    image: ghcr.io/labring/fastgpt:v4.9.0 # git
-    # image: registry.cn-hangzhou.aliyuncs.com/fastgpt/fastgpt:v4.9.0 # 阿里云
+    image: ghcr.io/labring/fastgpt:v4.8.23-fix # git
+    # image: registry.cn-hangzhou.aliyuncs.com/fastgpt/fastgpt:v4.8.23-fix # 阿里云
    ports:
      - 3000:3000
    networks:
@@ -181,6 +181,8 @@ services:
    depends_on:
      aiproxy_pg:
        condition: service_healthy
+    ports:
+      - '3002:3000'
    networks:
      - fastgpt
    environment:
@@ -202,8 +204,8 @@ services:
      timeout: 5s
      retries: 10
  aiproxy_pg:
-    image: pgvector/pgvector:0.8.0-pg15 # docker hub
-    # image: registry.cn-hangzhou.aliyuncs.com/fastgpt/pgvector:v0.8.0-pg15 # 阿里云
+    # image: pgvector/pgvector:0.8.0-pg15 # docker hub
+    image: registry.cn-hangzhou.aliyuncs.com/fastgpt/pgvector:v0.8.0-pg15 # 阿里云
    restart: unless-stopped
    container_name: aiproxy_pg
    volumes:
--- a/deploy/docker/docker-compose-pgvector.yml
+++ b/deploy/docker/docker-compose-pgvector.yml
@@ -28,8 +28,8 @@ services:
    # image: mongo:4.4.29 # cpu不支持AVX时候使用
    container_name: mongo
    restart: always
-    # ports:
-    #   - 27017:27017
+    ports:
+      - 27017:27017
    networks:
      - fastgpt
    command: mongod --keyFile /data/mongodb.key --replSet rs0
@@ -72,15 +72,15 @@ services:
  # fastgpt
  sandbox:
    container_name: sandbox
-    image: ghcr.io/labring/fastgpt-sandbox:v4.9.0 # git
-    # image: registry.cn-hangzhou.aliyuncs.com/fastgpt/fastgpt-sandbox:v4.9.0 # 阿里云
+    image: ghcr.io/labring/fastgpt-sandbox:v4.8.23-fix # git
+    # image: registry.cn-hangzhou.aliyuncs.com/fastgpt/fastgpt-sandbox:v4.8.23-fix # 阿里云
    networks:
      - fastgpt
    restart: always
  fastgpt:
    container_name: fastgpt
-    image: ghcr.io/labring/fastgpt:v4.9.0 # git
-    # image: registry.cn-hangzhou.aliyuncs.com/fastgpt/fastgpt:v4.9.0 # 阿里云
+    image: ghcr.io/labring/fastgpt:v4.8.23-fix # git
+    # image: registry.cn-hangzhou.aliyuncs.com/fastgpt/fastgpt:v4.8.23-fix # 阿里云
    ports:
      - 3000:3000
    networks:
@@ -138,6 +138,8 @@ services:
    depends_on:
      aiproxy_pg:
        condition: service_healthy
+    ports:
+      - '3002:3000'
    networks:
      - fastgpt
    environment:
@@ -159,8 +161,8 @@ services:
      timeout: 5s
      retries: 10
  aiproxy_pg:
-    image: pgvector/pgvector:0.8.0-pg15 # docker hub
-    # image: registry.cn-hangzhou.aliyuncs.com/fastgpt/pgvector:v0.8.0-pg15 # 阿里云
+    # image: pgvector/pgvector:0.8.0-pg15 # docker hub
+    image: registry.cn-hangzhou.aliyuncs.com/fastgpt/pgvector:v0.8.0-pg15 # 阿里云
    restart: unless-stopped
    container_name: aiproxy_pg
    volumes:
--- a/deploy/docker/docker-compose-zilliz.yml
+++ b/deploy/docker/docker-compose-zilliz.yml
@@ -53,15 +53,15 @@ services:
        wait $$!
  sandbox:
    container_name: sandbox
-    image: ghcr.io/labring/fastgpt-sandbox:v4.9.0 # git
-    # image: registry.cn-hangzhou.aliyuncs.com/fastgpt/fastgpt-sandbox:v4.9.0 # 阿里云
+    image: ghcr.io/labring/fastgpt-sandbox:v4.8.23-fix # git
+    # image: registry.cn-hangzhou.aliyuncs.com/fastgpt/fastgpt-sandbox:v4.8.23-fix # 阿里云
    networks:
      - fastgpt
    restart: always
  fastgpt:
    container_name: fastgpt
-    image: ghcr.io/labring/fastgpt:v4.9.0 # git
-    # image: registry.cn-hangzhou.aliyuncs.com/fastgpt/fastgpt:v4.9.0 # 阿里云
+    image: ghcr.io/labring/fastgpt:v4.8.23-fix # git
+    # image: registry.cn-hangzhou.aliyuncs.com/fastgpt/fastgpt:v4.8.23-fix # 阿里云
    ports:
      - 3000:3000
    networks:
@@ -119,6 +119,8 @@ services:
    depends_on:
      aiproxy_pg:
        condition: service_healthy
+    ports:
+      - '3002:3000'
    networks:
      - fastgpt
    environment:
@@ -140,8 +142,8 @@ services:
      timeout: 5s
      retries: 10
  aiproxy_pg:
-    image: pgvector/pgvector:0.8.0-pg15 # docker hub
-    # image: registry.cn-hangzhou.aliyuncs.com/fastgpt/pgvector:v0.8.0-pg15 # 阿里云
+    # image: pgvector/pgvector:0.8.0-pg15 # docker hub
+    image: registry.cn-hangzhou.aliyuncs.com/fastgpt/pgvector:v0.8.0-pg15 # 阿里云
    restart: unless-stopped
    container_name: aiproxy_pg
    volumes:
--- a/docSite/content/zh-cn/docs/development/custom-models/marker.md
+++ b/docSite/content/zh-cn/docs/development/custom-models/marker.md
@@ -24,9 +24,10 @@ PDF 是一个相对复杂的文件格式，在 FastGPT 内置的 pdf 解析器
 这里介绍快速 Docker 安装的方法：

 ```dockerfile
-docker pull crpi-h3snc261q1dosroc.cn-hangzhou.personal.cr.aliyuncs.com/marker11/marker_images:v0.2
-docker run --gpus all -itd -p 7231:7232 --name model_pdf_v2 -e PROCESSES_PER_GPU="2" crpi-h3snc261q1dosroc.cn-hangzhou.personal.cr.aliyuncs.com/marker11/marker_images:v0.2
+docker pull crpi-h3snc261q1dosroc.cn-hangzhou.personal.cr.aliyuncs.com/marker11/marker_images:latest
+docker run --gpus all -itd -p 7231:7231 --name model_pdf_v1 crpi-h3snc261q1dosroc.cn-hangzhou.personal.cr.aliyuncs.com/marker11/marker_images:latest
 ```
+
 ### 2. 添加 FastGPT 文件配置

 ```json
@@ -35,7 +36,7 @@ docker run --gpus all -itd -p 7231:7232 --name model_pdf_v2 -e PROCESSES_PER_GPU
  "systemEnv": {
    xxx
    "customPdfParse": {
-      "url": "http://xxxx.com/v2/parse/file", // 自定义 PDF 解析服务地址 marker v0.2
+      "url": "http://xxxx.com/v1/parse/file", // 自定义 PDF 解析服务地址
      "key": "", // 自定义 PDF 解析服务密钥
      "doc2xKey": "", // doc2x 服务密钥
      "price": 0 // PDF 解析服务价格
@@ -79,25 +80,4 @@ docker run --gpus all -itd -p 7231:7232 --name model_pdf_v2 -e PROCESSES_PER_GPU

 上图是分块后的结果，下图是 pdf 原文。整体图片、公式、表格都可以提取出来，效果还是杠杠的。

-不过要注意的是，[Marker](https://github.com/VikParuchuri/marker) 的协议是`GPL-3.0 license`，请在遵守协议的前提下使用。
-
-## 旧版 Marker 使用方法
-
-FastGPT V4.9.0 版本之前，可以用以下方式，试用 Marker 解析服务。
-
-安装和运行 Marker 服务：
-
-```dockerfile
-docker pull crpi-h3snc261q1dosroc.cn-hangzhou.personal.cr.aliyuncs.com/marker11/marker_images:v0.1
-docker run --gpus all -itd -p 7231:7231 --name model_pdf_v1 -e PROCESSES_PER_GPU="2" crpi-h3snc261q1dosroc.cn-hangzhou.personal.cr.aliyuncs.com/marker11/marker_images:v0.1
-```
-
-并修改 FastGPT 环境变量：
-
-```
-CUSTOM_READ_FILE_URL=http://xxxx.com/v1/parse/file
-CUSTOM_READ_FILE_EXTENSION=pdf
-```
-
-* CUSTOM_READ_FILE_URL - 自定义解析服务的地址, host改成解析服务的访问地址，path 不能变动。
-* CUSTOM_READ_FILE_EXTENSION - 支持的文件后缀，多个文件类型，可用逗号隔开。
+不过要注意的是，[Marker](https://github.com/VikParuchuri/marker) 的协议是`GPL-3.0 license`，请在遵守协议的前提下使用。
--- a/docSite/content/zh-cn/docs/development/openapi/dataset.md
+++ b/docSite/content/zh-cn/docs/development/openapi/dataset.md
@@ -1063,12 +1063,10 @@ curl --location --request DELETE 'http://localhost:3000/api/core/dataset/collect

 | 字段 | 类型 | 说明 | 必填 |
 | --- | --- | --- | --- |
-| type | String | 可选索引类型：default-默认索引; custom-自定义索引; summary-总结索引; question-问题索引; image-图片索引 | |
-| dataId | String | 关联的向量ID，变更数据时候传入该 ID，会进行差量更新，而不是全量更新 |  |
+| defaultIndex | Boolean | 是否为默认索引 | ✅ |
+| dataId | String | 关联的向量ID | ✅ |
 | text | String | 文本内容 | ✅ |

-`type` 不填则默认为 `custom` 索引，还会基于 q/a 组成一个默认索引。如果传入了默认索引，则不会额外创建。
-
 ### 为集合批量添加添加数据

 注意，每次最多推送 200 组数据。
@@ -1300,7 +1298,8 @@ curl --location --request GET 'http://localhost:3000/api/core/dataset/data/detai
        "chunkIndex": 0,
        "indexes": [
            {
-                "type": "default",
+                "defaultIndex": true,
+                "type": "chunk",
                "dataId": "3720083",
                "text": "N o . 2 0 2 2 1 2中 国 信 息 通 信 研 究 院京东探索研究院2022年 9月人工智能生成内容（AIGC）白皮书(2022 年)版权声明本白皮书版权属于中国信息通信研究院和京东探索研究院，并受法律保护。转载、摘编或利用其它方式使用本白皮书文字或者观点的，应注明“来源：中国信息通信研究院和京东探索研究院”。违反上述声明者，编者将追究其相关法律责任。前 言习近平总书记曾指出，“数字技术正以新理念、新业态、新模式全面融入人类经济、政治、文化、社会、生态文明建设各领域和全过程”。在当前数字世界和物理世界加速融合的大背景下，人工智能生成内容（Artificial Intelligence Generated Content，简称 AIGC）正在悄然引导着一场深刻的变革，重塑甚至颠覆数字内容的生产方式和消费模式，将极大地丰富人们的数字生活，是未来全面迈向数字文明新时代不可或缺的支撑力量。",
                "_id": "65abd4b29d1448617cba61dc"
@@ -1335,19 +1334,13 @@ curl --location --request PUT 'http://localhost:3000/api/core/dataset/data/updat
    "q":"测试111",
    "a":"sss",
    "indexes":[
-        {
-            "dataId": "xxxx",
-            "type": "default",
-            "text": "默认索引"
-        },
        {
            "dataId": "xxx",
-            "type": "custom",
-            "text": "旧的自定义索引1"
+            "defaultIndex":false,
+            "text":"自定义索引1"
        },
        {
-            "type":"custom",
-            "text":"新增的自定义索引"
+            "text":"修改后的自定义索引2。（会删除原来的自定义索引2，并插入新的自定义索引2）"
        }
    ]
 }'
--- a/docSite/content/zh-cn/docs/development/upgrading/4820.md
+++ b/docSite/content/zh-cn/docs/development/upgrading/4820.md
@@ -35,7 +35,7 @@ curl --location --request POST 'https://{{host}}/api/admin/initv4820' \

 ## 完整更新内容

-1. 新增 - 可视化模型参数配置，取代原配置文件配置模型。预设超过 100 个模型配置。同时支持所有类型模型的一键测试。（预计下个版本会完全支持在页面上配置渠道）。[点击查看模型配置方案](/docs/development/modelconfig/intro/)
+1. 新增 - 可视化模型参数配置，取代原配置文件配置模型。预设超过 100 个模型配置。同时支持所有类型模型的一键测试。（预计下个版本会完全支持在页面上配置渠道）。
 2. 新增 - DeepSeek resoner 模型支持输出思考过程。
 3. 新增 - 使用记录导出和仪表盘。
 4. 新增 - markdown 语法扩展，支持音视频（代码块 audio 和 video）。
--- a/docSite/content/zh-cn/docs/development/upgrading/490.md
+++ b/docSite/content/zh-cn/docs/development/upgrading/490.md
@@ -1,5 +1,5 @@
 ---
-title: 'V4.9.0(包含升级脚本)'
+title: 'V4.9.0(进行中)'
 description: 'FastGPT V4.9.0 更新说明'
 icon: 'upgrade'
 draft: false
@@ -12,141 +12,9 @@ weight: 801

 ### 1. 做好数据库备份

-### 2. 更新镜像和 PG 容器
+### 2. 更新镜像

- 更新 FastGPT 镜像 tag: v4.9.0
- 更新 FastGPT 商业版镜像 tag: v4.9.0
- Sandbox 镜像，可以不更新
- 更新 PG 容器为 v0.8.0-pg15, 可以查看[最新的 yml](https://raw.githubusercontent.com/labring/FastGPT/main/deploy/docker/docker-compose-pgvector.yml)
-
-### 3. 替换 OneAPI（可选）
-
-如果需要使用 AI Proxy 替换 OneAPI 的用户可执行该步骤。
-
-#### 1. 修改 yml 文件
-
-参考[最新的 yml](https://raw.githubusercontent.com/labring/FastGPT/main/deploy/docker/docker-compose-pgvector.yml) 文件。里面已移除 OneAPI 并添加了 AIProxy配置。包含一个服务和一个 PgSQL 数据库。将 `aiproxy` 的配置`追加`到 OneAPI 的配置后面（先不要删除 OneAPI，有一个初始化会自动同步 OneAPI 的配置）
-
-{{% details title="AI Proxy Yml 配置" closed="true" %}}
-
-```
-  # AI Proxy
-  aiproxy:
-    image: 'ghcr.io/labring/sealos-aiproxy-service:latest'
-    container_name: aiproxy
-    restart: unless-stopped
-    depends_on:
-      aiproxy_pg:
-        condition: service_healthy
-    networks:
-      - fastgpt
-    environment:
-      # 对应 fastgpt 里的AIPROXY_API_TOKEN
-      - ADMIN_KEY=aiproxy
-      # 错误日志详情保存时间（小时）
-      - LOG_DETAIL_STORAGE_HOURS=1
-      # 数据库连接地址
-      - SQL_DSN=postgres://postgres:aiproxy@aiproxy_pg:5432/aiproxy
-      # 最大重试次数
-      - RetryTimes=3
-      # 不需要计费
-      - BILLING_ENABLED=false
-      # 不需要严格检测模型
-      - DISABLE_MODEL_CONFIG=true
-    healthcheck:
-      test: ['CMD', 'curl', '-f', 'http://localhost:3000/api/status']
-      interval: 5s
-      timeout: 5s
-      retries: 10
-  aiproxy_pg:
-    image: pgvector/pgvector:0.8.0-pg15 # docker hub
-    # image: registry.cn-hangzhou.aliyuncs.com/fastgpt/pgvector:v0.8.0-pg15 # 阿里云
-    restart: unless-stopped
-    container_name: aiproxy_pg
-    volumes:
-      - ./aiproxy_pg:/var/lib/postgresql/data
-    networks:
-      - fastgpt
-    environment:
-      TZ: Asia/Shanghai
-      POSTGRES_USER: postgres
-      POSTGRES_DB: aiproxy
-      POSTGRES_PASSWORD: aiproxy
-    healthcheck:
-      test: ['CMD', 'pg_isready', '-U', 'postgres', '-d', 'aiproxy']
-      interval: 5s
-      timeout: 5s
-      retries: 10
-```
-
-{{% /details %}}
-
-#### 2. 增加 FastGPT 环境变量：
-
-修改 yml 文件中，fastgpt 容器的环境变量：
-
-```
-# AI Proxy 的地址，如果配了该地址，优先使用
- AIPROXY_API_ENDPOINT=http://aiproxy:3000
-# AI Proxy 的 Admin Token，与 AI Proxy 中的环境变量 ADMIN_KEY
- AIPROXY_API_TOKEN=aiproxy
-```
-
-#### 3. 重载服务
-
-`docker-compose down` 停止服务，然后 `docker-compose up -d` 启动服务，此时会追加 `aiproxy` 服务，并修改 FastGPT 的配置。
-
-#### 4. 执行OneAPI迁移AI proxy脚本
-
- 可联网方案:
-
-```bash
-# 进入 aiproxy 容器
-docker exec -it aiproxy sh
-# 安装 curl
-apk add curl
-# 执行脚本
-curl --location --request POST 'http://localhost:3000/api/channels/import/oneapi' \
--header 'Authorization: Bearer aiproxy' \
--header 'Content-Type: application/json' \
--data-raw '{
-    "dsn": "mysql://root:oneapimmysql@tcp(mysql:3306)/oneapi"
-}'
-# 返回 {"data":[],"success":true} 代表成功
-```
-
- 无法联网时，可打开`aiproxy`的外网暴露端口，然后在本地执行脚本。
-
-aiProxy 暴露端口：3003:3000，修改后重新 `docker-compose up -d` 启动服务。
-
-```bash
-# 在终端执行脚本
-curl --location --request POST 'http://localhost:3003/api/channels/import/oneapi' \
--header 'Authorization: Bearer aiproxy' \
--header 'Content-Type: application/json' \
--data-raw '{
-    "dsn": "mysql://root:oneapimmysql@tcp(mysql:3306)/oneapi"
-}'
-# 返回 {"data":[],"success":true} 代表成功
-```
-
- 如果不熟悉 docker 操作，建议不要走脚本迁移，直接删除 OneAPI 所有内容，然后手动重新添加渠道。
-
-#### 5. 进入 FastGPT 检查`AI Proxy` 服务是否正常启动。
-
-登录 root 账号后，在`账号-模型提供商`页面，可以看到多出了`模型渠道`和`调用日志`两个选项，打开模型渠道，可以看到之前 OneAPI 的渠道，说明迁移完成，此时可以手动再检查下渠道是否正常。
-
-#### 6. 删除 OneAPI 服务
-
-```bash
-# 停止服务，或者针对性停止 OneAPI 和其 Mysql
-docker-compose down
-# yml 文件中删除 OneAPI 和其 Mysql 依赖
-# 重启服务
-docker-compose up -d
-```
-
-### 4. 运行 FastGPT 升级脚本
+### 3. 运行升级脚本

 从任意终端，发起 1 个 HTTP 请求。其中 {{rootkey}} 替换成环境变量里的 `rootkey`；{{host}} 替换成**FastGPT 域名**。

@@ -160,7 +28,7 @@ curl --location --request POST 'https://{{host}}/api/admin/initv490' \

 1. 升级 PG Vector 插件版本
 2. 全量更新知识库集合字段。
-3. 全量更新知识库数据中，index 的 type 类型。（时间较长，最后可能提示 timeout，可忽略，数据库不崩都会一直增量执行）
+3. 全量更新知识库数据中，index 的 type 类型。（时间较长）

 ## 兼容 & 弃用

@@ -174,7 +42,6 @@ curl --location --request POST 'https://{{host}}/api/admin/initv490' \
 1. PDF增强解析交互添加到页面上。同时内嵌 Doc2x 服务，可直接使用 Doc2x 服务解析 PDF 文件。
 2. 图片自动标注，同时修改知识库文件上传部分数据逻辑和交互。
 3. pg vector 插件升级 0.8.0 版本，引入迭代搜索，减少部分数据无法被检索的情况。
-4. 新增 qwen-qwq 系列模型配置。

 ## ⚙️ 优化

@@ -182,9 +49,8 @@ curl --location --request POST 'https://{{host}}/api/admin/initv490' \
 2. Markdown 解析，增加链接后中文标点符号检测，增加空格。
 3. Prompt 模式工具调用，支持思考模型。同时优化其格式检测，减少空输出的概率。
 4. Mongo 文件读取流合并，减少计算量。同时优化存储 chunks，极大提高大文件读取速度。50M PDF 读取时间提高 3 倍。
-5. HTTP Body 适配，增加对字符串对象的适配。

 ## 🐛 修复

 1. 增加网页抓取安全链接校验。
-2. 批量运行时，全局变量未进一步传递到下一次运行中，导致最终变量更新错误。
+2. 批量运行时，全局变量未进一步传递到下一次运行中，导致最终变量更新错误。
--- a/docSite/content/zh-cn/docs/use-cases/external-integration/official_account.md
+++ b/docSite/content/zh-cn/docs/use-cases/external-integration/official_account.md
@@ -89,9 +89,6 @@ weight: 506
 47.99.59.223
 112.124.46.5
 121.40.46.247
-120.26.145.73
-120.26.147.199
-121.43.125.163
 ```

 ## 4. 获取AES Key，选择加密方式
--- a/packages/global/common/string/markdown.ts
+++ b/packages/global/common/string/markdown.ts
@@ -168,7 +168,7 @@ export const markdownProcess = async ({
  return simpleMarkdownText(imageProcess);
 };

-export const matchMdImg = (text: string) => {
+export const matchMdImgTextAndUpload = (text: string) => {
  const base64Regex = /!\[([^\]]*)\]\((data:image\/[^;]+;base64[^)]+)\)/g;
  const imageList: ImageType[] = [];

--- a/packages/global/support/user/team/controller.d.ts
+++ b/packages/global/support/user/team/controller.d.ts
@@ -10,6 +10,7 @@ export type AuthTeamRoleProps = {
 export type CreateTeamProps = {
  name: string;
  avatar?: string;
+  defaultTeam?: boolean;
  memberName?: string;
  memberAvatar?: string;
  notificationAccount?: string;
--- a/packages/global/support/user/team/type.d.ts
+++ b/packages/global/support/user/team/type.d.ts
@@ -47,6 +47,7 @@ export type TeamMemberSchema = {
  role: `${TeamMemberRoleEnum}`;
  status: `${TeamMemberStatusEnum}`;
  avatar: string;
+  defaultTeam: boolean;
 };

 export type TeamMemberWithTeamAndUserSchema = TeamMemberSchema & {
@@ -64,6 +65,7 @@ export type TeamTmbItemType = {
  balance?: number;
  tmbId: string;
  teamDomain: string;
+  defaultTeam: boolean;
  role: `${TeamMemberRoleEnum}`;
  status: `${TeamMemberStatusEnum}`;
  notificationAccount?: string;
--- a/packages/service/common/file/image/controller.ts
+++ b/packages/service/common/file/image/controller.ts
@@ -6,7 +6,6 @@ import { guessBase64ImageType } from '../utils';
 import { readFromSecondary } from '../../mongo/utils';
 import { addHours } from 'date-fns';
 import { imageFileType } from '@fastgpt/global/common/file/constants';
-import { retryFn } from '@fastgpt/global/common/system/utils';

 export const maxImgSize = 1024 * 1024 * 12;
 const base64MimeRegex = /data:image\/([^\)]+);base64/;
@@ -41,15 +40,13 @@ export async function uploadMongoImg({
    return Promise.reject(`Invalid image file type: ${mime}`);
  }

-  const { _id } = await retryFn(() =>
-    MongoImage.create({
-      teamId,
-      binary,
-      metadata: Object.assign({ mime }, metadata),
-      shareId,
-      expiredTime: forever ? undefined : addHours(new Date(), 1)
-    })
-  );
+  const { _id } = await MongoImage.create({
+    teamId,
+    binary,
+    metadata: Object.assign({ mime }, metadata),
+    shareId,
+    expiredTime: forever ? undefined : addHours(new Date(), 1)
+  });

  return `${process.env.NEXT_PUBLIC_BASE_URL || ''}${imageBaseUrl}${String(_id)}.${extension}`;
 }
--- a/packages/service/common/file/image/utils.ts
+++ b/packages/service/common/file/image/utils.ts
@@ -2,30 +2,23 @@ import axios from 'axios';
 import { addLog } from '../../system/log';
 import { serverRequestBaseUrl } from '../../api/serverRequest';
 import { getFileContentTypeFromHeader, guessBase64ImageType } from '../utils';
-import { retryFn } from '@fastgpt/global/common/system/utils';

 export const getImageBase64 = async (url: string) => {
  addLog.debug(`Load image to base64: ${url}`);

  try {
-    const response = await retryFn(() =>
-      axios.get(url, {
-        baseURL: serverRequestBaseUrl,
-        responseType: 'arraybuffer',
-        proxy: false
-      })
-    );
+    const response = await axios.get(url, {
+      baseURL: serverRequestBaseUrl,
+      responseType: 'arraybuffer',
+      proxy: false
+    });

    const base64 = Buffer.from(response.data, 'binary').toString('base64');
    const imageType =
      getFileContentTypeFromHeader(response.headers['content-type']) ||
      guessBase64ImageType(base64);

-    return {
-      completeBase64: `data:${imageType};base64,${base64}`,
-      base64,
-      mime: imageType
-    };
+    return `data:${imageType};base64,${base64}`;
  } catch (error) {
    addLog.debug(`Load image to base64 failed: ${url}`);
    console.log(error);
--- a/packages/service/common/file/read/utils.ts
+++ b/packages/service/common/file/read/utils.ts
@@ -6,12 +6,11 @@ import type { ImageType, ReadFileResponse } from '../../../worker/readFile/type'
 import axios from 'axios';
 import { addLog } from '../../system/log';
 import { batchRun } from '@fastgpt/global/common/system/utils';
-import { htmlTable2Md, matchMdImg } from '@fastgpt/global/common/string/markdown';
+import { htmlTable2Md, matchMdImgTextAndUpload } from '@fastgpt/global/common/string/markdown';
 import { createPdfParseUsage } from '../../../support/wallet/usage/controller';
 import { getErrText } from '@fastgpt/global/common/error/utils';
 import { delay } from '@fastgpt/global/common/system/utils';
 import { getNanoid } from '@fastgpt/global/common/string/tools';
-import { getImageBase64 } from '../image/utils';

 export type readRawTextByLocalFileParams = {
  teamId: string;
@@ -100,7 +99,7 @@ export const readRawContentByFileBuffer = async ({
    addLog.info(`Custom file parsing is complete, time: ${Date.now() - start}ms`);

    const rawText = response.markdown;
-    const { text, imageList } = matchMdImg(rawText);
+    const { text, imageList } = matchMdImgTextAndUpload(rawText);

    createPdfParseUsage({
      teamId,
@@ -121,8 +120,8 @@ export const readRawContentByFileBuffer = async ({
    const parseTextImage = async (text: string) => {
      // Extract image links and convert to base64
      const imageList: { id: string; url: string }[] = [];
-      let processedText = text.replace(/!\[.*?\]\((http[^)]+)\)/g, (match, url) => {
-        const id = `IMAGE_${getNanoid()}_IMAGE`;
+      const processedText = text.replace(/!\[.*?\]\((http[^)]+)\)/g, (match, url) => {
+        const id = getNanoid();
        imageList.push({
          id,
          url
@@ -130,24 +129,22 @@ export const readRawContentByFileBuffer = async ({
        return `![](${id})`;
      });

-      // Get base64 from image url
      let resultImageList: ImageType[] = [];
-      await batchRun(
-        imageList,
-        async (item) => {
+      await Promise.all(
+        imageList.map(async (item) => {
          try {
-            const { base64, mime } = await getImageBase64(item.url);
+            const response = await axios.get(item.url, { responseType: 'arraybuffer' });
+            const mime = response.headers['content-type'] || 'image/jpeg';
+            const base64 = response.data.toString('base64');
            resultImageList.push({
              uuid: item.id,
              mime,
              base64
            });
          } catch (error) {
-            processedText = processedText.replace(item.id, item.url);
            addLog.warn(`Failed to get image from ${item.url}: ${getErrText(error)}`);
          }
-        },
-        5
+        })
      );

      return {
@@ -315,14 +312,14 @@ export const readRawContentByFileBuffer = async ({
          return await uploadMongoImg({
            base64Img: `data:${item.mime};base64,${item.base64}`,
            teamId,
+            // expiredTime: addHours(new Date(), 1),
            metadata: {
              ...metadata,
              mime: item.mime
            }
          });
        } catch (error) {
-          addLog.warn('Upload file image error', { error });
-          return 'Upload load image error';
+          return '';
        }
      })();
      rawText = rawText.replace(item.uuid, src);
--- a/packages/service/common/mongo/init.ts
+++ b/packages/service/common/mongo/init.ts
@@ -19,7 +19,7 @@ export async function connectMongo(): Promise<Mongoose> {
    // Remove existing listeners to prevent duplicates
    connectionMongo.connection.removeAllListeners('error');
    connectionMongo.connection.removeAllListeners('disconnected');
-    connectionMongo.set('strictQuery', 'throw');
+    connectionMongo.set('strictQuery', false);

    connectionMongo.connection.on('error', async (error) => {
      console.log('mongo error', error);
--- a/packages/service/core/ai/config/provider/Qwen.json
+++ b/packages/service/core/ai/config/provider/Qwen.json
@@ -122,56 +122,6 @@
      "showTopP": true,
      "showStopSign": true
    },
-    {
-      "model": "qwq-plus",
-      "name": "qwq-plus",
-      "maxContext": 128000,
-      "maxResponse": 8000,
-      "quoteMaxToken": 100000,
-      "maxTemperature": null,
-      "vision": false,
-      "reasoning": true,
-      "toolChoice": true,
-      "functionCall": false,
-      "defaultSystemChatPrompt": "",
-      "datasetProcess": false,
-      "usedInClassify": false,
-      "customCQPrompt": "",
-      "usedInExtractFields": false,
-      "usedInQueryExtension": false,
-      "customExtractPrompt": "",
-      "usedInToolCall": true,
-      "defaultConfig": {},
-      "fieldMap": {},
-      "type": "llm",
-      "showTopP": false,
-      "showStopSign": false
-    },
-    {
-      "model": "qwq-32b",
-      "name": "qwq-32b",
-      "maxContext": 128000,
-      "maxResponse": 8000,
-      "quoteMaxToken": 100000,
-      "maxTemperature": null,
-      "vision": false,
-      "reasoning": true,
-      "toolChoice": true,
-      "functionCall": false,
-      "defaultSystemChatPrompt": "",
-      "datasetProcess": false,
-      "usedInClassify": false,
-      "customCQPrompt": "",
-      "usedInExtractFields": false,
-      "usedInQueryExtension": false,
-      "customExtractPrompt": "",
-      "usedInToolCall": true,
-      "defaultConfig": {},
-      "fieldMap": {},
-      "type": "llm",
-      "showTopP": false,
-      "showStopSign": false
-    },
    {
      "model": "qwen-coder-turbo",
      "name": "qwen-coder-turbo",
--- a/packages/service/core/chat/utils.ts
+++ b/packages/service/core/chat/utils.ts
@@ -165,7 +165,7 @@ export const loadRequestMessages = async ({
            try {
              // If imgUrl is a local path, load image from local, and set url to base64
              if (imgUrl.startsWith('/') || process.env.MULTIPLE_DATA_TO_BASE64 === 'true') {
-                const { completeBase64: base64 } = await getImageBase64(imgUrl);
+                const base64 = await getImageBase64(imgUrl);

                return {
                  ...item,
--- a/packages/service/core/dataset/search/controller.ts
+++ b/packages/service/core/dataset/search/controller.ts
@@ -787,7 +787,6 @@ export const defaultSearchDatasetData = async ({
  ...props
 }: DefaultSearchDatasetDataProps): Promise<SearchDatasetDataResponse> => {
  const query = props.queries[0];
-  const histories = props.histories;

  const extensionModel = datasetSearchUsingExtensionQuery
    ? getLLMModel(datasetSearchExtensionModel)
@@ -797,8 +796,7 @@ export const defaultSearchDatasetData = async ({
    await datasetSearchQueryExtension({
      query,
      extensionModel,
-      extensionBg: datasetSearchExtensionBg,
-      histories
+      extensionBg: datasetSearchExtensionBg
    });

  const result = await searchDatasetData({
--- a/packages/service/core/workflow/dispatch/chat/oneapi.ts
+++ b/packages/service/core/workflow/dispatch/chat/oneapi.ts
@@ -264,7 +264,7 @@ export const dispatchChatCompletion = async (props: ChatProps): Promise<ChatResp
    }
  })();

-  if (!answerText && !reasoningText) {
+  if (!answerText) {
    return Promise.reject(getEmptyResponseTip());
  }

--- a/packages/service/core/workflow/dispatch/tools/http468.ts
+++ b/packages/service/core/workflow/dispatch/tools/http468.ts
@@ -120,144 +120,27 @@ export const dispatchHttp468Request = async (props: HttpRequestProps): Promise<H
    2. Replace newline strings
  */
  const replaceJsonBodyString = (text: string) => {
-    // Check if the variable is in quotes
-    const isVariableInQuotes = (text: string, variable: string) => {
-      const index = text.indexOf(variable);
-      if (index === -1) return false;
-
-      // 计算变量前面的引号数量
-      const textBeforeVar = text.substring(0, index);
-      const matches = textBeforeVar.match(/"/g) || [];
-
-      // 如果引号数量为奇数，则变量在引号内
-      return matches.length % 2 === 1;
-    };
-    const valToStr = (val: any, isQuoted = false) => {
+    const valToStr = (val: any) => {
      if (val === undefined) return 'null';
      if (val === null) return 'null';

      if (typeof val === 'object') return JSON.stringify(val);

      if (typeof val === 'string') {
-        if (isQuoted) {
-          return val.replace(/(?<!\\)"/g, '\\"');
-        }
        try {
-          JSON.parse(val);
+          const parsed = JSON.parse(val);
+          if (typeof parsed === 'object') {
+            return JSON.stringify(parsed);
+          }
          return val;
        } catch (error) {
          const str = JSON.stringify(val);
-
          return str.startsWith('"') && str.endsWith('"') ? str.slice(1, -1) : str;
        }
      }

      return String(val);
    };
-    // Test cases for variable replacement in JSON body
-    // const bodyTest = () => {
-    //   const testData = [
-    //     // 基本字符串替换
-    //     {
-    //       body: `{"name":"{{name}}","age":"18"}`,
-    //       variables: [{ key: '{{name}}', value: '测试' }],
-    //       result: `{"name":"测试","age":"18"}`
-    //     },
-    //     // 特殊字符处理
-    //     {
-    //       body: `{"text":"{{text}}"}`,
-    //       variables: [{ key: '{{text}}', value: '包含"引号"和\\反斜杠' }],
-    //       result: `{"text":"包含\\"引号\\"和\\反斜杠"}`
-    //     },
-    //     // 数字类型处理
-    //     {
-    //       body: `{"count":{{count}},"price":{{price}}}`,
-    //       variables: [
-    //         { key: '{{count}}', value: '42' },
-    //         { key: '{{price}}', value: '99.99' }
-    //       ],
-    //       result: `{"count":42,"price":99.99}`
-    //     },
-    //     // 布尔值处理
-    //     {
-    //       body: `{"isActive":{{isActive}},"hasData":{{hasData}}}`,
-    //       variables: [
-    //         { key: '{{isActive}}', value: 'true' },
-    //         { key: '{{hasData}}', value: 'false' }
-    //       ],
-    //       result: `{"isActive":true,"hasData":false}`
-    //     },
-    //     // 对象类型处理
-    //     {
-    //       body: `{"user":{{user}},"user2":"{{user2}}"}`,
-    //       variables: [
-    //         { key: '{{user}}', value: `{"id":1,"name":"张三"}` },
-    //         { key: '{{user2}}', value: `{"id":1,"name":"张三"}` }
-    //       ],
-    //       result: `{"user":{"id":1,"name":"张三"},"user2":"{\\"id\\":1,\\"name\\":\\"张三\\"}"}`
-    //     },
-    //     // 数组类型处理
-    //     {
-    //       body: `{"items":{{items}}}`,
-    //       variables: [{ key: '{{items}}', value: '[1, 2, 3]' }],
-    //       result: `{"items":[1,2,3]}`
-    //     },
-    //     // null 和 undefined 处理
-    //     {
-    //       body: `{"nullValue":{{nullValue}},"undefinedValue":{{undefinedValue}}}`,
-    //       variables: [
-    //         { key: '{{nullValue}}', value: 'null' },
-    //         { key: '{{undefinedValue}}', value: 'undefined' }
-    //       ],
-    //       result: `{"nullValue":null,"undefinedValue":null}`
-    //     },
-    //     // 嵌套JSON结构
-    //     {
-    //       body: `{"data":{"nested":{"value":"{{nestedValue}}"}}}`,
-    //       variables: [{ key: '{{nestedValue}}', value: '嵌套值' }],
-    //       result: `{"data":{"nested":{"value":"嵌套值"}}}`
-    //     },
-    //     // 多变量替换
-    //     {
-    //       body: `{"first":"{{first}}","second":"{{second}}","third":{{third}}}`,
-    //       variables: [
-    //         { key: '{{first}}', value: '第一' },
-    //         { key: '{{second}}', value: '第二' },
-    //         { key: '{{third}}', value: '3' }
-    //       ],
-    //       result: `{"first":"第一","second":"第二","third":3}`
-    //     },
-    //     // JSON字符串作为变量值
-    //     {
-    //       body: `{"config":{{config}}}`,
-    //       variables: [{ key: '{{config}}', value: '{"setting":"enabled","mode":"advanced"}' }],
-    //       result: `{"config":{"setting":"enabled","mode":"advanced"}}`
-    //     }
-    //   ];
-
-    //   for (let i = 0; i < testData.length; i++) {
-    //     const item = testData[i];
-    //     let bodyStr = item.body;
-    //     for (const variable of item.variables) {
-    //       const isQuote = isVariableInQuotes(bodyStr, variable.key);
-    //       bodyStr = bodyStr.replace(variable.key, valToStr(variable.value, isQuote));
-    //     }
-    //     bodyStr = bodyStr.replace(/(".*?")\s*:\s*undefined\b/g, '$1:null');
-
-    //     console.log(bodyStr === item.result, i);
-    //     if (bodyStr !== item.result) {
-    //       console.log(bodyStr);
-    //       console.log(item.result);
-    //     } else {
-    //       try {
-    //         JSON.parse(item.result);
-    //       } catch (error) {
-    //         console.log('反序列化异常', i, item.result);
-    //       }
-    //     }
-    //   }
-    // };
-    // bodyTest();

    // 1. Replace {{key.key}} variables
    const regex1 = /\{\{\$([^.]+)\.([^$]+)\$\}\}/g;
@@ -265,10 +148,6 @@ export const dispatchHttp468Request = async (props: HttpRequestProps): Promise<H
    matches1.forEach((match) => {
      const nodeId = match[1];
      const id = match[2];
-      const fullMatch = match[0];
-
-      // 检查变量是否在引号内
-      const isInQuotes = isVariableInQuotes(text, fullMatch);

      const variableVal = (() => {
        if (nodeId === VARIABLE_NODE_ID) {
@@ -286,9 +165,9 @@ export const dispatchHttp468Request = async (props: HttpRequestProps): Promise<H
          return getReferenceVariableValue({ value: input.value, nodes: runtimeNodes, variables });
      })();

-      const formatVal = valToStr(variableVal, isInQuotes);
+      const formatVal = valToStr(variableVal);

-      const regex = new RegExp(`\\{\\{\\$(${nodeId}\\.${id})\\$\\}\\}`, '');
+      const regex = new RegExp(`\\{\\{\\$(${nodeId}\\.${id})\\$\\}\\}`, 'g');
      text = text.replace(regex, () => formatVal);
    });

@@ -297,16 +176,10 @@ export const dispatchHttp468Request = async (props: HttpRequestProps): Promise<H
    const matches2 = text.match(regex2) || [];
    const uniqueKeys2 = [...new Set(matches2.map((match) => match.slice(2, -2)))];
    for (const key of uniqueKeys2) {
-      const fullMatch = `{{${key}}}`;
-      // 检查变量是否在引号内
-      const isInQuotes = isVariableInQuotes(text, fullMatch);
-
-      text = text.replace(new RegExp(`{{(${key})}}`, ''), () =>
-        valToStr(allVariables[key], isInQuotes)
-      );
+      text = text.replace(new RegExp(`{{(${key})}}`, 'g'), () => valToStr(allVariables[key]));
    }

-    return text.replace(/(".*?")\s*:\s*undefined\b/g, '$1:null');
+    return text.replace(/(".*?")\s*:\s*undefined\b/g, '$1: null');
  };

  httpReqUrl = replaceStringVariables(httpReqUrl);
--- a/packages/service/support/user/team/controller.ts
+++ b/packages/service/support/user/team/controller.ts
@@ -43,6 +43,7 @@ async function getTeamMember(match: Record<string, any>): Promise<TeamTmbItemTyp
    teamDomain: tmb.team?.teamDomain,
    role: tmb.role,
    status: tmb.status,
+    defaultTeam: tmb.defaultTeam,
    permission: new TeamPermission({
      per: Per ?? TeamDefaultPermissionVal,
      isOwner: tmb.role === TeamMemberRoleEnum.owner
@@ -70,7 +71,8 @@ export async function getUserDefaultTeam({ userId }: { userId: string }) {
    return Promise.reject('tmbId or userId is required');
  }
  return getTeamMember({
-    userId: new Types.ObjectId(userId)
+    userId: new Types.ObjectId(userId),
+    defaultTeam: true
  });
 }

--- a/packages/service/support/user/team/teamMemberSchema.ts
+++ b/packages/service/support/user/team/teamMemberSchema.ts
@@ -39,14 +39,14 @@ const TeamMemberSchema = new Schema({
  updateTime: {
    type: Date
  },
+  defaultTeam: {
+    type: Boolean,
+    default: false
+  },

  // Abandoned
  role: {
    type: String
-  },
-  // Abandoned
-  defaultTeam: {
-    type: Boolean
  }
 });

--- a/packages/service/worker/htmlStr2Md/utils.ts
+++ b/packages/service/worker/htmlStr2Md/utils.ts
@@ -1,6 +1,6 @@
 import TurndownService from 'turndown';
 import { ImageType } from '../readFile/type';
-import { matchMdImg } from '@fastgpt/global/common/string/markdown';
+import { matchMdImgTextAndUpload } from '@fastgpt/global/common/string/markdown';
 import { getNanoid } from '@fastgpt/global/common/string/tools';
 // @ts-ignore
 const turndownPluginGfm = require('joplin-turndown-plugin-gfm');
@@ -46,7 +46,7 @@ export const html2md = (
    // Base64 img to id, otherwise it will occupy memory when going to md
    const { processedHtml, images } = processBase64Images(html);
    const md = turndownService.turndown(processedHtml);
-    const { text, imageList } = matchMdImg(md);
+    const { text, imageList } = matchMdImgTextAndUpload(md);

    return {
      rawText: text,
--- a/packages/web/i18n/zh-CN/common.json
+++ b/packages/web/i18n/zh-CN/common.json
@@ -664,7 +664,6 @@
  "core.dataset.website.Selector Course": "使用教程",
  "core.dataset.website.Start Sync": "开始同步",
  "core.dataset.website.UnValid Website Tip": "您的站点可能非静态站点，无法同步",
-  "core.dataset.error.unExistDataset": "数据集不存在",
  "core.module.Add question type": "添加问题类型",
  "core.module.Add_option": "添加选项",
  "core.module.Can not connect self": "不能连接自身",
--- a/plugins/model/pdf-marker/Readme.md
+++ b/plugins/model/pdf-marker/Readme.md
@@ -70,7 +70,7 @@ export PROCESSES_PER_GPU="1"
   python api_mp.py
   ```

-# 镜像打包和部署(推荐)
+# 镜像打包和部署

 ## 本地构建镜像

@@ -83,39 +83,26 @@ export PROCESSES_PER_GPU="1"
    ```bash
    sudo docker run --gpus all -itd -p 7231:7231 --name model_pdf_v1 -e PROCESSES_PER_GPU="2" model_pdf
    ```
-    
-## 快速构建镜像(推荐)
-
+## 快速构建镜像
 ```dockerfile
-docker pull crpi-h3snc261q1dosroc.cn-hangzhou.personal.cr.aliyuncs.com/marker11/marker_images:v0.2
-docker run --gpus all -itd -p 7231:7232 --name model_pdf_v2 -e PROCESSES_PER_GPU="2" crpi-h3snc261q1dosroc.cn-hangzhou.personal.cr.aliyuncs.com/marker11/marker_images:v0.2
+docker pull crpi-h3snc261q1dosroc.cn-hangzhou.personal.cr.aliyuncs.com/marker11/marker_images:latest
+docker run --gpus all -itd -p 7231:7231 --name model_pdf_v1 -e PROCESSES_PER_GPU="2" crpi-h3snc261q1dosroc.cn-hangzhou.personal.cr.aliyuncs.com/marker11/marker_images:latest
 ```
-
+*注意*：参数PROCESSES_PER_GPU设置每张显卡上文件处理的并行数量，24G的显卡可以设置为2。在多显卡的环境中会自动切换显卡来运行多文件的并行处理。 
 # 访问示例

-marker v0.1：用Post方法访问端口为 `7321 ` 的 `v1/parse/file` 服务
-
-marker v0.2：用Post方法访问端口为 `7321 ` 的 `v2/parse/file` 服务
-
+用Post方法访问端口为 `7321 ` 的 `v1/parse/file` 服务

+参数：file-->本地文件的地址

 - 访问方法
-    
-   - v0.2
-      ```
-      curl --location --request POST "http://localhost:7231/v2/parse/file" \
-      --header "Authorization: Bearer your_access_token" \
-      --form "file=@./file/chinese_test.pdf"
-      ```
-  - v0.1
-      ```
-      curl --location --request POST "http://localhost:7231/v1/parse/file" \
-      --header "Authorization: Bearer your_access_token" \
-      --form "file=@./file/chinese_test.pdf"
-      ```
-      
-      参数：file-->本地文件的地址
-  
+
+  ```
+  curl --location --request POST "http://localhost:7231/v1/parse/file" \
+  --header "Authorization: Bearer your_access_token" \
+  --form "file=@./file/chinese_test.pdf"
+  ```
+
 - 多文件测试数据

  运行 `test` 文件下的 `test.py` 文件，修改里面的 `file_paths` 为自己仓库的 `url` 即可
--- a/projects/app/public/docs/versionIntro.md
+++ b/projects/app/public/docs/versionIntro.md
@@ -1,21 +1,13 @@
-### FastGPT V4.9.0 更新说明
+### FastGPT V4.8.20 更新说明

-#### 弃用 & 兼容
-
-1. 弃用 - 之前私有化部署的自定义文件解析方案，请同步更新到最新的配置方案。[点击查看 PDF 增强解析配置](/docs/development/configuration/#使用-doc2x-解析-pdf-文件)
-2. 弃用 - 弃用旧版本地文件上传 API：/api/core/dataset/collection/create/file（以前仅商业版可用的 API，该接口已放切换成：/api/core/dataset/collection/create/localFile）
-3. 停止维护，即将弃用 - 外部文件库相关 API，可通过 API 文件库替代。
-4. API更新 - 上传文件至知识库、创建连接集合、API 文件库、推送分块数据等带有 `trainingType` 字段的接口，`trainingType`字段未来仅支持`chunk`和`QA`两种模式。增强索引模式将设置单独字段：`autoIndexes`，目前仍有适配旧版`trainingType=auto`代码，但请尽快变更成新接口类型。具体可见：[知识库 OpenAPI 文档](/docs/development/openapi/dataset.md)
-
-#### 功能更新
-
-1. 新增 - PDF 增强解析，可以识别图片、公式、扫描件，并将内容转化成 Markdown 格式。
-2. 新增 - 支持对文档中的图片链接，进行图片索引，提高图片内容的检索精度。
-3. 新增 - 语义检索增加迭代搜索，减少漏检。
-4. 优化 - 知识库数据不再限制索引数量，可无限自定义。同时可自动更新输入文本的索引，不影响自定义索引。
-5. 优化 - Markdown 解析，增加链接后中文标点符号检测，增加空格。
-6. 优化 - Prompt 模式工具调用，支持思考模型。同时优化其格式检测，减少空输出的概率。
-7. 优化 - 优化文件读取代码，极大提高大文件读取速度。50M PDF 读取时间提高 3 倍。
-8. 优化 - HTTP Body 适配，增加对字符串对象的适配。
-9. 修复 - 批量运行时，全局变量未进一步传递到下一次运行中，导致最终变量更新错误。
+1. 新增 - 使用记录导出和仪表盘。
+2. 新增 - DeepSeek resoner 模型支持输出思考过程。
+3. 新增 - markdown 语法扩展，支持音视频（代码块 audio 和 video）。
+4. 新增 - 飞书/语雀知识库。
+5. 新增 - 工作流知识库检索支持按知识库权限进行过滤。
+6. 新增 - 流程等待插件，可以等待 n 毫秒后继续执行流程。
+7. 新增 - 飞书机器人接入，支持配置私有化飞书地址。
+8. 新增 - 支持通过 JSON 配置直接创建应用。
+9. 新增 - 支持通过 CURL 脚本快速创建 HTTP 插件。
+10. 新增 - 支持部门架构权限模式。

--- a/projects/app/src/pageComponents/account/team/MemberTable.tsx
+++ b/projects/app/src/pageComponents/account/team/MemberTable.tsx
@@ -93,7 +93,7 @@ function MemberTable({ Tabs }: { Tabs: React.ReactNode }) {

  const { runAsync: onLeaveTeam } = useRequest2(
    async () => {
-      const defaultTeam = myTeams[0];
+      const defaultTeam = myTeams.find((item) => item.defaultTeam) || myTeams[0];
      // change to personal team
      onSwitchTeam(defaultTeam.teamId);
      return delLeaveTeam();
--- a/projects/app/src/pageComponents/dataset/detail/Import/commonProgress/DataProcess.tsx
+++ b/projects/app/src/pageComponents/dataset/detail/Import/commonProgress/DataProcess.tsx
@@ -159,29 +159,34 @@ function DataProcess() {
                  gridTemplateColumns={'repeat(2, 1fr)'}
                />
              </Box>
-              {trainingType === DatasetCollectionDataProcessModeEnum.chunk && feConfigs?.isPlus && (
+              {trainingType === DatasetCollectionDataProcessModeEnum.chunk && (
                <Box mt={6}>
                  <Box fontSize={'sm'} mb={2} color={'myGray.600'}>
                    {t('dataset:enhanced_indexes')}
                  </Box>
-                  <HStack gap={[3, 7]}>
-                    <HStack flex={'1'} spacing={1}>
-                      <Checkbox {...register('autoIndexes')}>
-                        <FormLabel>{t('dataset:auto_indexes')}</FormLabel>
-                      </Checkbox>
-                      <QuestionTip label={t('dataset:auto_indexes_tips')} />
-                    </HStack>
-                    <HStack flex={'1'} spacing={1}>
-                      <MyTooltip
-                        label={!datasetDetail?.vlmModel ? t('common:error_vlm_not_config') : ''}
-                      >
-                        <Checkbox isDisabled={!datasetDetail?.vlmModel} {...register('imageIndex')}>
-                          <FormLabel>{t('dataset:image_auto_parse')}</FormLabel>
+                  {feConfigs?.isPlus && (
+                    <HStack gap={[3, 7]}>
+                      <HStack flex={'1'} spacing={1}>
+                        <Checkbox {...register('autoIndexes')}>
+                          <FormLabel>{t('dataset:auto_indexes')}</FormLabel>
                        </Checkbox>
-                      </MyTooltip>
-                      <QuestionTip label={t('dataset:image_auto_parse_tips')} />
+                        <QuestionTip label={t('dataset:auto_indexes_tips')} />
+                      </HStack>
+                      <HStack flex={'1'} spacing={1}>
+                        <MyTooltip
+                          label={!datasetDetail?.vlmModel ? t('common:error_vlm_not_config') : ''}
+                        >
+                          <Checkbox
+                            isDisabled={!datasetDetail?.vlmModel}
+                            {...register('imageIndex')}
+                          >
+                            <FormLabel>{t('dataset:image_auto_parse')}</FormLabel>
+                          </Checkbox>
+                        </MyTooltip>
+                        <QuestionTip label={t('dataset:image_auto_parse_tips')} />
+                      </HStack>
                    </HStack>
-                  </HStack>
+                  )}
                </Box>
              )}
              <Box mt={6}>
--- a/projects/app/src/pageComponents/dataset/detail/InputDataModal.tsx
+++ b/projects/app/src/pageComponents/dataset/detail/InputDataModal.tsx
@@ -1,5 +1,5 @@
 import React, { useCallback, useEffect, useMemo, useRef, useState } from 'react';
-import { Box, Flex, Button, Textarea } from '@chakra-ui/react';
+import { Box, Flex, Button, Textarea, useTheme } from '@chakra-ui/react';
 import {
  FieldArrayWithId,
  UseFieldArrayRemove,
@@ -19,7 +19,8 @@ import MyModal from '@fastgpt/web/components/common/MyModal';
 import MyTooltip from '@fastgpt/web/components/common/MyTooltip';
 import { useQuery } from '@tanstack/react-query';
 import { useTranslation } from 'next-i18next';
-import { useRequest2 } from '@fastgpt/web/hooks/useRequest';
+import { useRequest, useRequest2 } from '@fastgpt/web/hooks/useRequest';
+import { useConfirm } from '@fastgpt/web/hooks/useConfirm';
 import { getSourceNameIcon } from '@fastgpt/global/core/dataset/utils';
 import { DatasetDataIndexItemType } from '@fastgpt/global/core/dataset/type';
 import DeleteIcon from '@fastgpt/web/components/common/Icon/delete';
@@ -29,12 +30,10 @@ import MyBox from '@fastgpt/web/components/common/MyBox';
 import { getErrText } from '@fastgpt/global/common/error/utils';
 import { useSystemStore } from '@/web/common/system/useSystemStore';
 import QuestionTip from '@fastgpt/web/components/common/MyTooltip/QuestionTip';
+import { useSystem } from '@fastgpt/web/hooks/useSystem';
 import LightRowTabs from '@fastgpt/web/components/common/Tabs/LightRowTabs';
 import styles from './styles.module.scss';
-import {
-  DatasetDataIndexTypeEnum,
-  getDatasetIndexMapData
-} from '@fastgpt/global/core/dataset/data/constants';
+import { getDatasetIndexMapData } from '@fastgpt/global/core/dataset/data/constants';

 export type InputDataType = {
  q: string;
@@ -63,10 +62,11 @@ const InputDataModal = ({
  onSuccess: (data: InputDataType & { dataId: string }) => void;
 }) => {
  const { t } = useTranslation();
+  const theme = useTheme();
  const { toast } = useToast();
  const [currentTab, setCurrentTab] = useState(TabEnum.content);
  const { embeddingModelList, defaultModels } = useSystemStore();
-
+  const { isPc } = useSystem();
  const { register, handleSubmit, reset, control } = useForm<InputDataType>();
  const {
    fields: indexes,
@@ -112,6 +112,11 @@ const InputDataModal = ({
    }
  ];

+  const { ConfirmModal, openConfirm } = useConfirm({
+    content: t('common:dataset.data.Delete Tip'),
+    type: 'delete'
+  });
+
  const { data: collection = defaultCollectionDetail } = useQuery(
    ['loadCollectionId', collectionId],
    () => {
@@ -158,8 +163,8 @@ const InputDataModal = ({
  }, [collection.dataset.vectorModel, defaultModels.embedding, embeddingModelList]);

  // import new data
-  const { runAsync: sureImportData, loading: isImporting } = useRequest2(
-    async (e: InputDataType) => {
+  const { mutate: sureImportData, isLoading: isImporting } = useRequest({
+    mutationFn: async (e: InputDataType) => {
      if (!e.q) {
        setCurrentTab(TabEnum.content);
        return Promise.reject(t('common:dataset.data.input is empty'));
@@ -176,8 +181,12 @@ const InputDataModal = ({
        collectionId: collection._id,
        q: e.q,
        a: e.a,
-        // Contains no default index
-        indexes: e.indexes
+        // remove dataId
+        indexes:
+          e.indexes?.map((index) => ({
+            ...index,
+            dataId: undefined
+          })) || []
      });

      return {
@@ -185,20 +194,18 @@ const InputDataModal = ({
        dataId
      };
    },
-    {
-      successToast: t('common:dataset.data.Input Success Tip'),
-      onSuccess(e) {
-        reset({
-          ...e,
-          q: '',
-          a: '',
-          indexes: []
-        });
-        onSuccess(e);
-      },
-      errorToast: t('common:common.error.unKnow')
-    }
-  );
+    successToast: t('common:dataset.data.Input Success Tip'),
+    onSuccess(e) {
+      reset({
+        ...e,
+        q: '',
+        a: '',
+        indexes: []
+      });
+      onSuccess(e);
+    },
+    errorToast: t('common:common.error.unKnow')
+  });

  // update
  const { runAsync: onUpdateData, loading: isUpdating } = useRequest2(
@@ -232,7 +239,6 @@ const InputDataModal = ({
    () => getSourceNameIcon({ sourceName: collection.sourceName, sourceId: collection.sourceId }),
    [collection]
  );
-
  return (
    <MyModal
      isOpen={true}
@@ -285,8 +291,9 @@ const InputDataModal = ({
              p={0}
              onClick={() =>
                appendIndexes({
-                  type: DatasetDataIndexTypeEnum.custom,
-                  text: ''
+                  type: 'custom',
+                  text: '',
+                  dataId: `${Date.now()}`
                })
              }
            >
@@ -324,6 +331,7 @@ const InputDataModal = ({
          </MyTooltip>
        </Flex>
      </MyBox>
+      <ConfirmModal />
    </MyModal>
  );
 };
--- a/projects/app/src/pages/api/core/ai/model/test.ts
+++ b/projects/app/src/pages/api/core/ai/model/test.ts
@@ -80,10 +80,8 @@ const testLLMModel = async (model: LLMModelItemType) => {
  });

  const responseText = response.choices?.[0]?.message?.content;
-  // @ts-ignore
-  const reasoning_content = response.choices?.[0]?.message?.reasoning_content;

-  if (!responseText && !reasoning_content) {
+  if (!responseText) {
    return Promise.reject('Model response empty');
  }

--- a/projects/app/src/pages/api/core/chat/chatTest.ts
+++ b/projects/app/src/pages/api/core/chat/chatTest.ts
@@ -204,42 +204,44 @@ async function handler(req: NextApiRequest, res: NextApiResponse) {
    });

    // save chat
-    const isInteractiveRequest = !!getLastInteractiveValue(histories);
-    const { text: userInteractiveVal } = chatValue2RuntimePrompt(userQuestion.value);
+    if (!res.closed) {
+      const isInteractiveRequest = !!getLastInteractiveValue(histories);
+      const { text: userInteractiveVal } = chatValue2RuntimePrompt(userQuestion.value);

-    const newTitle = isPlugin
-      ? variables.cTime ?? getSystemTime(timezone)
-      : getChatTitleFromChatMessage(userQuestion);
+      const newTitle = isPlugin
+        ? variables.cTime ?? getSystemTime(timezone)
+        : getChatTitleFromChatMessage(userQuestion);

-    const aiResponse: AIChatItemType & { dataId?: string } = {
-      dataId: responseChatItemId,
-      obj: ChatRoleEnum.AI,
-      value: assistantResponses,
-      [DispatchNodeResponseKeyEnum.nodeResponse]: flowResponses
-    };
+      const aiResponse: AIChatItemType & { dataId?: string } = {
+        dataId: responseChatItemId,
+        obj: ChatRoleEnum.AI,
+        value: assistantResponses,
+        [DispatchNodeResponseKeyEnum.nodeResponse]: flowResponses
+      };

-    if (isInteractiveRequest) {
-      await updateInteractiveChat({
-        chatId,
-        appId: app._id,
-        userInteractiveVal,
-        aiResponse,
-        newVariables
-      });
-    } else {
-      await saveChat({
-        chatId,
-        appId: app._id,
-        teamId,
-        tmbId: tmbId,
-        nodes,
-        appChatConfig: chatConfig,
-        variables: newVariables,
-        isUpdateUseTime: false, // owner update use time
-        newTitle,
-        source: ChatSourceEnum.test,
-        content: [userQuestion, aiResponse]
-      });
+      if (isInteractiveRequest) {
+        await updateInteractiveChat({
+          chatId,
+          appId: app._id,
+          userInteractiveVal,
+          aiResponse,
+          newVariables
+        });
+      } else {
+        await saveChat({
+          chatId,
+          appId: app._id,
+          teamId,
+          tmbId: tmbId,
+          nodes,
+          appChatConfig: chatConfig,
+          variables: newVariables,
+          isUpdateUseTime: false, // owner update use time
+          newTitle,
+          source: ChatSourceEnum.test,
+          content: [userQuestion, aiResponse]
+        });
+      }
    }

    createChatUsage({
--- a/projects/app/src/service/core/dataset/data/controller.ts
+++ b/projects/app/src/service/core/dataset/data/controller.ts
@@ -25,35 +25,16 @@ const formatIndexes = ({
  a?: string;
 }) => {
  indexes = indexes || [];
-  // If index not type, set it to custom
-  indexes = indexes
-    .map((item) => ({
-      text: typeof item.text === 'string' ? item.text : String(item.text),
-      type: item.type || DatasetDataIndexTypeEnum.custom,
-      dataId: item.dataId
-    }))
-    .filter((item) => !!item.text.trim());
+  const defaultIndex = getDefaultIndex({ q, a });

-  // Recompute default indexes, Merge ids of the same index, reduce the number of rebuilds
-  const defaultIndexes = getDefaultIndex({ q, a });
-  const concatDefaultIndexes = defaultIndexes.map((item) => {
-    const oldIndex = indexes!.find((index) => index.text === item.text);
-    if (oldIndex) {
-      return {
-        type: DatasetDataIndexTypeEnum.default,
-        text: item.text,
-        dataId: oldIndex.dataId
-      };
-    } else {
-      return item;
-    }
-  });
+  // 1. Reset default index
  indexes = indexes.filter((item) => item.type !== DatasetDataIndexTypeEnum.default);
-  indexes.push(...concatDefaultIndexes);
-
-  // Filter same text
+  // 2. Add default index
+  indexes.unshift(...defaultIndex);
+  // 3. Filter same text
  indexes = indexes.filter(
-    (item, index, self) => index === self.findIndex((t) => t.text === item.text)
+    (item, index, self) =>
+      !!item.text.trim() && index === self.findIndex((t) => t.text === item.text)
  );

  return indexes.map((index) => ({
@@ -248,7 +229,7 @@ export async function updateData2Dataset({
  const newIndexes = patchResult
    .filter((item) => item.type !== 'delete')
    .map((item) => item.index) as DatasetDataIndexItemType[];
-
+  console.log(newIndexes, '---');
  // console.log(clonePatchResult2Insert);
  await mongoSessionRun(async (session) => {
    // Update MongoData
Author	SHA1	Message	Date
archer	081a843d7e	update action	2025-03-05 18:45:24 +08:00
Archer	e53646d13e	pdf parse doc (#3990 )	2025-03-05 18:33:53 +08:00
Archer	693db35a42	fix: link (#3987 )	2025-03-05 17:08:18 +08:00
Archer	9717be8522	simple mode tool reason (#3984 ) * simple mode tool reason * model config cannot set empty * perf: read files code * perf: mongo gridfs chunks * perf: doc	2025-03-05 15:55:02 +08:00
archer	02685f7a3e	update init sh	2025-03-05 15:09:49 +08:00
archer	e1b021af71	doc	2025-03-05 15:09:48 +08:00
Archer	051b590284	feat: prompt call tool support reason;perf: ai proxy doc (#3982 ) * update schema * perf: ai proxy doc * feat: prompt call tool support reason	2025-03-05 15:09:48 +08:00
heheer	60f0c18997	ai proxy docker compose & doc (#3947 )	2025-03-05 15:09:47 +08:00
Archer	6a3bd30add	Add markdown format; Update doc (#3969 ) * update doc * markdown	2025-03-05 15:09:46 +08:00
Archer	2c89752f67	feat: pg vector 0.8.0；perf: app pdf enhance parse (#3962 ) * perf: app pdf enhance parse * feat: pg vector 0.8.0 * update schema default * model sort and default image * perf: i18n * perf: ui tip	2025-03-05 15:09:46 +08:00
Archer	139b142293	Add image index and pdf parse (#3956 ) * feat: think tag parse * feat: parse think tag test * feat: pdf parse ux * feat: doc2x parse * perf: rewrite training mode setting * feat: image parse queue * perf: image index * feat: image parse process * feat: add init sh * fix: ts	2025-03-05 15:09:41 +08:00