1、检索精度优化策略 1. 数据预处理优化 目标:减少噪声,提升文本质量。 方法: 去除冗余模板(如重复条款)。 消除空白与格式不一致(合并空行、统一缩进)。 删除无关信息(页眉、页脚、版权声明)。 1.分块策略调整: 动态分块:根据文本结构(如段落、标题)动态调整块大小。 重叠分块:相邻块间保留10%-20%的重叠内容,避免上下文断裂。 from langchain