DependencyMatcher + ML 混合策略 Pipeline 设计模式-CSDN博客

           ┌────────────────────────────┐
           │      用户输入 Query         │
           └────────────┬──────────────┘
                        ▼
            ┌─────────────────────┐
            │ DependencyMatcher    │
            │   高置信度规则匹配   │
            └────────┬────────────┘
          匹配成功?   │ 是             │ 否
                    ▼                  ▼
       ┌─────────────────────┐     ┌─────────────────────┐
       │  规则结果直接答复    │     │ ML / LLM  Fallback   │
       └────────┬────────────┘     └────────┬────────────┘
                        ▼                           ▼
               ┌────────────────────────────┐
               │       最终答复输出          │
               └────────────────────────────┘

3️⃣ 设计原则

3.1 规则优先匹配

业务关键场景（如支付时间、公司名称、合同义务）优先用 DependencyMatcher
高置信度规则 → 可直接答复 → 无需进入 LLM

3.2 Fallback 策略

DependencyMatcher 匹配失败 or 不足覆盖 → fallback 到 ML / LLM
Fallback 可用：
- 传统 ML 分类器
- BERT / RoBERTa QA 模型
- RAG Pipeline → embedding + retrieval + LLM

3.3 策略切换阈值设计

可配置 规则置信度阈值
部分场景允许 “规则 + ML 混合结果融合” → voting / reranking
需记录日志 → 支撑后续优化

4️⃣ 代码示例框架

4.1 Pipeline 主控逻辑

class HybridQAPipeline:
    def __init__(self, matcher_engine, ml_model):
        self.matcher_engine = matcher_engine
        self.ml_model = ml_model

    def process_query(self, query_text):
        # Step 1: DependencyMatcher 匹配
        rule_result = self.matcher_engine.match(query_text)

        if rule_result and rule_result["confidence"] >= 0.9:
            return {
                "source": "rule",
                "answer": rule_result["answer"],
                "confidence": rule_result["confidence"]
            }

        # Step 2: fallback 到 ML / LLM
        ml_answer, ml_confidence = self.ml_model.predict(query_text)

        return {
            "source": "ml",
            "answer": ml_answer,
            "confidence": ml_confidence
        }

4.2 Matcher Engine 统一接口示例

class MatcherEngine:
    def __init__(self, matcher, nlp):
        self.matcher = matcher
        self.nlp = nlp

    def match(self, text):
        doc = self.nlp(text)
        matches = self.matcher(doc)

        if matches:
            # 简化示例，实际可做更复杂 confidence 计算
            return {
                "answer": self._extract_answer(doc, matches),
                "confidence": 0.95
            }
        else:
            return None