Skip to content

Constructor Agent 详细指南

ConstructorAgent 负责把原始候选数据变成更适合训练的数据。

核心职责

  • 数据清洗
  • 数据合成
  • 去重与筛选

进入它之前通常要准备什么

通常要有:

  • Obtainer 或 WebCrawler 给出的原始数据
  • 处理策略或目标格式
  • 输出路径

它的输入和输出可以怎么理解

输入通常是:

  • 原始数据
  • 处理规则
  • 数据构造目标

输出通常是:

  • 更干净的数据集
  • 可直接供 Trainer 使用的训练数据

在闭环中的位置

Constructor 是“原始数据”到“训练数据”之间的桥梁。

使用时最该关注什么

  • 清洗是否充分
  • 去重是否有效
  • 数据是否已经适合进入训练阶段

Built with VitePress for LoopAI