WebCrawler Agent 详细指南

WebCrawlerAgent 是偏网页抓取方向的数据获取节点，可以看作 Obtainer 在开放网页场景下的补充与扩展。

核心职责

通常需要先想清楚以下几件事：

输入通常包括：

输出通常包括：

WebCrawler 可以看作 Obtainer 的一个外部数据扩展分支。

在闭环中，它通常处于：

text

Analyzer -> Obtainer / WebCrawler -> Constructor -> Trainer

当已有数据源不足，或者需要从公开网页补充信息时，WebCrawler 就会发挥作用。