AgenticRAG Operators

About 1730 wordsAbout 6 min

2025-06-24

Overview

AgenticRAG Operators are a specialized suite of tools designed for agentic RAG (Retrieval-Augmented Generation) tasks, with a particular focus on generating question-and-answer (QA) samples from provided text to support RL-based agentic RAG training. These operators are primarily categorized into two groups: Data Generation Operators (Generators) and Processing Operators (Processors).

🚀 Independent Innovation: Core algorithms developed from scratch, filling existing algorithmic gaps or further improving performance, breaking through current performance bottlenecks.
✨ Open Source First: First integration of this operator into mainstream community frameworks, facilitating use by more developers and achieving open-source sharing.

Data Generation Operators

Data Generation Operators are responsible for producing RAG-related RL training data, including automated prompt creation, question and answer generation, and QA scoring.

Name	Application Type	Description	Official Repository or Paper
AutoPromptGenerator🚀	Prompt Synthesis	Generates prompts for question and answer creation tailored to specific content by leveraging large language models.	-
AtomicTaskGenerator✨	Atomic Task Generation	Generates high-quality questions and verifiable answers based on the given text content.	Refined and improved from https://github.com/OPPO-PersonalAI/TaskCraft
QAGenerator✨	Question and Answer Generation	Produces questions and answers for given text content using large language models and generated prompts.	-
WidthQAGenerator✨	QA Breadth Expansion	Combines multiple QA pairs to generate new, more difficult QA pairs.	Refined and improved from https://github.com/OPPO-PersonalAI/TaskCraft
DepthQAGenerator✨	QA Depth Expansion	Expands individual QA pairs into new, more challenging QA pairs.	Refined and improved from https://github.com/OPPO-PersonalAI/TaskCraft

Data Evaluation Operators

Data evaluation operators are responsible for assessing reinforcement learning training data related to RAG, including quality scoring for questions and answers.

Name	Application Type	Description	Official Repository or Paper
QAScorer✨	QA Scoring	Evaluates the quality of questions, answer consistency, answer verifiability, and downstream utility for QA pairs and their related content.	-
F1Scorer🚀	QA Scoring	Assesses the verifiability of answers with and without the presence of gold documents in QA tasks.	-

Processing Operators

Processing Operators are mainly tasked with choosing suitable data.

Name	Application Type	Description	Official Repository or Paper
ContentChooser🚀	Content chooser	Selects a subset of content from a larger collection for further processing within the pipeline.	-

Operator Interface Usage Instructions

Specifically, for operators that specify storage paths or call models, we provide encapsulated model interfaces and storage object interfaces. You can predefine model API parameters for operators in the following way:

from dataflow.llmserving import APILLMServing_request

api_llm_serving = APILLMServing_request(
                api_url="your_api_url",
                model_name="model_name",
                max_workers=5
        )

You can predefine storage parameters for operators in the following way:

from dataflow.utils.storage import FileStorage

 self.storage = FileStorage(
            first_entry_file_name="your_file_path",
            cache_path="./cache",
            file_name_prefix="dataflow_cache_step",
            cache_type="json", # jsonl, json, ...
        )

The api_llm_serving and self.storage used in the following text are the interface objects defined here. Complete usage examples can be found in test/test_agentic_rag.py.

For parameter passing, the constructor of operator objects mainly passes information related to operator configuration, which can be configured once and called multiple times; while the X.run() function passes key information related to IO. Details can be seen in the operator description examples below.

Detailed Operator Descriptions

Data Generation Operators

1. AutoPromptGenerator

Function Description: This operator is specifically designed to generate specialized prompts for creating question-and-answer pairs based on given text content.

Input Parameters:

__init__()
- llm_serving: Large language model interface object to use (default: predefined value above)
run()
- storage: Storage interface object (default: predefined value above)
- input_key: Input text content field name (default: "text")
- output_key: Output generated prompt field name (default: "generated_prompt")

Key Features:

Supports multiple types of text contents
Automatically generates suitable prompts

Usage Example:

prompt_generator = AutoPromptGenerator(api_llm_serving)
result = prompt_generator.run(
            storage = self.storage.step(),
            input_key = "text",
            output_key = "generated_prompt"
        )

2. AtomicTaskGenerator

Function Description: This operator is used to generate appropriate high-quality questions and verifiable answers for the provided text content.

Input Parameters:

__init__()
- llm_serving: Large language model interface object to use (default: predefined value above)
run()
- storage: Storage interface object (default: predefined value above)
- input_key: Field name of the input text content (default: "prompts")
- output_question_key: Field name for the output question (default: "question")
- output_answer_key: Field name for the output answer (default: "answer")
- output_refined_answer_key: Field name for the output refined answer (default: "refined_answer")
- output_optional_answer_key: Field name for the output optional refined answer (default: "optional_answer")
- output_golden_doc_answer_key: Field name for the output answer based on gold documents (default: "golden_doc_answer")

Key Features:

Supports various types of text content
Capable of generating appropriate question-answer pairs
Generates verifiable answers and alternative answers

Usage Example:

atomic_task_gen = AtomicTaskGenerator(llm_serving=api_llm_serving)
result = atomic_task_gen.run(
    storage = self.storage.step(),
    input_key = "text",
)

3. QAGenerator

Function Description: This operator generates a pair of question and answer for a special content.

Input Parameters:

__init__()
- llm_serving: Large language model interface object to use (default: predefined value above)
run()
- storage: Storage interface object (default: predefined value above)
- input_key: Input text content field name (default: "text")
- prompt_key: Output answer field name (default: "generated_prompt")
- output_quesion_key: Output answer field name (default: "generated_question")
- output_answer_key: Output answer field name (default: "generated_answer")

Key Features:

Supports multiple types of text contents
Generates suitable pairs of questions and answers

Usage Example:

qa_gen = QAGenerator(llm_serving=api_llm_serving)
result = qa_gen.run(
            storage = self.storage.step(),
            input_key="text",
            prompt_key="generated_prompt",
            output_quesion_key="generated_question",
            output_answer_key="generated_answer"
          )

4. WidthQAGenerator

Function Description: This operator is used to combine two QA pairs and generate a new question.

Input Parameters:

__init__()
- llm_serving: Large language model interface object to use (default: predefined value above)
run()
- storage: Storage interface object (default: predefined value above)
- input_question_key: Field name for the input question (default: "question")
- input_identifier_key: Field name for the input identifier (default: "identifier")
- input_answer_key: Field name for the input answer (default: "answer")
- output_question_key: Field name for the output question (default: "generated_width_task")

Key Features:

Combines two QA pairs to generate a more complex new question.

Usage Example:

width_qa_gen = WidthQAGenerator(llm_serving=api_llm_serving)
result = width_qa_gen.run(
    storage = self.storage.step(),
    input_question_key = "question",
    input_identifier_key = "identifier",
    input_answer_key = "refined_answer"
)

5. DepthQAGenerator

Function Description: This operator is used to generate deeper questions based on existing QA pairs.

Input Parameters:

__init__()
- llm_serving: Large language model interface object to use (default: predefined value above)
run()
- storage: Storage interface object (default: predefined value above)
- input_key: Field name for the input (default: "question")
- output_key: Field name for the output (default: "depth_question")

Key Features:

Generates deeper questions based on existing QA pairs

Usage Example:

depth_qa_gen = DepthQAGenerator(llm_serving=api_llm_serving)
result = depth_qa_gen.run(
    storage = self.storage.step(),
    input_key = "question",
    output_key = "depth_question"
)

Data Evaluation Operators

1. QAScorer

Function Description: This operator generates multiple evaluation scores for the produced question-and-answer pairs.

Input Parameters:

__init__()
- llm_serving: Large language model interface object to use (default: predefined value above)
run()
- storage: Storage interface object (default: predefined value above)
- input_question_key: Input text content field name containing the generated questions (default: "generated_question")
- input_answer_key: Input text content field name containing the generated answers (default: "generated_answer")
- output_question_quality_key: Output field name for question quality grades (default: "question_quality_grades")
- output_question_quality_feedback_key: Output field name for detailed feedback on question quality (default: "question_quality_feedbacks")
- output_answer_alignment_key: Output field name for answer alignment grades (default: "answer_alignment_grades")
- output_answer_alignment_feedback_key: Output field name for detailed feedback on answer alignment (default: "answer_alignment_feedbacks")
- output_answer_verifiability_key: Output field name for answer verifiability grades (default: "answer_verifiability_grades")
- output_answer_verifiability_feedback_key: Output field name for detailed feedback on answer verifiability (default: "answer_verifiability_feedbacks")
- output_downstream_value_key: Output field name for downstream value grades (default: "downstream_value_grades")
- output_downstream_value_feedback_key: Output field name for detailed feedback on downstream value (default: "downstream_value_feedbacks")

Key Features:

Generates multiple useful scores for further filtering

Usage Example:

qa_scorer = QAScorer(llm_serving=api_llm_serving)
result = qa_scorer.run(
            storage = self.storage.step(),
            input_question_key="generated_question",
            input_answer_key="generated_answer",
            output_question_quality_key="question_quality_grades",
            output_question_quality_feedback_key="question_quality_feedbacks",
            output_answer_alignment_key="answer_alignment_grades",
            output_answer_alignment_feedback_key="answer_alignment_feedbacks",
            output_answer_verifiability_key="answer_verifiability_grades",
          )

2. F1Scorer

Function Description: This operator is used to evaluate the verifiability of QA tasks with and without support from gold documents.

Input Parameters:

__init__()
- llm_serving: Large language model interface object to use (default: predefined value above)
run()
- storage: Storage interface object (default: predefined value above)
- prediction_key: Field name for the input prediction (default: "refined_answer")
- ground_truth_key: Field name for the input ground truth answer (default: "golden_doc_answer")
- output_key: Field name for the output QA quality score (default: "F1Score")

Key Features:

Generates verifiability evaluation results with and without gold document support, facilitating subsequent filtering.

Usage Example:

f1_scorer = F1Scorer(llm_serving=api_llm_serving)
result = f1_scorer.run(
    storage = self.storage.step(),
    prediction_key = "refined_answer",
    ground_truth_key = "golden_doc_answer",
    output_key = "F1Score",
)

Processing Operators

1. ContentChooser

Function Description: This operator identifies and selects representative text content from a set of text contexts.

Input Parameters:

init()
- num_samples: Numuber of choosen samples
- method: The method used to select from the original text contents (default: 'random')
- embedding_server: The server to generate embeddings for text contents
run()
- storage: Storage interface object (default: predefined value above)
- input_key: Input text content field name (default: "text")

Key Features:

Supports random choose and kmean choose
Supports a lot of embedding models

Usage Example:

embedding_serving = LocalModelLLMServing_vllm(hf_model_name_or_path="your_embedding_model_path", vllm_max_tokens=8192)

content_chooser = ContentChooser(num_samples = 5, method = "kcenter", embedding_serving=embedding_serving)
result = content_chooser.run(
            storage = self.storage.step(),
            input_key = "text",
          )