TreeinstructSampleEvaluator

433 字约 1 分钟

2025-10-09

📘 概述

TreeinstructSampleEvaluator 是一个指令复杂性评估算子。它通过调用大语言模型（LLM）分析给定指令的语法树结构，并根据语法树的节点数量来量化其复杂性。节点越多，代表指令越复杂。该算子最终会将计算出的复杂性得分追加到数据中。

`init`函数

def __init__(self, llm_serving: LLMServingABC = None):

init参数说明

参数名	类型	默认值	说明
llm_serving	LLMServingABC	None	大语言模型服务实例，用于执行评估。

Prompt模板说明

`run`函数

def run(self, storage: DataFlowStorage, input_instruction_key: str, output_key: str='TreeinstructScore'):

参数

名称	类型	默认值	说明
storage	DataFlowStorage	必需	数据流存储实例，负责读取与写入数据。
input_instruction_key	str	必需	输入列名，对应需要评估复杂性的指令字段。
output_key	str	"TreeinstructScore"	输出列名，对应生成的指令复杂性得分字段。

🧠 示例用法

from dataflow.operators.text_sft.eval import TreeinstructSampleEvaluator
from dataflow.utils.storage import FileStorage
from dataflow.utils.llm_serving import APILLMServing_request

# 准备仅包含指令数据的存储
storage = FileStorage(first_entry_file_name="sft_instructions.jsonl")

# 初始化 LLM 服务
llm_serving = APILLMServing_request(
    api_url="http://<your_llm_api_endpoint>",
    model_name="<your_model_name>",
)

# 初始化并运行评估器
evaluator = TreeinstructSampleEvaluator(llm_serving=llm_serving)
evaluator.run(
    storage.step(),
    input_instruction_key="instruction",
    output_key="TreeinstructScore",
)

🧾 默认输出格式（Output Format）

该算子会读取输入的 DataFrame，并向其中添加一个新的列（默认为 TreeinstructScore）来存储评估结果。

字段	类型	说明
...	...	输入的原始字段。
TreeinstructScore	float	模型生成的指令复杂性得分。

示例输入：

{
  "instruction": "Can you provide a list of healthy habits to maintain a healthy lifestyle? Please format your response as an HTML page with bullet points."
}

示例输出：

{
  "instruction": "Can you provide a list of healthy habits to maintain a healthy lifestyle? Please format your response as an HTML page with bullet points.",
  "TreeinstructScore": 11.0
}

eval

generate

eval

generate

eval

filter

generate

eval

filter

generate

generate

eval

filter

generate

refine

generate

generate

eval

filter

refine

generate

generate

eval

filter

generate

eval

filter

generate

eval

filter

generate

eval

filter

generate

refine

TreeinstructSampleEvaluator