我正在尝试为我的数据集创建标签,该数据集只是一个包含 20_000 行文本的 csv 文件。我使用了以下方法,但创建所有结果大约需要 15 分钟。期望的结果是
“这是一个非常糟糕的产品”,generated_label_with_confidence_score
import pandas as pd
import flair
from flair.models import TextClassifier
from flair.data import Sentence
import numba
import tqdm
import numpy as np
#@numba.jit
def predict_label(text):
sentence = Sentence(text)
classifier.predict(sentence)
# print sentence with predicted labels
return sentence.labels
for index, row in tqdm.tqdm(df_train.iterrows()):
df_train.iloc[index, 1] = predict_label(df_train.iloc[index,0])