我想使用 Keras 的序列模型来预测序列。我的数据框包含字符串数据,因此我决定使用LabelEncoder
sklearn 库对字符串数据进行编码。
我试过这个代码片段:
import pandas as pd
df = pd.read_csv("sample-03.csv")
from sklearn.preprocessing import LabelEncoder
df.apply(LabelEncoder().fit_transform)
给出这个结果:
此标签编码适用于具有不同值的每一列,即我需要将http://example.com/296表示为整个数据集的“2”。我将不胜感激提出解决方案。
我还尝试将数据集转换为元组并为此数据集使用字典,但对于不同列中的相同值,该键再次不是唯一的。