我使用 svm light 文件作为稀疏矩阵的存储。
测试表明,对于具有 570601944 个条目的 31700108x54070 矩阵
import xgboost as xgb
dtrain = xgb.DMatrix(train_file)
用了 21 秒,比
from sklearn.datasets import load_svmlight_file
x_train, y_train = load_svmlight_file(train_file)
用了7分钟。
在破解代码之前,任何人都可以帮我回答这个问题吗?
您对提升 load_svmlight_file 功能有什么建议吗?
非常感谢!