假设我有一个pandas数据框并应用sklearn.model_selection.train_test_split参数random_seed设置为 1。
假设我然后采用完全相同的pandas数据框并创建一个带有SQLContext. 如果我在参数设置为 1 的情况下应用 PySparkrandomSplit函数seed,是否总是能保证获得相同的精确分割?
假设我有一个pandas数据框并应用sklearn.model_selection.train_test_split参数random_seed设置为 1。
假设我然后采用完全相同的pandas数据框并创建一个带有SQLContext. 如果我在参数设置为 1 的情况下应用 PySparkrandomSplit函数seed,是否总是能保证获得相同的精确分割?