假设我有一个pandas
数据框并应用sklearn.model_selection.train_test_split
参数random_seed
设置为 1。
假设我然后采用完全相同的pandas
数据框并创建一个带有SQLContext
. 如果我在参数设置为 1 的情况下应用 PySparkrandomSplit
函数seed
,是否总是能保证获得相同的精确分割?
假设我有一个pandas
数据框并应用sklearn.model_selection.train_test_split
参数random_seed
设置为 1。
假设我然后采用完全相同的pandas
数据框并创建一个带有SQLContext
. 如果我在参数设置为 1 的情况下应用 PySparkrandomSplit
函数seed
,是否总是能保证获得相同的精确分割?