基本上,我想确定数据集中的缺失值是否连续重复。如果数据集中有无数重复的缺失值,我想知道每个连续重复的缺失值集的长度是否高于某个数字。
例如:
data =['1', '0', '9', '31', '11', '12', 'nan', '10', '44', '53', '12', '66', '99', '3', '2', '6.75833',....., 'nan', 'nan', 'nan', '3', '7', 'nan', 'nan']
在data
上面,总数'nan'
为 6,可以用 来计算data.count('nan')
。但是,我想知道的是缺失值可以连续重复多少。对于这个数据,答案是 3。
很抱歉我没有展示我的示例代码,但我在这方面是一个非常新手,我对编码一无所知。
任何想法、帮助或提示将不胜感激。