我有一个带有模式的数据集,
BIKE_ID | REGN_NUMBER | ENGINE_NUMBER | 车架号 | BUYED_YEAR |
---|---|---|---|---|
1 | XN67TY567 | 34567ABGN65 | 145089 | 2011 |
2 | XN67TM567 | 34567ABGT65 | 145085 | 2011 |
3 | XN67TM569 | 34567VBGT65 | 1450867 | 2013 |
. | . | . | . | . |
. | . | . | . | . |
2870763 | XN56RTMN | 34786VHGT65 | 14501236 | 2016 年 |
现在我想生成从 28,70,764 到大约 3,28,70,764 的数据,即生成大约 3000 万行 ,以便在 pandas 中我们可以使用以下方法。
val = 2870764
df3['POLICY_ID'] = range(val ,val+30000000)
但由于它是大熊猫无法生成的大量数据,所以有什么方法可以通过在 Vaex 中解决这个问题。
但是 Vaex 给我一个错误 ValueError: range(2870764, 5870764) is not of string or Expression type, but <class 'range'>
那么,任何人都可以建议我是否可以在Vaex中这样做。