问题标签 [random-data]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
94 浏览

python - 随机化 DataFrame 行

如果创建一个 DataFrame 对象,可以说df = pd.DataFrame({'A':range(5), 'B':range(5)},并尝试随机化一些行,df.reindex(np.random.permutation(df.index))我得到

Numpy 版本是 1.15.0

熊猫版本是 0.23.3

知道为什么它只是混合索引而不是整行吗?

0 投票
1 回答
29 浏览

r - 在 R 中生成 3.000.000 个长度为 11 的字符串

显然,如果我尝试这个:

R 会说 NOPE,对不起:

我应该购买更多 RAM* 吗?

*这是一个笑话,但我非常感谢任何帮助!

编辑:所需的输出是 20 个变量和 3x10^6 行的数据框。一些列/变量应该是字符串,一些整数。长度范围从 2 到 12。

0 投票
1 回答
174 浏览

java - 无法使用 mockneat 将 MockUnit 转换为 String

尝试在library 的帮助下使用我自己的Enum喜欢。但问题是我无法从对象中获取正确的开关循环工作的价值。mockmockneatstringMockUnit

这是我的Enum

这是我的Build课,我尝试使用以下自定义值SubType

}

主要目标是,根据subtype字段中的字符串,输出相应的json文件

更新:

Json我要生成的最终文件:

另一种情况:

即使localId是类中的一个final字段,当有东西引用它时,它每次都会给出随机值。不明白这有什么问题。。

0 投票
1 回答
276 浏览

python - 从分布生成随机字节数组

我正在寻找一种方法来生成从指定的底层分布中采样的随机字节。例如,从具有给定均值和方差的正态分布生成的字节,从具有指定 lambda 的泊松分布生成的字节等等。

我已经使用numpy.random.bytes(...)了文档提到的,它生成随机字节,我认为这些字节是从均匀分布中采样的。但是,我想要一个基于 numpy 的代码片段来从可能列出的任何指定分布中生成指定数量的字节numpy 采样分布

0 投票
1 回答
215 浏览

duplicates - Duplicate Primary Key when Generating Data with Talend

I'm creating a job in Talend where I have to generate files containing data generated with tRowGenerator along with other sources : SQL Server database and delimited files.

enter image description here

The issue is that I have duplicated files with the same primary key. All i want to get is 100 records(420 rows) : For each Random UUID generated i shall get 42 rows and so on, but instead i'm getting the same row 10 times(it's duplicated 10 times)

enter image description here

I'm getting data from 3 sources as shown below: enter image description here

To get this fields in my output file: enter image description here enter image description here

0 投票
2 回答
53 浏览

r - 如何在R中构建不同年份的随机数据集?

下面的代码将在 2009 年的每日时间步长上生成均匀分布的数据。假设我想构建一个类似的数据集,其中包括 2009、2012、2015 和 2019 年,我该怎么做?我基本上是在尝试避免重复代码或使用过滤器来获取感兴趣的年份的数据。

0 投票
0 回答
22 浏览

geolocation - Faker - 重复的地理位置

我正在使用 Faker ( https://pypi.org/project/Faker/ ) 生成虚假用户数据。美国境内似乎只有大约 200 个独特的地理位置。

如何获得更大、更真实的数据集(10'000 多个位置)?有一些扩展吗?在这种情况下我可以使用其他服务吗?