我有一组数据,我想知道这个数据集是否有逻辑分布。当我制作我的数据集的直方图时(请参阅http://imageshack.us/photo/my-images/593/histogram.png/上的直方图),它似乎有一个逻辑分布,但可以肯定的是我会喜欢在 R 中测试逻辑分布。所以我的问题是:有没有办法测试你的数据的逻辑分布,你是如何做到的?
附加信息:数据集由 8544 个项目组成。数据是 2 个地理点之间的水平距离,以千米为单位。
感谢您的关注
桑德
我有一组数据,我想知道这个数据集是否有逻辑分布。当我制作我的数据集的直方图时(请参阅http://imageshack.us/photo/my-images/593/histogram.png/上的直方图),它似乎有一个逻辑分布,但可以肯定的是我会喜欢在 R 中测试逻辑分布。所以我的问题是:有没有办法测试你的数据的逻辑分布,你是如何做到的?
附加信息:数据集由 8544 个项目组成。数据是 2 个地理点之间的水平距离,以千米为单位。
感谢您的关注
桑德
在 R 中,您可以使用ks.test
orchisq.test
函数(可能还有其他函数)来测试假设分布。请注意,这些测试(和其他测试)都是排除测试,不显着的结果并不能保证数据来自给定的分布,只是您不能排除它。另请注意,对于 8544 的样本量,这些测试可能会被压倒,这意味着它将有能力找到微小的无意义差异,并且即使它“足够接近”,您也可能会拒绝原假设。此外,您根据首先查看数据来决定分布这一事实可能会使结果产生偏差。
如果逻辑分布“足够接近”而不是精确分布,另一种方法可能会让您更好地感受,是使用vis.test
TeachingDemos 包中的函数(请务必阅读帮助页面中引用的论文以了解测试和假设你正在制作)。
最重要的是理解导致数据的科学,逻辑分布在科学上有意义吗?还有哪些其他分布可能是合理的?还要了解您试图用数据回答什么问题以及对分布的这些答案有什么影响(例如,CLT 将允许您使用正态来回答一些问题,但不能使用正态分布来回答其他问题,甚至虽然数据来自物流或类似的东西)。