问题标签 [entropy]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c - /dev/random 不阻塞
我正在尝试从 /dev/random 收集真正的随机数。这是我的简单代码:
正如你所看到的,我要求 100 个随机字节,但是当我运行这个程序时,我总是在 15 到 30 范围内的变量nbr中得到输出,这是可以理解的,因为 /dev/random 并不总是有足够的熵,但我的期望是在 read() 时,/dev/random 应该阻塞,直到它将我的缓冲区填充到 100 个随机字节,这在这种情况下不会发生并且程序不会阻塞。我阅读了 /dev/random 的手册页。它说
当熵池为空时,来自 /dev/random 的读取将被阻塞,直到收集到额外的环境噪声。
这是否真的意味着 /dev/random 只会在熵池为空时阻塞,并且在它有任何数量的数据时不会阻塞,无论它是否小于所需的字节?
任何帮助,将不胜感激。
compiler-construction - Fortran if 语句错误
我有一个程序应该告诉用户他们输入的温度是否绝对为零。如果确实是这样,那么他们应该看到“对你来说没有熵”,如果它更大,那么它应该告诉他们它们在 a0 之上有多远,但是我不断收到消息说我的 if 语句有错误,并且不知道在哪里首先,有人可以帮我吗?
sql - SQL Server 2008 GUID 生成
可能重复:
如何在 SQL Server 中生成 GUID?
我想知道 SQL Server 2008 GUID 是如何生成的?熵位
algorithm - 熵解码器。从数据中提取未知数量的编码系数
我需要使用以下算法从流中读取数据:
-从流中计算所有连续的设置位(“1”)。
- 然后,从流中读取更多位。K 是可变的,并且在整个程序中都会发生变化。让我们将读取的数据称为“m”
解码后的数字是
这个算法被执行了很多次。正因为如此,这段代码尽可能快是至关重要的。
主要问题是 1 字节、2 字节、4 字节等集合中的编码数字的数量是可变的,因此一个简单的实现(我现在脑子里只有一个)需要一个读取单字节的循环来自流的位。在最坏的情况下,对于一个编码系数,我在循环中进行了 14 次迭代。
我能以某种方式避免这个循环吗?
security - 从密码中排除特殊字符有什么好处吗?
最近,我在设置密码时遇到了两条奇怪的错误消息,一条在Chipolte 移动订购应用程序上,另一条在金融服务门户上。在这两种情况下,我都无法设置密码,因为它包含非字母数字字符。金融服务网站还规定了一个我认为相当奇怪的最大长度(密码不能超过 8 个字符,似乎非常短视)。我想知道对于防止某些字符的密码策略是否有任何安全理由。
java - 表示决策树归纳的数据结构
目前,我参与了一些与数据挖掘相关的项目。而且,我必须使用以 GINIsplit 作为分割标准的决策树归纳,将给定的数据集(.csv 格式)分类为不同的类。所有这些我一直在 java 平台上做的,没有使用任何工具,例如 WEKA、ORANGE...等。
我的查询是-什么是表示决策树的最佳数据结构,以便分类快速有效?而且,如果属性是名义的、数字的或有序的,是否有任何针对属性的优化技术,我的意思是,具体的技术?
提前致谢!
token - 散列的 uuid4 是一个好的 csrf 令牌吗?
这是一个好的 csrf 令牌吗?它是否有足够的熵,或者是否有一些容易猜到并且可以减少熵的部分,比如请求的时间?
一个示例 python 实现将 b
.net - 使用鼠标移动和击键来生成加密熵(如在 MEGA 上所见)
我有兴趣从 .NET 中的鼠标移动和击键生成熵(出于加密目的,这可能是在通过应用程序本身的事件接收鼠标移动和击键数据的 Forms 应用程序中,也可能是在 Web 应用程序中鼠标移动和击键数据使用 JavaScript 记录并通过 Ajax 发送到服务器。
该技术目前正在新的 MEGA 站点上使用。
我自己做了一些研究,发现了一个看起来像 C++ 的好例子,但它有点超出了我的 C/C++ 知识。
如果有人可以阐明如何通过 .NET(C# 或 VB.Net 很好)来实现这一点,那将是最有帮助的。
提前致谢。
克里斯
statistics - 压缩/加密数据中的熵和字节分布比较
我有一个问题困扰了我一段时间。
熵测试通常用于识别加密数据。当分析数据的字节均匀分布时,熵达到最大值。熵测试识别加密数据,因为该数据具有均匀分布 - 就像压缩数据一样,在使用熵测试时被归类为加密。
示例:一些 JPG 文件的熵是 7,9961532 Bits/Byte,一些 TrueCrypt 容器的熵是 7,9998857。这意味着通过熵测试,我无法检测到加密数据和压缩数据之间的差异。但是:正如您在第一张图片上看到的那样,显然 JPG 文件的字节不是均匀分布的(至少不像来自 truecrypt-container 的字节那样均匀)。
另一个测试可以是频率分析。测量每个字节的分布,例如执行卡方检验以将分布与假设分布进行比较。结果,我得到了一个 p 值。当我对 JPG 和 TrueCrypt 数据执行此测试时,结果不同。
JPG 文件的 p-Value 为 0,这意味着从统计上看分布不均匀。TrueCrypt 文件的 p 值为 0,95,这意味着分布几乎完全均匀。
我现在的问题是:有人能告诉我为什么熵测试会产生这样的误报吗?是表示信息内容的单位的比例(每字节的位数)吗?例如,p 值是否是一个更好的“单位”,因为规模更小?
非常感谢你们的任何回答/想法!
编辑:不幸的是我不能发布图片,因为我还没有获得 10 名声望 :(