问题标签 [entropy]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
17 回答
155614 浏览

java - 如何处理缓慢的 SecureRandom 生成器?

如果你想在 Java 中使用加密的强随机数,你可以使用SecureRandom. 不幸的是,SecureRandom可能会很慢。如果它/dev/random在 Linux 上使用,它可以阻止等待足够的熵建立。如何避免性能损失?

有没有人用Uncommon Maths来解决这个问题?

谁能确认这个性能问题已经在 J​​DK 6 中解决了?

0 投票
15 回答
5040 浏览

theory - 替代熵源

好的,我想这完全是主观的,但我正在考虑随机数生成器的熵源。大多数生成器都是以当前时间播种的,对吗?好吧,我很好奇还有哪些其他来源可以用来生成完全有效的随机(松散定义)数字。

使用多个源(例如时间 + 当前 HDD 寻道时间 [我们在这里太棒了])一起创建一个比单个源“更随机”的数字吗?来源数量的逻辑限制是什么?多少才真正够?仅仅因为方便才选择时间吗?

如果不允许这种事情,请原谅,但我对来源背后的理论感到好奇。

0 投票
15 回答
58850 浏览

computer-science - 熵的计算机科学定义是什么?

我最近在我的大学开设了一门数据压缩课程。然而,我发现“熵”这个词在计算机科学中的使用相当含糊。据我所知,它粗略地转化为系统或结构的“随机性”。

计算机科学“熵”的正确定义是什么?

0 投票
2 回答
627 浏览

statistics - 混淆矩阵的信息标准

可以使用Akaike 信息准则 (AIC)来衡量统计模型的拟合优度,该准则说明了拟合优度和用于模型创建的参数数量。AIC 涉及计算该模型 ( L )的似然函数的最大值。给定分类模型的预测结果,如何计算L,表示为混淆矩阵?

0 投票
4 回答
4384 浏览

compression - 香农熵公式。帮助我的困惑

我对熵公式的理解是它用于计算表示某些数据所需的最小位数。它通常在定义时措辞不同,但之前的理解是我直到现在所依赖的。

这是我的问题。假设我有一个 100 '1' 后跟 100 '0' = 200 位的序列。字母表是{0,1},熵的底是2。符号“0”的概率是0.5,“1”是0.5。所以熵是 1 或 1 位来表示 1 位。

但是,您可以使用类似 100 / 1 / 100 / 0 的方式对其进行游程长度编码,其中输出的位数后跟位。似乎我的表示小于数据。特别是如果您将 100 增加到更大的数字。

我目前正在使用:http ://en.wikipedia.org/wiki/Information_entropy作为参考。我哪里做错了?是分配给符号的概率吗?我不认为这是错的。还是我把压缩和熵之间的联系弄错了?还要别的吗?

谢谢。

编辑

我的后续回答是:您会将熵公式应用于消息的特定实例以尝试找出其信息内容吗?接受消息“aaab”并说熵是~0.811是否有效。如果是,那么 1...10....0 的熵是多少,其中 1 和 0 使用熵公式重复 n 次。答案是1?

是的,我了解您正在创建输入符号的随机变量,并根据您的消息猜测概率质量函数。我要确认的是熵公式没有考虑消息中符号的位置。

0 投票
1 回答
484 浏览

binary - 二进制流的熵编码

我想压缩二进制流。我知道在每个“1”之后找到“0”的概率更高,在每个“0”之后找到“1”的概率更高。我应该如何编码?我在考虑赖斯代码,但我没有到目前为止......提前感谢您的任何回复。

0 投票
4 回答
615 浏览

random - 是否存在用于根据用户输入构建熵池的软件?

出于某些目的,能够绕过任何类型的算法生成的随机数以支持自然输入(例如掷骰子)会很好。例如,加密密钥生成让我觉得需要足够少的随机数据,并且数据真正随机的要求足够高,这可能是一个可行且理想的事情。

所以在我动手之前我想知道的是:是否有任何软件可以直接从随机数字输入构建熵池?请注意,仅仅将事物从基数 r 转换为基数 2 是不够的;例如,因为 3 和 2 是相对素数,所以将基数 3(或基数 6)数字转换为二进制数字同时保持原始输入中的最大熵并不完全简单。

0 投票
4 回答
1155 浏览

iphone - 有没有人尝试过任何 SQLite3 包装器 API 来简化 iPhone 上的数据库功能?

来自非 SQL 背景,过去几天我一直很难吸收 SQLite3。有没有人使用任何 SQLite3 包装器 API 获得任何好的结果?它们工作可靠吗?哪个最好?我还听到有关 Core Data 即将登陆 iPhone 的传闻。不确定这些信息是否值得信赖,但也许你们中的一些人知道:在某个时候会有适用于 iPhone 的 Core Data 吗?

0 投票
1 回答
216 浏览

entropy - 数字的哪一部分有更多的熵?

给定来自某个来源的序列 pf 数字N1 , N2 , N3...,而不是 PRNG,而是说传感器或某种类型的记录数据,假设这样处理它是否安全

Nn/ B = Qn Rem Mn

会导致序列Q的熵比序列少M吗?

注意:假设B两者QM具有相同大小的范围。


这与观察到大多数现实世界的数据集,无论来源或来源,都具有对数分布有关;以 1 开头的数字比以 9 开​​头的数字更常见。但这对低阶部分几乎没有说明。

用一种有趣的方式来测试这个(并通过让他的计算机陷入困境来惹恼你的系统管理员)在 bash 中运行它:

并获取文件大小第一位的直方图。

0 投票
12 回答
67178 浏览

algorithm - 如何计算文件的熵?

如何计算文件的熵?(或者我们只是说一堆字节)
我有一个想法,但我不确定它在数学上是否正确。

我的想法如下:

  • 创建一个包含 256 个整数(全为零)的数组。
  • 遍历文件并为其每个字节
    增加数组中的相应位置。
  • 最后:计算数组的“平均值”。
  • 用零初始化一个计数器,
    并且对于数组的每个条目:
    将条目的差异添加到计数器的“平均值”中。

好吧,现在我被困住了。如何“投影”计数器结果以使所有结果都介于 0.0 和 1.0 之间?但我敢肯定,无论如何,这个想法是不一致的......

我希望有人有更好更简单的解决方案?

注意:我需要对文件的内容做出假设:(
纯文本、标记、压缩或一些二进制文件,...)