问题标签 [discrete]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 如何放大ggplot2中分类变量的特定范围值?
我只想放大值ford
和数据框中nissan
的x 轴mpg
。
使用的包装:tidyverse
但是使用该coord_cartesian()
功能时出现以下错误:
错误
+coord_cartesian(xlim = c("ford", "nissan"))
:一元运算符的参数无效
python - Tensorflow概率中多项式模型的规范
我正在使用 Tensorflow Probability 中的混合多项式离散选择模型。该函数应在 3 个选项中选择一个输入。选择的替代方案由 CHOSEN(一个 #observationsx3 张量)指定。下面是代码的更新,以反映我在问题上的进展(但问题仍然存在)。
我目前收到错误:
回溯表明问题出在调用 log_prob() 以获取联合分布的最终组件(即 tfp.Independent(tfp.Multinomial(...))
主要组件是(感谢 Padarn Wilson 帮助修复联合分布定义):
computer-science - 如果一个问题 A ≤p B,那么 B ≤p A,证明或反证
如何正式证明或反证如果一个问题 A ≤p B,那么 B ≤p A
我凭直觉认为这应该被反驳,但我不知道该怎么做。
dynamic - 引起未知信号 6
你得到一套金条,你的目标是尽可能多地把金条装进你的包里。每个条形图只有一个副本,对于每个条形图,您可以选择或不接受(因此您不能选择一个条形图的一小部分)。问题描述任务。给定 n 条金条,找出装进一袋容量 W 的最大黄金重量。输入格式。输入的第一行包含一个背包的容量 W 和金条的数量 n。下一行包含 n 个整数 w0,w1,...,wn−1,定义金条的重量。约束。1≤W≤104;1≤n≤300;0 ≤ w0,...,wn−1 ≤ 105。输出格式。输出适合容量为 W 的背包的最大黄金重量。这是我的代码。
我无法弄清楚这个问题的解决方案。非常感谢您在这件事上的任何帮助。TIA。
python - 对非常大的离散值样本数据集进行聚类
我正在尝试聚类(AgglomerativeCluster,kMeans)以下类型的非常大的数据集:
[0, 0, 0, 0, 1, 2, 2, 2, 2, 3, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5]
即重复多次的整数样本。
简而言之,我想通过将样本转换为更短的计数列表来预处理样本:
[(0, 4), (1, 1), (2, 4), (3, 1), (4 , 3), (5, 9)]
然后将其用作聚类的输入。
问:你知道如何使用这样的计数列表作为聚类的输入吗?
我这样做的主要动机是当输入数组的长度超过 50000 时,sklearn.cluster.KMeans 或 sklearn.cluster.AgglomerativeClustering 都会引发异常。我的数据集的长度为数百万。
我已经启动并运行了一个数据压缩阶段,我在其中:
- 种类
- 以相同大小的块分组
- 计算每个块的平均值
然后继续使用平均值列表作为聚类的输入。这行得通。但是,生成的集群显示出对块大小的依赖性,我发现这种选择很难辩护。
我还尝试使用每个值的频率作为权重,这是 sklearn.cluster.KMeans 似乎允许的。但是,我真的在这里猜测这些权重是用来做什么的。
谢谢
r - scale_x_continuous :提供给连续刻度的离散值
我是 R 的初学者。我收到此错误
错误:提供给连续刻度的离散值
当我尝试使用
我得到的情节如下。如您所见,轴需要减少...
我从 csv 文件中获取数据
起初,我虽然这是变量类(数字,因子......)的问题,但即使我转换为数字它也不起作用......
谢谢你的时间!
这是我的代码:
r - 用于变量选择和预测的惩罚多项离散时间竞争风险模型
我在尝试拟合有助于变量选择的惩罚多项式模型时遇到问题。数据包括每学期学生从注册到辍学或完成的表现记录。所以我每个学生都有多个记录,时间是注册的学期。因此,一个在 3 个学期后辍学的学生,其时间记录为 1、2 和 3。数据还包含有关学生的信息,例如性别、学生在特定学期是否感知到经济援助以及其他时变变量和一些固定变量。基本上它是一个离散时间竞争的生存模型。但是,由于简单的多项分布不做变量选择,我想知道是否有人可以帮助我提供一些可以解决这个问题的 R 代码或资源。
谢谢
statistics - n 个相关伯努利变量的分布是什么?
对于独立的伯努利 X_1, X_2, ..., X_n,最大分布为
Y=max{X_1,X_2,⋯,X_n }~Bernoulli(1-∏_(i=1)^n▒(1-p_i ) )
但是对于相关伯努利,最大分布是多少?有什么建议吗?非常感谢。
optimization - 在python中解决非线性装箱优化问题
有没有一种直接的方法(例如一些带有常用求解器的模块)来解决python中众所周知的装箱问题(例如参见https://en.wikipedia.org/wiki/Bin_packing_problem )衍生的问题?
详细地说,装箱问题,其中 s(i) 是物品的重量
应扩展到以下目标函数 K_nonlinear
因此,不仅要最小化使用的 bin 数量,而且还要最小化共享一个 bin 的选定项目的标准偏差(这通常会导致一些必要的折衷)。因此,在我看来,这个问题变得非线性。
我很感谢任何关于如何使用 python 来解决这个问题的建议(python api 就足够了,算法本身也可以用任何其他语言实现)。
到目前为止,我已经尝试扩展现有的装箱求解器(基于 Coin-or 分支和切割求解器)关于目标函数中的附加部分,但失败了。这大概是由于诱导的非线性。
提前谢谢了