问题标签 [scipy]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 使用 scipy 计算矩阵排名
我想使用 scipy 计算矩阵的数学秩。最明显的函数numpy.rank
计算数组的维数(即标量的维数为 0,向量为 1,矩阵为 2,等等)。我知道该numpy.linalg.lstsq
模块具有此功能,但我想知道这样的基本操作是否内置在某处的矩阵类中。
这是一个明确的例子:
这给出2
了我正在寻找答案的维度3
。
python - 数组的连续、重叠子集(NumPy、Python)
我有一个NumPy数组[1,2,3,4,5,6,7,8,9,10,11,12,13,14]
,并且想要一个结构类似于[[1,2,3,4], [2,3,4,5], [3,4,5,6], ..., [11,12,13,14]]
.
当然,这可以通过循环大数组并将长度为 4 的数组添加到新数组中来实现,但我很好奇是否有一些秘密的“魔术”Python 方法可以做到这一点:)
python - 使用 numpy.apply
这段代码有什么问题?
有任何想法吗?
python - Scipy稀疏...数组?
所以,我正在使用非常稀疏的 numpy 数组进行一些 Kmeans 分类 - 很多很多零。我想我会使用 scipy 的“稀疏”包来减少存储开销,但我对如何创建数组而不是矩阵有点困惑。
我已经阅读了有关如何创建稀疏矩阵的教程: http ://www.scipy.org/SciPy_Tutorial#head-c60163f2fd2bab79edd94be43682414f18b90df7
为了模拟一个数组,我只创建了一个 1xN 矩阵,但正如您可能猜到的那样,Asp.dot(Bsp) 并不能很好地工作,因为您不能将两个 1xN 矩阵相乘。我必须将每个数组转置为 Nx1,这很蹩脚,因为我会为每个点积计算都这样做。
接下来,我尝试创建一个 NxN 矩阵,其中第 1 列 == 第 1 行(这样您可以将两个矩阵相乘并将左上角作为点积),但结果证明效率非常低。
我很想使用 scipy 的 sparse 包作为 numpy 的 array() 的神奇替代品,但到目前为止,我还不确定该怎么做。
有什么建议吗?
python - Scipy.cluster.hierarchy.fclusterdata + 距离测量
1)我正在使用 scipy 的 hcluster 模块。
所以我可以控制的变量是阈值变量。我如何知道每个阈值的表现?即在 Kmeans 中,这个性能将是所有点到它们的质心的总和。当然,这必须进行调整,因为通常更多的集群 = 更小的距离。
有没有我可以用 hcluster 做的观察?
2)我意识到有大量可用于 fclusterdata 的指标。我正在基于关键术语的 tf-idf 对文本文档进行聚类。交易是,一些文档比其他文档长,我认为余弦是“规范化”这个长度问题的好方法,因为文档越长,它在 n 维字段中的“方向”应该保持不变,如果他们内容一致。有人可以建议其他方法吗?我该如何评价?
谢谢
python - 使用 sunperf atlas 库编译 numpy
我想在编译 scipy 和 numpy 时使用 sunperf 库。我尝试使用似乎从 SUNPERF 库中检查的 setupscons.py,但它没有识别出我的位置:这是 /pkg/linux/SS12/sunstudio12.1 的列表(这就是 sunperf 库所在的位置):
我尝试在sites.cfg 中指定此目录,但仍然出现以下错误:
任何帮助表示赞赏
python - scipy.sparse 矩阵中的 csr_matrix 中的非零值
scipy 库的 csr_matrix 有一个 nonzero() 方法,但是根据应该返回包含行和列数组的元组的手册,尝试将该函数用于 csr 矩阵会导致错误。关于这个问题的任何想法?
最好的问候,乌姆特
python - Scipy负距离?什么?
我有一个输入文件,其中包含小数点后 4 位的浮点数:
(第一个是id)。我的班级使用将loadVectorsFromFile
其乘以 10000 然后是int()
这些数字的方法。最重要的是,我还循环遍历每个向量以确保内部没有负值。但是,当我执行时_hclustering
,我不断看到错误"Linkage
Z contains negative values"
。
我认真地认为这是一个错误,因为:
- 我检查了我的价值观,
- 这些值没有足够小或足够大以接近浮点数的限制,并且
- 我用来导出文件中值的公式使用绝对值(我的输入绝对正确)。
有人可以让我了解为什么我会看到这个奇怪的错误吗?是什么导致了这个负距离误差?
=====
python - 在 Windows 32 位上编译 scipy:libf77blas.a 的链接器错误
有没有人尝试在 Windows 上使用 numpy-1.3.0 编译 SciPy 0.7.1,该 numpy-1.3.0 是使用安装文档中链接的预构建 ATLAS 库 ( atlas3.6.0_WinNT_P4SSE2.zip
)构建的。
我收到以下链接器错误,并且不知道如何解决此问题。
有谁知道这里可能出了什么问题?例如,在 libf77blas.a 中寻找ATL_daxpy
会导致:
有_ATL_daxpy
,但没有ATL_daxpy
。
python - 使用 numpy/scipy 在 python 中均匀有效地采样整数
我有一个问题,根据随机硬币翻转的结果,我必须从字符串中采样一个随机起始位置。如果这个随机位置的采样在字符串上是统一的,我想到了两种方法来做到这一点:一种使用 numpy.random 中的多项式,另一种使用 Python 标准库的简单 randint 函数。我对此进行了如下测试:
输出是:
多项式耗时:6.58072400093 秒兰德耗时:2.35189199448 秒
randint 似乎更快,但对我来说似乎仍然很慢。有没有一种矢量化的方法可以使用 numpy 或 scipy 让它变得更快?
谢谢。