问题标签 [scipy]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
7 回答
37484 浏览

python - 使用 scipy 计算矩阵排名

我想使用 scipy 计算矩阵的数学秩。最明显的函数numpy.rank计算数组的维数(即标量的维数为 0,向量为 1,矩阵为 2,等等)。我知道该numpy.linalg.lstsq模块具有此功能,但我想知道这样的基本操作是否内置在某处的矩阵类中。

这是一个明确的例子:

这给出2了我正在寻找答案的维度3

0 投票
7 回答
10823 浏览

python - 数组的连续、重叠子集(NumPy、Python)

我有一个NumPy数组[1,2,3,4,5,6,7,8,9,10,11,12,13,14],并且想要一个结构类似于[[1,2,3,4], [2,3,4,5], [3,4,5,6], ..., [11,12,13,14]].

当然,这可以通过循环大数组并将长度为 4 的数组添加到新数组中来实现,但我很好奇是否有一些秘密的“魔术”Python 方法可以做到这一点:)

0 投票
1 回答
5348 浏览

python - 使用 numpy.apply

这段代码有什么问题?

有任何想法吗?

0 投票
3 回答
36543 浏览

python - Scipy稀疏...数组?

所以,我正在使用非常稀疏的 numpy 数组进行一些 Kmeans 分类 - 很多很多零。我想我会使用 scipy 的“稀疏”包来减少存储开销,但我对如何创建数组而不是矩阵有点困惑。

我已经阅读了有关如何创建稀疏矩阵的教程: http ://www.scipy.org/SciPy_Tutorial#head-c60163f2fd2bab79edd94be43682414f18b90df7

为了模拟一个数组,我只创建了一个 1xN 矩阵,但正如您可能猜到的那样,Asp.dot(Bsp) 并不能很好地工作,因为您不能将两个 1xN 矩阵相乘。我必须将每个数组转置为 Nx1,这很蹩脚,因为我会为每个点积计算都这样做。

接下来,我尝试创建一个 NxN 矩阵,其中第 1 列 == 第 1 行(这样您可以将两个矩阵相乘并将左上角作为点积),但结果证明效率非常低。

我很想使用 scipy 的 sparse 包作为 numpy 的 array() 的神奇替代品,但到目前为止,我还不确定该怎么做。

有什么建议吗?

0 投票
1 回答
3512 浏览

python - Scipy.cluster.hierarchy.fclusterdata + 距离测量

1)我正在使用 scipy 的 hcluster 模块。

所以我可以控制的变量是阈值变量。我如何知道每个阈值的表现?即在 Kmeans 中,这个性能将是所有点到它们的质心的总和。当然,这必须进行调整,因为通常更多的集群 = 更小的距离。

有没有我可以用 hcluster 做的观察?

2)我意识到有大量可用于 fclusterdata 的指标。我正在基于关键术语的 tf-idf 对文本文档进行聚类。交易是,一些文档比其他文档长,我认为余弦是“规范化”这个长度问题的好方法,因为文档越长,它在 n 维字段中的“方向”应该保持不变,如果他们内容一致。有人可以建议其他方法吗?我该如何评价?

谢谢

0 投票
0 回答
717 浏览

python - 使用 sunperf atlas 库编译 numpy

我想在编译 scipy 和 numpy 时使用 sunperf 库。我尝试使用似乎从 SUNPERF 库中检查的 setupscons.py,但它没有识别出我的位置:这是 /pkg/linux/SS12/sunstudio12.1 的列表(这就是 sunperf 库所在的位置):


我尝试在sites.cfg 中指定此目录,但仍然出现以下错误:


任何帮助表示赞赏

0 投票
1 回答
474 浏览

python - scipy.sparse 矩阵中的 csr_matrix 中的非零值

scipy 库的 csr_matrix 有一个 nonzero() 方法,但是根据应该返回包含行和列数组的元组的手册,尝试将该函数用于 csr 矩阵会导致错误。关于这个问题的任何想法?

最好的问候,乌姆特

0 投票
5 回答
6292 浏览

python - Scipy负距离?什么?

我有一个输入文件,其中包含小数点后 4 位的浮点数:

(第一个是id)。我的班级使用将loadVectorsFromFile其乘以 10000 然后是int()这些数字的方法。最重要的是,我还循环遍历每个向量以确保内部没有负值。但是,当我执行时_hclustering,我不断看到错误"LinkageZ contains negative values"

我认真地认为这是一个错误,因为:

  1. 我检查了我的价值观,
  2. 这些值没有足够小或足够大以接近浮点数的限制,并且
  3. 我用来导出文件中值的公式使用绝对值(我的输入绝对正确)。

有人可以让我了解为什么我会看到这个奇怪的错误吗?是什么导致了这个负距离误差?

=====

0 投票
1 回答
703 浏览

python - 在 Windows 32 位上编译 scipy:libf77blas.a 的链接器错误

有没有人尝试在 Windows 上使用 numpy-1.3.0 编译 SciPy 0.7.1,该 numpy-1.3.0 是使用安装文档中链接的预构建 ATLAS 库 ( atlas3.6.0_WinNT_P4SSE2.zip)构建的。

我收到以下链接器错误,并且不知道如何解决此问题。

有谁知道这里可能出了什么问题?例如,在 libf77blas.a 中寻找ATL_daxpy会导致:

_ATL_daxpy,但没有ATL_daxpy

0 投票
1 回答
1324 浏览

python - 使用 numpy/scipy 在 python 中均匀有效地采样整数

我有一个问题,根据随机硬币翻转的结果,我必须从字符串中采样一个随机起始位置。如果这个随机位置的采样在字符串上是统一的,我想到了两种方法来做到这一点:一种使用 numpy.random 中的多项式,另一种使用 Python 标准库的简单 randint 函数。我对此进行了如下测试:

输出是:

多项式耗时:6.58072400093 秒兰德耗时:2.35189199448 秒

randint 似乎更快,但对我来说似乎仍然很慢。有没有一种矢量化的方法可以使用 numpy 或 scipy 让它变得更快?

谢谢。