2

因此,我正在研究 mpld3 以获取我可以使用square/crossfilter加载的一些更大的数据集(磁盘上约 700MB) 。有趣的是能够执行以下操作:

import matplotlib.pyplot as pl
import numpy as np
import mpld3

# data is a numpy recarray of city information, for example

fig, ax = pl.subplots(1,3)
n, bins, patches = ax[0].hist(data['population'], bins=10)
counts, edges_x, edges_y, im = ax[1].hist2d(data['land_area'], data['wealth'], bins=10)
points = ax[2].scatter(data['latitude'], data['longitude'])

然后能够在生成的直方图上进行拖动/滑动选择,以动态更改其他两个图以仅绘制通过选择的点。我的猜测是,因为地块中的每个“城市”之间没有联系,所以这可能要求太多,而且d3完全使用更容易?

4

1 回答 1

0

传统上,我们一直在引导人们远离mpld3大型数据集,例如常见问题解答

mpld3 是否适用于大型数据集?

简短的回答:不是真的。Mpld3 和 matplolib 本身一样,是为中小型可视化而设计的,这一点不太可能改变。原因是 mpld3 建立在 HTML 的 SVG 的基础上,它并不是特别适合大型数据集。具有超过几千个元素的绘图对交互功能的响应会明显变慢。

然而,这可能crossfilter是一个很好的mpld3处理大数据的通用方法,如果你让它工作,请分享!

于 2014-09-12T21:02:59.823 回答