问题标签 [blaze]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
41 浏览

python - 什么是表示分层对象向量的好方法?

我有一个表示为嵌套字典\数组的对象 集合中的所有对象都具有相同的模式,尽管数组中的条目数可能因对象而异 我正在寻找一种存储此数据的好方法,这将允许简单批处理操作。具体来说,快速访问作为 numpy 数组的列\一组列很重要(这是不使用简单对象列表的主要原因)

带有 MultiIndex 的 pandas 是我的第一个想法,但我不相信它可以支持可变长度数组

0 投票
1 回答
57 浏览

blaze - 如何过滤 blaze 中 id 等于指定 id 的记录?

我正在使用 blaze 从 csv 和 json 查询数据。我只需要查询一个id等于指定id的记录吗?可能吗。

在尝试执行上述代码时,它显示 SyntaxError: invalid syntax

0 投票
3 回答
181 浏览

python - 如何将 blaze 数据对象转换为 json?

尝试在 blaze 中使用 json.dumps 时发生错误说 TypeError: object is not JSON serializable。

0 投票
0 回答
43 浏览

python - 是否可以使用 blaze python 从嵌套的 json 结构中查询记录

我正在尝试使用 blaze 从 json 查询数据。如果 json 是单级的,则可以查询数据。当我尝试对嵌套 json 进行查询时,会发生以下错误:ValueError:不理解

0 投票
2 回答
53 浏览

dataframe - Select some columns based on WHERE in a dataframe

So, I am working with Blaze and wanted to perform this query on a dataframe:

For SELECT *, this works: d[d.col1 > 0]. But I want col1 and col2 only rather than all columns. How should I go about it?

Thanks in advance!

Edit: Here I create d as: d = Data('postgresql://uri')

0 投票
1 回答
1977 浏览

python - 获取“整数超出范围”错误 sqlalchemy

所以,我正在使用odo数据迁移,但遇到了这个错误:

源表和目标表都具有相同的架构,但在后端执行的 sql 语句中,整数值带有 .0。就像源表中的整数34显示为34.0

如果需要更多信息,请告诉我。

0 投票
1 回答
294 浏览

python - 加载 csv 文件时如何将编码传递给 odo?

odo 文档非常稀疏,它没有解释如何在加载 csv 文件时传递更多参数。例如,我如何告诉 odo 该文件是 latin1 编码的?

0 投票
4 回答
4591 浏览

python - 使用 pandas 或 blaze 从非常大的 CSV 文件中删除列

我有一个非常大的 csv 文件(5 GB),所以我不想将整个内容加载到内存中,我想删除它的一个或多个列。我尝试在 blaze 中使用以下代码,但它所做的只是将结果列附加到现有的 csv 文件中:

有没有办法使用 pandas 或 blaze 只保留我想要的列并删除其他列?

0 投票
0 回答
89 浏览

python-2.7 - 使用 Bokeh 绘制 Blaze 数据框时出现 NoneType 错误

我有一个Blaze数据框df,如下所示:

在此处输入图像描述

我正在尝试在散景中制作一个条形图overall,将 x 轴范围作为 x 轴范围,聚合在wordcount列上。

这是我尝试过的代码:

但我收到如下错误:

谁能帮我解决这个问题?

0 投票
1 回答
143 浏览

python - 使用 Blaze 包查找特定行的有效方法?

我有一个包含大约 7400 万行的数据表,我使用 blaze 来加载它。

它具有以下字段:A、B、C、D、E、F、G

由于这是一个如此大的数据框,我如何有效地输出符合特定条件的行?例如,我想要具有 A==4、B==8、E==10 的行。有没有办法多任务查找?例如,通过线程或并行编程之类的?

通过并行编程,我的意思是,例如,一个线程将尝试从第 1 行到第 100000 行查找匹配行,第二个线程将尝试从第 100001 行到第 200000 行查找匹配行,依此类推......