问题标签 [datashape]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
845 浏览

python - Anaconda Python 中的最小 Blaze 示例

我正在尝试在Anaconda 安装(Python 3.3)中获取一个简单的Blaze 示例,在 Ubuntu 上工作。

但是运行给了我这个错误:

但是,我可以导入datashape,使用

当我尝试时conda install <pkgname>,我得到满足的依赖关系。我认为这与这个问题有关,但我觉得这个建议难以理解。

任何帮助表示赞赏。

0 投票
1 回答
137 浏览

python - 如何修补由 Python 数据形状中的装饰器注册的方法?

我正在使用datashape@datashape.discover.register Python 包并使用装饰器注册一个新类型。我想测试一下,当我调用datashape.discover我正在注册的类型的对象时,它会调用被装饰的函数。我还想用良好的单元测试原则来做到这一点,这意味着实际上不执行被修饰的函数,因为它会产生我不希望在测试中出现的副作用。但是,这是行不通的。

这是一些示例代码来演示该问题:

我的文件.py:

test_myfile.py:

问题似乎是我想要模拟的函数在测试主体中被模拟,但是,它在装饰时(即导入时)没有被模拟。该函数本质上是在内部注册被修饰的函数,以便在使用给定类型的参数调用discover.register时查找它。discover()不幸的是,它似乎每次都在内部注册真实函数,而不是我想要的补丁版本,所以它总是会调用真实函数。

关于如何修补被装饰的函数并断言它在被调用时datashape.discover被调用的任何想法?

0 投票
1 回答
1930 浏览

python - 使用 odo 和 SQLAlchemy 将 CSV 加载到 MySQL

我正在使用 odo 将 CSV 文件写入 MySQL 表。

当我没有指定datashape时,将创建 MySQL 表,其中所有字符串列作为 TEXT,所有整数列作为 BIGINT(20)。所以,我尝试了以下数据形状,并得到以下错误:

NotImplementedError:数据形状没有 SQLAlchemy dtype 匹配:var

NotImplementedError:数据形状没有 SQLAlchemy dtype 匹配:float16

NotImplementedError:没有与数据形状匹配的 SQLAlchemy dtype:uint32

NotImplementedError:数据形状没有 SQLAlchemy dtype 匹配:int8

理想情况下,例如,我可以将 int8 映射到 TINYINT,将 175 * var * 字符串映射到 VARCHAR(175),将 10 * 字符串映射到 CHAR(10),但似乎 SQLAlchemy 不支持这一点。我解决并将我的所有数据类型设置为 int32 或 float32,并从我的字符串类型中删除了 var 名称。

这会将 int32 映射到 INT(11) 并将 float32 映射到 DOUBLE。我可以忍受这个。但我不能接受我所有的字符串列仍然在 MySQL 上写为 TEXT。

我必须如何更改我的数据形状才能在 MySQL 中获取 CHAR 和 VARCHAR 数据类型?

0 投票
3 回答
738 浏览

python - python odo sql AssertionError: datashape must be Record type, got 0 * {...}

我正在尝试使用 odo 将 CSV 导入 MySQL,但出现数据形状错误。

我的理解是 datashape 采用以下格式:

其中 var 表示可变数量的行。我收到以下错误:

我不确定 0 行数来自哪里。我已经尝试使用 明确设置数据形状dshape(),但继续得到相同的错误。

这是重新创建错误的代码的精简版本:

我正在使用 Conda 运行 Ubuntu 16.04 和 Python 3.6.1。

感谢您的任何意见。

0 投票
0 回答
104 浏览

python - 如何从稀疏的非规范化表创建 xarray?

假设我有以下结构化数组:

我的data有形状(6, 5, 5)。但实际上,它的形状是(3, 2, 5, 5),但我只有列ab非规范化。

是否可以通过提供列和长度xarray DataArray直接从这个形状创建一个并弄清楚形状?会是什么?(6, 5, 5)ab6xarray(3, 2, 5, 5)coordsdims

实际上,table它是稀疏的并且有很多维度,我正在尝试看看是否有任何xarray创造机器可以依靠而不是重塑table自己。

0 投票
1 回答
607 浏览

python - Keras LSTM 训练。如何塑造我的输入数据?

我有一个包含 3000 个观察值的数据集。每个观察由 3 个长度为 200 个样本的时间序列组成。作为输出,我有 5 个类标签。

所以我将训练构建为测试集,如下所示:

我使用 Keras 功能 API 构建我的网络:

然后,我尝试拟合模型:

我收到以下错误:

ValueError: Error when checking model input: the list of Numpy arrays that you are passing to your model is not the size the model expected. Expected to see 3 array(s), but instead got the following list of 1 arrays...

我应该如何重塑我的数据来解决这个问题?

0 投票
2 回答
649 浏览

dask - pydata BLAZE 项目的方向在哪里?

我发现 blaze 生态系统* 令人惊叹,因为它涵盖了大多数数据工程用例。在 2015-2016 年期间,这些项目肯定有很多兴趣,但最近被忽略了。我这样说是看 github repos 上的提交。

所以我对社区的问题是

- 2016 年发生了什么导致失去兴趣的事情?

- 是否有其他基于 python 的库已经取代了 blaze?

火焰生态系统:

  • Blaze:在不同存储系统上查询数据的接口
  • Dask:通过任务调度和阻塞算法进行并行计算
  • Datashape:一种数据描述语言
  • DyND:用于动态多维数组的 C++ 库
  • Odo:不同存储系统之间的数据迁移

参考资料: http ://blaze.pydata.org/

0 投票
0 回答
68 浏览

arrays - 机器学习的数据形状

我有 90 张图像,每个图像的大小为 100 x 100。我使用 PIL Image 读取所有图像,将它们转换为 numpy 数组并将它们保存到文本文件中。之后,我使用 numpy.loadtxt() 加载它们并将它们存储到变量 X 中。当我执行 X.shape() 时,它返回我 (100,100)。不应该是(90,10000)吗?怎么做?我知道重塑是(数组,新形状)但是,我们不能将大小为 10000 的数组重塑为形状(90,10000)。

在此处输入图像描述

0 投票
2 回答
179 浏览

python - Python 1D CNN 模型 - model.fit() 中的错误

我正在尝试通过处理心电图信号来诊断睡眠呼吸暂停来构建一维 CNN 模型。

我正在使用 sklearn 库并在train_test_split. 这是我的代码:

我得到错误:

我不明白我做错了什么?任何帮助将非常感激。

0 投票
1 回答
45 浏览

python - 检查目标时出错:预期 dense_2 的形状为 (1,) 但得到的数组的形状为 (11627,)

我正在尝试构建一个 1D CNN 模型,但在尝试了很多方法之后似乎无法破解数据形状问题。

这是我的代码:

向我抛出这个错误:

我不明白我做错了什么任何帮助都会很棒!