“data-cube”的相关标签问题

0 投票

0 回答

74 浏览

excel - 循环遍历所有可用的 OLAP 多维数据集过滤器值

试图在这里找到解决方案，但没有成功。

我在 Excel 中有一个数据透视表，它连接到一个数据立方体。有效的是使用代码对内部的值设置过滤器Pivot Table：

如果被过滤的值不存在，我会收到一条错误消息 - 这是有道理的。

有没有办法在设置过滤器之前获取所有可用值的列表？用填充数组会很好ItemsList，但我找不到与itemslist.

可用值的示例：

编辑：我想避免错误处理解决方案，因为我可能还需要执行其他检查（大写/小写）。

2020-08-19T14:49:47.613

0 投票

0 回答

78 浏览

python - Open Data Cube：无法连接到 opendatacube Conda 环境中的数据库

我按照https://cubes.readthedocs.io/en/v1.0.1/install.html中列出的步骤进行了以下操作：

安装的 Python
安装的 PostgreSQL
安装 Miniconda 并创建 conda datacube 环境

给我一个错误说明

psql：错误：无法连接到服务器：无法连接到服务器：没有这样的文件或目录服务器是否在本地运行并接受 Unix 域套接字“/tmp/.s.PGSQL.5432”上的连接？

问题是 PostgreSQL 可以在环境之外访问，但一旦环境被激活就无法连接。

附上相同的屏幕截图。错误截图

python postgresql conda data-cube

2020-09-22T04:10:30.160

0 投票

0 回答

26 浏览

python - 安装打开的datacube，无法启动postgressql

我正在关注有关安装和启动数据立方体的文档：

https://datacube-core.readthedocs.io/en/latest/ops/db_setup.html

我已经到了它所说的步骤

安装后，启动 PostgreSQLPortable.exe（并在 Windows 启动菜单中放置一个快捷方式）。

要准备数据库以供首次使用，请在 PostgrSQL Portable 窗口中输入以下命令，将“u12345”替换为您的 Windows 登录用户 ID：

这部分有点模糊，因为我下载的便携式postgresql（https://sourceforge.net/projects/pgsqlportable/）没有“PostgreSQLPortable.exe”，所以我认为它的意思是“Make Cluster.bat”？（在这一点上很可能是错误的）。

我看到在 ~\pgsql\ 中使用我在“Make Cluster.bat”中键入的命令创建了一些文件夹，但是当我使用psql \duAll I get is检查用户时

(cubeenv) C:\Users\user1>psql\du

psql：错误：致命：不存在 el rol «user1»

如何创建用户名？

python windows postgresql anaconda data-cube

2021-04-30T19:35:04.473

0 投票

0 回答

33 浏览

data-mining - 如何计算数据立方体中的冰山单元？

昨天我在大学作业中遇到了以下关于数据挖掘的问题，但不明白如何正确解决。

假设一个 100 维的立方体只包含 2 个基本单元：(a1,a2,a3,...,a100),(a1,a2,b3,...,b100)。如果“计数>=2^n”有多少个冰山细胞？

有没有人可以帮我解决这个问题？非常感谢有用的建议。

data-mining data-cube

2021-05-05T00:08:31.640

0 投票

0 回答

55 浏览

python - 来自数据立方体的多个像素的平均光谱

我有一个拟合数据立方体，其中包含 3 轴上的银河经度、纬度和速度。为了从数据立方体中提取特定经度和纬度像素值的光谱，我使用了函数

并使用函数提取图像

此处附有样本光谱和缩放图像。

亮点是检测。如何使用多个像素并对光谱进行平均以获得平均光谱，从而降低噪声并分析峰值？我一直在尝试对此进行编码，但我不知道如何进行，因为我是 python 新手。有人可以给个提示吗？

python pixel spectrum fits data-cube

2021-05-25T06:31:47.120

0 投票

1 回答

94 浏览

sparql - SPARQL：有没有办法以属性为中心？

我正在查询具有 3 个维度和 1 个度量的 DataCube（RDF 统计数据）。在这个数据立方体中，每个观察由 4 个语句组成（3 个用于维度，1 个用于度量，如下例所示（可在http://kaiko.getalp.org/sparql查询）。

查询返回如下内容：

版本	lg	关系	数数
“20210601”	“ID”	反义词	4
“20210601”	“ID”	近似同义词	0
“20210601”	“ID”	上位词	0
“20210601”	“ID”	代名词	108
“20150602”	“ID”	反义词	2
“20150602”	“ID”	近似同义词	0
“20150602”	“ID”	上位词	0
“20150602”	“ID”	代名词	36
“20150702”	“ID”	反义词	2
“20150702”	“ID”	近似同义词	0
“20150702”	“ID”	上位词	0
“20150702”	“ID”	代名词	36

我想以关系的值为中心得到下表：

版本	lg	反义词	代名词
“20210601”	“ID”	4	108
“20150602”	“ID”	2	36
“20150702”	“ID”	2	36

我找不到一种方法来制作单个 SPARQL 查询来获得这个。目前，我需要使用我使用的任何客户端语言（此处为 python）获取所有数据并进行数据透视。

这在 SPARQL 1.1 中可行吗？如何？

我宁愿有一个一般性的答案，但接入点目前由 Virtuoso 提供服务。

编辑：为了更好地解释我的期望。在 DataCube Vocabulary 中，DataCube 的结构被描述为给出不同的维度和度量（通常由本体）。因此，维度和度量被认为是查询开发者已知的（至少对于特定版本的本体而言）。

在这里，nymRelation 的值是事先不知道的，它们是数据的一部分，而不是结构的一部分。Pivot 操作似乎是对 DataCube 的有效操作（以及切片、投影等）。

我想知道是否可以在服务器上进行这样的操作（通过不依赖于服务器上实际数据的通用查询）。这将使客户端可以维护一个 LAZY 数据立方体对象并在确实需要结果时推迟实际的枢轴操作。

我怀疑（并且第一个答案似乎暗示）如果不获取整个 DataCube（在客户端的内存中执行操作）或获取实际的不同属性值并自动制作取决于此的查询，则此操作是不可能的第一个结果。

sparql data-cube

2021-06-22T08:17:52.533

0 投票

0 回答

14 浏览

nan - 如何找出数据立方体中有一个 nan 值？

如何找出数据立方体中有一个 nan 值？

我有一个数据立方体，我使用了零矩投影，

我的数据类型变成了：

然后当我想打印数据时，它说是 Nan 但我确定不是！

nan spectrum data-cube

2021-07-12T13:31:06.070

0 投票

0 回答

20 浏览

ssas - SCSM - 来自数据立方体的报告不包括时间

我们正在尝试使用 SSAS 报告来自 SCSM（默认安装 - 无自定义）的事件，并且可以从默认多维数据集中提取所有必需的信息，但时间除外。当我们向下钻取日期（正确的）时，所有时间都显示 00:00:00 吗？当我检查底层 sql 表时，包括时间。关于我们做错了什么有什么想法吗？

ssas data-cube

2021-11-01T15:35:27.783

0 投票

0 回答

28 浏览

arrays - 如何使用数据立方体词汇表注释 hdf5 数据

我想使用 RDF 注释存储在 hdf5 中的大型多维数据集，并且我认为数据立方体词汇表将是正确的选择。我通读了 w3c 的介绍：https ://www.w3.org/TR/vocab-data-cube/ 在他们的示例中，他们展示了一个用例，其中注释了一个小数据集：

在此示例中，带注释的数据集的所有值都使用数据立方体词汇表存储在 RDF 中。我认为这不是在 RDF 中存储大量数据的合适方式，例如我的 hdf5 数据集。我的一些数据集具有包含数千个值的多维数组。有没有办法在没有完全转换成 RDF 的情况下注释这些数据集？

我想我可以使用 hdf5 结构的组路径和节点名称来引用数据集。用伪 RDF 编写：

我没有找到任何类似的例子。我想我错过了一些东西。RDF 中是否有任何标准或词汇表允许在不将数据完全转换为 RDF 的情况下对 hdf5 数据进行注释？

arrays rdf hdf5 ontology data-cube

2021-11-23T09:47:08.777

0 投票

1 回答

44 浏览

python - Datacube Xarray 按时间排序和选择数组

我有一个用 Xarray 打开的数据立方体，它有几个变量和一个格式为的时间向量（“ mid_date”，维度18206）datetime64。

变量是18206 x 334 x 333。问题是时间向量根本没有排序，我想按升序（从最旧到最近）对其进行排序。同时，重新组织我的变量数组。

然后，我想vy在两个日期之间选择一个变量的一部分（例如：“”）（这样我就可以只对我的一部分数据进行计算）。我可以对日期向量进行排序，但不能将该排序应用于其他变量。我怎么能那样做？

以下是数据集的信息：

我试过了：

或者

和

但没有任何效果。

python sorting time python-xarray data-cube

2022-01-15T00:23:44.423

问题标签 [data-cube]

Reference