问题标签 [data-cube]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
74 浏览

excel - 循环遍历所有可用的 OLAP 多维数据集过滤器值

试图在这里找到解决方案,但没有成功。

我在 Excel 中有一个数据透视表,它连接到一个数据立方体。有效的是使用代码对内部的值设置过滤器Pivot Table

如果被过滤的值不存在,我会收到一条错误消息 - 这是有道理的。

有没有办法在设置过滤器之前获取所有可用值的列表?用 填充数组会很好ItemsList,但我找不到与itemslist.

可用值的示例:

可用值

编辑:我想避免错误处理解决方案,因为我可能还需要执行其他检查(大写/小写)。

0 投票
0 回答
78 浏览

python - Open Data Cube:无法连接到 opendatacube Conda 环境中的数据库

我按照https://cubes.readthedocs.io/en/v1.0.1/install.html中列出的步骤 进行了以下操作:

  1. 安装的 Python

  2. 安装的 PostgreSQL

  3. 安装 Miniconda 并创建 conda datacube 环境

给我一个错误说明

psql:错误:无法连接到服务器:无法连接到服务器:没有这样的文件或目录服务器是否在本地运行并接受 Unix 域套接字“/tmp/.s.PGSQL.5432”上的连接?

问题是 PostgreSQL 可以在环境之外访问,但一旦环境被激活就无法连接。

附上相同的屏幕截图。错误截图

0 投票
0 回答
26 浏览

python - 安装打开的datacube,无法启动postgressql

我正在关注有关安装和启动数据立方体的文档:

https://datacube-core.readthedocs.io/en/latest/ops/db_setup.html

我已经到了它所说的步骤

安装后,启动 PostgreSQLPortable.exe(并在 Windows 启动菜单中放置一个快捷方式)。

要准备数据库以供首次使用,请在 PostgrSQL Portable 窗口中输入以下命令,将“u12345”替换为您的 Windows 登录用户 ID:

这部分有点模糊,因为我下载的便携式postgresql(https://sourceforge.net/projects/pgsqlportable/)没有“PostgreSQLPortable.exe”,所以我认为它的意思是“Make Cluster.bat”?(在这一点上很可能是错误的)。

我看到在 ~\pgsql\ 中使用我在“Make Cluster.bat”中键入的命令创建了一些文件夹,但是当我使用psql \duAll I get is检查用户时

(cubeenv) C:\Users\user1>psql\du

psql:错误:致命:不存在 el rol «user1»

如何创建用户名?

0 投票
0 回答
33 浏览

data-mining - 如何计算数据立方体中的冰山单元?

昨天我在大学作业中遇到了以下关于数据挖掘的问题,但不明白如何正确解决。

假设一个 100 维的立方体只包含 2 个基本单元:(a1,a2,a3,...,a100),(a1,a2,b3,...,b100)。如果“计数>=2^n”有多少个冰山细胞?

有没有人可以帮我解决这个问题?非常感谢有用的建议。

0 投票
0 回答
55 浏览

python - 来自数据立方体的多个像素的平均光谱

我有一个拟合数据立方体,其中包含 3 轴上的银河经度、纬度和速度。为了从数据立方体中提取特定经度和纬度像素值的光谱,我使用了函数

并使用函数提取图像

此处附有样本光谱光谱 和缩放图像。图片

亮点是检测。如何使用多个像素并对光谱进行平均以获得平均光谱,从而降低噪声并分析峰值?我一直在尝试对此进行编码,但我不知道如何进行,因为我是 python 新手。有人可以给个提示吗?

0 投票
1 回答
94 浏览

sparql - SPARQL:有没有办法以属性为中心?

我正在查询具有 3 个维度和 1 个度量的 DataCube(RDF 统计数据)。在这个数据立方体中,每个观察由 4 个语句组成(3 个用于维度,1 个用于度量,如下例所示(可在http://kaiko.getalp.org/sparql查询)。

查询返回如下内容:

版本 lg 关系 数数
“20210601” “ID” 反义词 4
“20210601” “ID” 近似同义词 0
“20210601” “ID” 上位词 0
“20210601” “ID” 代名词 108
“20150602” “ID” 反义词 2
“20150602” “ID” 近似同义词 0
“20150602” “ID” 上位词 0
“20150602” “ID” 代名词 36
“20150702” “ID” 反义词 2
“20150702” “ID” 近似同义词 0
“20150702” “ID” 上位词 0
“20150702” “ID” 代名词 36

我想以关系的值为中心得到下表:

版本 lg 反义词 近似同义词 上位词 代名词
“20210601” “ID” 4 0 0 108
“20150602” “ID” 2 0 0 36
“20150702” “ID” 2 0 0 36

我找不到一种方法来制作单个 SPARQL 查询来获得这个。目前,我需要使用我使用的任何客户端语言(此处为 python)获取所有数据并进行数据透视。

这在 SPARQL 1.1 中可行吗?如何 ?

我宁愿有一个一般性的答案,但接入点目前由 Virtuoso 提供服务。

编辑:为了更好地解释我的期望。在 DataCube Vocabulary 中,DataCube 的结构被描述为给出不同的维度和度量(通常由本体)。因此,维度和度量被认为是查询开发者已知的(至少对于特定版本的本体而言)。

在这里,nymRelation 的是事先不知道的,它们是数据的一部分,而不是结构的一部分。Pivot 操作似乎是对 DataCube 的有效操作(以及切片、投影等)。

我想知道是否可以在服务器上进行这样的操作(通过不依赖于服务器上实际数据的通用查询)。这将使客户端可以维护一个 LAZY 数据立方体对象并在确实需要结果时推迟实际的枢轴操作。

我怀疑(并且第一个答案似乎暗示)如果不获取整个 DataCube(在客户端的内存中执行操作)或获取实际的不同属性值并自动制作取决于此的查询,则此操作是不可能的第一个结果。

0 投票
0 回答
14 浏览

nan - 如何找出数据立方体中有一个 nan 值?

如何找出数据立方体中有一个 nan 值?

我有一个数据立方体,我使用了零矩投影,

我的数据类型变成了:

然后当我想打印数据时,它说是 Nan 但我确定不是!

0 投票
0 回答
20 浏览

ssas - SCSM - 来自数据立方体的报告不包括时间

我们正在尝试使用 SSAS 报告来自 SCSM(默认安装 - 无自定义)的事件,并且可以从默认多维数据集中提取所有必需的信息,但时间除外。当我们向下钻取日期(正确的)时,所有时间都显示 00:00:00 吗?当我检查底层 sql 表时,包括时间。关于我们做错了什么有什么想法吗?

0 投票
0 回答
28 浏览

arrays - 如何使用数据立方体词汇表注释 hdf5 数据

我想使用 RDF 注释存储在 hdf5 中的大型多维数据集,并且我认为数据立方体词汇表将是正确的选择。我通读了 w3c 的介绍:https ://www.w3.org/TR/vocab-data-cube/ 在他们的示例中,他们展示了一个用例,其中注释了一个小数据集:

在此示例中,带注释的数据集的所有值都使用数据立方体词汇表存储在 RDF 中。我认为这不是在 RDF 中存储大量数据的合适方式,例如我的 hdf5 数据集。我的一些数据集具有包含数千个值的多维数组。有没有办法在没有完全转换成 RDF 的情况下注释这些数据集?

我想我可以使用 hdf5 结构的组路径和节点名称来引用数据集。用伪 RDF 编写:

我没有找到任何类似的例子。我想我错过了一些东西。RDF 中是否有任何标准或词汇表允许在不将数据完全转换为 RDF 的情况下对 hdf5 数据进行注释?

0 投票
1 回答
44 浏览

python - Datacube Xarray 按时间排序和选择数组

我有一个用 Xarray 打开的数据立方体,它有几个变量和一个格式为的时间向量(“ mid_date”,维度18206datetime64

变量是18206 x 334 x 333。问题是时间向量根本没有排序,我想按升序(从最旧到最近)对其进行排序。同时,重新组织我的变量数组。

然后,我想vy在两个日期之间选择一个变量的一部分(例如:“”)(这样我就可以只对我的一部分数据进行计算)。我可以对日期向量进行排序,但不能将该排序应用于其他变量。我怎么能那样做?

以下是数据集的信息:

我试过了:

或者

但没有任何效果。