问题标签 [data-cube]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Open Data Cube:无法连接到 opendatacube Conda 环境中的数据库
我按照https://cubes.readthedocs.io/en/v1.0.1/install.html中列出的步骤 进行了以下操作:
安装的 Python
安装的 PostgreSQL
安装 Miniconda 并创建 conda datacube 环境
给我一个错误说明
psql:错误:无法连接到服务器:无法连接到服务器:没有这样的文件或目录服务器是否在本地运行并接受 Unix 域套接字“/tmp/.s.PGSQL.5432”上的连接?
问题是 PostgreSQL 可以在环境之外访问,但一旦环境被激活就无法连接。
附上相同的屏幕截图。错误截图
python - 安装打开的datacube,无法启动postgressql
我正在关注有关安装和启动数据立方体的文档:
https://datacube-core.readthedocs.io/en/latest/ops/db_setup.html
我已经到了它所说的步骤
安装后,启动 PostgreSQLPortable.exe(并在 Windows 启动菜单中放置一个快捷方式)。
要准备数据库以供首次使用,请在 PostgrSQL Portable 窗口中输入以下命令,将“u12345”替换为您的 Windows 登录用户 ID:
这部分有点模糊,因为我下载的便携式postgresql(https://sourceforge.net/projects/pgsqlportable/)没有“PostgreSQLPortable.exe”,所以我认为它的意思是“Make Cluster.bat”?(在这一点上很可能是错误的)。
我看到在 ~\pgsql\ 中使用我在“Make Cluster.bat”中键入的命令创建了一些文件夹,但是当我使用psql \du
All I get is检查用户时
(cubeenv) C:\Users\user1>psql\du
psql:错误:致命:不存在 el rol «user1»
如何创建用户名?
data-mining - 如何计算数据立方体中的冰山单元?
昨天我在大学作业中遇到了以下关于数据挖掘的问题,但不明白如何正确解决。
假设一个 100 维的立方体只包含 2 个基本单元:(a1,a2,a3,...,a100),(a1,a2,b3,...,b100)。如果“计数>=2^n”有多少个冰山细胞?
有没有人可以帮我解决这个问题?非常感谢有用的建议。
sparql - SPARQL:有没有办法以属性为中心?
我正在查询具有 3 个维度和 1 个度量的 DataCube(RDF 统计数据)。在这个数据立方体中,每个观察由 4 个语句组成(3 个用于维度,1 个用于度量,如下例所示(可在http://kaiko.getalp.org/sparql查询)。
查询返回如下内容:
版本 | lg | 关系 | 数数 |
---|---|---|---|
“20210601” | “ID” | 反义词 | 4 |
“20210601” | “ID” | 近似同义词 | 0 |
“20210601” | “ID” | 上位词 | 0 |
“20210601” | “ID” | 代名词 | 108 |
“20150602” | “ID” | 反义词 | 2 |
“20150602” | “ID” | 近似同义词 | 0 |
“20150602” | “ID” | 上位词 | 0 |
“20150602” | “ID” | 代名词 | 36 |
“20150702” | “ID” | 反义词 | 2 |
“20150702” | “ID” | 近似同义词 | 0 |
“20150702” | “ID” | 上位词 | 0 |
“20150702” | “ID” | 代名词 | 36 |
我想以关系的值为中心得到下表:
版本 | lg | 反义词 | 近似同义词 | 上位词 | 代名词 |
---|---|---|---|---|---|
“20210601” | “ID” | 4 | 0 | 0 | 108 |
“20150602” | “ID” | 2 | 0 | 0 | 36 |
“20150702” | “ID” | 2 | 0 | 0 | 36 |
我找不到一种方法来制作单个 SPARQL 查询来获得这个。目前,我需要使用我使用的任何客户端语言(此处为 python)获取所有数据并进行数据透视。
这在 SPARQL 1.1 中可行吗?如何 ?
我宁愿有一个一般性的答案,但接入点目前由 Virtuoso 提供服务。
编辑:为了更好地解释我的期望。在 DataCube Vocabulary 中,DataCube 的结构被描述为给出不同的维度和度量(通常由本体)。因此,维度和度量被认为是查询开发者已知的(至少对于特定版本的本体而言)。
在这里,nymRelation 的值是事先不知道的,它们是数据的一部分,而不是结构的一部分。Pivot 操作似乎是对 DataCube 的有效操作(以及切片、投影等)。
我想知道是否可以在服务器上进行这样的操作(通过不依赖于服务器上实际数据的通用查询)。这将使客户端可以维护一个 LAZY 数据立方体对象并在确实需要结果时推迟实际的枢轴操作。
我怀疑(并且第一个答案似乎暗示)如果不获取整个 DataCube(在客户端的内存中执行操作)或获取实际的不同属性值并自动制作取决于此的查询,则此操作是不可能的第一个结果。
nan - 如何找出数据立方体中有一个 nan 值?
如何找出数据立方体中有一个 nan 值?
我有一个数据立方体,我使用了零矩投影,
我的数据类型变成了:
然后当我想打印数据时,它说是 Nan 但我确定不是!
ssas - SCSM - 来自数据立方体的报告不包括时间
我们正在尝试使用 SSAS 报告来自 SCSM(默认安装 - 无自定义)的事件,并且可以从默认多维数据集中提取所有必需的信息,但时间除外。当我们向下钻取日期(正确的)时,所有时间都显示 00:00:00 吗?当我检查底层 sql 表时,包括时间。关于我们做错了什么有什么想法吗?
arrays - 如何使用数据立方体词汇表注释 hdf5 数据
我想使用 RDF 注释存储在 hdf5 中的大型多维数据集,并且我认为数据立方体词汇表将是正确的选择。我通读了 w3c 的介绍:https ://www.w3.org/TR/vocab-data-cube/ 在他们的示例中,他们展示了一个用例,其中注释了一个小数据集:
在此示例中,带注释的数据集的所有值都使用数据立方体词汇表存储在 RDF 中。我认为这不是在 RDF 中存储大量数据的合适方式,例如我的 hdf5 数据集。我的一些数据集具有包含数千个值的多维数组。有没有办法在没有完全转换成 RDF 的情况下注释这些数据集?
我想我可以使用 hdf5 结构的组路径和节点名称来引用数据集。用伪 RDF 编写:
我没有找到任何类似的例子。我想我错过了一些东西。RDF 中是否有任何标准或词汇表允许在不将数据完全转换为 RDF 的情况下对 hdf5 数据进行注释?
python - Datacube Xarray 按时间排序和选择数组
我有一个用 Xarray 打开的数据立方体,它有几个变量和一个格式为的时间向量(“ mid_date
”,维度18206
)datetime64
。
变量是18206 x 334 x 333
。问题是时间向量根本没有排序,我想按升序(从最旧到最近)对其进行排序。同时,重新组织我的变量数组。
然后,我想vy
在两个日期之间选择一个变量的一部分(例如:“”)(这样我就可以只对我的一部分数据进行计算)。我可以对日期向量进行排序,但不能将该排序应用于其他变量。我怎么能那样做?
以下是数据集的信息:
我试过了:
或者
和
但没有任何效果。