问题标签 [alluxio]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
316 浏览

hive - 在 parquet 数据类型问题中使用 alluxio 存储的 Hive Metastore

我使用 prestodb 和 hive 元存储作为模式存储,alluxio 缓存作为数据的外部存储。alluxio 和 hive 模式中使用的存储格式是PARQUET。使用 hive 目录从 presto 检索时间戳字段时。我得到跟随错误。

utdate 列被声明为类型timestamp,但Parquet文件将该列声明为INT64类型

数据集的架构是

创建表测试(utcdate 时间戳) WITH(格式='PARQUIET',external_location='alluxio://path-toserver/directory-path-to-parquet')

此问题是从 prestodb v0.221升级到v0.226版本后产生的。

0 投票
1 回答
48 浏览

java - Alluxio Web UI 中的“服务器配置检查”为 WARN

启动位于host_ip:19999(默认端口号为 19999)的 Alluxio Web UI,对于 metricServer Configuration Check下的 metric Alluxio Summary,值为WARN
我想知道它转向的原因WARN,任何详细信息以及如何访问它?

0 投票
1 回答
33 浏览

java - Alluxio master动态输出verbose正常吗

我正在使用Alluxio2.0 来加速计算层的性能。

当没有查询正在执行时,我发现有关于netty附加到$Alluxio_home/logs/master.log.

每秒附加数十条上述消息master.log。这是正常行为吗?如果确定,它是用来做什么的?对于组件之间的心跳?

0 投票
1 回答
289 浏览

java - 直接在shell中调用maven和从intellij IDEA调用maven的区别

编辑 3:我还尝试通过此线程中提到的 java 选项参数设置 maven 代理。


编辑 2:我确定 intellij idea 使用相同的 settings.xml、相同的 maven 二进制文件和与系统 maven 相同的本地存储库。


编辑 1:我尝试检查每个工作负载的构建日志,主要区别在于如何在构建日志的最开始调用 maven。

对于 intellij 的想法,如下所示:

对于系统外壳,maven 刚刚启动而没有此调用信息。


我正在使用 maven从源代码构建项目Alluxio 。

我尝试了 Windows 10 和 Ubuntu,在使用 intellij idea 时发现了同样的问题,让我详细说明一下。

  • 操作系统:Windows 10/Ubuntu 18.04
  • Maven:3.5.4
  • 构建命令:mvn -T 2C clean install -DskipTests -Dmaven.javadoc.skip -Dfindbugs.skip -Dcheckstyle.skip -Dlicense.skip

Alluxio 可以直接使用 maven 3.5.4 成功构建,但使用 intellij idea 失败并出现多个错误。让我感到困惑的是,我将 intellij idea 配置为使用系统 maven 3.5.4 并使用完全相同的构建命令。为什么错误发生在这里而不是系统外壳。

我遇到的错误是这样的:

并且还喜欢:

从intellij idea触发maven build的方法:

  • 点击右上角的maven图标
  • 点击Execute Maven Goal
  • 输入mvn -T 2C clean install -DskipTests -Dmaven.javadoc.skip -Dfindbugs.skip -Dcheckstyle.skip -Dlicense.skip并输入以启动构建

intellij idea 中的 maven 设置是默认设置,只是将 maven 二进制文件从内置二进制文件更改为系统 maven 3.5.4。

提前感谢您的帮助。

0 投票
1 回答
281 浏览

java - 格式化Alluxio:没有在文件系统工厂下找到:hdfs://nameservice1/alluxio/journal/BlockMaster

我想在有 HA 的集群上部署 Alluxio。我的 CDH 版本:3.0.0+cdh6.3.2。

我使用特定的 Hadoop 发布版本构建 Alluxio:

我将 alluxio-assembly-server-2.4.1-2-SNAPSHOT-jar-with-dependencies.jar 和 alluxio-underfs-hdfs-2.4.1-2-SNAPSHOT-jar-with-dependencies.jar 放在 lib/ 文件夹中Alluxio 的每个节点。

/opt/alluxio-2.4.1-1/conf/alluxio-site.properties:

当我在其中一个主节点中使用以下命令格式化 Alluxio 集群时:

我收到一个错误:

任何帮助将非常感激。

0 投票
0 回答
34 浏览

dask - 使用 Alluxio 作为 Dask 的数据访问和缓存层

我正在研究使用Alluxio作为 Dask 的数据访问和缓存。我想知道是否有人尝试过将 Dask 与 Alluxio 一起运行,是否可以分享他们的用例和经验?

0 投票
0 回答
32 浏览

amazon-web-services - Kubernetes(EKS)上的Alluxio支持没有aws accessKey和secretKey的s3连接?s3 连接是否可以单独使用角色 arn 进行配置?

我们正在使用 s3 作为底层存储层在 EKS 上安装 Alluxio。完成如下配置后,Alluxio 集群已启动并使用 s3 存储运行(使用 aws aceess 密钥和密钥)

ALLUXIO_JAVA_OPTS:|- -Dalluxio.master.hostname=alluxio-master-0 -Dalluxio.master.journal.type=UFS -Dalluxio.master.journal.folder=/journal -Dalluxio.security.stale.channel.purge.interval= 365d -Dalluxio.master.mount.table.root.ufs=s3://cubixalluxiodata/ -Dalluxio.master.mount.table.root.option.aws.accessKeyId=AxxxxxxxxxxxxO -Dalluxio.master.mount.table.root.option .aws.secretKey=DxxxxxxxxxxxxD *

然而,我们正在寻找一种方法来为 alluxio 配置 s3 存储而无需 accessKey/secretKey。但是仅使用基于角色的身份验证。请就该方法的可能性提出建议。