问题标签 [ppc64le]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
docker - Jenkins 中来自 docker.push 的 UnsatisfiedLinkError 和 JNLP4-connect 问题
尝试在docker.push
由 x86 Jenkins 主服务器调用的 ppc64le Jenkins 从服务器上运行时,会发生以下错误。
从 / 远程调用 JNLP4-connect 连接
java.lang.UnsatisfiedLinkError:/tmp/libnetty-transport-native-epoll3535546627560640699.so:/tmp/libnetty-transport-native-epoll3535546627560640699.so:无法打开共享对象文件:没有这样的文件或目录(可能的原因:不能在 Power PC 64 位平台上加载 AMD 64 位 .so
整个日志
h2o - libxgboost4j_gpu.so for x86 architecture inside h2o.jar for ppc64le
我正在使用 V100 GPU 的 ppc64le Redhat 上试用 DAI 1.4.2,但我发现 dai-h2o 守护程序存在一些奇怪的错误。
似乎它无法初始化其 GPU 后端,我在 h2o.jar 中找到了用于 x86 架构(不是 ppc64le)的 libxgboost4j_gpu.so。
这是某种错误还是根本不重要?
bazel - 巴泽尔布德:“可配置属性“实际”与此配置不匹配”
我正在设置一个 ppc64le 服务器,我需要在其上安装 bazel 0.23.*。我为这个架构编译了 bazel,但它不能正常工作。
我正在尝试在 Ubuntu 18.04 ppc64le 服务器上安装应用程序(ONOS)。此架构不支持它,因此我需要使用 bazel 从源代码构建它(如 ONOS 文档所述)。我从已经为 ppc64le 架构编译的二进制文件安装了 bazel 版本 0.23.0。现在我尝试使用 bazel (bazel build onos) 构建应用程序,但它显示与“JDK 环境”相关的错误
构建 ONOS:
我检查了出现错误的BUILD文件:
)
这个文件中似乎没有配置 ppc64le 架构,我不知道该怎么办。它还说 jdk10 而我有 jdk11 但还有其他具有相同结构的“remote_jdk11”。如您所见,如果我的问题没有意义或者我没有正确解释自己,我只是一个初学者,非常抱歉。另外,英语不是我的第一语言,所以再次抱歉。
node.js - RHEL8 ppc64le ...致命错误:vips/vips8:没有这样的文件或目录
这适用于我的 MAC,但现在我需要安装在运行 RHEL8 的 ppc64le 上。我用谷歌搜索了答案,但没有找到任何可以帮助我确定解决方案的东西。谁能给我一些关于如何解决这个问题的指导?
操作系统:红帽企业 Linux 8.0 (Ootpa)
内核:Linux 4.18.0-80.el8.ppc64le
gcc 版本 8.2.1 20180905 (Red Hat 8.2.1-3) (GCC)
linux - 如何确定 Linux ppc64le 上的处理器插槽数
lscpu 似乎有一个错误,它无法确定正确的套接字数量。为此打开了一个问题,但我没有得到任何回复https://github.com/karelzak/util-linux/issues/698。这是我的输出:
还有其他方法可以获取套接字数量吗?
c++ - 在加载的 PowerPC 上使用 LibUnwind 引发 C++ 异常会设置随机浮点异常陷阱
我目前正在调试 PyTorch 中的一些故障,这是一个带有 C++ 扩展的 Python 库,因此 Python 代码调用了一些 C++ 代码。
std::exp
发生故障是因为在看似无辜的调用导致核心转储之前设置了一些浮点异常陷阱。奇怪的是,将其减少到最低限度,只需设置 FPE viafeenableexcept
然后std::exp
使用相同的值调用不会产生此崩溃/核心转储。所以我坚持调试原始应用程序。
进行一些 printf 调试(当然,在调试模式下编译时代码不会中断 [即未设置陷阱]),我将其缩小为一条throw c10::Error(...)
语句。这个类派生自std::exception
这里没有什么不寻常的。要将该 C++ 异常转换为 Python 异常catch(...){ /*set a bool*/; throw;}catch(c10::Error&){...}
,请输入 a。到目前为止没有什么奇怪的,当然这也不会在最小的设置中重现。
将 gdb 与catch throw
我一起使用,catch catch
我到达了引发和捕获此异常的地方,并做了一些单步执行 ( step
),然后p fegetexcept()
确实:
因此,在投掷的内部,FPE 仍未设置,而在接球的内部。里面的线eh_throw
是_Unwind_RaiseException (&header->exc.unwindHeader);
我无法进入的。
此外,每个程序调用的值也fegetexcept()
有很大不同。此外,如果我不使用 GLOG 构建,我使用 libunwind 进一步追踪到它,问题就会消失。
setcontext
但是,我只能从我只得到汇编的 libunwind 调用中得到任何进一步的信息。一行lfd fp29,(SIGCONTEXT_FP_REGS+(PT_R29*8))(r31)
的值发生fegetexcept()
变化。
所以这看起来像是一个 libunwind 的问题。但是,当我使用 clang 9.0.1 而不是 GCC 8.3.0 时,问题也不会出现。所以我在这里不知所措。
有谁知道问题可能是什么,我还能做什么或者是否存在已知错误?这是使用 glibc 2.17 和 libunwind 1.4.0 以防万一。
anaconda - 由于硬件限制(ppc64le IBM),当我被迫使用pytorch 1.3.1时强制安装torchvision 0.4.2
如果我被迫使用torch,我处于一个奇怪的场景中1.3.1
(由于硬件,请参阅:https ://public.dhe.ibm.com/ibmdl/export/pub/software/server/ibm-ai/conda/#/ ) . 我从 pytorch 文档中读到它的对应版本的 torchvision 是0.4.1
(https://pypi.org/project/torchvision/):
安装
我们推荐 Anaconda 作为 Python 包管理系统。PyTorch(火炬)安装的详细信息请参考pytorch.org。以下是对应的torchvision版本和支持的Python版本。
但由于某种原因,我的版本错误:
有没有办法安装正确版本的torchvision?
我试过的:
首先,我尝试使用 conda 强制安装正确的版本。Conda 找不到我需要的 torchvision 版本:
然后我继续尝试安装它,不管 pip
也有错误。
还有什么可以尝试的吗?
我试过但失败了:
有关的:
- crossposted SO:由于硬件限制(ppc64le IBM),当我被迫使用pytorch 1.3.1时强制安装torchvision 0.4.2
- 交叉发布 pytorch 论坛:https ://discuss.pytorch.org/t/force-installing-torchvision/97279
- 交叉发布的 reddit pytorch:https ://www.reddit.com/r/pytorch/comments/iyf2qn/force_installing_torchvision/
- 交叉发布的 reddit ibm:https ://www.reddit.com/r/IBM/comments/iyhzex/force_installing_torchvision_042_when_i_am_forced/
- 真正的问题是安装torchmeta:https ://github.com/tristandeleu/pytorch-meta/issues/95
- https://www.ibm.com/mysupport/s/forumsquestion?id=0D50z00006gaxV9CAI
- quora:https ://www.quora.com/unanswered/How-does-one-install-specific-Python-packages-in-Conda-from-IBM-architectures
- reddit ibm2:https ://www.reddit.com/r/newIBM/comments/iyij10/force_installing_torchvision_042_when_i_am_forced/
- ibm 的 gitissue:https ://github.com/IBM/powerai/issues/268 pytorch 中的 gitissue
python - 如何在 pytorch 中为 ppc64le 架构安装 torchmeta?
我试图在 ppc64le 架构中使用torchmeta。不幸的是,安装并不容易,因为 ppc64le 需要特殊的二进制文件才能工作。
我最终设法按照以下说明为 pytorch 和 torchvision 获取了正确的二进制文件(在正确的 ibm 通道前面加上 conda 二进制文件,并安装了所有必需的文件):
之后我开始安装正确版本的 torchmeta,1.3.1
因为 ppc64le 只有 pytorch1.3.1
和 torchvision 0.4.2
。所以我做了:
但现在我有一个新错误,它找不到与我想做的兼容的正确版本的 h5py。错误消息太大,无法粘贴,但我将粘贴我希望有用的部分:
任何人都知道如何在 ppc64le 中成功安装工作的 torchmeta 版本(使用 wmcle 1.7.0)?
有关的:
torchmeta 的 gitissue:https ://github.com/tristandeleu/pytorch-meta/issues/95
IBM gitissue 用于 torchmeta 支持:https ://github.com/IBM/powerai/issues/269
用于 torchmeta 的 h5py gitissue:https ://github.com/h5py/h5py/issues/1678
IBM h5py 对 torchmeta 的支持:https ://github.com/IBM/powerai/issues/270
pytorch - 如何使用 ppc64le 和 x86 跨不同版本的 pytorch(1.3.1 和 1.6.x)加载检查点?
正如我在这里概述的那样,由于硬件原因,例如使用 ppc64le IBM 架构,我被困在使用旧版本的 pytorch 和 torchvision。
出于这个原因,我在不同计算机、集群和我的个人 Mac 之间发送和接收检查点时遇到问题。我想知道是否有任何方法可以避免这个问题来加载模型?例如,在使用 1.6.x 时,可能会以新旧格式保存模型。当然,对于 1.3.1 到 1.6.x 来说是不可能的,但至少我希望有些东西能奏效。
有什么建议吗?当然,我理想的解决方案是我不必担心它,我总是可以加载和保存我的检查点以及我通常在所有硬件上统一腌制的所有内容。
我得到的第一个错误是 zip jit 错误:
所以我使用了它(和其他泡菜库):
但我抱怨我被迫使用不同的 pytorch 版本:
任何想法如何使集群中的所有内容保持一致?我什至无法打开泡菜文件。
也许这对于我被迫使用的当前 pytorch 版本来说是不可能的:(
使用代码:
相关链接:
- 如何使用 ppc64le 和 x86 跨不同版本的 pytorch(1.3.1 和 1.6.x)加载检查点?
- https://discuss.pytorch.org/t/how-to-load-checkpoints-across-different-versions-of-pytorch-1-3-1-and-1-6-x-using-ppc64le-and- x86/97829
- 相关的gitissue:https ://github.com/pytorch/pytorch/issues/43766
- reddit:https ://www.reddit.com/r/pytorch/comments/jvza7v/how_to_load_checkpoints_across_different_versions/
docker - Travis CI 上的 Docker buildx
我正在尝试在我们的企业 Travis CI 实例上通过 Docker Buildx 和 Buildkit 为平台 ppc64le 构建映像。
.travis.yml:
构建将因错误而失败:
看起来 Buildx 扩展未启用,但 Docker 信息将显示 Experimental_cli 已启用。
关于如何在 Travis 上启用 buildx 的任何想法?