问题标签 [tensorflow-xla]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

71 问题

0 投票

0 回答

580 浏览

tensorflow - 在 CPU 后端使用 TensorFlow XLA-JIT 进行操作融合的性能

谁能给我任何提示，为什么 XLA-JIT 在 CPU 后端有更好的性能？

我在单个 CPU上的mnist基准测试中尝试了没有和使用 XLA-JIT（手动模式）的TensorFlow。使用 XLA-JIT 与没有 XLA-JIT 的 TensorFlow 相比，实现了 13.6 倍的加速。

说到XLA-JIT的优点，经常会提到操作融合，我自然想到这个技术可能是背后的原因，所以我学习了源码，发现融合过程大致是这样的（如有错误请指正):

检查HloComputation（CompOld）中是否有操作可以融合；
如果是，则在 CompOld 中添加一条新的 Fusion 指令，并从 CompOld 中删除融合操作；
然后创建一个由融合操作组成的新 HloComputation (CompNew)。CompOld 中添加的 Fusion 指令有一个指向 CompNew 的指针。
当涉及到后端时，LLVM IR 为 CompOld 和 CompNew 独立发出。

考虑到显着的性能改进，我认为肯定还有更多我想念或误解的东西。我可以听听你的建议吗？

2017-11-24T04:29:43.153

0 投票

0 回答

190 浏览

tensorflow - XLA 支持在 Raspberry Pi GPU 上实现自定义内核

我正在尝试在 Raspberry Pi3 GPU (QPU) 上为 Conv2D、Pooling、ReLU 等操作实现 Tensorflow OpKernels。这些操作主要旨在提高推理期间的性能，而不关心训练（因此反向传播和梯度）。

使用 XLA 是实现这一目标的正确方法还是有更好的方法？

tensorflow raspberry-pi3 tensorflow-xla

2017-12-05T12:39:30.090

0 投票

1 回答

589 浏览

python - 为什么 TensorFlow XLA 处于实验状态

我有兴趣使用 XLA 进行自定义设备（FPGA，...）的训练。
但是，我从开发人员的教程中了解到 XLA 现在处于实验状态。

https://www.tensorflow.org/performance/xla/

我没有得到 XLA 处于实验状态的原因。
除了性能提升之外，XLA 还有什么大问题吗？

谢谢

python tensorflow tensorflow-xla

2017-12-09T07:53:45.190

0 投票

1 回答

581 浏览

python - 尝试为 Tensorflow 编译 XLA AOT 时出现链接错误

我正在尝试按照本教程构建一个 XLA AOT 示例（内容取自this）。我已经能够从源代码构建 Tensorflow 并让 XLA JIT 在小型mnist_softmax_xla.py上工作。

到目前为止我已经完成的步骤是：

2）我还必须将第 21 行更改/home/m2angus/tensorflow/third_party/llvm/llvm.BUILD为：

这是为了防止 bazel 出错。

使用以下文件：

tensorflow/tensorflow/compiler/aot/tests/my_code.cc

tensorflow/tensorflow/compiler/aot/tests/BUILD

错误输出很大，所以我只放一小段

这....几乎只是一堆undefined reference to错误。任何想法如何解决这一问题？

python tensorflow bazel tensorflow-gpu tensorflow-xla

2017-12-12T06:20:21.637

0 投票

1 回答

1484 浏览

python - 如何让张量流在运行时评估形状？

我想在运行时评估张量的形状。我正在计算两组之间的交集。交点的数量是张量的维度x。在定义图形时，张量的形状设置为[Dimension(None)]。因此，通常的x.get_shape()方法只会返回None。有没有办法None在运行时评估形状？我可以做sess.run(x)并获得 numpy 数组的形状，但我希望这是一个编译的操作，以便只返回形状。谢谢！

python tensorflow linear-algebra tensorflow-xla

2017-12-29T16:37:57.733

0 投票

0 回答

738 浏览