问题标签 [deeplearning4j]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
43 浏览

java - 定义 DataSetIterator 的对象时出错

我正在尝试运行 deeplearning4j LenetMnistExample 的示例。这些行中出现“框架不可用”的错误

谁能帮助解决这个问题?

0 投票
1 回答
501 浏览

java - deeplearning4j word2vec 输出词向量

当我运行示例程序时Word2VecRawTextExample.java

网址:[ https://raw.githubusercontent.com/deeplearning4j/dl4j-0.4-examples/master/src/main/java/org/deeplearning4j/examples/nlp/word2vec/Word2VecRawTextExample.java ]

要为给定的样本句子文件生成 word2Vec 向量,每次运行该过程时都会得到不同的词向量权重。

我会认为给定过程是种子,结果每次都应该是相同的?

0 投票
3 回答
2394 浏览

java - 性能 Encog 与 Deeplearning4J

我们正在开发一个使用神经网络的 Java 项目。我们想在我们的数据集上测试不同的网络结构。现在我们评估哪个 Java 神经网络在性能方面是最好的。我们正在评估 Encog、Neuroph 和 DL4J。你能告诉我们一些好的资源或你自己的经验吗?谢谢

0 投票
1 回答
1676 浏览

neural-network - Deeplearning4j LSTM 示例

我正在尝试了解 Deeplearning4j 上的 LSTM。我正在检查示例的源代码,但我无法理解。

我们为什么要存储 3D 数组,这是什么意思?

0 投票
1 回答
468 浏览

java - 使用 deeplearning4j 加载 nlp 模型的问题

所以我正在尝试为 Java 实现名为 deeplearning4j 的免费深度学习库,以解决 nlp 中的分类任务。

相当标准,与网上提供的样本没有太大区别。然后使用 writeFullModel 方法将拟合后的训练模型保存到文本文件中。然后就可以用这个方法加载了

问题是,当模型变大时,它似乎不起作用。对于大小为 120Mb 的模型文件,我不断得到这个

不过,它可以用一个小模型文件很好地加载。任何帮助将不胜感激,非常感谢。

0 投票
4 回答
3781 浏览

java - Word2Vec 与中文

我一直在学习 Word2Vec(Deeplearning4j),但我找不到任何关于它支持中文的信息。从各种来源我了解到,通过使用一些插件,它也可以用于中文。

所以请告诉我任何中文插件,以及它应该如何用word2vec实现。

如果 Deeplearning4j Word2Vec 对英语和中文(两者)的支持好不好。如果没有,请通过它的链接提出一些更好的选择。

语言:Java

0 投票
1 回答
384 浏览

machine-learning - 在 deeplearning4j 中实现 tensorflow 功能

我正在尝试使用 deeplearning4j 实现这篇博文中描述的代码。

http://www.wildml.com/2015/12/implementing-a-cnn-for-text-classification-in-tensorflow/

我在同一通道上实现多个内核并连接生成的张量时遇到问题。deeplearning4j 中甚至还有 concat 函数吗?甚至有可能在同一个通道上有不同的内核吗?

提前给你加油。

0 投票
1 回答
63 浏览

java - 带有 Deeplearning4j 和 Lux Delux 的 Ant build.xml

我正在尝试为风险游戏 Lux Delux 创建一个 AI,它将利用在 Deeplearning4j 中训练的神经网络。

自然,当我编译时,我得到一堆包不存在的错误。如何将此类依赖项添加到 ant 构建中?我需要使用常春藤吗?构建文件如下:

0 投票
0 回答
59 浏览

caffe - 数字预测测试数据库的概率

我正在使用数字进行图像分类任务。

我想对测试数据库进行评分并在 csv 文件中获取预测的概率。谁能告诉我应该在哪里更改数字文件?

0 投票
1 回答
639 浏览

java - 使用运行时生成的数据在 deeplearning4j 中训练循环神经网络

我是 deeplearning4j 库的新手,但我对一般的神经网络有一些经验。
我正在尝试训练一个循环神经网络(特别是 LSTM),它应该实时检测音乐中的节拍。到目前为止,我发现的所有使用带有 deeplearning4j 的递归神经网络的示例都使用了一个从文件中读取训练数据的阅读器。由于我想通过麦克风实时录制音乐,我无法读取一些预生成的文件,因此输入神经网络的数据是由我的应用程序实时生成的。

这是我用来生成网络的代码:

在这种情况下,我使用了大约 700 个输入(主要是录制音频的 FFT 数据)、1 个输出(应该输出 0 [无节拍] 和 1 [节拍] 之间的数字)和我的 hiddenLayers 数组包括整数 {50, 25, 10}。

为了获得网络的输出,我正在使用以下代码:

其中 netInputData 是我想作为一维双精度数组输入网络的数据。
我相对确定这段代码工作正常,因为我得到了一些未经训练的网络的输出,当我绘制它时,它看起来像这样。
但是,一旦我尝试训练一个网络(即使我只训练了很短的时间,这应该会稍微改变网络的权重,因此输出应该与未经训练的网络非常相似),我得到一个看起来像常量的输出。

这是我用来训练网络的代码:

再一次,我得到了输入数据和所需输出的双精度数组。这次这两个数组是二维的。第一个索引表示时间(其中索引 0 是录制音频的第一个音频数据),第二个索引表示该时间步的输入(或相应的所需输出)。
鉴于训练网络后显示的输出,我倾向于认为用于从数据创建 INDArray 的代码一定有问题。我是否错过了初始化这些数组的一些重要步骤,或者我是否弄乱了将数据放入这些数组所需的顺序?

感谢您提前提供任何帮助。