问题标签 [deeplearning4j]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1214 浏览

machine-learning - DL4J 在 GoogleNews-vectors 文件上超级慢

我尝试在 DL4J 上执行以下示例(加载预训练的向量文件):

但它非常慢(尽管它们是正确的,但需要大约 10 分钟来计算最近的单词)。

有足够的内存 ( -Xms20g -Xmx20g)。

当我从https://code.google.com/p/word2vec/运行相同的 Word2Vec 示例时

它很快就给出了最接近的词。

DL4J 使用声称比 Numpy 快两倍的 ND4J:http: //nd4j.org/benchmarking

我的代码有什么问题吗?

更新:它基于https://github.com/deeplearning4j/dl4j-0.4-examples.git(我没有触及任何依赖项,只是尝试阅读 Google 预训练向量文件)。Word2VecRawTextExample 工作得很好(但数据量相对较小)。

0 投票
1 回答
262 浏览

java - 对于 deeplearning4j 单 RBM 使用需要一些帮助

我有一堆传感器,我真的只想重建输入。

所以我想要的是这样的:

  1. 在我训练完我的模型后,我将传入我的特征矩阵
  2. 取回重建的特征矩阵
  3. 我想调查哪些传感器值与重建值完全不同

因此,我认为 RBM 将是正确的选择,并且由于我习惯了 Java,因此我尝试使用 deeplearning4j。但是我很早就被卡住了。如果您运行以下代码,我将面临 2 个问题。

  1. 结果与正确的预测相差甚远,其中大多数只是[1.00,1.00,1.00]。

  2. 我希望得到 4 个值(这是预期要重建的输入数)

那么我必须调整什么来获得a)更好的结果和b)恢复重建的输入?

0 投票
1 回答
1570 浏览

java - deeplearning4j - 使用 Word2Vec 进行命名实体识别

我正在尝试使用 deeplearning4j从头开始​​复制论文 NLP(几乎) 。我已完成以下步骤:

  1. 加载 SENNA 词向量
  2. 为 CoNLL'03 数据集编写一个迭代器:对于每个单词,我通过连接其相邻单词的单词向量来形成一个单词特征向量(窗口大小 = 5)
  3. 使用上面的数据集迭代器来训练一个简单的回归层,例如:

我尝试了许多不同的配置,但没有一个对我有用。该模型继续预测所有带有“O”标签的单词。如果您能指出我的方法有什么问题,我将不胜感激?下一步我应该做什么?谢谢!

0 投票
1 回答
289 浏览

intellij-idea - DeepLearning4j 示例 maven 项目无法由 Intellij 处理

如屏幕截图所示,dl4j-0.4-examples 项目的依赖项无法由 intellij 加载。

无法获取依赖信息:无法读取工件“com.github.jai-imageio-core.jar”的元数据文件:配置文件“java8-and-higher”中的 JDK 版本无效:无界范围 [1.8

在此处输入图像描述

在这个问题中解决了类似的问题

https://github.com/google/gson/issues/596

作为快速修复打开本地存储库中的 pom 文件并添加“)”,应该看起来像

91 [1.8,)

保存并再次执行

但是在这种情况下没有jdk标签:所以不能使用这种方法。

有没有人找到解决方法将此项目加载到 intellij 中?

0 投票
1 回答
582 浏览

java - dl4j canova 示例不起作用

Deeplearning4j canova 示例不工作。我得到 eval.stats 的输出为 NaN(准确度)。我

0 投票
1 回答
10114 浏览

java - org.nd4j.linalg.factory.Nd4jBackend$NoAvailableBackendException

我不知道它想从我这里得到什么。我在用

在哪里

但我得到

如果我尝试加载 Google 词向量模型:

0 投票
2 回答
1275 浏览

java - Deeplearning4j 到 Spark 管道:将 String 类型转换为 org.apache.spark.mllib.linalg.VectorUDT

我有一个情绪分析程序,可以使用循环中性网络预测给定的电影评论是正面的还是负面的。我正在为该程序使用 Deeplearning4j 深度学习库。现在我需要将该程序添加到 apache spark 管道中。

这样做时,我有一个MovieReviewClassifier扩展的类,我必须将该类org.apache.spark.ml.classification.ProbabilisticClassifier的一个实例添加到管道中。使用方法将构建模型所需的特征输入到程序中setFeaturesCol(String s)。我添加的特性是有String格式的,因为它们是一组用于情感分析的字符串。但功能应该是形式org.apache.spark.mllib.linalg.VectorUDT。有没有办法将字符串转换为 Vector UDT?

我在下面附上了我的管道实现代码:

Review 是包含要预测为正或负的字符串的特征列。

执行代码时出现以下错误:

0 投票
1 回答
1098 浏览

java - DL4J - 去噪自动编码器的准确性

我一直在尝试运行 DL4J 为堆叠去噪自动编码器提供的示例代码。但是,我的结果非常糟糕:

我不确定是什么导致结果如此糟糕。我使用的是 MNIST 数据集,堆叠去噪自动编码器的代码由 DL4J 提供。我的代码如下:

谢谢!

0 投票
2 回答
1847 浏览

neural-network - 在神经网络上回归最大函数

我正在训练自己学习神经网络。有一个功能我无法让我的神经网络学习:f(x) = max(x_1, x_2). 这似乎是一个非常简单的函数,有 2 个输入和 1 个输入,但是一个 3 层神经网络训练了超过 2000 个 epoch 的一千个样本,却完全错误。我正在使用deeplearning4j.

是否有任何理由为什么对于神经网络来说 max 函数很难学习,或者我只是把它调错了?

0 投票
1 回答
387 浏览

machine-learning - DeepLearning4J - ParagraphVectors:为什么相似度为负?

我在 DeepLearning4j 框架中使用 ParagraphVector 工具。我正在做的是在一组文本文档上训练一个模型,然后计算这些文档之间的相似度。

现在,正如参考页面(http://deeplearning4j.org/word2vec)所说,该工具用于计算相似度的度量是余弦相似度,它应该包含在 0 和 1 之间。但是,对于某些文档对,我得到负分。

谁能告诉这是为什么?

先感谢您。