问题标签 [deeplearning4j]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - DL4J 在 GoogleNews-vectors 文件上超级慢
我尝试在 DL4J 上执行以下示例(加载预训练的向量文件):
但它非常慢(尽管它们是正确的,但需要大约 10 分钟来计算最近的单词)。
有足够的内存 ( -Xms20g -Xmx20g
)。
当我从https://code.google.com/p/word2vec/运行相同的 Word2Vec 示例时
它很快就给出了最接近的词。
DL4J 使用声称比 Numpy 快两倍的 ND4J:http: //nd4j.org/benchmarking
我的代码有什么问题吗?
更新:它基于https://github.com/deeplearning4j/dl4j-0.4-examples.git(我没有触及任何依赖项,只是尝试阅读 Google 预训练向量文件)。Word2VecRawTextExample 工作得很好(但数据量相对较小)。
java - 对于 deeplearning4j 单 RBM 使用需要一些帮助
我有一堆传感器,我真的只想重建输入。
所以我想要的是这样的:
- 在我训练完我的模型后,我将传入我的特征矩阵
- 取回重建的特征矩阵
- 我想调查哪些传感器值与重建值完全不同
因此,我认为 RBM 将是正确的选择,并且由于我习惯了 Java,因此我尝试使用 deeplearning4j。但是我很早就被卡住了。如果您运行以下代码,我将面临 2 个问题。
结果与正确的预测相差甚远,其中大多数只是[1.00,1.00,1.00]。
我希望得到 4 个值(这是预期要重建的输入数)
那么我必须调整什么来获得a)更好的结果和b)恢复重建的输入?
java - deeplearning4j - 使用 Word2Vec 进行命名实体识别
我正在尝试使用 deeplearning4j从头开始复制论文 NLP(几乎) 。我已完成以下步骤:
- 加载 SENNA 词向量
- 为 CoNLL'03 数据集编写一个迭代器:对于每个单词,我通过连接其相邻单词的单词向量来形成一个单词特征向量(窗口大小 = 5)
- 使用上面的数据集迭代器来训练一个简单的回归层,例如:
我尝试了许多不同的配置,但没有一个对我有用。该模型继续预测所有带有“O”标签的单词。如果您能指出我的方法有什么问题,我将不胜感激?下一步我应该做什么?谢谢!
intellij-idea - DeepLearning4j 示例 maven 项目无法由 Intellij 处理
如屏幕截图所示,dl4j-0.4-examples 项目的依赖项无法由 intellij 加载。
无法获取依赖信息:无法读取工件“com.github.jai-imageio-core.jar”的元数据文件:配置文件“java8-and-higher”中的 JDK 版本无效:无界范围 [1.8
在这个问题中解决了类似的问题
https://github.com/google/gson/issues/596
作为快速修复打开本地存储库中的 pom 文件并添加“)”,应该看起来像
91 [1.8,)
保存并再次执行
但是在这种情况下没有jdk
标签:所以不能使用这种方法。
有没有人找到解决方法将此项目加载到 intellij 中?
java - dl4j canova 示例不起作用
Deeplearning4j canova 示例不工作。我得到 eval.stats 的输出为 NaN(准确度)。我
java - org.nd4j.linalg.factory.Nd4jBackend$NoAvailableBackendException
我不知道它想从我这里得到什么。我在用
在哪里
但我得到
如果我尝试加载 Google 词向量模型:
java - Deeplearning4j 到 Spark 管道:将 String 类型转换为 org.apache.spark.mllib.linalg.VectorUDT
我有一个情绪分析程序,可以使用循环中性网络预测给定的电影评论是正面的还是负面的。我正在为该程序使用 Deeplearning4j 深度学习库。现在我需要将该程序添加到 apache spark 管道中。
这样做时,我有一个MovieReviewClassifier
扩展的类,我必须将该类org.apache.spark.ml.classification.ProbabilisticClassifier
的一个实例添加到管道中。使用方法将构建模型所需的特征输入到程序中setFeaturesCol(String s)
。我添加的特性是有String
格式的,因为它们是一组用于情感分析的字符串。但功能应该是形式org.apache.spark.mllib.linalg.VectorUDT
。有没有办法将字符串转换为 Vector UDT?
我在下面附上了我的管道实现代码:
Review 是包含要预测为正或负的字符串的特征列。
执行代码时出现以下错误:
java - DL4J - 去噪自动编码器的准确性
我一直在尝试运行 DL4J 为堆叠去噪自动编码器提供的示例代码。但是,我的结果非常糟糕:
我不确定是什么导致结果如此糟糕。我使用的是 MNIST 数据集,堆叠去噪自动编码器的代码由 DL4J 提供。我的代码如下:
谢谢!
neural-network - 在神经网络上回归最大函数
我正在训练自己学习神经网络。有一个功能我无法让我的神经网络学习:f(x) = max(x_1, x_2)
. 这似乎是一个非常简单的函数,有 2 个输入和 1 个输入,但是一个 3 层神经网络训练了超过 2000 个 epoch 的一千个样本,却完全错误。我正在使用deeplearning4j
.
是否有任何理由为什么对于神经网络来说 max 函数很难学习,或者我只是把它调错了?
machine-learning - DeepLearning4J - ParagraphVectors:为什么相似度为负?
我在 DeepLearning4j 框架中使用 ParagraphVector 工具。我正在做的是在一组文本文档上训练一个模型,然后计算这些文档之间的相似度。
现在,正如参考页面(http://deeplearning4j.org/word2vec)所说,该工具用于计算相似度的度量是余弦相似度,它应该包含在 0 和 1 之间。但是,对于某些文档对,我得到负分。
谁能告诉这是为什么?
先感谢您。