问题标签 [semantic-comparison]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
.net - NUnit:使用 SemanticComparison .NET 库跟踪复合结果中预期和实际之间的差异
我在我的单元测试(NUnit)中使用 SemanticComparison 并且经常遇到这样的错误:
我之前跟踪过这样的错误,因为这是由于某些子属性不等于我在单元测试中定义的预期值。但是错误消息只是具有这种非常一般的形式。而且我在堆栈跟踪中也看不到任何东西。但我想该库包含以某种方式自动显示不同的属性。手动跟踪它们都需要我相当长的时间。
为了完整起见,我的代码如下所示。但是我希望熟悉 SemanticComparison 的人阅读这个问题(它是一个库/NuGet 包,用于帮助 Mark Seemann aka Ploeh 进行的单元测试。它是 AutoFixture 的一个附带项目。)。
java - 使用 dkpro 语义相似度与 uby
我想计算具有 dkpro 相似度(https://dkpro.github.io/dkpro-similarity/)的字符串之间的相似度,它的工作原理如下:
我使用这样的类:
我使用 LexicalSemanticResource 作为比较资源,它可以是 wordnet、wikipedia、germanet 等。现在我注意到我需要的所有资源都在 uby ( https://www.ukp.tu-darmstadt.de/data/lexical-资源/uby/,https://github.com/dkpro/dkpro-uby/blob/master/de.tudarmstadt.ukp.uby.lmf.api-asl/src/main/java/de/tudarmstadt/ukp/lmf _ /api/Uby.java )。
我的问题是:我可以用 uby 的资源替换该资源,这样我就不必每次需要一个新资源时都重新包含一个新资源?所以我想使用 uby 资源而不是 ResourceFactory.getInstance().get("wordnet"),所以像 new Uby().getLexicalResource("wordnet") - 但是来自 uby 的 lexicalresource 与 LexicalSemanticResource 我不一样现在用于语义比较。所以:我不想使用例如 LexicalSemanticResource wordnet,而是使用 uby 的 wordnet 作为比较器。有没有办法做到这一点?
deep-learning - 我应该使用全部可用数据来训练我的深度学习模型吗?仅使用子集的优缺点是什么?
我有一个非常复杂的基于 LSTM 的神经网络模型,我正在对 Quora Duplicate Question 对进行训练。原始数据集中大约有 400 000 个句子对。在整个(或 80%)数据集上进行训练需要大量的处理能力和计算时间。如果我选择数据集的一个随机子集(例如仅 8000 对)用于训练,而选择 2000 对用于测试,那会不会很不明智?会对性能造成严重影响吗?“更多的数据,更好的模型”总是真的吗?