问题标签 [conceptnet]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
stanford-nlp - 为什么 ConceptNet Numberbatch 词嵌入对类比查询的结果很差?
我一直在对一些公开可用的词嵌入进行类比查询,特别是使用以下内容:
numberbatch-en-19.08
来自https://github.com/commonsense/conceptnet-numberbatchglove.42B.300d
来自https://nlp.stanford.edu/projects/glove/glove.840B.300d
来自https://nlp.stanford.edu/projects/glove/
我正在做一些基本查询,包括(queryTarget
我在哪里寻找):
baseSource:baseTarget :: querySource:queryTarget
例如man:woman :: king:queen
- 最大化
cosine_similarity(baseTarget-baseSource, queryTarget-querySource)
- 最大化
cosine_similarity(baseTarget-baseSource, queryTarget-querySource) * cosine_similarity(baseTarget-queryTarget,baseSource-querySource)
- 最小化 L2norm(baseTarget-baseSource+querySource, queryTarget)
对于查询:
man:woman :: king:?
数据为我提供了各种匹配策略的glove
正确queen
, lady
,princess
结果。但是,conceptnet 将female_person
, adult_female
,king_david's_harp
列为前 3 名,这是我没想到的(女王不在前 20 名中)。同样,我看到糟糕的结果经常取代我在手套结果中看到的预期结果。
在使用之前,conceptnet 嵌入是否需要进行某种额外的调整?还是它只是不适合/不适合英语类比?
nlp - 如何使用 FastText 查找与两个关键字相似的单词?
我试图找到与两个不同单词相似的单词。我知道我可以使用 FastText 找到最相似的词,但我想知道是否有办法找到与两个关键词相似的关键词。例如,“apple”类似于“orange”,也类似于“kiwi”。所以,我想做的是,如果我有两个词,“器官”和“猕猴桃”,那么我想得到关键字“苹果”或任何其他水果的建议。有没有办法做到这一点?
nlp - 构建自己的 ConceptNet 副本而不是使用他们的 REST API 会提高性能吗?
我浏览了所有的 ConceptNet wiki 和常见问题解答,以了解在性能方面在 AWS 上创建我们自己的 ConceptNet 副本的优势,但没有找到任何东西。通过他们的 Web REST API 调用 ConceptNet 与在 AWS 上构建自己的 ConceptNet 副本时,性能有何不同?对于 Web API,它是wiki中给出的每小时 3600 个请求,但是在我们的 AWS 容器上使用呢?假设数据与 ConceptNet 相同。