问题标签 [vsm]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
xaml - 更改动画中的边框背景颜色
我是XAML领域的新手,我只想了解VSM。当我在 StoryBoard 中添加一些东西时,总是会出现同样的错误。如下:
无法解析指定对象上的 TargetProperty Background.Color。
为什么以及如何修复它,谢谢!
python-2.7 - 如何在 python 中为有限字符串实现 BM25F、VSM 或 POS 标记?
我有一个文本文件,其中只有 35 个字符串我想在文本文件中找出最相关的字符串。如何实现 BM25F、VSM 或 POS 来找到它?
例如
给定的输入是Bahawalpur 火车站
如何找到最合适/相关的字符串?
python - 词嵌入提取
我正在使用 python 2.7,并且我已经预先训练了英语嵌入。我需要从这个文件中查找某个词嵌入。
该文件有 300 个维度,格式如下:
the -0.0279698616277 -0.00822567637943 -0.066859518431 0.0152934683231 -0.0329719520937 0.0530985715151 0.0346279291928 0.000898163363809 -0.0342044668875 -0.0358478199459 0.0330627337979 -0.0291780565785 -0.050316270082 0.0226246942919 -0.0999551118641 -0.0211768282161 -0.0650169654368 -0.13170513108 0.0136621823624 0.00761099698762 -0.0747038745232 -0.0309831087459 -0.0281774157081 -0.0381752846197 0.000854164869137 0.118230081556 -0.0544820178539 -0.0259578123228 -0.0250848970404 0.0432551614539 0.0604299831315 0.0605994794422 -0.0652365866148 0.0741619690129 -0.0122427203782 -0.0486630776978 0.0266766400501 -0.0575422338293 -0.0120115890454 0.067022888369 0.0563923322428 0.116347799963 0.0272241149902 -0.0271056717851 -0.0876134412848 -0.0160824708647 0.0478176382685 -0.0278610721008 -0.043103116023 -0.123507487497 -0.0286480325182 -0.00985009337681 -0.00749645238334 -0.00322952663845 -0.046423238718 0.103032221776 0.0821490881533 -0.121380150997 -0.00599957532621 -0.0843011157914 -0.0667407039306 0.0204320098169 -0.0953102074899 -0.0644943672828 -0.00133722007224 0.00249399062204 -0.0199877549741 -0.0494372284268 0.00730022281006 0.100155611334 0.0158984940368 0.0919811737074 -0.0762293413195 0.110083862374 0.0495974423547 -0.0737607844265 0.0507363907294 0.01065877457 -0.0101547411817 0.0437805443228 0.0801814086384 -0.0739505163318 0.0359545673486 0.122458949531 - 0.0289695742598 0.0247212132806 -0.0799729263198 -0.0204555870693 -0.00530952298573 -0.0580316010527 0.0849861556452 -0.0386267797212 0.0264685290268 -0.0680456213105 0.0826555349612 -0.0264161763876 -0.0995871582083 0.0344213033507 0.0533503097378 0.037602190303 -0.061794122114 -0.00452664681682 -0.025897662482 -0.0804463278447 -0.0725472056937 -0.109343313871 0.0121977936453
我尝试使用.split(" ")
,但这也会导致向量分裂。关于如何搜索单词并从文件中提取其向量的任何想法?
solr - 带有 Nutch 和 Solr 的向量空间模型
我是 NUTCH 和 SOLR 的新手,我必须在我的顶点项目中基于这两个构建一个搜索引擎。好吧,我的理解是 Nutch 的相似性是 LinkRank 与 Google 的 PageRank 和 Solr 7.3.1 默认使用 BM25 相似性的工作方式相同,现在我必须使用向量空间模型,但我不知道我是否必须在 Nutch 和 Solr 中或仅在 Solr 上实现它。请你指导我好吗?(如果我理解错了,请为我纠正)。
continuous-integration - 有没有办法在 gocd 中导出价值流图?
在 GoCD 管道中,我们可以将管道元数据导出为 json 或 xml。同理,是否可以导出属于价值流图的所有管道?
rstudio - 提取同义词
- 我有十个 txt 文件并生成了这些文件的语料库。
- 创建我的语料库后,我需要生成向量空间模型。
- 对于 VSM,我对语料库进行了预处理以删除停用词、数字、标点符号等...
- 现在我需要阅读语料库并针对语料库中存在的每个关键字/字符/单词生成同义词。
- 我无法使用 wordnet 来获取文本语料库中存在的每个文件的同义词。
我想生成每个单词的同义词并将这些关键字附加到同一个文件中..
neo4j - Neo4j:包含另一个项目时创建一个项目列表
我想从 Buy1 与 Item346 Buy1 的交集创建一个新列表 (c2):[Item 12, Item 23, Item 7, Item 562, Item 346, Item 85]
我要返回的列表(vsm 表示) c2 : [0, 0, 0, 0, 1, 0]
tensorflow - 如何将 Tensorboard 从 localhost 扩展到我们的内部 Web 应用程序门户?
我正在研究一些模型,到目前为止,张量板可视化对我们的团队非常有用。我的团队要求我找到一种方法,将这些可视化嵌入到我们的内部 Web 应用程序中。有没有人有这样做的想法?
python - 使用python的大型数据集中的向量支持模型
我写了函数,然后不得不更改 tf-idf 函数(因为有一个错误),现在当我运行代码时,我不再得到分数,但它也没有失败。我已经调试了好几个小时了,有什么想法吗?
输入如下:
我正在对较小的文档集合测试输出,以便可以对其进行处理,但这是输出: