问题标签 [thesaurus]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sql - SQL FREETEXT 搜索转义空间
我的数据库中有一个词库表,我想使用 FREETEXT 收集数据。但是,我正在搜索的字符串包含空格。
比如我要搜索代码“AB 001”
此代码将搜索“AB”和“001”,这会给我更多的垃圾结果。我尝试将字符串放在双引号中,但它也不起作用。
我该怎么做才能搜索完整的“AB 001”字符串?
我使用了 LIKE,它给了我想要的结果,但我想尝试全文搜索,因为它更快,并且在我的情况下会给出更准确的结果。
谢谢!
编辑
我尝试使用CONTAINS
,但它给了我额外的结果,我不明白为什么要返回它们。该CONTAINS
功能对我也不起作用:/
c - 插入函数在 C 中的同义词库程序中无法正常工作
我已经开始创建一个程序并按照我的理解使用 Graph ADT。但是我在插入我的一组单词时仍然存在问题。当我尝试插入另一组单词时,我之前插入的单词似乎从列表中消失了,即使我没有终止程序。我不明白 请帮忙
c - C中的文件处理和图形ADT
我在 C 中创建了一个词库程序。在我的程序中,用户可以插入一个单词及其同义词。另一个功能是搜索一个词,然后显示该词的同义词。
我的问题是如何保留我插入的单词并在再次运行程序时仍然检索它们?文件处理是一种解决方案吗?我将如何做?
java - 从 Java 中的 Moby Grady 同义词中获取同义词的最佳方法是什么?
我正在创建一个视觉词库,它将作为此处显示的淡化版本: https ://www.visualthesaurus.com/
我是一名新程序员,这将是我的第一个项目之一。我正在为我的词库列表使用 Moby Grady 的词库文本文件,但我遇到了问题。
Moby Thesaurus 的格式设置为有一个词根,后跟一个逗号,然后是类似或相关的词,而不是回车符/换行符和另一个词根...
前任。词根,如字,如字,如字
我现在用于查找同义词的技术如下: 1. 输入单词以查找 2. 从第一行开始,将行转换为字符串数组,然后测试 wordToFind 是否在该行中,如果它即,打印该行并搜索更多行以查找 wordToFind。
我已成功打印出包含我的 wordToFind 的每一行,但该行中的每个单词都不是同义词的良好匹配。我要求任何有这种经验的人帮助我想出一种方法来获得与我的 wordsToFind 更相似的单词。
json - 获取json中单词的所有含义
如何在 json 响应中获得一个单词的所有含义。最好没有键/注册/api 键。如果我输入测试,那么该单词的所有含义。
我试过了 :
但它不工作。
即使这是返回null。
我只尝试了上面的 php。我想知道我是否可以在没有 api 键的情况下进行休息调用,只是与查询词匹配的单词。你是否有任何休息电话。我非常感谢任何帮助。在此先感谢。
nlp - 从语料库构建词库
我正在开发一个自然语言处理应用程序。我有一个描述 30 个域的文本。每个域都有一个简短的段落来解释它。我的目标是根据该文本构建一个词库,以便我可以从输入中确定string
涉及哪些域。文本大约 5000 个单词,每个域由 150 个单词描述。我的问题是:
我是否有足够长的文本来创建词库?
我构建词库的想法是合法的,还是应该只使用 NLP 库来分析我的语料库和输入字符串?
目前,我计算了按域分组的每个单词的总出现次数,因为我首先想到了索引方法。但我真的不确定哪种方法最好。有人在 NLP 和词库构建方面都有经验吗?
postgresql - PostgreSQL CREATE TEXT SEARCH DICTIONARY 报告词库文件行上实际上不包含报告的停用词的停用词
我尝试使用查询从词库文件moby.ths创建词库
Postgres 报告以下错误:
[F0000] 错误:同义词样本词“over”是停用词(规则 63944)
当我打开 moby.ths 时,第 63944 行不包括“over”。
- 规则号与 .ths 文件中的行号不一样吗?
- 如何在 .ths 文件中找到与规则编号相对应的行?
更新:
- .ths 文件样本端没有“结束”。
- Postgres 是否通过从原始 .ths 文件中删除行并创建其规则集来进行一些预处理?
- 如果是这样,我如何查看 Postgres 正在处理的规则集以及规则 63944 可能存在的位置?
sql-server-2008 - SQL Server 2008 缺少词库 xml 和 ftdata 文件夹
我最近安装了 SQL Server 2008,我尝试了全文搜索,现在我需要使用同义词库作为同义词,但我找不到任何 xmq 并且我阅读的 ftdata 文件夹应该包含 xml 文件。 。谢谢你!!!
dictionary - 在 Postgresql 中创建过滤词库
我正在使用 Postgresql 进行全文搜索,但在创建过滤词库时遇到了麻烦,按照 Postgresql 文档中关于使用字典的全文搜索 (12.6) 的描述。
我知道文档只讨论了一个过滤字典,它是一个程序,它接受一个标记作为输入并返回一个带有 TSL_FILTER 标志集的单个词素,用一个新的标记替换原始标记,以传递给后续的字典。我的问题是:是否可以创建一个词库,它接受一个短语(1-3 个标记)并返回一个带有 TSL_FILTER 标志集的单个词素,该标志集被传递给后续字典或词库?如果是这样,我做错了什么?
我尝试创建一个名为 dict_fths 的新扩展,它与 Postgresql 提供的默认词库基本相同,只是短语映射到的每个词素都设置了 TSL_FILTER 标志。我通过以下方式创建了两个名为 fths 和 second_ths 的文本搜索词典:
当映射在单个标记和单个词位之间时,dict_fths 行为正确。
fths_sample.ths 条目:
second_ths.ths 条目:
输出(正确,正确):
但是,当我编辑 ths 文件以包含短语时,我不再得到我想要的输出:
fths_sample.ths 条目:
输出(正确,正确,不正确,不正确):
即使在我编辑了 fths_sample.ths 文件后,输出仍然不正确:
fths_sample.ths 包含:
这是输出(正确,不正确):
因此,当 1)它有超过 1 个标记 2)它是较长短语的一部分时,词库似乎无法通过词位。
perl - 是否有我可以使用 Perl 访问的英语词库资源?
我想使用 Perl 来搜索离线词库。我不知道这是否可能,或者实现这一目标的机制是什么
我希望能够
在机器上拥有下载的词库
编写一个 Perl 程序,搜索下载的词库并返回最少的输出。
例如
我注意到有一个Biblio::Thesaurus
似乎很有希望,但我完全不知道如何使用这个模块,除非有一个通用的(或至少流行的)ISO 格式的英语词库,可以在某处免费下载
我想我在寻找
ISO 格式的英语词库
一种使用 Perl 导航此数据的方法