问题标签 [text-search]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
regex - 正则表达式仅查找第一个匹配项
我有这段文字:-
我的要求是找到此模式“成功次数:(\d+)”的第一次出现,即成功次数:3556。但上面的表达式也返回后续匹配项。
我希望正则表达式为我执行此操作,这与我可以使用循环进行迭代的 java 不同。
任何人都可以帮助我使用只能找到第一次出现的正则表达式。
javascript - 如何删除 window.find(text) 的突出显示格式
在WebView
(Android)中使用 JavaScript 进行文本搜索后window.find(text)
,使用此 SO 帖子中的代码,成功并突出显示相应的文本。
不幸的是,我没有成功找到删除该格式的代码。我尝试了各种方法(一些来自 StackOverflow)但没有成功,但我认为正确的方法都没有:
如何删除格式?
java - 如何在 JAVA 中对阿拉伯语文本进行搜索?
我在数据库中有带有变音符号的阿拉伯语文本。当我输入阿拉伯语来搜索某些字符串时,它没有变音符号,这绝对与数据库字符串不匹配。它在没有变音符号的文本上运行良好。有没有办法在带有变音符号的文本上运行它???
c# - 从文本文件中扫描多个单词
我有一个单词列表。我希望程序从文本文件中扫描多个单词。
这是我已经拥有的:
所以我想扫描文件中的一个单词,如果它不存在,扫描下一个单词...
wpf - Text Search in WPF ListView not working properly with selectionmode extended
I have a WPF ListView with selection mode set to Extended (and I need to keep it extended for other funationality). I have also enabled text search on this listview using TextSearch options.
Now consider I have following 5 items in ListView :
- Apple
- Ball ==> This is current selected item.
- Cat
- Dog
- Elephant
At this stage, if I press key "E" on keyboard, the text search works properly and the item "Elephant" gets selected. However, if I press "Shift + E", all items from Ball to Elephant gets selected, i.e. Shift key is used for extended selection and not for Capital Letter E. However, since I am doing a search using keyboard, shouldn't the only item "Elephant" get selected and shift key should be used for capital E and not for extended selection? Can we somehow achieve this?
search - Search Algorithm for a web application that needs to look for a specific value
I'm developing a webapp that will need to download the html form a website and then iterate through the code and try to find a specific but ever changing value (in our case it will be the price for the product).
For this, I was thinking about asking the user (upon installation and setup) to provide the system with a few lines of html from the page (that has the price) and then from then on, every time we need to fetch the price we would try to search for those lines and find the price.
Now, I believe this is a horrible and slow way of doing this and since there are no rules and the html can be totally different from one website to another (even the same website might change) I couldn't find a better way.
One improvement that I thought about was to iterate through the first time and record the line at which we find the code. Once found, the subsequent times we would then start from a few lines before the expected location and start the search. Any Thoughts on how I can improve on this?
I posted this question on https://cstheory.stackexchange.com/ but they commented that it's not on topic and that I should post it here.
I have the code for the above and if needed I can post it, I'm simply thinking that there must be a better, faster way of doing this.
php - 将文本与多个文本进行比较并找到具有匹配句子的文本
我希望能够将一个段落与多个(比如数千甚至更多)不同的段落进行比较,看看这些段落的任何部分是否在第一个段落中完全使用。
想象一下,您有一个名为的段落A
,您想检查它是否包含其他数千个段落中的任何句子或句子的一部分。
我认为一种非常低效的方式,并且没有更好的答案出现在我的脑海中。我的方法是从输入段落 ( A
) 中读取前三个单词。然后,检查所有数千个文本的数据库中是否有任何精确匹配。如果有任何匹配,列出它们,然后将第四个单词添加到字符串4-word
中,并从匹配列表中找到与字符串匹配的字符串3-word
。执行此操作,直到字符串不再匹配为止n-word
。的列表(n-1)-word
将作为此运行的结果保存。接下来,新的3-word
字符串将是nth
,单词(n+1)th
和(n+2)th
一切都重新开始,直到文档结束。
对于大型输入文本和大型比较文本数据库,这将是非常低效的。有更好的算法吗?
java - JenaText:查询 RDF 文件的工作示例
我正在尝试为Apache Jena Text制作官方示例以使用 rdf 文件。这里给出了官方的例子。
老实说,我认为文档太少,示例太笼统。它没有提供一个真正的 rdf 文件作为示例,并且有很多东西需要配置。我正在尝试分析这个 RDF 文件。
- 更新 -
我找到了官方示例中使用的文件,如对此问题的评论中所述。
因此,我通过将原始示例与 foaf.rdf 文件混合来定义以下 ttl 文件。现在我有了文件foaf.ttl
:
因此,对于目前提到的原始Java文件,我在main中设置:
在queryData
我的方法中:
在createCode()
我有:
结果是:
但是,我报告说 X1 也包含在三元组中:
但B2
不在结果集中。有人可能会说:“你必须定义一个索引”。好吧,非常奇怪的是,如果我设置createCode()
:
结果没有改变!
那么,它的作用是EntityDefinition
什么?我究竟做错了什么?
pdf - 如何自动搜索 2 个 PDF 文件以查找字符或单词的差异
我正在寻找一个可以在两个单独的 pdf 中搜索文本差异的程序。一个 pdf 是扫描的书,另一个 pdf 是同一扫描 pdf 的 OCR 输出。我需要找到缺少的字符,有人知道该怎么做吗?
mongodb - mongodb 2.6上的文本搜索返回错误
我正在使用 mongoDB 2.6,我的文档结构是这样的:
我想在 about 字段上应用文本搜索。我是这样做的:db.user.ensureIndex({"about":"text"})
但是当我运行搜索查询时:db.user.find({$text:{$search:"internet"}})
我收到此错误:error: { "$err" : "invalid operator: $search", "code" : 10068 }
根据文档,默认情况下在 mongodb 2.6 上启用了文本搜索。那么有什么问题呢?早些时候我在我的机器上安装了 2.2。我最近下载了 2.6,我只使用 2.6 应用了这个索引。