问题标签 [examine]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - 根据昵称检索姓名记录
请注意,我不是在寻找意见,而是从做过这件事的人那里寻找例子。
我们有一个约 20,000 人的数据库。我们目前使用 Examine/Lucene 来索引名称,并允许通过自由格式的文本字段进行搜索,用户可以在其中输入名字、姓氏或两者兼而有之。我们正在寻求改进结果,因为 Lucene 模糊搜索不能完全满足我们的需求。
我们正在寻求投资 Peacock 昵称数据库并将其添加到我们现有的 SQL Server 数据库中。我正在绞尽脑汁思考如何最好地使用这个昵称数据。
我可以将名字与可能的昵称结合起来,并在搜索集合中对其进行索引。但这会比我在索引中单独保存更快吗?只对名称/昵称执行 SQL 查询而不使用 Lucene 怎么样?
umbraco - 检查 MultiIndexSearcher 示例 Umbraco
尝试使用 MultiIndexSearcher 提供程序在 razor 中获取搜索器。
这导致零结果 - 通过代码和后台的检查管理。
有没有人有使用 MultiIndexSearcher 的示例或代码片段,因为我显然遗漏了一些东西。
lucene - Lucene 包含查询不起作用 - Umbraco 检查管理内容搜索器
我的数据库中有 2 个文档:
查询 1:如果我运行 Lucene 查询:title:"something else"
- 它找到 ID 为 1 的文档。
查询 2:如果我运行 Lucene 查询:title:"something els"
- 它没有找到任何文件。
查询 3:如果我运行 Lucene 查询: title:"something els*"
- 它没有找到任何文件。
可能出了什么问题?
我希望看到查询 2 和 3 返回 ID 为 1 的文档
笔记:
title: something else
从 Umbraco 显示的内容搜索器返回。
umbraco - Umbraco lucene/examine 丢失自定义字段
我们有一个相当大的 umbraco 网站,正在为客户维护。特别是一种节点类型具有自定义检查索引器/搜索器,用于在站点的特定区域中进行搜索。我们有一个 DirectoryIndexer_GatheringNodeData 事件,它连接在启动处理程序中,它将一些数据推送到一些定义的索引字段中:
我们正在观察一个问题,即定期(似乎无法在本地重现)索引只是完全删除brandIndex和productIndex字段(它们从索引中消失,就像它们从未存在过一样)
如果我们在后台使用检查管理仪表板查看索引数据,clientBrandInfo 字段仍然存在,但brandIndex和productIndex字段不存在。
它们同时对所有节点消失,并且重新索引将它们恢复。
我们检查了跟踪日志,没有迹象表明所有节点都调用了 NodeGathering 事件(因此没有完全重建),其中自定义字段设置为空。
每当此事件运行并在索引中设置节点信息时,我们都会记录。
有没有人有什么建议?现在,我们已经安排每小时重建一次索引,大约需要 3 分钟。
我观察到的唯一一件事是当问题发生时索引显示一些删除 但是在开发测试中,即使通过删除/更新/添加索引到 lucene 的节点,我也无法重现丢失的字段问题(删除是)。
c# - Lucene 搜索 creteria 改字
我使用 lucene 进行搜索。
对于索引中的每个文档,我都有一些名为“uniqueIdentifier”的字段,类型为字符串。
当我想查找所有带有“uniqueIdentifier”==“haaglanden”的项目时,我使用下面的代码:
在温度我看到:
但是“哈格兰”!=“哈格兰登”。
而且我找不到我的文档。
如何使用“haaglanden”构建查询?
lucene - 如何让 Examine 在 Umbraco 7 中执行短语查询?
我正在尝试在 Umbraco 7 (7.3.6) 中构建一些自定义搜索逻辑,它将搜索用户提供的多个术语,其中这些术语可能包括用引号括起来的短语。
我有以下代码,它采用提供的术语,使用正则表达式来拆分单个术语(同时保留用引号括起来的术语),然后使用一系列GroupedOr
调用来搜索多个字段
这是 GetValues 方法:
我的索引中有一个文档,其中包含“The quick brown fox jumps over the lazy dog”一词。"\"brown fox\""
如果我通过上述逻辑传递字符串然后检查我的查询,我可以看到我的query
对象包含以下 Lucene 查询:
但是,当我使用它来构建如下搜索查询时,我没有得到任何结果。
但是,如果我使用Luke运行完全相同的 Lucene 查询,我会得到我期望的结果。
有谁可以帮助我理解这一点?如果您能解释为什么我的提升值没有被添加到 Lucene 查询中,请加分!!
umbraco - 检查索引搜索 (Umbraco) 是否支持带重音的单词?
我正在使用 Umbraco 的检查索引搜索来搜索 Ucommerce 产品。如果我搜索欧莱雅,它工作正常。但是当我搜索欧莱雅时,它给了我 500 错误。
任何帮助表示赞赏!
谢谢
performance - 性能问题,Azure 上的 Umbraco
只是想知道是否有人可以帮助我解决托管在 Azure 上的网站(v7.4.3)的性能问题。没有自动缩放,标准。忍受它,这是一个问题,但我的信息很长。
该网站实际上运行得相当好/很快,但时不时地,并且令人讨厌的是,当客户审查时,页面挂起,在 5-15 秒之间,这是完全不可接受的。当它发生时,它会发生在每个不同的模板页面上。然而,一旦它加载完毕,它就会运行得非常完美,正如您所期望的那样。
这几乎正是您第一次在服务器上运行站点时/它需要唤醒,将所有剃刀视图重新加载到缓存中,但由于这种情况经常发生,它似乎是别的东西,或者 Azure 的体系结构导致了问题.
我什至尝试升级到最新版本 7.6.0,但问题仍然存在,所以我认为不是 Umbraco。就我们的代码而言,我在带有注册表单的页面上使用了它,该注册表单是手动构建的,并且只有一个图像调用。就是这样,根本没有什么花哨的事情发生。
它认为 Azure 的工作方式是将站点加载到 web worker 中(它们现在可能被称为不同的名称),偶尔会被加载出来,然后重新加载到新的 web worker 中。我认为这就是问题所在,每次发生时,都是 a) 重新加载站点、视图等,b) 检查索引发生了一些事情,要么正在重建,这导致站点加载缓慢,或在某处造成延迟。
此外,该站点已加载到 Web Worker,但基本上所有文件仍在从文件系统中读取,检查索引仍在文件系统上,我认为访问速度很慢。
为了纠正其中一些问题,索引器和搜索器已经useTempStorage="Sync"
打开,因此它们应该被复制到工作人员,并在本地运行。
我们在此配置值中添加了加速静态文件服务,这无疑使静态文件加载更快:
<serverRuntime enabled="true" frequentHitThreshold="1" frequentHitTimePeriod="00:00:20" />
我们添加的最新配置应用程序设置是这样的:<add key="umbracoContentXMLUseLocalTemp" value="true" />
同样,这应该在本地加载内容缓存,而不是从文件系统中加载,但是在我们这样做之前,我们已经收到了肯定连接的常规错误. 但是,我想相信这是我一直在寻找的神奇价值,但我也读过这是针对负载平衡环境的,我不确定 Azure 最终会像负载平衡环境一样工作.
此类错误包括:
System.Exception: Cannot index queue items, the index is currently locked,, IndexSet: InternalIndexSet
Could not create index writer with snapshot policy for copying... retrying.... Exception: Lucene.Net.Store.LockObtainFailedException: Lock obtain timed out: NativeFSLock@D:\home\site\wwwroot\App_Data\TEMP\ExamineIndexes\External\Index\write.lock: System.IO.IOException: The process cannot access the file 'D:\home\site\wwwroot\App_Data\TEMP\ExamineIndexes\External\Index\write.lock' because it is being used by another process.
希望有人知道如何解决这些问题,或者遇到过原始问题?
提前致谢!
lucene - umbraco pdf 搜索结果排名
我们在我们的 Umbraco 应用程序之一中使用了 pdf 搜索器(nuget 包)。当我看到 pdf 搜索结果时,它看起来不是 100% 正确的。
搜索结果中的前 2 个 pdf 包含搜索词,但搜索结果中的第 3 个、第 4 个和其余其他 pdf 没有搜索词。不知道为什么在搜索结果中添加了没有搜索词的 pdf。
谁能提供一些关于 umbraco pdf 搜索器如何工作的信息?并对结果项进行排名?
有没有办法从搜索结果中删除根本不包含搜索词的pdf。
lucene - Umbraco 检查 - 查询整数不起作用
我正在使用 Umbraco v.7.6.1 和 Examine v0.1.82 (Lucene 2.9.4.1)。我有一个车辆列表和一个搜索表单来查询不同类型的字段,包括价格。Price 字段是一个数字数据字段,在 ExamineIndex 中定义为:
问题是在搜索价格范围时,我没有结果。使用 Umbraco 后台的检查管理工具进行以下查询:
即使我有该价格范围内的车辆,也不返回任何结果。
如果我更改检查索引并从价格字段中删除 Type="INT" 标记,则范围查询将作为普通字符串范围查询工作并返回结果。
该查询对所有字符串字段都正常工作。
根据我在文档中阅读的所有内容以及之前关于考试的问题/答案,这应该适用于我正在使用的考试版本。有什么问题?