问题标签 [cfindex]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
coldfusion - Coldfusion cfsearch 不适用于关键字吸烟
我有四个文件 [一个 .PDF、一个 .doc 和两个 .docx]。我使用 ColdFusion Administrator创建了一个名为“testCollection”的 ColdFusion 集合。在管理 ColdFusion 集合屏幕中,我输入了文件扩展名 [.pdf、.doc、.docx] 和放置所有 4 个文件的目录路径。还选中了复选框 [Recursively Index Sub Directories]。单击提交后,我可以在 Solr Collections 中看到 5 个具有其大小的文档。
之后,我在下面写了一个 cfm 文件,以根据其内容搜索文件。
搜索.cfm
当我输入标准“老年”时,它会给我正确的结果并显示除一个文件“Search_Not_Show_For_Aged.docx”之外的所有文件,因为它没有搜索标准内容“老年”。
我的问题是当我输入标准“吸烟”时,它没有给我正确的结果。它显示除一个文件“Search_Not_Show_For_Smoking.docx”之外的所有文件,但该文件包含“吸烟”字样。我将文件放入保管箱并在此处分享
请提出建议并帮助解决此问题。
谢谢
pdf - Coldfusion索引损坏的文件
对第一个文件运行刷新,然后对所有其他文件运行更新。递归可能不是必需的。
在遇到损坏的 PDF 文件之前可以正常工作。如果我尝试在 PDF 阅读器中手动打开文件,我会收到文件可能已损坏的消息。
我需要它来通过这个文件并继续索引其余部分。我尝试了三分钟的请求超时,但这不起作用。我曾尝试提取 CFPDF 信息,但它也挂起读取它。我不知道如何测试文档以查看它是否已损坏。
最终,我希望它在大约 3 分钟后放弃该文件。
有什么建议么
solr - HTMLStripCharFilterFactory @ Solr 3.4 是否为返回的字段去除 html?
根据corporatezen.com/2013/11/updating-solr-engine-coldfusion,我正在使用应该使用Solr 3.4的CF10。我添加<charFilter class="solr.HTMLStripCharFilterFactory"/>
了,<fieldType name="text">
但搜索结果中的摘要字段仍然包含 HTML。知道为什么吗?
<field name="summary" type="text" indexed="false" stored="true" required="false" />
http://localhost:8985/solr/test/admin/schema.jsp显示:
字段:摘要字段类型:TEXT
属性:标记化、存储
模式:标记化,存储
位置增量差距:100
指数分析器:org.apache.solr.analysis.TokenizerChain 详情
字符过滤器:
org.apache.solr.analysis.HTMLStripCharFilterFactory args:{luceneMatchVersion: LUCENE_24 } Tokenizer Class: org.apache.solr.analysis.WhitespaceTokenizerFactory
过滤器:
org.apache.solr.analysis.StopFilterFactory args:{words: stopwords.txt ignoreCase: true enablePositionIncrements: true luceneMatchVersion: LUCENE_24 } org.apache.solr.analysis.WordDelimiterFilterFactory args:{splitOnCaseChange: 1 generateNumberParts: 1 catenateWords: 1 luceneMatchVersion: LUCENE_24 generateWordParts: 1 catenateAll: 0 catenateNumbers: 1 } org.apache.solr.analysis.LowerCaseFilterFactory args:{luceneMatchVersion: LUCENE_24} org.apache.solr.analysis.EnglishPorterFilterFactory args:{protected: protwords.txt luceneMatchVersion: LUCENE_24 } org. apache.solr.analysis.RemoveDuplicatesTokenFilterFactory args:{luceneMatchVersion: LUCENE_24 } 查询分析器:org.apache.solr.analysis.TokenizerChain 详情
字符过滤器:
org.apache.solr.analysis.HTMLStripCharFilterFactory args:{luceneMatchVersion: LUCENE_24 } Tokenizer Class: org.apache.solr.analysis.WhitespaceTokenizerFactory
过滤器:
org.apache.solr.analysis.SynonymFilterFactory args:{synonyms: synonyms.txt expand: true ignoreCase: true luceneMatchVersion: LUCENE_24 } org.apache.solr.analysis.StopFilterFactory args:{words: stopwords.txt ignoreCase: true luceneMatchVersion: LUCENE_24 } org.apache.solr.analysis.WordDelimiterFilterFactory 参数:{splitOnCaseChange:1 generateNumberParts:1 catenateWords:0 luceneMatchVersion:LUCENE_24 generateWordParts:1 catenateAll:0 catenateNumbers:0} org.apache.solr.analysis.LowerCaseFilterFactory 参数:{luceneMatchVersion:LUCENE_24 } org.apache.solr.analysis.EnglishPorterFilterFactory args:{protected: protwords.txt luceneMatchVersion: LUCENE_24 } org.apache.solr.analysis.RemoveDuplicatesTokenFilterFactory args:{luceneMatchVersion: LUCENE_24 }
search - 如何将最后修改日期作为字段插入文档集合的 ColdFusion CFIndex 中?
如何使集合的 cfindex 包含一列,该列包含指定目录路径中各种文档的修改日期?文档似乎涵盖了数据库集合搜索的内容,但对文件/文件夹搜索保持沉默。
coldfusion - cfindex 显示插入的记录,但 doccount 为 0
我在查询中使用 cfindex,但无法从索引中获取数据。当我检查它们的集合时,我的其他索引的文档计数大于 0,但即使刷新的状态具有值,这个也始终为 0。这是我的代码:
我认为没有任何理由显示创建 qExams 的查询,但我已经在索引之前转储了它,并且我确实注意到其中确实有数据。
结果#info#
如下:
结果#qQizzes#
如下:
为了清楚起见,我删除了路径和日期。但是正如您所看到的,大小不是 0,如果我说在索引中添加或删除自定义字段,它甚至会发生变化,但是文档计数始终为 0。
什么会导致每次都为0?
solr - 在 solr 集合中包含文件名?
是否可以在 ColdFusion Solr 集合中索引文件,并以可搜索的方式包含文件名?
如果我搜索我知道已编入索引的文件名,并且集合的转储显示键和 url 包含该文件名,它会返回 0 个结果。
我尝试将文件名添加到中的 body 参数中cfindex
,但这不起作用:
我知道您通常不会在 a 上包含 body type=file
,但我想我会尝试。
solr - 有多少 ColdFusion 集合太多了?
我们在 Windows server 2012 R2 上使用 CF 11。有了我们的数据结构,我们需要使用一个非常大或大约 500 个小的 Solr 集合。无论哪种方式,都有哪些优点和缺点?是否有关于收藏数量的最佳实践的指南/参考?任何意见是极大的赞赏!
solr - ColdFusion 11 更新 19 - 新 SOLR 集合“未找到”问题
我们在 CF 11 中使用了许多 SOLR 集合。在我们应用更新 19 之前创建的集合正在正确刷新并且工作正常。但是,我们安装更新 19 后创建的集合无法正常运行。这是我们看到的:
正在以正确的方式创建一个新集合:一个新目录(带有正确的子目录)出现在 /cfusion/collections 下。CF Administrator 中的 Data & services --> ColdFusion Collections 下会出现一个新集合。但是,运行这一行:抛出“org.apache.solr.client.solrj.SolrServerException”。
当我们尝试通过运行“http://localhost:8987/solr/#collection#/dataimport?command=delta-import&commit=true”来刷新该新集合时,我们会收到 404 Not Found 错误: 新创建的集合刷新尝试时出错
我们的旧集合(在我们应用 CF 更新 19 之前创建)正在使用相同的命令正确刷新。
我们在更新 19 中破坏/遗漏了哪些可能导致此问题的内容?非常感谢任何想法或线索!