问题标签 [analyzer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
objective-c - Obj-C,“self”未设置为“[(super or self)init ...]”的结果时使用的实例变量
我知道不久前我问过类似的问题,但我仍然有点不确定。同样的事情发生在好几个地方。
'self' 未设置为 '[(super or self) init...]' 的结果时使用的实例变量
一种
乙
C
对于块 A,这是否正确
和 B&C
iphone - [cell viewWithTag:] 的奇怪问题
我刚刚分析了整个 iPhone 应用程序,我得到了一个Logic Error。
我得到这个问题:
消息“帧”的接收者为 nil,并返回一个类型为“CGRect”的值,该值将是垃圾
如果我改变:
和
他很高兴。正常吗?我可以毫无问题地获得标签,并且可以在任何地方使用它,但是当我尝试获得它的框架时,它会说这个问题。你有想法吗?
lucene - 在 Lucene.Net 中标记关键字
我正在使用 Lucene.Net 2.9.2,我认为我需要编写一个自定义标记器,但想检查以防我遗漏了一些明显的东西。
该文档由标题、关键字和内容以及一些元数据(如作者、日期等)组成,每个元数据都存储为一个字段。这些文件是软件技术文件,可能在标题、关键字和/或内容中包含“.Net”、“C++”、“C#”等短语。
我将 KeywordAnalyzer 用于 Keyword 字段,StandardAnalyzer 用于 Title 和 Content - StopWords 和 LowerCase 等是必要的,因为文档可能很长。
我还为搜索编写了一个同义词自定义过滤器,因为我想搜索例如“C#”但也识别“CSharp”、“C#.Net”等。标记器已经从“C#”中删除了“#”或来自 C++ 的“++”,因此可能与“C”语言参考相混淆
我的想法是,当我索引标题和内容时,我需要根据当前标记是关键字短语的一部分还是它的任何同义词来分支标记化。
这是最好的方法吗?提前谢谢了 :)
objective-c - -init 方法不会被调用
我通常会粘贴我的代码,但我认为在这种情况下,展示我的代码的外观很重要。
根据此处的建议解决泄漏问题,我进行了一些更改。但是,我的-init
方法不再被调用。谁能指出问题?
的断点-init
从未遇到过。
lucene - 带有重音词的 Lucene SpanishAnalyzer 类的奇怪行为
我正在使用 Lucene 3.4 中的 SpanishAnalyzer 类。当我想解析重音单词时,我得到了一个奇怪的结果。例如,如果我解析这两个词:“comunicación”和“comunicacion”,我得到的词干是“comun”和“comunicacion”。如果我改为解析“maratón”和“maraton”,我会得到两个词的相同词干(“maraton”)。
所以,至少在我看来,同一个词“comunicación”会根据重音与否而给出不同的结果,这很奇怪。如果我搜索“comunicacion”这个词,无论它是否有重音,我都应该得到相同的结果。
我正在使用的代码是下一个:
我发现能够获得共享“comunicacion”词干的每个单词的解决方案,无论是否带重音,是在第一步中去掉重音,然后用分析器解析它,但我没有知道这是否是正确的方法。
请问,谁能帮帮我?
ios - Cocos2D 库泄漏?
我的 Xcode 分析工具显示来自 Cocos2D 库 (CCAtlasNode.m) 的泄漏。无论如何,我将如何解决这个泄漏?
谢谢!
objective-c - XCode 4 分析配置?
有没有办法配置 XCode 4 静态分析器工具报告和不报告哪些类型的问题?
我正在处理一些“有效”但有大量静态分析问题的遗留代码,并试图首先列出某些可能更关键的问题。
lucene - Lucene StandardAnalyzer 3.5 TypeAttribute
我最近注意到 Lucene StandardAnalyzer 的行为自 3.1 版以来发生了一些变化。具体来说,3.0 和之前的版本将电子邮件、IP 地址、公司名称等识别为单独的词汇类型,而更高版本则不识别。
例如,对于输入文本:“ example@mail.com 127.0.0.1 H&M ”,3.0 分析器将识别以下类型:
1:example@mail.com:0->16:<电子邮件>
2:127.0.0.1:17->26:<主机>
3:h&m:27->30:<公司>
但是,3.1 版及更高版本为相同的输入文本提供以下输出:
1:示例:0->7:< ALPHANUM >
2:mail.com:8->16:< ALPHANUM >
3:127.0.0.1:17->26:<数字>
我的问题是,如何使用新版本的 Lucene 库实现旧的 StandardAnalyzer 行为?是否有一些标准的 TokenFilters 可以帮助我实现这一点,或者我是否需要实现自定义过滤器?
c# - Lucene StandardAnalyzer 在 C# 中使用 Hunspell TokenFilter?
如何在 Lucene 中将 TokenFilter 添加到 StandardAnalyzer?或者是否有另一个分析器做同样的事情,只允许我也使用一个 TokenFilter?
我在 C# 中有一个用于 Hunspell 的 TokenFilter,我不确定在哪里/如何插入索引过程?
另一方面,我有:
从:
http://devhost.se/blog/post/2011/04/07/C-port-of-lucene-hunspell.aspx
任何人都可以帮忙吗?
lucene - Lucene 上的 AnalyzerUtil 错误
我正在学习使用 lucene。我编写了一个简单的程序来测试 lucene 分析器,例如:
但我收到以下错误:
我认为图书馆 wordnet 或 AnalyzerUtils 不可用。如何安装 lucene 的这一部分?你有什么想法?为什么不见了?我已经安装了 lucene 3.5.0。