问题标签 [porter-stemmer]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - PorterStemmer 似乎不起作用
我是 python 新手,用书中的例子练习。
谁能解释为什么当我试图用这段代码来阻止一些例子时,什么都没有改变?
但是当我这样做时它有效
perl - Perl 词干提取英文文本
我试图阻止英文文本,我阅读了很多论坛,但我看不到一个明确的例子。我正在使用搬运工词干分析器,就像使用 Text::ENglish 一样。这是我走了多远:
stemming - 词干算法
我有一个关于 Porter Stemmer 算法的问题,我在互联网上研究过,
但我找不到词干不足和词干过度之间的区别。
波特算法是低估还是过度?
你有想法吗?
提前致谢
r - 在 R 中调试 - 如何定位错误?
我正在尝试编写一个函数,该函数在使文本进行搬运工词干处理时返回单词的词干图。当我尝试运行一个示例时,代码不会停止运行,即没有输出。没有错误,但是当我强制停止它时,它给出了如下警告:
我的代码如下:
如何识别错误?我的测试语句是:
android - 字符串输入分发到数组(Android)?
我一直在寻找关于我的问题的答案,但我找不到一个,或者我可能不只是在搜索时使用了正确的术语。
我的问题是,如何将在 editText 中输入的字符串分配给数组?
这是关于我的 porter2 词干项目。我需要将在EditText
字段中输入的字符串分配给一个数组,这样我就可以扫描x
in是否array[x]
是元音。
前任。字段中的字符串EditText
= "dog"
。
数组应该是:
很抱歉我不能给出代码,因为我真的不知道如何编写这个代码。谢谢大家!谢谢。:)
android - Android - 将字符数组值移动到相同的字符数组
我如何将 char 数组的值移动到同一个 char 数组?这是一个代码:
假设 ctr_r1=1 ,
附加“字母”,然后将其转换为字符串,然后将其转换为 char 数组,然后将其设为“lettersr1”值。
我想要完成的是给了 EUCHARIST 这个词,我需要把 HARIST 这个词取出并将它放在另一个数组上并称之为区域 1(Porter2 词干算法)。
代码“ctr_X = (ctr_r1 + 2)”从 H 开始,直到 T。问题是我不能直接传递值,这就是为什么我试图更新现有的 char 数组然后附加它。
我试过这样做:
但是当我这样做时,我的应用程序崩溃了。请提供任何帮助。谢谢!
android - Android - 将字符串与数组进行比较
是否可以将字符串与android中的数组进行比较?这是使用我正在为我的论文开发的 Porter Stemmer 的字典应用程序。
例如,输入单词是 PROCESSES(放置在 char 数组中),我想扫描输入是否包含“s”、“es”或“sses”,然后删除它们。
我想逐个字母比较,但我相信这将是一个乏味的编码。有没有更简单的方法来比较输入单词,如下所示:
java - Porter2 Stemming Java 实现查询
我看过其他关于这个的帖子,但我仍然无法让它工作。
http://snowball.tartarus.org/dist/libstemmer_java.tgz <<- 这包含了 porter2 算法的 java 实现。
我所做的是提取桌面上的内容(以便于访问)并使用 Netbeans IDE 打开其 .java 文件。我运行了它,但它返回了一个错误。
Netbeans 不读取其他 java 文件。由于所有 java 文件都相互连接,因此 javaX 文件中的一个错误会在 javaY 文件上产生错误,依此类推。
TestApp.java 是应该运行的。但是会出现以下错误。请参阅屏幕截图。
以下是截图:
http://img248.imageshack.us/img248/290/java1.jpg
magento - Magento SOLR 模糊搜索
我在 magento 中使用 SOLR 搜索并尝试使用 SOLR 模糊搜索的功能。但到目前为止似乎没有运气。
我尝试在搜索查询结束时使用 tilda (~),还尝试使用“PorterStemFilterFactory”,这是迄今为止我所知道的最好的词干工厂。但这并没有给我任何结果。例如; 我有名为“设拉子”的产品。因此,如果使用“shirag”或“shrag”进行搜索,模糊搜索将返回相同的结果。
这是我的架构部分(我只给出英文部分,因为这是我唯一使用的部分)
这些也是我尝试过的链接:
http://johntwang.com/blog/2011/09/05/Fuzzy-and-Document-Searching-with-WebSolr-and-Heroku/ http://docs.lucidworks.com/display/solr/The+Standard+查询+解析器 http://www.rqna.net/qna/mnuhwh-solr-fuzzy-search-for-similar-words.html
java - Lucene Porter Stemmer 未公开
如何在 Lucene 3.6.2 中使用 Porter Stemmber 类?这是我所拥有的:
有人告诉我: PorterStemmer 在 org.apache.lucene.analysis 中不公开;无法从外部包访问。
编辑:我还广泛阅读了有关使用 Snowball 的信息,但不鼓励这样做。在 Java 中使用 Lucene 的正确方法是什么?