问题标签 [porter-stemmer]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
15454 浏览

python - PorterStemmer 似乎不起作用

我是 python 新手,用书中的例子练习。
谁能解释为什么当我试图用这段代码来阻止一些例子时,什么都没有改变?

但是当我这样做时它有效

0 投票
1 回答
615 浏览

perl - Perl 词干提取英文文本

我试图阻止英文文本,我阅读了很多论坛,但我看不到一个明确的例子。我正在使用搬运工词干分析器,就像使用 Text::ENglish 一样。这是我走了多远:

0 投票
1 回答
435 浏览

stemming - 词干算法

我有一个关于 Porter Stemmer 算法的问题,我在互联网上研究过,

但我找不到词干不足和词干过度之间的区别。

波特算法是低估还是过度?

你有想法吗?

提前致谢

0 投票
1 回答
153 浏览

r - 在 R 中调试 - 如何定位错误?

我正在尝试编写一个函数,该函数在使文本进行搬运工词干处理时返回单词的词干图。当我尝试运行一个示例时,代码不会停止运行,即没有输出。没有错误,但是当我强制停止它时,它给出了如下警告:

我的代码如下:

如何识别错误?我的测试语句是:

0 投票
1 回答
233 浏览

android - 字符串输入分发到数组(Android)?

我一直在寻找关于我的问题的答案,但我找不到一个,或者我可能不只是在搜索时使用了正确的术语。

我的问题是,如何将在 editText 中输入的字符串分配给数组?

这是关于我的 porter2 词干项目。我需要将在EditText字段中输入的字符串分配给一个数组,这样我就可以扫描xin是否array[x]是元音。

前任。字段中的字符串EditText= "dog"

数组应该是:

很抱歉我不能给出代码,因为我真的不知道如何编写这个代码。谢谢大家!谢谢。:)

0 投票
2 回答
927 浏览

android - Android - 将字符数组值移动到相同的字符数组

我如何将 char 数组的值移动到同一个 char 数组?这是一个代码:

假设 ctr_r1=1 ,

附加“字母”,然后将其转换为字符串,然后将其转换为 char 数组,然后将其设为“lettersr1”值。

我想要完成的是给了 EUCHARIST 这个词,我需要把 HARIST 这个词取出并将它放在另一个数组上并称之为区域 1(Porter2 词干算法)。

代码“ctr_X = (ctr_r1 + 2)”从 H 开始,直到 T。问题是我不能直接传递值,这就是为什么我试图更新现有的 char 数组然后附加它。

我试过这样做:

但是当我这样做时,我的应用程序崩溃了。请提供任何帮助。谢谢!

0 投票
3 回答
896 浏览

android - Android - 将字符串与数组进行比较

是否可以将字符串与android中的数组进行比较?这是使用我正在为我的论文开发的 Porter Stemmer 的字典应用程序。

例如,输入单词是 PROCESSES(放置在 char 数组中),我想扫描输入是否包含“s”、“es”或“sses”,然后删除它们。

我想逐个字母比较,但我相信这将是一个乏味的编码。有没有更简单的方法来比较输入单词,如下所示:

0 投票
1 回答
524 浏览

java - Porter2 Stemming Java 实现查询

我看过其他关于这个的帖子,但我仍然无法让它工作。

http://snowball.tartarus.org/dist/libstemmer_java.tgz <<- 这包含了 porter2 算法的 java 实现。

我所做的是提取桌面上的内容(以便于访问)并使用 Netbeans IDE 打开其 .java 文件。我运行了它,但它返回了一个错误。

Netbeans 不读取其他 java 文件。由于所有 java 文件都相互连接,因此 javaX 文件中的一个错误会在 javaY 文件上产生错误,依此类推。

TestApp.java 是应该运行的。但是会出现以下错误。请参阅屏幕截图。

以下是截图:

http://img248.imageshack.us/img248/290/java1.jpg

http://img4.imageshack.us/img4/5196/java2l.jpg

http://img441.imageshack.us/img441/8625/java3i.jpg

0 投票
1 回答
1044 浏览

magento - Magento SOLR 模糊搜索

我在 magento 中使用 SOLR 搜索并尝试使用 SOLR 模糊搜索的功能。但到目前为止似乎没有运气。

我尝试在搜索查询结束时使用 tilda (~),还尝试使用“PorterStemFilterFactory”,这是迄今为止我所知道的最好的词干工厂。但这并没有给我任何结果。例如; 我有名为“设拉子”的产品。因此,如果使用“shirag”或“shrag”进行搜索,模糊搜索将返回相同的结果。

这是我的架构部分(我只给出英文部分,因为这是我唯一使用的部分)

这些也是我尝试过的链接:

http://johntwang.com/blog/2011/09/05/Fuzzy-and-Document-Searching-with-WebSolr-and-Heroku/ http://docs.lucidworks.com/display/solr/The+Standard+查询+解析器 http://www.rqna.net/qna/mnuhwh-solr-fuzzy-search-for-similar-words.html

0 投票
2 回答
7986 浏览

java - Lucene Porter Stemmer 未公开

如何在 Lucene 3.6.2 中使用 Porter Stemmber 类?这是我所拥有的:

有人告诉我: PorterStemmer 在 org.apache.lucene.analysis 中不公开;无法从外部包访问。

编辑:我还广泛阅读了有关使用 Snowball 的信息,但不鼓励这样做。在 Java 中使用 Lucene 的正确方法是什么?