问题标签 [morphological-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
nlp - 英语形态分析器
我想用英语提取名词和代词的性别、数字、人称。我需要一个在 linux 操作系统上运行的工具。你能帮我找到工具吗?
谢谢,赫曼思
python - 在 python NLTK 中,我想获得非空白字符串的形态分析结果
我想从 NLTK 获得非空白字符串的形态分析结果。
例如:
字符串是"societynamebank"
.
我想得到['society', 'name', 'bank']
如何在 NLTK 上获得该结果?
python - 获取英语单词的基本形式
我正在尝试获取从其基本形式修改的英语单词的基本英语单词。这个问题在这里被问过,但我没有看到正确的答案,所以我试着这样说。我从 NLTK 包中尝试了 2 个词干分析器和一个词形还原器,它们是搬运工词干分析器、雪球词干分析器和 wordnet 词形分析器。
我试过这段代码:
这是我得到的输出:
但我想要这个输出
我怎样才能做到这一点?是否有任何可用的工具?这称为形态分析。我知道这一点,但肯定有一些工具已经实现了这一点。帮助表示赞赏:)
第一次编辑
我试过这段代码
在这里,我尝试通过提供适当的标签来使用 wordnet lemmatizer。这是输出:
不过,这种方法不会处理“到达”和“结论”之类的词。有什么解决办法吗?
python - How to parse a DOT file in Python
I have a transducer saved in the form of a DOT file. I can see a graphical representation of the graphs using gvedit, but what if I want to convert the DOT file to an executable transducer, so that I can test the transducer and see what strings it accepts and what it doesn't.
In most of the tools I have seen in Openfst, Graphviz, and their Python extensions, DOT files are only used to create a graphical representation, but what if I want to parse the file to get an interactive program where I can test the strings against the transducer?
Are there any libraries out there that would do the task or should I just write it from scratch?
As I said, the DOT file is related to a transducer I have designed that simulates morphology of English. It is a huge file, but just to give you an idea of how it is like, I provide a sample. Let's say I want to create a transducer that would model the behavior of English with regards to Nouns and in terms of plurality. My lexicon consists of only three words (book, boy, girl). My transducer in this case would look something like this:
which is directly constructed from this DOT file:
Now testing this transducer against the words means that if you feed it with book+Pl
it should spit back books
and vice versa. I'd like to see how it is possible to turn the dot file into a format that would allow such analysis and testing.
c++ - OpenCV中的形态重建
在 OpenCV 中处理带有文本的图像时,我的打开操作不会产生正确的输出数据。该问题与本文中描述的问题非常相似: http ://www.cpe.eng.cmu.ac.th/wp-content/uploads/CPE752_06part2.pdf
我所看到的,人们建议使用重建操作。OpenCV 中是否有任何内置机制或一些已知的库/代码可以实现这一点?
algorithm - 用于车牌识别的洪水填充
我有一个二值图像的车牌。
我对图像进行了膨胀以加厚边缘,然后“填充”,最后进行侵蚀以进行细化:
但我希望我的输出是这样的:
任何人都可以帮助我吗?并告诉我如何获得所需的输出。
ios - ios 使用 Stroke 制作 Masked BlurView
我有一个有点高级的问题,我想在半透明且 png 具有透明区域的 png 图像上进行自定义形状模糊,然后在图像周围画一个笔触(避免 png 图像中的透明区域)。我尝试使用 GPUImage 在图像上制作蓝色,但在图像的非透明部分周围绘制笔画时被阻塞。我尝试使用这种方法(https://stackoverflow.com/a/15010886/4641980)但是笔划是半透明的(因为图像不透明部分是半透明的)。
我需要你的帮助才能完成这项工作。这个例子几乎就是我的意思
http://i.stack.imgur.com/YdITu.png
我花了很多时间寻找和尝试,但到目前为止都是徒劳的,我将非常感谢您的帮助。谢谢你。
r - 在 R 中重新格式化 procrustes 坐标
我对 164 个机翼形状数据文件进行了 procrustes 分析,每个文件使用 8 个地标;
它为每个人产生输出;
str(Procrustescoords) 的输出是;
...等等所有 164 个人
我现在希望将输出坐标重新格式化为一个表格,其中每一行都是一个单独的(文件),并且坐标显示为诸如“X1”、“Y1”、“X2”、“Y2”等列...“ X8”、“Y8”。到目前为止,我真的很努力如何做到这一点。
任何帮助都会很棒。谢谢
java - 西班牙语的形态学实现
有谁知道形态实现工具(最好是 Java 工具)。我正在做一个项目,我需要实现正确的动词“to be”,如果它是针对男性/女性 - 单数/复数 - 第一人称/第三人称的,并且关于此类输入会生成正确的动词“to be”。SimpleNLG 是包含形态学实现的理想软件,但它仅适用于英语和法语。例如:如果特征是男性第一人称单数,结果将是“I”,如果特征是复数第三人称男性,结果将是“他们”。