我有一个大XML
文件,下面是其中的摘录:
...
<LexicalEntry id="Ait~ifAq_1">
<Lemma partOfSpeech="n" writtenForm="اِتِّفاق"/>
<Sense id="Ait~ifAq_1_tawaAfuq_n1AR" synset="tawaAfuq_n1AR"/>
<WordForm formType="root" writtenForm="وفق"/>
</LexicalEntry>
<LexicalEntry id="tawaA&um__1">
<Lemma partOfSpeech="n" writtenForm="تَوَاؤُم"/>
<Sense id="tawaA&um__1_AinosijaAm_n1AR" synset="AinosijaAm_n1AR"/>
<WordForm formType="root" writtenForm="وأم"/>
</LexicalEntry>
<LexicalEntry id="tanaAgum_2">
<Lemma partOfSpeech="n" writtenForm="تناغُم"/>
<Sense id="tanaAgum_2_AinosijaAm_n1AR" synset="AinosijaAm_n1AR"/>
<WordForm formType="root" writtenForm="نغم"/>
</LexicalEntry>
<Synset baseConcept="3" id="tawaAfuq_n1AR">
<SynsetRelations>
<SynsetRelation relType="hyponym" targets="AinosijaAm_n1AR"/>
<SynsetRelation relType="hyponym" targets="AinosijaAm_n1AR"/>
<SynsetRelation relType="hypernym" targets="ext_noun_NP_420"/>
</SynsetRelations>
<MonolingualExternalRefs>
<MonolingualExternalRef externalReference="13971065-n" externalSystem="PWN30"/>
</MonolingualExternalRefs>
</Synset>
...
我想从中提取特定信息。对于给定writtenForm
的 from<Lemma>
或<WordForm>
,程序获取synset
from的值<Sense>
that writtenForm
(same <LexicalEntry>
) 并搜索所有与from具有相同值的id
值。之后,程序给我们那个 的所有关系,即显示 的值并返回并寻找与 的值相同的人的值,然后显示它的。<Synset>
synset
<Sense>
Synset
relType
<LexicalEntry>
synset
<Sense>
targets
writtenForm
我认为这有点复杂,但结果应该是这样的:
اِتِّفاق hyponym تَوَاؤُم, اِنْسِجام
由于内存消耗,解决方案之一是使用 Stream 阅读器。但我不知道我应该如何继续得到我想要的。请帮帮我。