我想通过编写 java 代码逐页读取 XML 转储,但我有这个 Scala 代码,我不明白要重写它,所以类似的 java 代码是什么。我知道它可以在 JVM 上正常运行,但我想要一些我理解的东西。
import edu.umd.cloud9.collection.wikipedia.language._
import edu.umd.cloud9.collection.wikipedia._
def wikiXmlToPlainText(xml: String): Option[(String, String)] = {
val page = new EnglishWikipediaPage()
WikipediaPage.readPage(page, xml)
if (page.isEmpty) None
else Some((page.getTitle, page.getContent))
}
val plainText = rawXmls.flatMap(wikiXmlToPlainText)