我正在为我的学校制作一个应用程序,人们可以检查他们是否有时间表更改。此处列出了所有时间表更改:http ://www.augustinianum.eu/roosterwijzigingen/14062012.pdf 。我想在该页面中搜索关键字(在 EditText 中输入的用户组)。我已经找到了如何让应用程序检查 edittext 是否与某个字符串匹配,所以现在我只需将该页面上的所有文本下载到一个字符串中。但问题是它不是一个简单的网页,而是一个PDFpage。我听说您需要一个特殊的 pdf 库或其他东西来从 PDF 中提取文本,然后将该文本放入一个字符串中,然后使用contains()
. 但是我对此有一些疑问:
这个 PDF 是用 PDF 创建器制作的,它不是扫描页面左右。例如,您实际上可以选择文本或使用 CTRL+F 搜索关键字。所以我想知道是否真的需要提取 PDF 和东西,或者是否有更简单的方法。
我希望应用程序每隔一小时检查一次更改。所以它还必须每小时(大约 8 页)下载 PDF 并提取文本,这会消耗很多汁液吗?
我听说有很多图书馆可以做我想做的事。那么我应该使用哪个?(如果可能的话,我想要一个免费的:))
谁能向我解释如何在我的代码中使用它?(我不是很有经验,所以请保持简单一点:))
非常感谢你们!!!