我正在尝试为我大学的布告栏制作一个电话应用程序。
这是布告栏。并且每个通知都作为一个HTML 页面。通知的 URL 结构很简单,“docid”给出了每个通知的 ID。据我从模式中猜到它是一个自动递增键。
到目前为止,我的策略是通过增加 docid 值从 get 请求中获取 HTML 文件。解析 html 以获得所需的值,例如 Title、Posted by、Attention、Date 和 body。
最初将现有通知存储到数据存储中,然后 cron 作业可以检查新通知。
这些值集将作为 JSON 提供给手机应用程序。
通知的正文部分使用 HTML 标记进行格式化。我想保留格式。我只是将正文存储为包含所有 html 标记的字符串。这可能是一个问题吗?有没有更好的方法来保留格式?
我必须这样做,因为我无法预先知道完成了哪种格式