3

我正在尝试使用 Java 抓取网络并将 HTML 数据存储在 MongoDB 上。不幸的是,在存储数据时,MongoDB 驱动程序会将数据清空并为 HTML 数据存储空字段。

当我获得前 500 个字符的 HTML 数据时,我可以毫无问题地存储/更新它,所以我认为 HTML(或其中的 Javascript)中的某些内容会破坏发送到 MongoDB 的命令,而 MongoDB 存储的是空数据而不是 HTML。(编辑:我也试过 40.000 和 50.000 字符,40.000 没问题,但 50.000 字符数据没有显示在 MongoDB 上)我应该使用其他东西来存储 HTML/JavaScript 数据吗?

这是我的代码片段

BasicDBObject savedDoc = new BasicDBObject();
savedDoc.put("url_ID", objURL.get("_id"));
savedDoc.put("cnt", content); //Content field
savedDoc.put("st", 0);
collection.update(new BasicDBObject().append("url_ID", objURL.get("_id")), savedDoc, true, false);
4

0 回答 0