我是 Marklogic 世界的新手。我的程序使用定制的 Java 应用程序来查询 Also.com 获取 XML 数据提要每 30 秒。结果以 XML 格式返回。Java 应用程序使用 XCC API (Marklogic API) 将检索到的数据插入到 ML 中的单个 XML 文件中。数据大小为每分钟 6 MB,如果应用程序运行一天左右,数据量将以 GB 为单位增长。我不知道我必须做任何管理员配置才能将大量数据放入 MarkLogic 中的单个 XML 文件中。有人可以验证我的方法,或者建议我是否必须在管理员级别进行任何配置更改。XML的结构如下...
<?xml version="1.0" encoding="UTF-8"?>
<moreovercontentdump>
<article id="_6232903453">
<description></description>
<author></author>
<source_category>Local</source_category>
<genre>General</genre>
<publisher></publisher>
<media_type>text</media_type>
<docurl>http://www.ilrestodelcarlino.it</docurl>
<harvest_time>Apr 4 2012 4:28PM</harvest_time>
<valid_time>May 14 2012 4:27PM</valid_time>
</article>
<article id="_6232903453">
<description></description>
<author></author>
<source_category>Local</source_category>
<genre>General</genre>
<publisher></publisher>
<media_type>text</media_type>
<docurl>http://www.ilrestodelcarlino.it</docurl>
<harvest_time>Apr 4 2012 4:28PM</harvest_time>
<valid_time>May 14 2012 4:27PM</valid_time>
</article>
<article id="_6232903453">
<description></description>
<author></author>
<source_category>Local</source_category>
<genre>General</genre>
<publisher></publisher>
<media_type>text</media_type>
<docurl>http://www.ilrestodelcarlino.it</docurl>
<harvest_time>Apr 4 2012 4:28PM</harvest_time>
<valid_time>May 14 2012 4:27PM</valid_time>
</article>
</moreovercontentdump>