0

我已经在 marklogic 中加载了 XHTML 文件。但需要对属性、元素和文本进行搜索。所以我需要将文档作为文本获取/加载并在文档上执行搜索。

下面是 XHTML 文件。

            <?xml version="1.0" encoding="UTF-8"?>
    <html xmlns="http://www.w3.org/1999/xhtml">
        <meta>
            </meta>
        <body class="Default">

        </body>
    </html>

Using below code I am ble to save text file but it will aloow to save (>0.2KB )small size file. I need to save upto 1 to 50MB files in marklogic DB.

Using below code I am able to save file as text but big file not able to save.
 ContentCreateOptions createOptions = ContentCreateOptions.newTextInstance();

 Content content = ContentFactory.newContent("/"+uID,filetext, createOptions);

 mlSession.insertContent(content);
4

1 回答 1

0

仍然不太确定这背后的用例,但你去吧:

如果您真的想在元素名称、属性和文本上一起搜索全文,没有区别,您最好在摄取时将其作为文本插入。例如:

xdmp:document-insert(
    "/my.xhtml",
    text {
        xdmp:quote(
            <html xmlns="http://www.w3.org/1999/xhtml">
                ...
            </html>
        )
    }
)

或者:

xdmp:document-load(
    "/server/path/to/my.xhtml",
    <options xmlns="xdmp:document-load">
        <format>text</format>
    </options>
)

之后,您可以简单地执行以下操作:

cts:search(collection(), "mytagorattrorterm")

或者,您可以在执行 cts:contains 或 fn:contains 之前使用 xdmp:quote,但这会非常糟糕,因此您最好同时仅在一个或几个文档上执行此操作。

于 2015-01-07T10:26:59.227 回答