solr - 如何将文件从数据库加载到 Solr

Question

我正在使用以下 Groovy 代码加载存储在 MongoDB 中的文件，以便在 Solr 中进行索引。（我已经创建了一个包含文件内容和文件名的文件对象）：

ContentStreamUpdateRequest up = new ContentStreamUpdateRequest("/update/extract")

def tempFile = new File("temp/temp-${file.name}")
tempFile.append(file.file) //file.file references the byte[] of the file
//append call writes the file to disk

up.addFile(tempFile, "application/octet-stream")

up.setParam("literal.id", file.id.toString())
up.setParam("literal.name", "ConsultantFile")
up.setParam("literal.fileName_s", file.name)
up.setParam("literal.creator_s", file.createdBy?.lastFirstName)

up.setAction(AbstractUpdateRequest.ACTION.COMMIT, true, true)

server.request(up) //server object is the shared handle to the Solr instance

tempFile.delete()

所以，我已经有一个文件的字节数组，但我正在将它写入磁盘，所以我可以使用 addFile 方法。然后，作为清理，我删除了磁盘上的文件。它有效，但它很愚蠢。

我尝试使用以下代码代替 up.addFile()，但它抛出“非正常状态：500 消息：服务器错误”

def stringFile = new String(file.file, "UTF-8")
def stream = new ContentStreamBase.StringStream(stringFile)
up.addContentStream(stream)

索引我已经在内存中的文件而不必将其作为中间步骤写入磁盘的最佳方法是什么？

score 0 · Accepted Answer

您可以检查应该允许您使用流的addContentStream方法。

此外，如果您有一个 Web 界面来公开文件，您可以检查Sending_documents_to_Solr

solr - 如何将文件从数据库加载到 Solr

1 回答 1

Related

Reference