我想将二进制数据(例如 PDF)转换为我的 Oracle 数据库的 BLOB。起初,我将 PDF 放入 FileInputStream 并创建了一个字节数组。这是代码:
public static byte[] createByteArray(File pCurrentFolder, String pNameOfBinaryFile)
{
String pathToBinaryData = pCurrentFolder.getAbsolutePath()+"/"+pNameOfBinaryFile;
File file = new File(pathToBinaryData);
if (!file.exists())
{
System.out.println(pNameOfBinaryFile+" could not be found in folder "+pCurrentFolder.getName());
return null;
}
FileInputStream fin = null;
try {
fin = new FileInputStream(file);
} catch (FileNotFoundException e) {
e.printStackTrace();
}
byte fileContent[] = new byte[(int) file.length()];
try {
fin.read(fileContent);
} catch (IOException e) {
e.printStackTrace();
}
return fileContent;
}
我通过 MyBatis 将这个(字节数组)发送到数据库并且它工作,所以我的 BLOB 中有 PDF,我也可以从我的数据库中读取 PDF。但是现在我面临以下问题:我的搜索引擎有一个 JDBC 连接器(FAST ESP ......但这并不重要),它连接到某个数据库并将所有内容存储到一个 xml 文件中。在这个 xml 文件中有一个名为“data”的元素,其中包含其 CDATA 字段中的二进制数据。
当我想解析这个 xml 时,Java 告诉我:
The content of elements must consist of well-formed character data or markup.
对于一些 PDF,我可以工作,但有些不能。所以我认为问题在于,我以错误的方式将它们存储在数据库中。
有关更多信息,我将尊重我之前提出的另一个与此类似的问题。
那里有人告诉我,我应该用 base64 对我的 PDF(或任何二进制文件)进行编码。所以这意味着,我不只是将我的 PDF 放入 FileInputStream,存储 byte[] 并将这个 byte[] 放入我的数据库 BLOB。我必须做什么才能以正确的方式将 PDF 存储在我的数据库中,以便之后我可以正确解析 JDBC 连接器创建的 XML 文件?