我正在尝试从 microsoft-word 中提取数据并将其转换为 sql 语句并将其插入 Oracle 数据库。
当 ms-word 中的数据包含由 [Shift-Enter] 创建的新行而不只是输入时,
文本包含一个图标,看起来像一个带问号的框。
其中 ET 只是使用回车键的标准新行,而 ST 是使用
Shift-Enter 组合。因此,在生成 SQL 并将其插入到 oracle 时,oracle 不会将其视为文本,而是视为十六进制。
我的问题是,如何将 [shift-enter] 创建的行删除为标准的 '\n'?
谢谢
更新 这就是我获取文本信息的方式
POIFSFileSystem fs = new POIFSFileSystem(new FileInputStream(file));
HWPFDocument doc = new HWPFDocument(fs);
WordExtractor we = new WordExtractor(doc);
text = we.getText();
更新答案:这是 poi-3.6 中的一个错误。在 poi-3.8 中它显示为 \r。