我想创建一个能够解析该文件的 doc/docx 文件结构的应用程序,如下所示:
par-000.01 - some content
par-000.21 - some content
par-000.31 - some content
par-001.32 - some content
内容可以是多行而不是规则的。我想要做的是将这些内容放入数据库中,我的意思是第一条记录 -par-000.01
放入code
列和some content
文本列。
我不能手动执行此操作的原因是我有大约 15 个文档,其中每个文档包含大约 10 页我想放入我的数据库的段落。
我找不到任何文章如何解析整个 doc 文件,所以我相信如果我编写正确的正则表达式是可能的。任何人都可以将我重定向到文章如何做我想做的事-我找不到任何适合我的东西,可能我使用了错误的关键词..