我有一个 docx 格式的 word 文档,其中的数据采用重复格式模式。
我想从重复集中获取每个数据并上传到 SQL 表中的一行。
这里的数据样本:
Question No : 1
How is LINQ to SQL different from Entities?
A. Answer 1
B. Answer 1
C. Answer 1
D. Answer 1
Answer : D
Explanations :
Some explanation.
Question No : 2
How is NVARCHAR different from VARCHAR
A. Answer 1
B. Answer 1
C. Answer 1
D. Answer 1
Answer : D
Explanations :
Some explanation.
我可以想到几种方法:
- 使用 Office API 将文档读取为 docx
- 从 Word 将文档另存为 XML 并解析 XML [转换后的 XML 文档似乎没有结构/架构]
- 将文档另存为 HTML Word 和解析 HTML [DOM 结构格式不正确]
您会建议以上哪一项,为什么?是否有任何工具可以帮助转换文档并上传到 SQL 表或访问数据库?
谢谢!