我必须从几个 word 文档(很多)中获取内容(一些练习的文本)并对其进行转换,以便可以将它们加载到 Javascript 应用程序中。
这些word文档内容的一个例子是:
1.文字问题1
回答 1
回答 2
回答 3
2.用一个_ _ _ _ _ _ _ 或多个文本问题2。
回答 1
回答 2
回答 3
ETC
所以有一行是问题,一个空行,然后是 3 行是可能的答案。在示例中,我提出了 2 个问题,但每个 word 文档可能有 12+ 个问题。请注意,问题文本中的文字可以加下划线或加粗。也可能有空格(由几个 _ 字符表示,中间有或没有空格)。
这些 word 文档的输出格式类似于:
var questions = [
{
label : "1.Text question 1",
options : ["answer 1", "answer 2", "answer 3"],
answer : [1] //Here I will need to set the right answer, probably manually
},
{
label : "1.Text <strong>question</strong> 2",
options : ["answer 1", "answer 2", "answer 3"],
answer : [0] //Here I will need to set the right answer, probably manually
},
etc
];
所以它是 JS 中一个基本的关联数组。请注意,“标签”键将以 html 格式保存问题的文本(因此在示例中,有一个<strong>
标签来反映第二个问题中的粗体字)。
我正在寻找的是一个脚本,它接受像示例一样的 word 文档作为输入,并输出一个 JS 文件,也像我的输出示例一样(如果它是一个也可以工作的文本文件)。如果是 PHP 或 Javascript,脚本语言将是最好的。如果我必须在 word 文档上做一些工作以适应某些东西以使脚本更容易,那也没关系。
对我来说,主要挑战是如何保留文本可以具有的所有文本样式(粗体、下划线、空格......),否则我想将它们转换为简单的 txt 文件会起作用......
对此的任何帮助将不胜感激!