1

我必须从几个 word 文档(很多)中获取内容(一些练习的文本)并对其进行转换,以便可以将它们加载到 Javascript 应用程序中。

这些word文档内容的一个例子是:


1.文字问题1

回答 1
回答 2
回答 3

2.用一个_ _ _ _ _ _ _ 或多个文本问题2。

回答 1
回答 2
回答 3

ETC


所以有一行是问题,一个空行,然后是 3 行是可能的答案。在示例中,我提出了 2 个问题,但每个 word 文档可能有 12+ 个问题。请注意,问题文本中的文字可以加下划线或加粗。也可能有空格(由几个 _ 字符表示,中间有或没有空格)。

这些 word 文档的输出格式类似于:

var questions = [
{
label : "1.Text question 1",
options : ["answer 1", "answer 2", "answer 3"],
answer : [1] //Here I will need to set the right answer, probably manually
},
{
label : "1.Text <strong>question</strong> 2",
options : ["answer 1", "answer 2", "answer 3"],
answer : [0] //Here I will need to set the right answer, probably manually
},
etc
];

所以它是 JS 中一个基本的关联数组。请注意,“标签”键将以 html 格式保存问题的文本(因此在示例中,有一个<strong>标签来反映第二个问题中的粗体字)。

我正在寻找的是一个脚本,它接受像示例一样的 word 文档作为输入,并输出一个 JS 文件,也像我的输出示例一样(如果它是一个也可以工作的文本文件)。如果是 PHP 或 Javascript,脚本语言将是最好的。如果我必须在 word 文档上做一些工作以适应某些东西以使脚本更容易,那也没关系。

对我来说,主要挑战是如何保留文本可以具有的所有文本样式(粗体、下划线、空格......),否则我想将它们转换为简单的 txt 文件会起作用......

对此的任何帮助将不胜感激!

4

1 回答 1

0

假设所描述的新行,在新行处拆分并根据空白行进行选择,例如

function parse(str) {
    var a = str.split('\n'), // split input and var everything
        flag = 0, question = -1, qLine = 0, i,
        questions = [];
    for (i = 0; i < a.length; ++i) { // loop over lines
        if (!a[i]) {         // if blank line,
            flag = 1 - flag; // flip choice
            qLine = 0;       // reset multi-line counter
        }
        else if (flag === 0) {   // if question line
            if (qLine === 0) {   // if new question
                questions.push({ // add to questions
                    label: a[i],
                    options: [],
                    answer: []
                });
                ++question;      // and increase question count
            } else {             // else multi-line question
                questions[question].label += '\n' + a[i]; // add to label
            }
            ++qLine;             // either way increase multi-line counter
        }
        else if (flag === 1) {   // if answer line
            questions[question].options.push(a[i]);       // add answer
        }
    }
    return questions;
}

然后

parse('1.Text question 1\n\
\n\
answer 1\n\
answer 2\n\
answer 3\n\
\n\
2.Text question 2 with one _ _ _ _ _ _ _ or more.\n\
\n\
answer 1\n\
answer 2\n\
answer 3\n\
');
/*
[
    {
        "label": "1.Text question 1",
        "options": [
            "answer 1",
            "answer 2",
            "answer 3"
        ],
        "answer": []
    },
    {
        "label": "2.Text question 2 with one _ _ _ _ _ _ _ or more.",
        "options": [
            "answer 1",
            "answer 2",
            "answer 3"
        ],
        "answer": []
    }
]
*/
于 2013-07-08T23:26:52.137 回答