0

所以我有一个我已经开始创建的 QT 文本编辑器。我从这个http://doc.qt.io/archives/qt-5.7/gettingstartedqt.html开始,并添加了它。到目前为止,我已经添加了一个适当的保存/另存为功能(链接中的版本只有一个保存为功能)、一个“查找”功能和一个“打开新窗口”功能。很快,我将添加一个查找和替换功能。

我这样做主要是为了学习经验,但我最终还将添加更多功能,这些功能将专门帮助我在工作中创建 PLC 配置文件。这些配置文件可能有许多不同的编码,但它们中的大多数似乎都是 UTF-16LE(无论如何根据 Emacs。)我的文本编辑器最初读取 UTF-16LE 没有问题,但是用纯文本编写,我需要改变它。

这是 Emacs 描述的这些 UTF16-LE 文件之一的编码系统的片段。

U -- utf-16le-with-signature-dos (alias: utf-16-le-dos)
UTF-16 (little endian, with signature (BOM)).
Type: utf-16
EOL type: CRLF
This coding system encodes the following charsets:
  unicode

这是我用来在 QT 文本编辑器中对文本进行编码的代码示例。

首先...这类似于我之前提供的链接。这里唯一的区别是“saveFile”是一个全局变量,我创建它是为了执行一个简单的“Save”函数而不是“Save As”函数。这会将文本保存为纯文本并像魅力一样工作。

void findreplace::on_actionSave_triggered()
{
    if (!saveFile.isEmpty())
    {
        QFile file(saveFile);
        if (!file.open(QIODevice::WriteOnly))
        {
            // error message

        }
        else
        {
            QTextStream stream(&file);
            stream << ui->textEdit->toPlainText();
            stream.flush();
            file.close();

        }
    }


}

下面是我尝试将代码保存在“UTF-16LE”中的较新版本。我的文本编辑器在保存后可以很好地读取文本,但 Emacs 根本不会读取它。这对我来说意味着配置文件可能无法被读取它的程序读取。有些东西变了,不知道是什么。

void findreplace::on_actionSave_triggered()
{
    if (!saveFile.isEmpty())
    {
        QFile file(saveFile);
        if (!file.open(QIODevice::WriteOnly))
        {
            // error message

        }
        else
        {
            QTextStream stream(&file);
            stream << ui->textEdit->toPlainText();
            stream.setCodec("UTF-16LE");
            QString stream3 = stream.readAll();
            //QString stream2 = stream3.setUnicode();
            //QTextCodec *codec = QTextCodec::codecForName("UTF-16LE");
            //QByteArray stream2 = codec->fromUnicode(stream3);
            //file.write(stream3);
            stream.flush();
            file.close();

        }
    }


}

被注释掉的部分我也试过了,但他们最终把文件写成亚洲(中文或日文)字符。就像我说的我的文本编辑器(和 Wine 中的记事本)可以很好地读取文件,但是 Emacs 现在在保存后将编码描述为如下。

= -- no-conversion (alias: binary)

Do no conversion.

When you visit a file with this coding, the file is read into a
unibyte buffer as is, thus each byte of a file is treated as a
character.
Type: raw-text (text with random binary characters)
EOL type: LF

这向我表明文件中的某些内容不正确。最终,此文本编辑器将用于一次创建多个文本文件并通过用户输入修改其内容。如果我能正确编码,那就太好了。

4

1 回答 1

1

感谢在这里评论我的帖子的好心人,我能够回答我自己的问题。这里的代码解决了我的问题。

void findreplace::on_actionSave_triggered()
{
    if (!saveFile.isEmpty())
    {
        QFile file(saveFile);
        if (!file.open(QIODevice::WriteOnly))
        {
            // error message

        }
        else
        {
            QTextStream stream(&file);
            stream.setCodec("UTF-16LE");
            stream.setGenerateByteOrderMark(true);
            stream << ui->textEdit->toPlainText();
            stream.flush();
            file.close();

        }
    }


}

我设置了流的编解码器,然后将生成的 BOM 设置为“True”。我想我还有更多关于编码的知识。我认为必须将字节顺序标记设置为特定值或其他东西。我不知道我只需将此值设置为“True”并且它会自行处理。Emacs 现在可以读取通过使用此代码保存文档生成的文件,并且 Emacs 的编码文档是相同的。我最终会为用户添加选项,让他们在保存时选择他们需要的编码。很高兴我能在这里学到一些东西。

于 2018-01-14T21:07:56.500 回答