0

我正在保存一个使用 UTF-8 编码的文件,其中包含一些信息,包括来自 Dart 端的按钮的名称以及以下代码:

file.writeAsString([
          name.length.toString(),
          name + Constants.nativeFileDelimeter,
          ids.length.toString(),
          ids.join(" "),
        ].join(" "));

// Constants.nativeFileDelimeter is "|", it is used so that user can enter a name with whitespaces

我用 C 读取同一个文件并使用 FFI 在 C 和 Dart 之间传递数据。

        FILE *file;

        file = fopen(filePath, "r");

        if (!file) {
            LOGE("Could not open %s!", filePath);
            *operationState = MediaLoadState::FAILED_TO_LOAD;
            goto cleanup;
        }

        int32_t size;

        if(fscanf(file, "%d ", &size) != 1){
            LOGE("fscanf can not assign variables %s!", filePath);
            *operationState = MediaLoadState::FAILED_TO_LOAD;
            goto cleanup;
        }

        // +1 because C strings ends with /0
        *namePtr = new char[size + 1];

        if (size != 0){
            if(fscanf(file, "%[^|]|", *namePtr) != 1){
                LOGE("fscanf can not assign variables %s!", filePath);
                *operationState = MediaLoadState::FAILED_TO_LOAD;
                goto cleanup;
            }
        }

读取 C 保存的指针的 Dart 代码:

  Pointer<Pointer<Utf8>> _namePtrPtr;
  String get name => Utf8.fromUtf8(_namePtrPtr.value);

我的问题是这段代码可以处理 0 个错误,它甚至可以处理日文、俄文字符,但是当引入表情符号时,事情会变得很奇怪。当我保存一个包含表情符号的文件并尝试使用 C 和 Dart ffi 读取它时,我得到了Utf8.fromUtf8. 例如:

Unfinished UTF-8 octet sequence (at offset 48)

有时,它工作并呈现表情符号的代码相同,但后来应用程序随机崩溃。每次读取文件时抛出的异常似乎都不同,有时我没有异常,但后来崩溃了!这是不一致的。我不知道我做错了什么,我希望它可以与表情符号一起使用。谁能帮我解决这个问题?

4

1 回答 1

2

在 Dart 中,String.length返回 UTF-16 代码单元的数量。要在 C 中读取 UTF-8,您需要知道 UTF-8 字节数。因此,输出utf8.encode(name).length而不是name.lengthDart 代码(和 import dart:convert)。异常和崩溃可能是由于尺寸太短而触发的未定义行为。

以文本格式单独存储数据大小很容易出错。更好地使用这种方法:

看来您正在使用 C++。在那里,您可以将文件打开为std::ifstream,创建一个std::string name;并使用std::getline(file, name, '|');以读取具有动态大小的名称。您可以使用*namePtr = strdup(name.c_str())std::string.

于 2021-01-12T21:20:28.657 回答