15

我在 JNI C/C++ 中有一个方法,它接受 jstring 并返回 jstring,如下所示,

  NATIVE_CALL(jstring, method)(JNIEnv * env, jobject obj, jstring filename)
  {

// Get jstring into C string format.
  const char* cs = env->GetStringUTFChars (filename, NULL);
  char *file_path = new char [strlen (cs) + 1]; // +1 for null terminator
  sprintf (file_path, "%s", cs);
  env->ReleaseStringUTFChars (filename, cs);


  reason_code = INTERNAL_FAILURE;
  char* info = start_module(file_path);  


  jstring jinfo ;


  if(info==NULL)
  {
      jinfo = env->NewStringUTF(NULL);
  }
  else
  {
      jinfo = env->NewStringUTF(info);

  }


  delete info;

  info = NULL;
  return jinfo;
  }

该代码与之前的 android 4.0 版本(如 2.2、2.3 等)完美配合。使用 ICS 4.0 检查 JNI 默认情况下处于启用状态,因此应用程序崩溃并引发以下错误

 08-25 22:16:35.480: W/dalvikvm(24027): **JNI WARNING: input is not valid Modified UTF-8: illegal  continuation byte 0x40**
08-25 22:16:35.480: W/dalvikvm(24027):              
08-25 22:16:35.480: W/dalvikvm(24027): ==========
08-25 22:16:35.480: W/dalvikvm(24027): /tmp/create
08-25 22:16:35.480: W/dalvikvm(24027): ==========
08-25 22:16:35.480: W/dalvikvm(24027): databytes,indoorgames,drop
08-25 22:16:35.480: W/dalvikvm(24027): ==========���c_ag����ϋ@�ډ@�����@'
 08-25 22:16:35.480: W/dalvikvm(24027):              in Lincom/inter       /ndk/comNDK;.rootNDK:(Ljava/lang/String;)Ljava/lang/String; **(NewStringUTF)**
08-25 22:16:35.480: I/dalvikvm(24027): "main" prio=5 tid=1 NATIVE
08-25 22:16:35.480: I/dalvikvm(24027):   | group="main" sCount=0 dsCount=0 obj=0x40a4b460   self=0x1be1850
08-25 22:16:35.480: I/dalvikvm(24027):   | sysTid=24027 nice=0 sched=0/0 cgrp=default handle=1074255080
08-25 22:16:35.490: I/dalvikvm(24027):   | schedstat=( 49658000 26700000 48 ) utm=1 stm=3 core=1
08-25 22:16:35.490: I/dalvikvm(24027):   at comrootNDK(Native Method)

我对我错在哪里一无所知。如果您在上面看到 NewStringUTF 正在向 c Char* bytes 添加一些垃圾值。

  1. 关于为什么会发生这种情况的任何想法
  2. 欢迎任何实现上述目标的替代解决方案

如果你们中的一个人能帮助我,我真的很感激。提前致谢

看我

4

10 回答 10

22

此问题的原因与 NDK/JNI GetStringUTFChars() 函数(以及可能与 NewStringUTF 等相关函数)中的一个已知 UTF-8 错误直接相关。这些 NDK 函数不能正确转换补充 Unicode 字符(即,值为 U+10000 及以上的 Unicode 字符)。这会导致不正确的 UTF-8 和随后的崩溃。

我在处理包含表情符号字符的用户输入文本时遇到了崩溃(请参阅相应的 Unicode 图表)。表情符号字符位于补充 Unicode 字符范围内。

问题分析

  1. Java 客户端将包含补充 Unicode 字符的字符串传递给 JNI/NDK。
  2. JNI 使用 NDK 函数 GetStringUTFChars() 来提取 Java 字符串的内容。
  3. GetStringUTFChars() 将字符串数据返回为不正确且无效的 UTF-8。

有一个已知的 NDK 错误,即 GetStringUTFChars() 错误地转换补充 Unicode 字符,从而产生错误和无效的 UTF-8 序列。

在我的例子中,生成的字符串是一个 JSON 缓冲区。当缓冲区被传递给 JSON 解析器时,解析器立即失败,因为提取的 UTF-8 的 UTF-8 字符之一具有无效的 UTF-8 前缀字节。

可能的解决方法

我使用的解决方案可以总结如下:

  1. 目标是防止 GetStringUTFChars() 对补充 Unicode 字符执行不正确的 UTF-8 编码。
  2. 这是通过 Java 客户端将请求字符串编码为 Base64 来完成的。
  3. Base64 编码的请求被传递给 JNI。
  4. JNI 调用 GetStringUTFChars(),它在不执行任何 UTF-8 编码的情况下提取 Base64 编码的字符串。
  5. 然后,JNI 代码解码 Base-64 数据,生成原始 UTF-16(宽字符)请求字符串,包括补充 Unicode 字符。

通过这种方式,我们规避了从 Java 字符串中提取补充 Unicode 字符的问题。相反,我们在调用 GetStringUTFChars() 之前将数据转换为 Base-64 ASCII,使用 GetStringUTFChars() 提取 Base-64 ASCII 字符,然后将 Base-64 数据转换回宽字符。

于 2014-10-23T06:55:20.790 回答
13

我就是这样做的。

1- 字符数组到 JByteArray。

2- JByteArray 到 JString。

3-将jstring返回到java端。

JNI 代码;(.c) 格式

jstring Java_com_x_y_z_methodName(JNIEnv *env, jobject thiz) {
    int size = 16;
    char r[] = {'P', 'K', 'd', 'h', 't', 'X', 'M', 'm', 'r', '1', '8', 'n', '2', 'L', '9', 'K'};
    jbyteArray array = (*env)->NewByteArray(env, size);
    (*env)->SetByteArrayRegion(env, array, 0, size, r);
    jstring strEncode = (*env)->NewStringUTF(env, "UTF-8");
    jclass cls = (*env)->FindClass(env, "java/lang/String");
    jmethodID ctor = (*env)->GetMethodID(env, cls, "<init>", "([BLjava/lang/String;)V");
    jstring object = (jstring) (*env)->NewObject(env, cls, ctor, array, strEncode);

    return object;
}

Java代码;

native String methodName();

其他方法不适合我;

我也尝试过return (*env)->NewStringUTF(env, r),但返回一些不在 char 数组中的字符,在字符串末尾带有JNI WARNING: input is not valid Modified UTF-8:illegal continuation byte 0x40的警告。

例子; PKdhtXMmr18n2L9K………………-DL

编辑:

C++ 版本

jstring clientStringFromStdString(JNIEnv *env,const std::string &str){
//    return env->NewStringUTF(str.c_str());
    jbyteArray array = env->NewByteArray(str.size());
    env->SetByteArrayRegion(array, 0, str.size(), (const jbyte*)str.c_str());
    jstring strEncode = env->NewStringUTF("UTF-8");
    jclass cls = env->FindClass("java/lang/String");
    jmethodID ctor = env->GetMethodID(cls, "<init>", "([BLjava/lang/String;)V");
    jstring object = (jstring) env->NewObject(cls, ctor, array, strEncode);
    return object;
}
于 2015-12-11T08:14:09.197 回答
11

我通过返回字节数组而不是字符串解决了这个问题。在 Java 方面,我现在将 Byte 数组转换为 Strings 。工作正常!避免在 Android 4.0 及更高版本中使用 NewStringUTF(),因为 Google Android NDK 上已经报告了一个错误。

于 2012-09-04T19:40:53.000 回答
2

我在更改文件 Application.mk 时遇到了这个问题

从这一行:

APP_STL := stlport_static

至:

APP_STL := gnustl_static

一旦我再次更改它,它就解决了这个问题。

于 2013-07-04T05:30:51.710 回答
1

传递给 NewStringUTF() 的字符串必须是有效的 Modified UTF-8。您的 start_Inauthroot() 函数返回的字符串看起来像其他编码,或者只是返回无效字符串。在将字符串传递给 JNI 函数之前,您需要将其转换为 UTF-8。或者,您可以改用字符集感知 String 构造函数之一来构建 String 对象。

于 2012-08-26T22:28:22.973 回答
1

从最后一天开始,我也遇到了同样的问题。一天后终于想出了一个解决方案..我希望这个回复可以拯救某人的一天..

问题是我在本机函数中调用了另一个函数,直接使用了返回的字符串,这导致了 android 旧版本的崩溃

所以首先我将另一个函数返回的字符串保存到一个变量中,然后使用它,问题就消失了:D

以下示例可能会清除您的概念

//older code with error
//here key_ is the string from java code

const char *key = env->GetStringUTFChars(key_, 0);
const char *keyx = getkey(key).c_str();
return env->NewStringUTF(keyx);

这就是我解决这个错误的方法

//newer code which is working
//here key_ is the string from java code

const char *key = env->GetStringUTFChars(key_, 0);
string k = getkey(key);
const char *keyx = k.c_str();
return env->NewStringUTF(keyx);

快乐编码:D

于 2018-05-27T16:27:54.457 回答
1

对我来说,解决方案是将内容放在 const char* 上:

const char* string = name_sin.c_str();
jstring utf8 = env_r->NewStringUTF(string);

和功能:

jclass cls_Env = env_r->FindClass(CLASS_ACTIVITY_NAME); 
jmethodID mid = env_r->GetMethodID(cls_Env, "Delegate",
                                 "(Ljava/lang/String;)V");


//todo importante hacerlo asi, si pasas directamente c_str a veces da error de carater no UTF 8
const char* string = name_sin.c_str();
jstring utf8 = env_r->NewStringUTF(string);

env_r->CallVoidMethod(*object_r, mid, utf8);

env_r->DeleteLocalRef(utf8);
于 2017-09-15T01:09:07.217 回答
1

在我看来,这不是一个错误。

NewStringUTF 从经过修改的 UTF-8编码的字符数组构造一个新的 java.lang.String 对象。

修改后的 UTF-8 不是标准的 UTF-8。请参阅修改后的 UTF-8

在大多数情况下,UTF-8 编码的字符串是有效的修改后的 UTF-8。因为修改后的 UTF-8 和 UTF-8 非常相似。但是,当涉及基本多语言平面之外的 Unicode 字符串时,它们是不兼容的。

解决方案: 将 UTF-8 字节传递给 Java 层和 new String(bytes, "UTF-8") 然后将 jstring 传递给 JNI。

于 2017-08-22T13:55:17.810 回答
0

这在 C++ 中对我有用

extern "C" JNIEXPORT
jstring Java_com_example_ndktest_MainActivity_TalkToJNI(JNIEnv* env, jobject javaThis, jstring strFromJava)
{
    jboolean isCopy;
    const char* szHTML = env->GetStringUTFChars(strFromJava, &isCopy);

    std::string strMine;
    strMine = szHTML;
    strMine += " --- Hello from the JNI!!";

    env->ReleaseStringUTFChars(strFromJava, szHTML);
    return env->NewStringUTF(strMine.c_str());
}
于 2013-11-04T23:10:12.817 回答
0

candroid ndk的工作方式如下

JNIEXPORT jstring JNICALL
Java_com_example_hellojni_HelloJni_stringFromJNI( JNIEnv* env,
                                                  jobject thiz,jstring str )
{

    jboolean isCopy;
    const char* szHTML = (*env)->GetStringUTFChars(env, str, &isCopy);
     return (*env)->NewStringUTF(env, szHTML);
}
于 2018-04-24T13:28:34.647 回答