繁体   English   中英

jstring(JNI) 到 std::string(c++) 与 utf8 字符

[英]jstring(JNI) to std::string(c++) with utf8 characters

如何使用utf8字符将jstring (JNI) 转换为std::string (c++)?

这是我的代码。 它适用于非 utf8 字符,但使用 utf8 字符是错误的。

std::string jstring2string(JNIEnv *env, jstring jStr){
    const char *cstr = env->GetStringUTFChars(jStr, NULL);
    std::string str = std::string(cstr);
    env->ReleaseStringUTFChars(jStr, str);
    return str;
}

找了好久才找到解决办法。 我找到了一种方法:

在 java 中,unicode char 将使用 2 个字节( utf16 )进行编码。 所以jstring将容器字符utf16 c++ 中的std::string本质上是一个字节串,而不是字符,所以如果我们想将jstringJNI传递给c++ ,我们必须将utf16转换为字节。

在文档JNI 函数中,我们有 2 个函数可以从 jstring 中获取字符串:

// Returns a pointer to the array of Unicode characters of the string. 
// This pointer is valid until ReleaseStringchars() is called.
const jchar * GetStringChars(JNIEnv *env, jstring string, jboolean *isCopy);


// Returns a pointer to an array of bytes representing the string 
// in modified UTF-8 encoding. This array is valid until it is released 
// by ReleaseStringUTFChars().
const char * GetStringUTFChars(JNIEnv *env, jstring string, jboolean *isCopy);

GetStringUTFChars ,它将返回修改后的 utf8

GetStringChars将返回 jbyte *,我们将从 jbytes 中读取字符代码并将其转换为 C++ 中的字符

这是我的解决方案(适用于asciiutf8字符):

std::string jstring2string(JNIEnv *env, jstring jStr) {
    if (!jStr)
        return "";

    const jclass stringClass = env->GetObjectClass(jStr);
    const jmethodID getBytes = env->GetMethodID(stringClass, "getBytes", "(Ljava/lang/String;)[B");
    const jbyteArray stringJbytes = (jbyteArray) env->CallObjectMethod(jStr, getBytes, env->NewStringUTF("UTF-8"));

    size_t length = (size_t) env->GetArrayLength(stringJbytes);
    jbyte* pBytes = env->GetByteArrayElements(stringJbytes, NULL);

    std::string ret = std::string((char *)pBytes, length);
    env->ReleaseByteArrayElements(stringJbytes, pBytes, JNI_ABORT);

    env->DeleteLocalRef(stringJbytes);
    env->DeleteLocalRef(stringClass);
    return ret;
}
jboolean isCopy;
const char *convertedValue = (env)->GetStringUTFChars(yourJStringParam, &isCopy);
std::string string = std::string(convertedValue, length)

这工作得很好。 试一试。

解释在这里:

http://www.club.cc.cmu.edu/~cmccabe/blog_jni_flaws.html https://developer.android.com/training/articles/perf-jni (区域调用)

jsize
string_j2c(JNIEnv *env, jstring p, char *buffer) {

    if (buffer != NULL) {
        // Returns the length (the count of Unicode characters) of a
        // Java string.
        const jsize len = (*env).GetStringLength(p);

        // Translates 'len' number of Unicode characters into modified
        // UTF-8 encoding and place the result in the given buffer.
        (*env).GetStringUTFRegion(p, 0, len, buffer);

        // Returns JNI_TRUE when there is a pending exception;
        // otherwise, returns JNI_FALSE.
        const jboolean is_error = (*env).ExceptionCheck();

        if (is_error == JNI_TRUE) {
            return -1;
        }
    }

    // Returns the length in bytes of the modified UTF-8
    // representation of a string.
    const jsize len = (*env).GetStringUTFLength(p);
    return len;
}

const jsize len = string_j2c(env, p, NULL);
char buffer[len];
const jsize ret = string_j2c(env, p, buffer);

if (ret == -1) { // error
}
else {
    __android_log_print(ANDROID_LOG_DEBUG, "Native", "%s", buffer);
}

我调整了@Nikhil Tambe的答案,看起来像这样:

jboolean isCopy;
const char *convertedValue = (env)->GetStringUTFChars(yourJStringParam, &isCopy);
std::string str = convertedValue;

那奏效了! 因为在标准 C++ 中,字符串文字的类型是const char * ,因此您可以将const char *convertedValue分配给std::string类型的变量。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM