繁体   English   中英

在 C 中使用 strcat 进行动态字符串连接

[英]Dynamic string concatenation with strcat in C

我在使用 strcat 时遇到问题,但是使用 realloc,strcat 会覆盖目标字符串

char *splitStr(char *line) {
        char *str_;
        str_ = (char *) malloc(1);
        char *ptr = strtok(line,"\n");
        int a;
        while (ptr != NULL) {
              if (ptr[0] != '$') {
                        printf("oncesi %s\n", str_);
                        a = strlen(ptr) + strlen(str_) + 1;
                        str_ = realloc(str_, a);
                        strcat(str_, ptr);
                        str_[a] = '\0';
                        printf("sontasi:%s\n", str_);
              }
              ptr = strtok(NULL, "\n");
        }
        printf("splitStr %d\n", strlen(str_));
        printf("%s", str_);
        return str_;
}

我的输入值是;

*4
$3
200
$4
4814
$7
SUCCESS
$4
3204

所以我想通过 strtok 分割这个输入值; strtok(line,'\\n');

并将所有没有开始“$”字符的行连接到新字符。 但是,此代码提供以下输出;

line: *4
oncesi 
sontasi:*4
oncesi *4
200tasi:*4
200esi *4
4814asi:*4
4814si *4
SUCCESS:*4
SUCCESS*4
3204ESS:*4
splitStr 25

似乎覆盖了源字符串。 你知道为什么会发生这个问题吗?

以下建议代码:

  1. 干净地编译
  2. 执行指定的功能
  3. 为了输出的可读性稍作调整
  4. 检查malloc()realloc()
  5. 显示了如何初始化 str[] 数组,这是 OP 发布的代码中的问题。
  6. 函数: strlen()返回一个size_t ,而不是一个int 所以正确的输出格式转换说明符是: %zu
  7. 不在变量名上使用尾随下划线

现在,建议的代码:

#include <string.h>
#include <stdlib.h>
#include <stdio.h>


char *splitStr( char *line ) 
{
    printf("original line: %s\n", line);

    char *str = malloc(1);
    if( !str )
    {
        perror( "malloc failed" );
        exit( EXIT_FAILURE );
    }

    str[0] = '\0';   // critical statement
    char *token = strtok(line,"\n");


    while( token ) 
    {
        if( token[0] != '$') 
        {
            char* temp = realloc( str, strlen( token ) + strlen( str ) + 1 );
            if( ! temp )
            {
                perror( "realloc failed" );
                free( str );
                exit( EXIT_FAILURE );
            }

            str = temp;   // update pointer

            strcat(str, token);
            printf( "concat result: %s\n", str );
        }
        token = strtok(NULL, "\n");
    }

    printf("splitStr %zu\n", strlen(str));
    return str;
}


int main( void )
{
    char  firstStr[] = "$abcd\n$defg\nhijk\n";
    char *firstNewStr = splitStr( firstStr );
    printf( "returned: %s\n\n\n\n", firstNewStr );
    free( firstNewStr );

    char  secondStr[] = "abcd\ndefg\nhijk\n";
    char *secondNewStr = splitStr( secondStr );
    printf( "returned: %s\n\n\n\n", secondNewStr );
    free( secondNewStr );
}

运行建议的代码会导致:

original line: $abcd
$defg
hijk

concat result: hijk
splitStr 4
returned: hijk



original line: abcd
defg
hijk

concat result: abcd
concat result: abcddefg
concat result: abcddefghijk
splitStr 12
returned: abcddefghijk

您的输入包含 Windows/DOS 行尾编码"\\r\\n"

由于strtok()只是将'\\n'替换为'\\0' ,所以'\\r'保留在字符串中。 在输出时,它将光标向左移动,附加字符会覆盖旧字符,至少在视觉上是这样。

但是,您的连接字符串应该没问题。 计算字符数,不要忘记为每一行包含一个'\\r'"*4\\r200\\r4814\\rSUCCESS\\r3204\\r"是 25 个字符,如输出splitStr 25所示。


补充说明:

  • 正如其他人已经说过的, str_ = (char *) malloc(1); 初始化的空间str_点。 您需要自己执行此操作,例如str_[0] = '\\0'; .
  • 不要那样使用下划线。
  • 您不需要转换malloc()的结果,它是一个与char* (和任何其他)兼容的void*

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM