繁体   English   中英

删除字符串开头和结尾的标点符号

[英]Remove punctuation at beginning and end of a string

我有一个字符串,我只想删除其开头和结尾的所有标点符号,而不能删除中间的所有标点符号。

我编写了一个代码,仅从字符串的第一个和最后一个字符中删除标点符号,如果字符串的末尾有2个或更多个标点符号,这显然效率很低并且没有用。

这是一个例子:

{ Hello ""I am:: a Str-ing!! }

所需的输出

{ Hello I am a Str-ing }

我可以使用任何功能吗? 谢谢。

到目前为止,这是我所做的。 我实际上是在链接列表中编辑字符串

if(ispunct(removeend->string[(strlen(removeend->string))-1]) != 0) { 
    removeend->string[(strlen(removeend->string))-1] = '\0'; 
} 
else {} 

遍历字符串,使用isalpha()检查每个字符,将传递给新字符串的字符写入。

遍历字符串,在传递的第一个字符开始写入新字符串之后,使用isalpha()检查每个字符。

向后遍历新字符串,用\\0替换所有标点符号,直到找到不是标点符号的字符。

好吧,在一段while迭代中,多次调用strtok函数以用字符分隔每个单个字符串 (空白)。 您也可以使用sscanf代替strtok

然后,对于每个字符串,您都必须执行一个for循环,但是要从字符串的末尾开始直到开始为止。一旦遇到!isalpha(current character) ,请在当前字符串位置放置\\0 您已经消除了尾巴的标点符号。

现在,做一套for在同一串周期。 现在从0strlen(currentstring) !isalpha(current character) continue 如果isalpha则将当前字符和所有剩余字符放入buffer buffer是清理后的字符串。 将其复制到原始字符串中。

对其他strtok的输出重复上述两个步骤。 结束。

char *rm_punct(char *str) {
  char *h = str;
  char *t = str + strlen(str) - 1;
  while (ispunct(*p)) p++;
  while (ispunct(*t) && p < t) { *t = 0; t--; }
  /* also if you want to preserve the original address */
  { int i;
    for (i = 0; i <= t - p + 1; i++) {
      str[i] = p[i];
  } p = str; } /* --- */

  return p;
}
#include <stdio.h>
#include <ctype.h>
#include <string.h>

char* trim_ispunct(char* str){
    int i ;
    char* p;

    if(str == NULL || *str == '\0') return str;
    for(i=strlen(str)-1; ispunct(str[i]);--i)
        str[i]='\0';
    for(p=str;ispunct(*p);++p);

    return strcpy(str, p);
}

int main(){
    //test
    char str[][16] = { "Hello", "\"\"I", "am::", "a", "Str-ing!!" };
    int i, size = sizeof(str)/sizeof(str[0]);
    for(i = 0;i<size;++i)
        printf("%s\n", trim_ispunct(str[i]));

    return 0;
}
/* result:
Hello
I
am
a
Str-ing
*/

构造一个微型状态机。 cha2class()函数将字符分为等效类。 状态机将始终跳过标点符号,除非状态机左右具有字母数字字符。 在这种情况下,它将被保留。 (即状态3中的memmove())

#include <stdio.h>
#include <string.h>

#define IS_ALPHA 1
#define IS_WHITE 2
#define IS_PUNCT 3
int cha2class(int ch);
void scrutinize(char *str);

int cha2class(int ch)
{
if (ch >= 'a' && ch <= 'z') return IS_ALPHA;
if (ch >= 'A' && ch <= 'Z') return IS_ALPHA;
if (ch == ' ' || ch == '\t') return IS_WHITE;
if (ch == EOF || ch == 0) return IS_WHITE;
return IS_PUNCT;
}

void scrutinize(char *str)
{
size_t pos,dst,start;
int typ, state ;

state = 0;
for (dst = pos = start=0; ; pos++) {
        typ = cha2class(str[pos]);
        switch(state) {
        case 0: /* BOF, white seen */
                if (typ==IS_WHITE) break;
                else if (typ==IS_ALPHA) { start =  pos; state =1; }
                else if (typ==IS_PUNCT) { start =  pos; state =2; continue;}
                break;
        case 1: /* inside a word */
                if (typ==IS_ALPHA) break;
                else if (typ==IS_WHITE) { state=0; }
                else if (typ==IS_PUNCT) { start =  pos; state =3;continue; }
                break;
        case 2: /* inside punctuation after whitespace: skip it */
                if (typ==IS_PUNCT) continue;
                else if (typ==IS_WHITE) { state=0; }
                else if (typ==IS_ALPHA)  {state=1; }
                break;
        case 3: /* inside punctuation after a word */
                if (typ==IS_PUNCT) continue;
                else if (typ==IS_WHITE) { state=0; }
                else if (typ==IS_ALPHA) {
                        memmove(str+dst, str+start, pos-start); dst += pos-start;
                        state =1; }
                break;
                }
        str[dst++] = str[pos];
        if (str[pos] == '\0') break;
        }
}
int main (int argc, char **argv)
{
char test[] = ".This! is... ???a.string?" ;

scrutinize(test);

printf("Result=%s\n", test);

return 0;
}

int main (int argc, char **argv)
{
char test[] = ".This! is... ???a.string?" ;

scrutinize(test);

printf("Result=%s\n", test);

return 0;
}

输出:

Result=This is a.string

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM