[英]Remove punctuation at beginning and end of a string
我有一个字符串,我只想删除其开头和结尾的所有标点符号,而不能删除中间的所有标点符号。
我编写了一个代码,仅从字符串的第一个和最后一个字符中删除标点符号,如果字符串的末尾有2个或更多个标点符号,这显然效率很低并且没有用。
这是一个例子:
{ Hello ""I am:: a Str-ing!! }
所需的输出
{ Hello I am a Str-ing }
我可以使用任何功能吗? 谢谢。
到目前为止,这是我所做的。 我实际上是在链接列表中编辑字符串
if(ispunct(removeend->string[(strlen(removeend->string))-1]) != 0) {
removeend->string[(strlen(removeend->string))-1] = '\0';
}
else {}
遍历字符串,使用isalpha()检查每个字符,将传递给新字符串的字符写入。
遍历字符串,在传递的第一个字符开始写入新字符串之后,使用isalpha()
检查每个字符。
向后遍历新字符串,用\\0
替换所有标点符号,直到找到不是标点符号的字符。
好吧,在一段while
迭代中,多次调用strtok
函数以用字符分隔每个单个字符串 (空白)。 您也可以使用
sscanf
代替strtok
。
然后,对于每个字符串,您都必须执行一个for
循环,但是要从字符串的末尾开始直到开始为止。一旦遇到!isalpha(current character)
,请在当前字符串位置放置\\0
。 您已经消除了尾巴的标点符号。
现在,做一套for
在同一串周期。 现在从0
到strlen(currentstring)
。 !isalpha(current character)
continue
。 如果isalpha
则将当前字符和所有剩余字符放入buffer
。 buffer
是清理后的字符串。 将其复制到原始字符串中。
对其他strtok
的输出重复上述两个步骤。 结束。
char *rm_punct(char *str) {
char *h = str;
char *t = str + strlen(str) - 1;
while (ispunct(*p)) p++;
while (ispunct(*t) && p < t) { *t = 0; t--; }
/* also if you want to preserve the original address */
{ int i;
for (i = 0; i <= t - p + 1; i++) {
str[i] = p[i];
} p = str; } /* --- */
return p;
}
#include <stdio.h>
#include <ctype.h>
#include <string.h>
char* trim_ispunct(char* str){
int i ;
char* p;
if(str == NULL || *str == '\0') return str;
for(i=strlen(str)-1; ispunct(str[i]);--i)
str[i]='\0';
for(p=str;ispunct(*p);++p);
return strcpy(str, p);
}
int main(){
//test
char str[][16] = { "Hello", "\"\"I", "am::", "a", "Str-ing!!" };
int i, size = sizeof(str)/sizeof(str[0]);
for(i = 0;i<size;++i)
printf("%s\n", trim_ispunct(str[i]));
return 0;
}
/* result:
Hello
I
am
a
Str-ing
*/
构造一个微型状态机。 cha2class()函数将字符分为等效类。 状态机将始终跳过标点符号,除非状态机左右具有字母数字字符。 在这种情况下,它将被保留。 (即状态3中的memmove())
#include <stdio.h>
#include <string.h>
#define IS_ALPHA 1
#define IS_WHITE 2
#define IS_PUNCT 3
int cha2class(int ch);
void scrutinize(char *str);
int cha2class(int ch)
{
if (ch >= 'a' && ch <= 'z') return IS_ALPHA;
if (ch >= 'A' && ch <= 'Z') return IS_ALPHA;
if (ch == ' ' || ch == '\t') return IS_WHITE;
if (ch == EOF || ch == 0) return IS_WHITE;
return IS_PUNCT;
}
void scrutinize(char *str)
{
size_t pos,dst,start;
int typ, state ;
state = 0;
for (dst = pos = start=0; ; pos++) {
typ = cha2class(str[pos]);
switch(state) {
case 0: /* BOF, white seen */
if (typ==IS_WHITE) break;
else if (typ==IS_ALPHA) { start = pos; state =1; }
else if (typ==IS_PUNCT) { start = pos; state =2; continue;}
break;
case 1: /* inside a word */
if (typ==IS_ALPHA) break;
else if (typ==IS_WHITE) { state=0; }
else if (typ==IS_PUNCT) { start = pos; state =3;continue; }
break;
case 2: /* inside punctuation after whitespace: skip it */
if (typ==IS_PUNCT) continue;
else if (typ==IS_WHITE) { state=0; }
else if (typ==IS_ALPHA) {state=1; }
break;
case 3: /* inside punctuation after a word */
if (typ==IS_PUNCT) continue;
else if (typ==IS_WHITE) { state=0; }
else if (typ==IS_ALPHA) {
memmove(str+dst, str+start, pos-start); dst += pos-start;
state =1; }
break;
}
str[dst++] = str[pos];
if (str[pos] == '\0') break;
}
}
int main (int argc, char **argv)
{
char test[] = ".This! is... ???a.string?" ;
scrutinize(test);
printf("Result=%s\n", test);
return 0;
}
int main (int argc, char **argv)
{
char test[] = ".This! is... ???a.string?" ;
scrutinize(test);
printf("Result=%s\n", test);
return 0;
}
输出:
Result=This is a.string
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.