簡體   English   中英

計算文件C中的單詞出現次數

[英]Counting word occurrences in a file C

歡迎大家。 我是Stackoverflow的新手,我用C編寫了一段時間。 我在編寫一個計算文本文件中單詞出現次數的程序時遇到了問題。 我需要有一個輸出,告訴哪個單詞出現了多少次。 這是源代碼:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>

int new_words=0;
int nwords=0;

typedef struct element{
    char word[30];
    int how_many;
} element;

int is_word_new(element ** dictionary, char * string)
{
    for (int i =0; i<new_words; i++)
    {
        if (strcmp(string, dictionary[i]->word)==0)
            return 0;
    }
    return 1;
}
int which_word(element ** dictionary, char * string)
{
    for (int i =0; i<new_words; i++)
    {
        if (strcmp(string, dictionary[i]->word)==0)
            return i;
    }
    return 0;
}

int main()
{
    FILE * fp;
    char word[30];


    fp=fopen("input.txt", "r");
    if (fp==NULL)
    {
        printf("FILE ERROR");
        return 0;
    }


    while(!feof(fp))
    {
        fscanf(fp, "%s",word);
        nwords++;
    }
    nwords--;
    rewind(fp);

    struct element * dictionary = (element*)malloc(sizeof(element)*nwords);

    for (int i =0; i<nwords; i ++)
    {
        fscanf(fp, "%s", word);

        if( is_word_new(&dictionary, word) )
        {
            strcpy(dictionary[new_words].word, word);
            //dictionary[new_words].word= word;
            dictionary[new_words].how_many=1;
            new_words++;
        }
        else
            dictionary[which_word(&dictionary, word)].how_many++;
        word[0]='\0';
    }

    printf("\n\nFinal dictionary\n with %d words", new_words);
    for (int i =0; i<new_words; i++)
    {
        printf("%s %d \n", dictionary[i].word, dictionary[i].how_many);     
    }

    free(dictionary);
    fclose(fp);
    return 0;
}

我的想法是,我首先計算文本中有多少個單詞(以某種方式總是比實際上多一個單詞)。 函數is_word_new檢查詞典中是否已經有新讀的單詞。 which_word()告訴您找到了哪個單詞

但是我在運行該程序時遇到了分段錯誤。 當我使用// dictionary[i].word=word注釋的行// dictionary[i].word=word ,程序的行為就像字典中只有“ word”一樣。

請給我提示我在哪里做錯了

必須閱讀的問題: 為什么“ while(!feof(file))”總是錯誤的? 感謝喬納森·萊夫勒的評論。


請在下面的代碼中查看我的評論。 當單詞出現一次時,我為您提供了一個開始。 我把剩下的工作留給您,以便我們分享樂趣,但是您當然可以問。

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
int new_words = 0;
int nwords = 0;

typedef struct element {
    char word[30];
    int how_many;
} element;

// no need to pass double pointer
int is_word_new(element* dictionary, char * string) {
    int i;
    for (i = 0; i < new_words; i++) {
        printf("|%s|, |%s|\n", string, dictionary[i].word);
        if (strcmp(string, dictionary[i].word) == 0)
            return 0;
        printf("i=%d\n",i);
    }
    return 1;
}

int which_word(element ** dictionary, char * string) {
    int i;
    for (i = 0; i < new_words; i++) {
        if (strcmp(string, dictionary[i]->word) == 0)
            return i;
    }
    return 0;
}

int main() {
    FILE * fp;
    char word[30];


    fp = fopen("test.txt", "r");
    if (fp == NULL) {
        printf("FILE ERROR");
        return 0;
    }

    printf("file read\n");

    int read_counter;
    while (!feof(fp)) {
        read_counter = fscanf(fp, "%s", word);
        // increment only if we really read something
        if(read_counter >= 0)
                nwords++;
    }
    // this is wrong, remove it
    //nwords--;
    rewind(fp);

    printf("nwords = %d\n", nwords);
    // do not cast what malloc returns. Also struct is not needed.
    element * dictionary = malloc(sizeof (element) * nwords);

    int i;
    for (i = 0; i < nwords; i++) {
        fscanf(fp, "%s", word);
        printf("read |%s|\n", word);
        if (is_word_new(dictionary, word)) {
            strcpy(dictionary[new_words].word, word);
            //dictionary[new_words].word= word;                     
            dictionary[new_words].how_many = 1;
            new_words++;
        } else {
            printf("bhka\n");
            dictionary[which_word(&dictionary, word)].how_many++;
        }
        //word[0] = '\0';
    }

    printf("\n\nFinal dictionary\n with %d words", new_words);
    for (i = 0; i < new_words; i++) {
        printf("%s %d \n", dictionary[i].word, dictionary[i].how_many);
    }

    free(dictionary);
    fclose(fp);
    return 0;
}

這是我使用的test.txt:

sam klouvi george dit epfl
ok
end

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM