簡體   English   中英

提取PHP的關鍵字格式錯誤

[英]Malformed keywords on extraction PHP

我正在使用此資源從網頁中提取關鍵字。 它工作正常,但有些單詞格式錯誤。 單詞“ memory ”被提取為“ memori ”,“ article ”被提取為“ articl ”。 還有許多其他具有類似行為的關鍵字。 下面是摘自一些關鍵字的列表(后續代碼var_dump($ uniqueKeywords)) 這個網址作為參數傳遞給函數。

PS:我不會刪除數字。

使用詞干算法對單詞進行轉換。 詞干允許單詞的不同形式匹配,例如“記憶”“記憶”都轉換為“記憶” 請注意,詞干詞通常不是實際詞,而應僅用於比較。

如果您不希望這種行為,請跳過本教程的“詞干”部分。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM