[英]How to know if a website is non-english?
我正在做類似檢測網站語言的事情。 它大約有 1k 個網站,所以我不能一一做。我想這樣做我需要通過 python 獲取網站 html 代碼並獲取所有文本,進行分析。 是否正確,是否有人做過這樣的事情,這將非常有幫助:)
謝謝大家的回答,找到方法了。 通過列出網站的 Alexa 排名和大多數訪問者所在的國家/地區。 如果它是美國或其他說英語的國家,那么它就是英文網站。
用蟒蛇做的。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.