計算Python中一列每行的漢字數

Question

給定一個數據框，如下所示：

   id            name
0   1             個體戶
1   2              個人
2   3  利他潤己企業管理有限公司
3   4    博通國際投資有限公司
4   5      西潼·科技有限公司
5   6      度咪科技有限公司

我如何計算name列每行的漢字數？

預期的結果將是這樣的：

   id            name           count
0   1             個體戶            3
1   2              個人             2
2   3    利他潤己企業管理有限公司    12
3   4      博通國際投資有限公司      10
4   5        西潼科技有限公司        8
5   6        度咪科技有限公司        8

Answer 1

您可以使用str.count與正則表達式模式一起執行此操作：

df['count'] = df['name'].str.count(pat='[\u4e00-\u9fff]')

結果：

   id                    name   count
0   1                   個體戶      3
1   2                    個人       2
2   3  利他潤己企業管理有限公司      12
3   4      博通國際投資有限公司      10
4   5        西潼·科技有限公司       8
5   6         度咪科技有限公司       8

Answer 2

以下代碼有效，但如果您能分享其他可能的解決方案，我們將不勝感激。

def hans_count(str):
    hans_total = 0
    for s in str:
        if '\u4e00' <= s <= '\u9fef':
            hans_total += 1
    return hans_total

df['count'] = df['name'].apply(hans_count)
df

出去：

   id            name  count
0   1             個體戶      3
1   2              個人      2
2   3    利他潤己企業管理有限公司     12
3   4      博通國際投資有限公司     10
4   5        西潼科技有限公司     8
5   6        度咪科技有限公司     8

計算Python中一列每行的漢字數

問題描述

2 個解決方案

解決方案1
6 已采納 2020-12-28 09:37:57

解決方案2
0 2020-12-28 09:17:36

計算Python中一列每行的漢字數

問題描述

2 個解決方案

解決方案1 6 已采納 2020-12-28 09:37:57

解決方案2 0 2020-12-28 09:17:36

解決方案1
6 已采納 2020-12-28 09:37:57

解決方案2
0 2020-12-28 09:17:36