簡體   English   中英

如何在數據框列中找到不同數量的元素,其中字符串包含由分號分隔的多個元素

[英]How to find the distinct number of elements in data frame column, in which strings contain multiple elements separated by a semi-colon

我正在從 excel 導入一些數據並嘗試在 Streamlit 上制作一個儀表板。 現在,我正在嘗試計算稱為“標簽”的數據框列之一中不同元素的數量。 但是,對於某些行,我將不同的值組合成一個字符串,而不是多個字符串。

第一個“for循環”的數據是這樣出來的......“Python; C++”“Java;Python”“R;C;Java”

而不是像... [Python, C++, Java, R, C]。 對於第二個“for 循環”,我正在嘗試做我想做的事情,但是,該程序沒有輸出任何內容。 我究竟做錯了什么?

cnt=0
visited=[]
for i in range(0, len(df1['Tags'])):
    
    if df1['Tags'][i] not in visited: 
        
        visited.append(df1['Tags'][i])
          
        cnt += 1
u=[]
for j in range(0, len(visited)):
    new= visited[j].split(';')
    for z in range(0, len(new)):
        if new not in u:
            u.append(new)
st.write(new)

是你想要的結果嗎?

list(set([j.strip() for i in df1["Tags"] for j in i.split(';')]))

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM