![](/img/trans.png)
[英]DataFrame with multiple semi-colon separated variables in each column. How to one-hot encode?
[英]How to find the distinct number of elements in data frame column, in which strings contain multiple elements separated by a semi-colon
我正在從 excel 導入一些數據並嘗試在 Streamlit 上制作一個儀表板。 現在,我正在嘗試計算稱為“標簽”的數據框列之一中不同元素的數量。 但是,對於某些行,我將不同的值組合成一個字符串,而不是多個字符串。
第一個“for循環”的數據是這樣出來的......“Python; C++”“Java;Python”“R;C;Java”
而不是像... [Python, C++, Java, R, C]。 對於第二個“for 循環”,我正在嘗試做我想做的事情,但是,該程序沒有輸出任何內容。 我究竟做錯了什么?
cnt=0
visited=[]
for i in range(0, len(df1['Tags'])):
if df1['Tags'][i] not in visited:
visited.append(df1['Tags'][i])
cnt += 1
u=[]
for j in range(0, len(visited)):
new= visited[j].split(';')
for z in range(0, len(new)):
if new not in u:
u.append(new)
st.write(new)
是你想要的結果嗎?
list(set([j.strip() for i in df1["Tags"] for j in i.split(';')]))
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.