[英]How to create a dataframe in pandas?
我有兩個清單。 一種稱為“區域”,另一種稱為“產品”。 Region 有 111 個不同的值,Products 有 1181 個不同的值。 我想從這兩個列表中創建每個產品和區域組合的數據框。
例如,我想要這種類型的數據框由兩個列表組成。 在這里,產品有 2 個值,區域有 3 個值。
Pdts Region
0 A X
1 B X
2 A Y
3 B Y
4 A Z
5 B Z
我想要這種類型的數據框,但我的“區域”列表有 111 個不同的值,而“產品”列表有 1181 個不同的值。 我怎樣才能做到這一點?
這是笛卡爾積
import pandas as pd
df1 = pd.DataFrame({'dataframe1': ['A', 'B']})
df2 = pd.DataFrame({'dataframe2': ['X', 'Y', 'Z']})
# Assign new columns to a DataFrame
# Merge with a database-style join
# Drop specified labels from rows or columns
product_df = df1.assign(key=1)\
.merge(df2.assign(key=1), on='key')\
.drop('key', 1)
print(product_df)
輸出
dataframe1 dataframe2
0 A X
1 A Y
2 A Z
3 B X
4 B Y
5 B Z
你可以這樣做:
import pandas as pd
d = {'Region': first_list, 'Products': second_list}
df = pd.DataFrame(data=d)
你的意思是:
>>> df['Region'] = ['X', 'Y', 'Z'] * (len(df) // 3)
>>> df
Pdts Region
0 A X
1 B Y
2 A Z
3 B X
4 A Y
5 B Z
>>>
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.