將 csv 文件讀取到 Pandads dataframe 中，值的分隔符不止一個

Question

我有一個 csv 文件，它以逗號符號作為分隔符，同時值用 " 分隔。第一行是文本，第二行是空的，第三行由列標題組成。如果我嘗試導入使用 pandas 並使用代碼將文件放入 dataframe

IE00B0M62Q58 = pd.read_csv('ETF/sample.csv', sep=',')

我收到一個錯誤，例如

ParserError: Error tokenizing data. C error: Expected 2 fields in line 3, saw 13

如何將文件讀入 Pandas 中的 dataframe？

我復制並粘貼了 sample.csv 文件，如下所示：

Fondsposition per,"03.Jun.2021"


Emittententicker,Name,Anlageklasse,Gewichtung (%),Kurs,Nominale,Marktwert,Nominalwert,Sektor,ISIN,Börse,Standort,Marktwährung
"AAPL","APPLE INC","Aktien","3,63","123,54","1.722.459","212.792.585","212.792.584,86","IT","US0378331005","NASDAQ","Vereinigte Staaten","USD"
"MSFT","MICROSOFT CORP","Aktien","3,08","245,71","735.512","180.722.654","180.722.653,52","IT","US5949181045","NASDAQ","Vereinigte Staaten","USD"
"AMZN","AMAZON COM INC","Aktien","2,38","3.187,01","43.863","139.791.820","139.791.819,63","Zyklische Konsumgüter ","US0231351067","NASDAQ","Vereinigte Staaten","USD"
"FB","FACEBOOK CLASS A INC","Aktien","1,37","326,04","245.671","80.098.573","80.098.572,84","Kommunikation","US30303M1027","NASDAQ","Vereinigte Staaten","USD"
"GOOG","ALPHABET INC CLASS C","Aktien","1,24","2.404,61","30.223","72.674.528","72.674.528,03","Kommunikation","US02079K1079","NASDAQ","Vereinigte Staaten","USD"

Answer 1

嘗試在您的通話中使用decimal參數

IE00B0M62Q58 = pd.read_csv('ETF/sample.csv', sep=',', decimal=',')

還有如果. 它是一個數字分隔符， 2.404,61是2404.61 ，那么你可以使用thousands位參數：

IE00B0M62Q58 = pd.read_csv('ETF/sample.csv', sep=',', decimal=',' thousands='.')

如果您想在開頭跳過閱讀特定行，請添加跳過

IE00B0M62Q58 = pd.read_csv('ETF/sample.csv', sep=',',skiprows=2, thousands='.', decimal=',')

將 csv 文件讀取到 Pandads dataframe 中，值的分隔符不止一個

問題描述

1 個解決方案

解決方案1
0 已采納 2021-06-06 20:26:14

將 csv 文件讀取到 Pandads dataframe 中，值的分隔符不止一個

問題描述

1 個解決方案

解決方案1 0 已采納 2021-06-06 20:26:14

解決方案1
0 已采納 2021-06-06 20:26:14