AttributeError：制作生成器對象時，“ float”對象沒有屬性“ split”

Question

print([x["keywords"].split(",") for i,x in df.iterrows()  if not isinstance(x["keywords"], (int, float))])

print([x["tags"].split(",") for i,x in df.iterrows()  if not isinstance(x["tags"], (int, float))])

print([x["rating"].split(",") for i,x in df.iterrows()  if not isinstance(x["rating"], (int, float))])

print([x["rank"].split(",") for i,x in df.iterrows()  if not isinstance(x["rank"], (int, float))])

當我將它們連接在一起時，我想將這四個語句合並為一個語句，這給了我錯誤：

AttributeError：“ float”對象沒有屬性“ split”

features = [(x["entity_id"], x["tags"].split(","),x["rating"],
           x["rank"],x["keywords"].split(",") )
           for (index, x) in df.iterrows() if not isinstance(x, (int, float))]

Answer 1

pd.DataFrame.iterrows返回索引和pd.Series對象的元組。 因此，由於pd.Series對象不是int或float的子類，所以isinstance(x, (int, float))並沒有做您想要的事情。 使用此方法，您將需要迭代pd.Series對象中包含的各個值。

這是可能的，但我強烈建議不要這樣做。 實際上，我建議您完全避免iterrows ，因為它會丟失所有矢量化功能，這是Pandas的主要優點之一。

這是使用pd.DataFrame.mask和NumPy數組的解決方案：

df = pd.DataFrame({'entity_id': ['SomeId', 3124123, 'SomeOtherId', 314324],
                   'tags': ['Tag1,Tag2', None, 'Tag4', 'Tag5,Tag6,Tag7'],
                   'rating': [5.0, 'SomeRating', 'SomeOtherRating', np.nan],
                   'rank': ['SomeRank', 2, np.nan, 4],
                   'keywords': ['key1', 'key2,key3', 'key4', 'key5']})

df2 = df.mask(df.apply(pd.to_numeric, errors='coerce').notnull() | df.isnull(), None)

for col in ['tags', 'keywords']:
    df2[col] = df2[col].str.split(',')

col_order = ['entity_id', 'tags', 'rating', 'rank', 'keywords']
res = [list(filter(None, x)) for x in df2[col_order].values.tolist()]

結果

print(res)

[['SomeId', ['Tag1', 'Tag2'], 'SomeRank', ['key1']],
 ['SomeRating', ['key2', 'key3']],
 ['SomeOtherId', ['Tag4'], 'SomeOtherRating', ['key4']],
 [['Tag5', 'Tag6', 'Tag7'], ['key5']]]

作為評論，這很混亂。 優良作法是確定一致的結構，而不是這種混合的數據類型結構和基於類型的過濾。

AttributeError：制作生成器對象時，“ float”對象沒有屬性“ split”

問題描述

1 個解決方案

解決方案1
0 2018-09-05 09:23:45

AttributeError：制作生成器對象時，“ float”對象沒有屬性“ split”

問題描述

1 個解決方案

解決方案1 0 2018-09-05 09:23:45

解決方案1
0 2018-09-05 09:23:45