如何從數據框中消除行名和列名的值導致pyspark？

Question

嗨，我正在將一個csv文件加載到數據幀，並在數據幀上運行篩選操作，我得到如下輸出

[Row(table_name=u'DEMO', rec_count=u'170049', col_count=u'36')]

我如何獲得如下輸出

`['DEMO','170049','36']`

我嘗試了uni編碼，我可以使用for循環來迭代數據，但是問題是數據有時是動態的，我得到了三個以上的值，但是我想使過程自動化，但是我無法如上

Answer 1

您有一個列表，其元素為Row對象； 您可以使用鍵列表來定義結果中所需的列和相應順序，然后使用列表理解從Row對象中提取它們：

# this is what you have now
x = [Row(table_name=u'DEMO', rec_count=u'170049', col_count=u'36')]

keys = ['table_name', 'rec_count', 'col_count']
[x[0][key] for key in keys]
# [u'DEMO', u'170049', u'36']

如何從數據框中消除行名和列名的值導致pyspark？

問題描述

1 個解決方案

解決方案1
1 2017-07-11 17:36:31

如何從數據框中消除行名和列名的值導致pyspark？

問題描述

1 個解決方案

解決方案1 1 2017-07-11 17:36:31

解決方案1
1 2017-07-11 17:36:31