如何从数据框中消除行名和列名的值导致pyspark？

Question

嗨，我正在将一个csv文件加载到数据帧，并在数据帧上运行筛选操作，我得到如下输出

[Row(table_name=u'DEMO', rec_count=u'170049', col_count=u'36')]

我如何获得如下输出

`['DEMO','170049','36']`

我尝试了uni编码，我可以使用for循环来迭代数据，但是问题是数据有时是动态的，我得到了三个以上的值，但是我想使过程自动化，但是我无法如上

Answer 1

您有一个列表，其元素为Row对象； 您可以使用键列表来定义结果中所需的列和相应顺序，然后使用列表理解从Row对象中提取它们：

# this is what you have now
x = [Row(table_name=u'DEMO', rec_count=u'170049', col_count=u'36')]

keys = ['table_name', 'rec_count', 'col_count']
[x[0][key] for key in keys]
# [u'DEMO', u'170049', u'36']

如何从数据框中消除行名和列名的值导致pyspark？

问题描述

1 个解决方案

解决方案1
1 2017-07-11 17:36:31

如何从数据框中消除行名和列名的值导致pyspark？

问题描述

1 个解决方案

解决方案1 1 2017-07-11 17:36:31

解决方案1
1 2017-07-11 17:36:31