![](/img/trans.png)
[英]Converting a PySpark data frame to a PySpark.pandas data frame
[英]Why is my pandas data frame not converting rightly into columns and rows to pyspark's data frame?
我正在嘗試從 sql server 讀取數據,然后創建 pyspark 數據框。
我也嘗試為它創建一個特定的架構,但這也無濟於事
from pyspark.sql.types import *
mySchema = StructType([ StructField("CAMP_ID", StringType(), True)\
,StructField("SEG_ID", StringType(), True)\
,StructField("CUST_NAME", StringType(), True)\
,StructField("CUST_CNIC", StringType(), True)\
,StructField("CUST_GENDER", StringType(), True)\
,StructField("CUST_DOB", StringType(), True)\
,StructField("CUST_MOBILE", StringType(), True)\
,StructField("CUST_EMAIL", StringType(), True)\
,StructField("PAN", StringType(), True)\
,StructField("TRAN_DATE", StringType(), True)\
,StructField("TRAN_CURRENCY", StringType(), True)\
,StructField("TRAN_AMOUNT", FloatType(), True)\
,StructField("STAN", StringType(), True)\
,StructField("MERCHANT_CAT_CODE", StringType(), True)\
,StructField("MERCHANT_NAME", StringType(), True)\
,StructField("MERCHANT_TYPE", StringType(), True)\
,StructField("TRAN_LOCATION", StringType(), True)\
,StructField("RESPONSE_NAME", StringType(), True)\
,StructField("CHANNEL_NAME", StringType(), True)\
,StructField("NETWORK_NAME", StringType(), True)\
,StructField("ACCT_STATUS_NAME", StringType(), True)\
,StructField("ACCT_TYPE_NAME", StringType(), True)\
,StructField("card_status", StringType(), True)\
,StructField("product_code", StringType(), True)])
df = spark.createDataFrame(pdf,schema=mySchema)
這是預期的行為。 如果你想漂亮地打印它,請嘗試:
display(df)
如果你只想要前兩行,你可以嘗試像
df.take(2)
但它不會被印刷得很漂亮。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.