[英]How to visualize data on a map using python in spark that came from csv?
我在HDFS
有一個CSV
文件。 我正在使用最新版本的Spark
和Python 3.7
。 我怎樣才能使CSV
可視化?
我嘗試了以下示例代碼:
from pyspark.sql.functions import avg
mydataframe = spark.read.csv("/diamonds.csv", header="true", inferSchema="true")
display(mydataframe.select("color","price").groupBy("color").agg(avg("price")))
問題是,我在輸出中看到的只是文本,看起來像mydataframe的架構,而不是實際的圖表或可視化。
我想在地圖上顯示“緯度”和“經度”列。 我怎樣才能做到這一點?
您是否考慮過使用專為地理可視化(例如geopandas)設計的python模塊?
import geopandas as gpd
from shapely.geometry import Point
geometry = [Point(xy) for xy in zip( mydataframe["LONGITUDE"], mydataframe["LATITUDE"])]
gdf = gpd.GeoDataFrame(mydataframe, geometry=geometry)
gdf.plot()
有關更多詳細信息,請參見Application GeoPandas和Spark 。
我有一個非常類似的問題,我在數據磚平台上工作過。 簡而言之,想法如下所示:
對於任何足以在瀏覽器上引起麻煩的數據集,我建議您自己以可用的方式匯總數據。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.