[英]How to move from Graphlab to pandas
我一直在學習Graphlab,但是由於熊貓是開源的,所以我也想看看它,將來我可能會發現自己在一家沒有GL許可證的公司中,我想知道熊貓如何處理創建GL的基本模型。
data = pd.read_csv("~/Downloads/diamonds.csv")
sframe = gl.SFrame(data)
train_data, test_data = sframe.random_split(.8, seed=1)
train, test = train_test_split(data, train_size=0.75, random_state=88)
reg_model = gl.linear_regression.create(train_data, target="price", features=["carat","cut","color"], validation_set=None)
相當於上面最后一行的熊貓是多少?
pandas
本身沒有內置任何預測模型(據我所知)。 這是有關如何在統計模型中利用熊貓的良好鏈接 。 這也是。
pandas
可能是最好的一個(如果不是最好的 ),用於在Python數據操作模塊。 與列表和讀取CSV等相比,它將使存儲數據和處理數據以進行建模變得更加容易。
讀取文件非常簡單(請注意它的直觀性):
import pandas as pd
# Excel
df1 = read_excel(PATH_HERE)
# Csv
df1 = read_csv(PATH_HERE)
# JSON
df1 = read_json(PATH_HERE)
並吐出來:
# Excel
d1.to_excel(PATH_HERE)
# Need I go on again??
它還使過濾和切片數據非常簡單。 這是官方文件 :
為了建模,您必須使用sklearn庫。 最后一行等效項是:
model = sklearn.linear_model.LogisticRegression()
model.fit(train_data["carat","cut","color"], train_data["price"])
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.