簡體   English   中英

如何從Graphlab遷移到熊貓

[英]How to move from Graphlab to pandas

我一直在學習Graphlab,但是由於熊貓是開源的,所以我也想看看它,將來我可能會發現自己在一家沒有GL許可證的公司中,我想知道熊貓如何處理創建GL的基本模型。

data = pd.read_csv("~/Downloads/diamonds.csv")
sframe  = gl.SFrame(data)
train_data, test_data = sframe.random_split(.8, seed=1)
train, test = train_test_split(data, train_size=0.75, random_state=88)
reg_model = gl.linear_regression.create(train_data, target="price", features=["carat","cut","color"], validation_set=None)

相當於上面最后一行的熊貓是多少?

pandas本身沒有內置任何預測模型(據我所知)。 這是有關如何在統計模型中利用熊貓的良好鏈接 這也是。

pandas可能是最好的一個(如果不是最好 ),用於在Python數據操作模塊。 與列表和讀取CSV等相比,它將使存儲數據和處理數據以進行建模變得更加容易。

讀取文件非常簡單(請注意它的直觀性):

import pandas as pd
# Excel
df1 = read_excel(PATH_HERE)
# Csv
df1 = read_csv(PATH_HERE)
# JSON
df1 = read_json(PATH_HERE)

並吐出來:

# Excel
d1.to_excel(PATH_HERE)
# Need I go on again??

它還使過濾和切片數據非常簡單。 這是官方文件

出於建模目的,請查看sklearnNLTK進行文本分析。 還有其他,但那些是我使用過的。

為了建模,您必須使用sklearn庫。 最后一行等效項是:

model = sklearn.linear_model.LogisticRegression()
model.fit(train_data["carat","cut","color"], train_data["price"])

文檔

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM