如何從Graphlab遷移到熊貓

Question

我一直在學習Graphlab，但是由於熊貓是開源的，所以我也想看看它，將來我可能會發現自己在一家沒有GL許可證的公司中，我想知道熊貓如何處理創建GL的基本模型。

data = pd.read_csv("~/Downloads/diamonds.csv")
sframe  = gl.SFrame(data)
train_data, test_data = sframe.random_split(.8, seed=1)
train, test = train_test_split(data, train_size=0.75, random_state=88)
reg_model = gl.linear_regression.create(train_data, target="price", features=["carat","cut","color"], validation_set=None)

相當於上面最后一行的熊貓是多少？

Answer 1

pandas本身沒有內置任何預測模型（據我所知）。 這是有關如何在統計模型中利用熊貓的良好鏈接。 這也是。

pandas可能是最好的一個（如果不是最好的），用於在Python數據操作模塊。 與列表和讀取CSV等相比，它將使存儲數據和處理數據以進行建模變得更加容易。

讀取文件非常簡單（請注意它的直觀性）：

import pandas as pd
# Excel
df1 = read_excel(PATH_HERE)
# Csv
df1 = read_csv(PATH_HERE)
# JSON
df1 = read_json(PATH_HERE)

並吐出來：

# Excel
d1.to_excel(PATH_HERE)
# Need I go on again??

它還使過濾和切片數據非常簡單。 這是官方文件：

出於建模目的，請查看sklearn和NLTK進行文本分析。 還有其他，但那些是我使用過的。

Answer 2

為了建模，您必須使用sklearn庫。 最后一行等效項是：

model = sklearn.linear_model.LogisticRegression()
model.fit(train_data["carat","cut","color"], train_data["price"])

文檔

如何從Graphlab遷移到熊貓

問題描述

2 個解決方案

解決方案1
1 2017-05-26 20:28:13

解決方案2
1 2017-07-16 07:40:07

如何從Graphlab遷移到熊貓

問題描述

2 個解決方案

解決方案1 1 2017-05-26 20:28:13

解決方案2 1 2017-07-16 07:40:07

解決方案1
1 2017-05-26 20:28:13

解決方案2
1 2017-07-16 07:40:07