繁体   English   中英

将数据框从一个Jupyter Notebook文件导入另一个

[英]Import data frame from one Jupyter Notebook file to another

我有3个单独的jupyter笔记本文件处理单独的数据帧。 我为每个df清理和操作这些笔记本中的数据。 有没有办法在单独的笔记本中引用清理/最终数据?

我担心的是,如果我在一个笔记本中处理所有3个dfs,然后在(合并/加入)后使用它做更多,那么它将是一英里长。 我也不想重新编写一堆代码,只是为了准备好在我的新笔记本中使用的数据。

如果您正在使用pandas数据帧,那么一种方法是使用pandas.DataFrame.to_csv()pandas.read_csv()来在每个步骤之间保存和加载已清理的数据。

  1. Notebook1加载input1并保存result1。
  2. Notebook2加载result1并保存result2。
  3. Notebook3加载result2并保存result3。

如果这是您的数据:

import pandas as pd
raw_data = {'id': [10, 20, 30], 
            'name': ['foo', 'bar', 'baz']
           }
input = pd.DataFrame(raw_data, columns = ['id', 'name'])

然后在notebook1.ipynb中,像这样处理它:

# load
df = pd.read_csv('input.csv', index_col=0)
# manipulate frame here
# ...
# save
df.to_csv('result1.csv')

......并为链中的每个阶段重复该过程。

# load
df = pd.read_csv('result1.csv', index_col=0)
# manipulate frame here
# ...
# save
df.to_csv('result2.csv')

最后,您的笔记本集合将如下所示:

  • input.csv
  • notebook1.ipynb
  • notebook2.ipynb
  • notebook3.ipynb
  • result1.csv
  • result2.csv
  • result3.csv

文档:

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM