AWS Jupyter Notebook EC2实例：从S3读取熊猫csv时出错

Question

从S3读取CSV时，内核将重新启动，并弹出以下信息：

Kernel Restarting
The kernel appears to have died. It will restart automatically

下面是代码片段：

import boto3
import pandas as pd
from boto.s3.connection import S3Connection

YOUR_ACCESS_KEY='******'
YOUR_SECRET_KEY='******'
YOUR_BUCKET='******'

client = boto3.client('s3',aws_access_key_id=YOUR_ACCESS_KEY, aws_secret_access_key=YOUR_SECRET_KEY)
client.download_file(YOUR_BUCKET, 'test.csv','test.csv')

从以下行引发错误：

test_df = pd.read_csv('test.csv')

但是我可以访问其他文件，例如示例文本文件：

client.download_file(YOUR_BUCKET, 'sample.txt','sample.txt')
print(open('sample.txt').read())

我认为此错误是由于CSV文件的大小所致，但是读取5MB CSV文件会产生相同的错误。

Answer 1

似乎是pyTorch的错误。

https://github.com/jupyter/notebook/issues/2784

围绕那里讨论的替代方案和多种解决方案，该票证仍然开放。

希望能帮助到你。

AWS Jupyter Notebook EC2实例：从S3读取熊猫csv时出错

问题描述

1 个解决方案

解决方案1
0 2017-10-01 04:12:47

AWS Jupyter Notebook EC2实例：从S3读取熊猫csv时出错

问题描述

1 个解决方案

解决方案1 0 2017-10-01 04:12:47

解决方案1
0 2017-10-01 04:12:47