[英]Not able to parse a .csv file uploaded using Flask
我正在尝试上传一个 CSV 文件,对其进行处理以生成结果,然后写回(下载)一个包含结果的新 CSV 文件。 我对 Flask 非常csv.reader
,我无法获得“正确的” csv.reader
对象来进行迭代和处理。 这是到目前为止的代码,
__author__ = 'shivendra'
from flask import Flask, make_response, request
import csv
app = Flask(__name__)
def transform(text_file_contents):
return text_file_contents.replace("=", ",")
@app.route('/')
def form():
return """
<html>
<body>
<h1>Transform a file demo</h1>
<form action="/transform" method="post" enctype="multipart/form-data">
<input type="file" name="data_file" />
<input type="submit" />
</form>
</body>
</html>
"""
@app.route('/transform', methods=["POST"])
def transform_view():
file = request.files['data_file']
if not file:
return "No file"
file_contents = file.stream.read().decode("utf-8")
csv_input = csv.reader(file_contents)
print(file_contents)
print(type(file_contents))
print(csv_input)
for row in csv_input:
print(row)
result = transform(file_contents)
response = make_response(result)
response.headers["Content-Disposition"] = "attachment; filename=result.csv"
return response
if __name__ == "__main__":
app.run(host='0.0.0.0', port=5001, debug=True)
终端输出是
127.0.0.1 - - [12/Oct/2015 02:51:53] "GET / HTTP/1.1" 200 -
127.0.0.1 - - [12/Oct/2015 02:51:59] "POST /transform HTTP/1.1" 200 -
4,5,6
<class 'str'>
<_csv.reader object at 0x105149438>
['1']
['', '']
['2']
['', '']
['3']
[]
['4']
['', '']
['5']
['', '']
['6']
而我读的文件是
当我迭代 csv.reader 对象时,没有得到代表 2 行的 2 个列表,我做错了什么?
好的,所以您的脚本存在一个主要问题,这里提到的csv.reader
需要一个文件对象或至少一个支持迭代器协议的对象。 您正在传递一个确实实现迭代器协议的str
,但它不是遍历行,而是遍历字符。 这就是为什么你有你所做的输出。
首先,它给出了一个csv.reader
字符1
, csv.reader
将其视为具有一个字段的一行。 之后str
给出了另一个单个字符,
csv.reader
将其视为具有两个空字段的行(因为逗号是字段分隔符)。 它在整个str
一直如此,直到筋疲力尽。
解决方案(或至少一种解决方案)是将str
转换为类似文件的对象。 我尝试使用由flask.request.files["name"]
提供的流,但这不会遍历行。 接下来,我尝试使用cStringIO.StringIO
并且似乎有类似的问题。 我最终解决了这个问题, 该问题在通用换行符模式下建议了一个io.StringIO
对象,该对象有效。 我最终得到了以下工作代码(也许它可能会更好):
__author__ = 'shivendra'
from flask import Flask, make_response, request
import io
import csv
app = Flask(__name__)
def transform(text_file_contents):
return text_file_contents.replace("=", ",")
@app.route('/')
def form():
return """
<html>
<body>
<h1>Transform a file demo</h1>
<form action="/transform" method="post" enctype="multipart/form-data">
<input type="file" name="data_file" />
<input type="submit" />
</form>
</body>
</html>
"""
@app.route('/transform', methods=["POST"])
def transform_view():
f = request.files['data_file']
if not f:
return "No file"
stream = io.StringIO(f.stream.read().decode("UTF8"), newline=None)
csv_input = csv.reader(stream)
#print("file contents: ", file_contents)
#print(type(file_contents))
print(csv_input)
for row in csv_input:
print(row)
stream.seek(0)
result = transform(stream.read())
response = make_response(result)
response.headers["Content-Disposition"] = "attachment; filename=result.csv"
return response
if __name__ == "__main__":
app.run(host='0.0.0.0', port=5001, debug=True)
重要说明:此答案仅与SpooledTemporaryFile可用的平台相关。
除了iLuveTux answer 之外,您可以通过替换以下基于字符串的流创建来保存冗余的read()
调用:
stream = io.StringIO(f.stream.read().decode("UTF8"), newline=None)
和:
stream = io.TextIOWrapper(f.stream._file, "UTF8", newline=None)
例子:
stream = io.TextIOWrapper(f.stream._file, "UTF8", newline=None)
csv_input = csv.reader(stream)
print(csv_input)
for row in csv_input:
print(row)
更多信息:
Werkzeug 表单数据解析器的默认流是SpooledTemporaryFile (从1.0.1 开始),您可以从中使用其_file
成员获取底层缓冲区。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.