繁体   English   中英

无法解析使用 Flask 上传的 .csv 文件

[英]Not able to parse a .csv file uploaded using Flask

我正在尝试上传一个 CSV 文件,对其进行处理以生成结果,然后写回(下载)一个包含结果的新 CSV 文件。 我对 Flask 非常csv.reader ,我无法获得“正确的” csv.reader对象来进行迭代和处理。 这是到目前为止的代码,

__author__ = 'shivendra'
from flask import Flask, make_response, request
import csv

app = Flask(__name__)

def transform(text_file_contents):
    return text_file_contents.replace("=", ",")


@app.route('/')
def form():
    return """
        <html>
            <body>
                <h1>Transform a file demo</h1>

                <form action="/transform" method="post" enctype="multipart/form-data">
                    <input type="file" name="data_file" />
                    <input type="submit" />
                </form>
            </body>
        </html>
    """

@app.route('/transform', methods=["POST"])
def transform_view():
    file = request.files['data_file']
    if not file:
        return "No file"

    file_contents = file.stream.read().decode("utf-8")
    csv_input = csv.reader(file_contents)
    print(file_contents)
    print(type(file_contents))
    print(csv_input)
    for row in csv_input:
        print(row)

    result = transform(file_contents)

    response = make_response(result)
    response.headers["Content-Disposition"] = "attachment; filename=result.csv"
    return response

if __name__ == "__main__":
    app.run(host='0.0.0.0', port=5001, debug=True)

终端输出是

127.0.0.1 - - [12/Oct/2015 02:51:53] "GET / HTTP/1.1" 200 -
127.0.0.1 - - [12/Oct/2015 02:51:59] "POST /transform HTTP/1.1" 200 -
4,5,6
<class 'str'>
<_csv.reader object at 0x105149438>
['1']
['', '']
['2']
['', '']
['3']
[]
['4']
['', '']
['5']
['', '']
['6']

而我读的文件是

在此处输入图片说明

当我迭代 csv.reader 对象时,没有得到代表 2 行的 2 个列表,我做错了什么?

好的,所以您的脚本存在一个主要问题,这里提到的csv.reader需要一个文件对象或至少一个支持迭代器协议的对象。 您正在传递一个确实实现迭代器协议的str ,但它不是遍历行,而是遍历字符。 这就是为什么你有你所做的输出。

首先,它给出了一个csv.reader字符1csv.reader将其视为具有一个字段的一行。 之后str给出了另一个单个字符, csv.reader将其视为具有两个空字段的行(因为逗号是字段分隔符)。 它在整个str一直如此,直到筋疲力尽。

解决方案(或至少一种解决方案)是将str转换为类似文件的对象。 我尝试使用由flask.request.files["name"]提供的流,但这不会遍历行。 接下来,我尝试使用cStringIO.StringIO并且似乎有类似的问题。 我最终解决了这个问题, 问题在通用换行符模式下建议了一个io.StringIO对象,该对象有效。 我最终得到了以下工作代码(也许它可能会更好):

__author__ = 'shivendra'
from flask import Flask, make_response, request
import io
import csv

app = Flask(__name__)

def transform(text_file_contents):
    return text_file_contents.replace("=", ",")


@app.route('/')
def form():
    return """
        <html>
            <body>
                <h1>Transform a file demo</h1>

                <form action="/transform" method="post" enctype="multipart/form-data">
                    <input type="file" name="data_file" />
                    <input type="submit" />
                </form>
            </body>
        </html>
    """

@app.route('/transform', methods=["POST"])
def transform_view():
    f = request.files['data_file']
    if not f:
        return "No file"

    stream = io.StringIO(f.stream.read().decode("UTF8"), newline=None)
    csv_input = csv.reader(stream)
    #print("file contents: ", file_contents)
    #print(type(file_contents))
    print(csv_input)
    for row in csv_input:
        print(row)

    stream.seek(0)
    result = transform(stream.read())

    response = make_response(result)
    response.headers["Content-Disposition"] = "attachment; filename=result.csv"
    return response

if __name__ == "__main__":
    app.run(host='0.0.0.0', port=5001, debug=True)

重要说明:此答案仅与SpooledTemporaryFile可用的平台相关。

除了iLuveTux answer 之外,您可以通过替换以下基于字符串的流创建来保存冗余的read()调用:

stream = io.StringIO(f.stream.read().decode("UTF8"), newline=None)

和:

stream = io.TextIOWrapper(f.stream._file, "UTF8", newline=None)

例子:

stream = io.TextIOWrapper(f.stream._file, "UTF8", newline=None)
csv_input = csv.reader(stream)
print(csv_input)
for row in csv_input:
    print(row)

更多信息:

Werkzeug 表单数据解析器的默认流是SpooledTemporaryFile (从1.0.1 开始),您可以从中使用其_file成员获取底层缓冲区。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM