unicode方法在Python3中不起作用

Question

def unicode_csv_reader(utf8_data, dialect=csv.excel, **kwargs):
    csv_reader = csv.reader(utf8_data, dialect=dialect, **kwargs)
    for row in csv_reader:
        yield [unicode(cell, 'utf-8') for cell in row]

filename = '/Users/congminmin/Downloads/kg-temp.csv'
reader = unicode_csv_reader(open(filename))

out_filename = '/Users/congminmin/Downloads/kg-temp.out'
#writer = open(out_filename, "w", "utf-8")
for question, answer in reader:
  print(question+ " " + json.loads(answer)[0]['content'])
  #writer.write(question + " " + answer)

reader.close();

此代码在Python 2.7中有效。 但是它在Python 3.6中给出了一条错误消息：

Unresolved reference 'unicode'

如何使其适应Python 3.6？

Answer 1

只需确保您的数据以str开头，而不是字节csv.reader ，然后仅使用csv.reader而不进行解码即可。

data = utf8_data.decode('utf-8')
for row in csv.reader(data, dialect=csv.excel, ...):
    # ...

Answer 2

Python 3已经具有出色的unicode支持。 每次以文本模式打开文件时，都可以使用特定的编码，也可以将其默认设置为UTF-8。 Python 3中的str和unicode之间不再存在区别。后者不存在，并且前者具有完整的unicode支持。 由于根本不需要设置方法，因此极大地简化了您的工作。 您可以遍历普通的csv.reader 。

另外要注意的是，您应该始终在with块中打开文件，以便在出现任何异常的情况下对它们进行清理。 另外，当块结束时，您的文件将自动关闭：

with open(filename) as f:  # The default mode is 'rt', with utf-8 encoding
    for question, answer in csv.reader(f):
        # Do your thing here. Both question and answer are normal strings

仅当您确定每一行都包含2个元素时，此方法才能正常工作。 您最好做一些类似的事情

with open(filename) as f:  # The default mode is 'rt', with utf-8 encoding
    for row in csv.reader(f):
        if len(row) != 2:
            continue  # Or handle the anomaly by other means
        question, answer = row
        # Do your thing here as before

unicode方法在Python3中不起作用

问题描述

2 个解决方案

解决方案1
1 2018-08-21 18:37:50

解决方案2
0 已采纳 2018-08-21 18:53:18

unicode方法在Python3中不起作用

问题描述

2 个解决方案

解决方案1 1 2018-08-21 18:37:50

解决方案2 0 已采纳 2018-08-21 18:53:18

解决方案1
1 2018-08-21 18:37:50

解决方案2
0 已采纳 2018-08-21 18:53:18