[英]UnicodeEncodeError: 'ascii' codec can't encode character u'\xb0' in position 11: ordinal not in range(128)
[英]Bioformats-Python error: 'ascii' codec can't encode character u'\xb5' when using OMEXML()
我试图在Python中使用生物形式来读取显微镜图像(.lsm,.czi,.lif,你的名字),打印元数据,并显示图像。 ome = bf.OMEXML(md)
给出了一个错误(下面)。 我认为这是在讨论存储在md
的信息。 它不喜欢md
中的信息不是所有ASCII。 但是我该如何克服这个问题呢? 这就是我写的:
import Tkinter as Tk, tkFileDialog
import os
import javabridge as jv
import bioformats as bf
import matplotlib.pyplot as plt
import numpy as np
jv.start_vm(class_path=bf.JARS, max_heap_size='12G')
用户选择要使用的文件
#hiding root alllows file diaglog GUI to be shown without any other GUI elements
root = Tk.Tk()
root.withdraw()
file_full_path = tkFileDialog.askopenfilename()
filepath, filename = os.path.split(file_full_path)
os.chdir(os.path.dirname(file_full_path))
print('opening: %s' %filename)
reader = bf.ImageReader(file_full_path)
md = bf.get_omexml_metadata(file_full_path)
ome = bf.OMEXML(md)
将图像放在numpy数组中
raw_data = []
for z in range(iome.Pixels.get_SizeZ()):
raw_image = reader.read(z=z, series=0, rescale=False)
raw_data.append(raw_image)
raw_data = np.array(raw_data)
显示想要的元数据
iome = ome.image(0) # e.g. first image
print(iome.get_Name())
print(iome.Pixels.get_SizeX())
print(iome.Pixels.get_SizeY())
这是我得到的错误:
---------------------------------------------------------------------------
UnicodeEncodeError Traceback (most recent call last)
<ipython-input-22-a22c1dbbdd1e> in <module>()
11 reader = bf.ImageReader(file_full_path)
12 md = bf.get_omexml_metadata(file_full_path)
---> 13 ome = bf.OMEXML(md)
/anaconda/envs/env2_bioformats/lib/python2.7/site-packages/bioformats/omexml.pyc in __init__(self, xml)
318 if isinstance(xml, str):
319 xml = xml.encode("utf-8")
--> 320 self.dom = ElementTree.ElementTree(ElementTree.fromstring(xml))
321
322 # determine OME namespaces
<string> in XML(text)
UnicodeEncodeError: 'ascii' codec can't encode character u'\xb5' in position 1623: ordinal not in range(128)
这是具有专有显微镜格式的代表性测试图像
感谢您添加示例图像。 这极大地帮助了!
让我们首先删除所有不必要的Tkinter代码,直到我们找到一个允许我们重现您的错误消息的Minimal,Complete和Verifiable示例 。
import javabridge as jv
import bioformats as bf
jv.start_vm(class_path=bf.JARS, max_heap_size='12G')
file_full_path = '/path/to/Cell1.lsm'
md = bf.get_omexml_metadata(file_full_path)
ome = bf.OMEXML(md)
jv.kill_vm()
我们首先得到一些关于3i SlideBook SlideBook6Reader library not found
警告信息,但我们显然可以忽略它。
您的错误消息显示为UnicodeEncodeError: 'ascii' codec can't encode character u'\\xb5' in position 1623: ordinal not in range(128)
,所以让我们看看我们可以在1623位置找到什么。
如果在md = bf.get_omexml_metadata(file_full_path)
之后添加print md
,则打印出包含元数据的整个xml。 我们放大:
>>> print md[1604:1627]
PhysicalSizeXUnit="µm"
因此, µ
字符是罪魁祸首,它不能用'ascii' codec
。
回顾追溯:
/anaconda/envs/env2_bioformats/lib/python2.7/site-packages/bioformats/omexml.pyc in __init__(self, xml)
318 if isinstance(xml, str):
319 xml = xml.encode("utf-8")
--> 320 self.dom = ElementTree.ElementTree(ElementTree.fromstring(xml))
321
322 # determine OME namespaces
我们看到在错误发生之前的行中,我们将xml
编码为utf-8
,这应该可以解决我们的问题。 那为什么不发生呢?
如果我们添加print type(md)
我们会返回<type 'unicode'>
而不是<type 'str'>
omexml.py
<type 'str'>
作为预期的代码..所以这是omexml.py
一个错误!
要解决此问题,请执行以下操作(您可能需要是root用户);
/anaconda/envs/env2_bioformats/lib/python2.7/site-packages/bioformats/
omexml.pyc
omexml.py
从isinstance(xml, str):
更改第318行isinstance(xml, str):
到if isinstance(xml, basestring):
basestring
是str
和unicode
的超类。 它用于测试对象是str
还是unicode
的实例。
我想为此提交一个错误,但似乎已经存在一个未解决的问题 。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.