标签[chardet] - 堆栈内存溢出

Python：带有大二进制对象的 chardet.detect - Python: chardet.detect with a big binary object

我从网页上得到了一些大文件。它们是二进制的。我需要扫描它们以检测它们的编码，因为 chardet.detect 让我的脚本太慢了。我想使用 readline 但我不能，因为我只有二进制文件。可以在二进制对象上执行类似 readline 的操作吗？ ...

简单的 UTF-16-LE 文本文件上的 chardet - chardet on simple UTF-16-LE text file

我尝试使用 chardet package 检测 Python 3 中简单 UTF-16-LE 文本文件的编码，使用以下代码： rawdata （文件内容）如下：上面代码的结果如下：为什么chardet 100% 确定文本文件是 ascii，而它显然是 UTF-16？ ...

chardet.detect 返回空语言 - chardet.detect return empty language

我正在使用 chardet.detect 来检测字符串的语言，就像这里建议的解决方案之一一样我的代码如下所示：import chardet print(chardet.detect('test'.encode())) print(chardet.detect('בדיקה'.encode())) ...

解码未知字符串 - Decode unknown string

我有一个数据源，我无法控制，并且发送具有不同编码的字符串，我无法提前知道编码！我需要知道格式才能正确解码并以我理解和控制的格式正确存储，例如 UTF-8。例如： “J'ai déjÃ\\xa0 unproblÃ¨me, aprÃ¨s... je ne sais pas” 应该读 ...

如何检测文件格式的编码 - How to detect encoding of a file format

我在 s3 存储桶中有文件，我正在将它们作为流读取。我想检测不同文件的编码。我使用了 chardet 库，出现此错误：我的代码是：在打开文件之前是否还有其他方法可以检测编码 ...

我使用 chardet 测试编码，但出现错误 - I use chardet to test encode , but i got error

类型错误：字节或字节数组类型的预期对象，得到：< class 'str'> 我只是输入教程中的代码。我真的无法弄清楚发生了什么错误。 ...

Python (pip) - RequestsDependencyWarning: urllib3 (1.9.1) 或 chardet (2.3.0) 与支持的版本不匹配 - Python (pip) - RequestsDependencyWarning: urllib3 (1.9.1) or chardet (2.3.0) doesn't match a supported version

我找到了几个关于这个问题的页面，但没有一个解决了我的问题。即使我做了一个：我得到：我做了什么：但作为解释，它给了我同样的错误。所以我做了：并解除他所有的依赖。在我重新安装它之后-> 相同:'( 我对python-pip做了同样的事情。重新安装后 -&g ...

无法卸载chardet - Cannot uninstall chardet

我一直在尝试使用pip卸载chardet，但是我收到以下错误： “无法卸载'chardet'。这是一个安装了distutils的项目，因此我们无法准确确定哪些文件属于它，这只会导致部分卸载。” 我的pip版本是10.0.0，python 2.7.14，Ubuntu 14.04。 ...

软件包已安装但无法识别 - Package is installed but not recognized

我试图在Visual Studio 2017 15.6.2上的python中使用chardet包即使安装了chardet软件包，也无法识别。有什么可能是错的吗？这是一个屏幕截图 https://i.imgur.com/AFaiaH7.png 如果我尝试运行，则 ...

使用 Chardet 查找超大文件的编码 - Using Chardet to find encoding of very large file

我正在尝试使用Chardet以制表符分隔格式推断出一个非常大的文件（> 400 万行）的编码。目前，我的脚本可能由于文件的大小而挣扎。我想将其缩小到加载文件的前 x 行，可能，但是当我尝试使用readline()时遇到了困难。目前的脚本是：它有效，但它只读取文件的第一行。我尝 ...

chardetect将UTF-8编码的文件选择为ASCII - UTF-8 encoded file is picked by chardetect as ASCII

我正在编写一个包含文件夹中所有文件的文件，我希望文本文件采用UTF-8编码，我的代码如下当我使用chardetect查找编码时，它显示为ASCII，置信度为1.0 请解决问题。谢谢 ...

尝试启动 Jupyter Notebook (Python) 时出现运行时错误 - Runtime Error when trying to launch Jupyter Notebook (Python)

在编程 Python 时，我通常使用 Jupyter Notebook 接口，但最近我通过 pip (Bioservices)安装了 bioservices，当我尝试打开 Jupyter Notebook 时，出现以下运行时错误： ~$ jupyter 笔记本回溯（最近一次调用最后一次） ...

熊猫无法加载数据，csv编码之谜 - Pandas cannot load data, csv encoding mystery

我正在尝试将数据集加载到pandas中并且似乎无法通过步骤1.我是新的所以请原谅如果这很明显，我已经搜索了以前的主题而没有找到答案。数据主要是中文字符，这可能是问题所在。 .csv非常大，可以在这里找到： http ： //weiboscope.jmsc.hku.hk/datazip/ ...

ZipFile中的namelist（）返回带有无效编码的字符串 - namelist() from ZipFile returns strings with an invalid encoding

问题是，对于一些上传到python应用程序的档案或文件， ZipFile的namelist()返回错误解码的字符串。如何修复该代码，以便我总是解码unicode中的文件名（所以支持Chineeze，俄语和其他语言）？我已经看到了Python 2的一些示例，但由于字符串的性质在p ...

尝试使用chardet猜测文件的编码 - Trying to guess the encoding of a file using chardet

我正在编写一个适用于CSV文件的程序。这些文件可以具有特定的编码。我正在尝试合并一个过程来尝试猜测用户想要使用chardet打开的文件的编码。我正在尝试使用以下代码：但我得到以下的例外：我也尝试过：但得到：这是我要打开的文件的一部分： ...

检测iso-8859-2的Java chardet - Java chardet that detects iso-8859-2

是否有Java版本的python chardet可检测iso-8859-2？我尝试了Mozilla Universalchardet和jchardet都没有用，他们都猜到了Windows-1252，但是Linux附带的python chardet很好地检测到了它。 ...

juniversalchardet在www.wikipedia.org上有缺陷 - juniversalchardet is defective on www.wikipedia.org

我正在尝试使用juniversalchardet自动检测已保存网页的编码，我的第一个测试使用www.wikipedia.org，它根据HTTP响应标头使用UTF-8编码（此信息在保存到磁盘后会丢失）这是我这样做的scala代码：但是，无论我加载什么，字符集结果始终为“ null ...

rchardet gem对ISO-8859-1和Windows-1252的支持 - rchardet gem support for ISO-8859-1, and Windows-1252

我想知道rchardet是否支持ISO-8859-1和Windows-1252的编码。我已经看过文档，但是没有得到适当的信息。 ...

在Python中，如何开始使用chardet模块？ - In Python, how to begin with chardet module?

我想尝试一些使用chardet模块的代码。这是我在网上找到的代码：但是要尝试这个代码，我必须得到chardet模块：但是，我有两个选择： https ： //pypi.python.org/pypi/chardet#downloads chardet-2.2.1-py2. ...

在Windows中使用BeautifulSoup4，Chardet和Python 3.3解析页面时出错 - Error while parsing a page with BeautifulSoup4, Chardet and Python 3.3 in Windows

当我尝试调用BeautifulSoup（page）时出现以下错误我在Windows 7中运行Python 3.3，我通过下载.tar.gz从setup.py安装了bs4。我已经安装了pip，然后通过执行pip.exe install chardet来安装了chardet。我的c ...