繁体   English   中英

AWS 读取 utf-8 文件 pycaption.detect_format 返回 None

AWS reading utf-8 file pycaption.detect_format returns None

提示:本站收集StackOverFlow近2千万问答,支持中英文搜索,鼠标放在语句上弹窗显示对应的参考中文或英文, 本站还提供   中文繁体   英文版本   中英对照 版本,有任何建议请联系yoyou2525@163.com。

Python 版本:3.5-slim-buster 模块:pycaption

读取从 s3 存储桶中编码为 us-ascii 的标题 .srt 时:

obj.get()['Body'].read()
print(pycaption.detect_format(body.decode()))

我得到了想要的回应

<class 'pycaption.srt.SRTReader'> 

但是在读取 utf-8 编码的 s3 .srt 文件时

pycaption 无法检测格式响应:

None

我试过:

obj.get()['Body'].read().decode('utf-8')

print(pycaption.detect_format(body))

但没有运气

1 个回复

最后,问题出在 DOS 换行符 CR/LF 中,我将其转换为 DOS 换行符 CR/LF。

1 Python,.format()和UTF-8

我的背景是在Perl中,但我正在尝试使用Python和BeautifulSoup来尝试新项目。 在这个例子中,我试图提取并呈现单个页面中包含的链接目标和链接文本。 这是来源: 所有那些对.encode('utf-8')的显式调用都是我尝试使这个工作,但它们似乎没有帮助 - 我可能 ...

2 逐行读取文件(不是utf-8)?

是否可以逐行读取文件,如果它不是使用std::io::File和std::io::BufReader utf-8编码? 我查看std::io::Lines并返回Result&lt;String&gt; ,所以我担心,我是否实现了自己的BufReader ,但是返回Vec&lt;u8&gt; ...

2017-12-30 13:43:20 1 747   rust
3 读取UTF-8文件返回意外的字符

运行Windows 8 64位。 我有一个文件,用于存储一些数据,使用Windows记事本以UTF-8编码保存。 假设这是文件的内容: 1,一些,数据,这里,0,-1 我正在这样阅读: 而f.read()返回此: u“ \\ xef \\ xbb \\ x ...

4 读取文件utf-8 [重复]

这个问题已经在这里有了答案: 为什么Java BufferedReader()无法正确读取阿拉伯和中文字符? 3个答案 我写了下面的代码,它无法读取文件utf-8。 我尝试过在线搜索文档,但无法纠正。 //在主类中: 文件thue.txt: ...

2013-10-04 16:51:30 2 522   java
5 从文件读取和写入UTF-8

我有一些以UTF-8编码的文本。 “之前-之后。” 它是从网上获取的。 问题是“ –”字符。 如果尝试使用复制和粘贴从命令行直接打印: 但是,如果您保存到文本文件并尝试打印: 我很确定这是某种UTF-8编码/解码错误,但这使我难以理解。 我尝试解码或重新编码,但事实并非 ...

6 读取UTF-8文件

我正在使用VS 2008,需要读取具有UTF-8中文字符的文本文件。 该文件的组织方式如下:每行包含一个文档,文档以制表符分隔(索引'tab'doc title'选项卡'doc body)。 所以我需要做的是将选项卡上的行分开,然后用空格分隔第三列(doc body)并将每个单词存储在向量中 ...

8 如何读取文件,如果UTF-8无效,则中止错误?

在Go中,我想逐行读入文件,转换为str或[]rune 。 该文件应以UTF-8编码,但我的程序不应该信任它。 如果它包含无效的UTF-8,我想正确处理错误。 有bytes.Runes(s []byte) []rune ,但没有错误返回值。 遇到无效的UTF-8会不会感到恐慌? ...

2012-12-15 13:34:26 2 2127   go
9 使用UTF-8读取.txt文件

我有一个txt文件,其中包含采用UTF-8编码的单词。 我将其放在“资产”文件夹中,这是我阅读它们的一种方式: 然后,我将这些单词从数组中提取出来,并将它们放入TextViews中。 布局xml文件已指定UFT8编码: 但是仍然显示错误。 我在做什么不对? ...

10 Python:用UTF-8读取Ftp文件列表?

嗨,我正在使用模块ftplib。 并使用以下代码列出我的文件: 并使用以下代码将它们写入文本文件: 但是有一个编码问题,如果我的文件名有'ı,ğ,ş'字符,它无法读取这个并写入文件'?' 代替。 如何正确阅读? ...

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2022 STACKOOM.COM