在打开文件函数的一段长字符串中切片

Question

大家好，我是 StackOverflow 的新手，

我正在尝试对给定的 .dat 文件中的每一行进行切片。

目的是进行事件研究，我应该打开文件，然后在使用“.readlines”打开文件时操作数据，这是一个带有数字的巨大字符串。 打印通常的 '\\n' 以指示新行。

我得到的是每个列名的整数值的字符长度，以最终创建一个数据框。 这就是我想要切片的东西。

一行总共有 73 个字符。 从这一行开始，20 个字符是调整后的股票收盘价，然后接下来的 17 个字符是股票高价等。我试图获得这部分 20 个字符，然后是 20 个字符之后的 17 个字符，然后很快。

我觉得第一步是将文件转换为我通过 '.readlines' 完成的列表（仍然不确定这是否是正确的方法），然后遍历列表切片中的每个元素。

通过 '.readlines' 的文件如下所示：

'00041.1501808166503954.22999954223633053.61999893188476600000072014-08-14 \\ n'， '0040.92996978759765654.590000152587890054.3400001525878900000102014-08-15 \\ n'， '0041.24130249023437554.520000457763670054.3899993896484400000072014-08-18 \\ N'，

我想要的是每个新行的前 20 个字符的单独列表。 因此，对于上述内容，它将是这样的：

列表 = [00041.15018081665039, 0040.929969787597656, 0041.241302490234375 .....]

它也不是复杂的代码，但任何建议都非常感谢！

非常感谢

Answer 1

基本的列表理解应该可以解决问题：

试试这个代码：

lines = ['00041.1501808166503954.22999954223633053.61999893188476600000072014-08-14\n', 
         '0040.92996978759765654.590000152587890054.3400001525878900000102014-08-15\n', 
         '0041.24130249023437554.520000457763670054.3899993896484400000072014-08-18\n']
         
blocks = [ln[:20] for ln in lines]

print(blocks)

输出

['00041.15018081665039', '0040.929969787597656', '0041.241302490234375']

在打开文件函数的一段长字符串中切片

问题描述

1 个解决方案

解决方案1
0 2020-10-31 03:07:11

在打开文件函数的一段长字符串中切片

问题描述

1 个解决方案

解决方案1 0 2020-10-31 03:07:11

解决方案1
0 2020-10-31 03:07:11