为什么 read().split("\n") 会导致错误，即使它从列表中删除了 "\n" 不像 readlines() 和 readlines() 工作

Question

File1 包含以下整数：

File2 包含以下整数：

read()split("n") 出错

    Traceback (most recent call last):
      File "main.py", line 12, in <module>
        result = [int(number) for number in list1 if number in list2]
      File "main.py", line 12, in <listcomp>
        result = [int(number) for number in list1 if number in list2]
    ValueError: invalid literal for int() with base 10: ''

Output for：问题：为什么这段代码可以工作，而其他代码不能工作？ 我想我必须从 list1 和 list2 中新创建的字符串中删除“\n”，然后才能使用列表理解将其转换为 integer，这就是我尝试 read().split("\n" 的原因) 代码部分首先删除转义字符。 代码的 readlines() 部分能够转换包含“\n”的字符串没有问题。 这是因为在使用 int() 转义字符时会被忽略吗？


    with open("file1.txt","r") as file1:
          #list1 = file1.readlines()
    with open("file2.txt","r") as file2:
          list2 = file2.readlines()

['3\n', '6\n', '5\n', '8\n', '33\n', '12\n', '7\n', '4\n', '72\n', '2\n', '42\n', '13\n']

['3\n', '6\n', '13\n', '5\n', '7\n', '89\n', '12\n', '3\n', '33\n', '34\n', '1\n', '344\n', '42\n']

[3, 6, 5, 33, 12, 7, 42, 13]

Python：

with open("file1.txt","r") as file1:
    list1 = file1.read().split("\n")
with open("file2.txt","r") as file2:
    list2 = file2.read().split("\n")

# with open("file1.txt","r") as file1:
      #list1 = file1.readlines()

# with open("file2.txt","r") as file2:
      #list2 = file2.readlines()

result = [int(number) for number in list1 if number in list2]

print(result)

Answer 1

有点不清楚你在问什么，但我会尽力回答为什么这两行不等价以及为什么第二行会导致ValueError 。

file1.readlines()
file1.read().split("\n")

file1.readlines()

这个很简单。 readlines方法只是将文件转换为字符串列表。 文件中的一行对应于列表中的一项。 文件中有 12 行，因此您会得到一个包含 12 个字符串的列表。

with open("file1.txt", "r") as file1:
    print(file1.readlines())

# ['3', '6', '5', '8', '33', '12', '7', '4', '72', '2', '42', '13']

file1.read().split("\n")

在这种情况下， read方法将整个文件作为字符串返回。 这还包括您在原始帖子中提到的换行符。

with open("file1.txt", "r") as file1:
    file1.read()

# '3\n6\n5\n8\n33\n12\n7\n4\n72\n2\n42\n13\n'

现在，当您对字符串使用split方法时，它 Python 在分隔符的实例处拆分字符串并返回字符串的所有片段。 例如，如果我说"123".split("2")那么我可以期望['1', '3']被返回。 但是，当指定的分隔符位于字符串的末尾时，会发生什么不太直观。 如果我说"123".split("3")那么我可以期待['12', ''] 。 因此，如果分隔符位于字符串的末尾或开头， split将在列表的末尾或开头返回一个空字符串。

在file1的情况下，字符串末尾有一个\n分隔符，因此在拆分时您可以期待这样的内容：

with open("file1.txt", "r") as file1:
    file1.read().split('\n')

# ['3', '6', '5', '8', '33', '12', '7', '4', '72', '2', '42', '13', '']

因此，当您尝试将列表中的最后一项 ( '' ) 转换为int时，您会得到ValueError: invalid literal for int() with base 10: '' 。

奖励：file1.read().splitlines()

另一种选择是splitlines方法，它将在换行符处拆分，但删除任何前导或尾随空格。

with open("file1.txt", "r") as file1:
    file1.read().splitlines()

# ['3', '6', '5', '8', '33', '12', '7', '4', '72', '2', '42', '13']

为什么 read().split("\n") 会导致错误，即使它从列表中删除了 "\n" 不像 readlines() 和 readlines() 工作

问题描述

File1 包含以下整数：

File2 包含以下整数：

1 个解决方案

解决方案1
0 2021-12-27 23:57:46

file1.readlines()

file1.read().split("\n")

奖励：file1.read().splitlines()

为什么 read().split("\n") 会导致错误，即使它从列表中删除了 "\n" 不像 readlines() 和 readlines() 工作

问题描述

File1 包含以下整数：

File2 包含以下整数：

1 个解决方案

解决方案1 0 2021-12-27 23:57:46

file1.readlines()

file1.read().split("\n")

奖励：file1.read().splitlines()

解决方案1
0 2021-12-27 23:57:46