根据另一个文件中的行号从文件中拾取行

Question

我有两个文件-一个包含地址（行号），另一个包含数据，如下所示：

地址文件：

资料档案

1.000451451
2.000589214
3.117892278
4.479511994
5.484514874
6.784499874
7.021239396

我想根据地址文件的数量随机化数据文件，所以我得到：

2.000589214
4.479511994
6.784499874
7.021239396
1.000451451
3.117892278
5.484514874

我想用python或bash来做，但是还没有找到任何解决方案。

Answer 1

如果您不介意sed ，我们可以使用流程替换轻松实现这一目标：

sed -nf <(sed 's/$/p/' addr.txt) data.txt

-n禁止默认打印
-f使sed从进程替换<(...)读取命令
<(sed 's/$/p/' addr.txt)根据addr.txt行号创建sed打印命令

给出输出：

2.000589214
4.479511994
6.784499874
7.021239396
1.000451451
3.117892278
5.484514874

Answer 2

用awk ：

awk 'NR==FNR {a[NR]=$0; next} {print a[$0]}' data.txt addr.txt

NR==FNR {a[NR]=$0; next} NR==FNR {a[NR]=$0; next}创建一个关联数组a ，其键为记录（行）号，值为整个记录，这仅适用于第一个文件（ NR==FNR ），即data.txt 。 next使awk转到下一行而不进一步处理记录
{print a[$0]}从数组中打印值，键为当前文件的（ addr.txt ）行（记录）号

例：

% cat addr.txt 
2
4
6
7
1
3
5

% cat data.txt 
1.000451451
2.000589214
3.117892278
4.479511994
5.484514874
6.784499874
7.021239396

% awk 'NR==FNR {a[NR]=$0; next} {print a[$0]}' data.txt addr.txt
2.000589214
4.479511994
6.784499874
7.021239396
1.000451451
3.117892278
5.484514874

Answer 3

您也可以在Python此操作，例如以下示例：

with open("address_file", 'r') as f1, open("data_file", "r") as f2:
    data1 = f1.read().splitlines()
    data2 = f2.read().splitlines()

for k in data1:
    # Handle exceptions if there is any
    try:
        print(data2[int(k)-1])
    except Exception:
        pass

编辑：如建议@heemayl，这是仅使用一个list另一种解决方案：

with open("file1", 'r') as f1, open("file2", 'r') as f2:
    data = f2.read().splitlines()

    for k in f1.read().splitlines():
        print(data[int(k)-1])

两者都将输出：

2.000589214
4.479511994
6.784499874
7.021239396
1.000451451
3.117892278
5.484514874

根据另一个文件中的行号从文件中拾取行

问题描述

3 个解决方案

解决方案1
3 2017-06-09 04:42:06

解决方案2
2 已采纳 2017-06-09 04:13:06

解决方案3
0 2017-06-09 04:35:31

根据另一个文件中的行号从文件中拾取行

问题描述

3 个解决方案

解决方案1 3 2017-06-09 04:42:06

解决方案2 2 已采纳 2017-06-09 04:13:06

解决方案3 0 2017-06-09 04:35:31

解决方案1
3 2017-06-09 04:42:06

解决方案2
2 已采纳 2017-06-09 04:13:06

解决方案3
0 2017-06-09 04:35:31