比較bash中文件中的行

Question

input.txt文件

12345678,Manoj,23,Developer
12345678,Manoj,34,Developer
12345678,Manoj,67,Developer
12345679,Vijay,12,Tester
12345679,Vijay,98,Tester
12345676,Samrat,100,Manager
12345676,Samrat,25,Manager
12345676,Samrat,28,Manager

期望的輸出文件

12345678,Manoj,23,Developer,0
12345678,Manoj,34,Developer,1
12345678,Manoj,67,Developer,2
12345679,Vijay,12,Tester,0
12345679,Vijay,98,Tester,1
12345676,Samrat,100,Manager,0
12345676,Samrat,25,Manager,1
12345676,Samrat,28,Manager,2

說明

這里輸入文件的前3行中的第一個值即12345678是相同的，所以分別在前3行附加0 ,1 and ,2 。 和以下幾行類似。

如何在Shell腳本中完成。

在期望的輸出中編輯

是否也可以將所需輸出數字格式更改為以下輸出？

12345678,Manoj,23,Developer,0000000
12345678,Manoj,34,Developer,0000001
12345678,Manoj,67,Developer,0000002
12345679,Vijay,12,Tester,0000000
12345679,Vijay,98,Tester,0000001
12345676,Samrat,100,Manager,0000000
12345676,Samrat,25,Manager,0000001
12345676,Samrat,28,Manager,0000002

新：是否可以從0000019開始編號。是否還有其他選項來初始化變量，如a = 5，a = 19，a = 39，之后我可以增加。

12345678,Manoj,23,Developer,0000019
12345678,Manoj,34,Developer,0000020
12345678,Manoj,67,Developer,0000021
12345679,Vijay,12,Tester,0000019
12345679,Vijay,98,Tester,0000020
12345676,Samrat,100,Manager,0000019
12345676,Samrat,25,Manager,0000020
12345676,Samrat,28,Manager,0000021

Answer 1

使用awk：

$ awk 'BEGIN{FS=OFS=",";RS="\r?\n"}{print $0,a[$1]++}' file

輸出：

12345678,Manoj,23,Developer,0
12345678,Manoj,34,Developer,1
12345678,Manoj,67,Developer,2
12345679,Vijay,12,Tester,0
12345679,Vijay,98,Tester,1
12345676,Samrat,100,Manager,0
12345676,Samrat,25,Manager,1
12345676,Samrat,28,Manager,2

編輯：

隨着要求的變化和許多評論的發生，這里是最終版本（修訂版一，因為要求在評論和OP中有所不同，敲響了木材）：

$ awk 'BEGIN{FS=","}{sub(/\r$/,"");printf "%s,%07d" ORS,$0,a[$1]++}' file

解釋：

$ awk '
BEGIN { 
    FS=","
    # ORS="\r\n"                     # uncomment if Windows line-endings are desired
}      
{
    sub(/\r$/,"")                    # remove Windows line-endings (ie. \r from \r\n)
    printf "%s,%07d" ORS,$0,a[$1]++  # output zeropadded running count on $1
}' file

用gawk，mawk，busybox awk和原始awk（awk版本20121220）測試。 哦，5年前回收了我的Solaris盒子。 ; d

Answer 2

更新以修復我以前的自我未知的行結束錯誤。

利用這一點，雙方將致力於\\r\\n和\\n行結束，產量將結束\\n ：

awk -F, 'sub(/\r$/,"") ($(NF+1)=sprintf("%07d",a[$2]++))' OFS=, input.txt

輸出：

12345678,Manoj,23,Developer,0000000
12345678,Manoj,34,Developer,0000001
12345678,Manoj,67,Developer,0000002
12345679,Vijay,12,Tester,0000000
12345679,Vijay,98,Tester,0000001
12345676,Samrat,100,Manager,0000000
12345676,Samrat,25,Manager,0000001
12345676,Samrat,28,Manager,0000002

我這樣寫是為了簡潔，它在功能上等於：

awk 'BEGIN{FS=OFS=","}{sub(/\r$/,"");$(NF+1)=sprintf("%07d",a[$2]++)}1' input.txt

如果你安裝了ruby ：

ruby -aF, -pe 'BEGIN{a=Hash.new(-1)};sub(/\r?$/, "," + "%07d" % a[$F[1]]+=1)' input.txt

相同的輸出。

順便說一句，如果你想從19開始，你可以使用它（增加19+的值）：

awk 'sub(/\r$/,"") ($(NF+1)=sprintf("%07d",19+a[$2]++))' FS=, OFS=, input.txt

或者這個（初始化為18）：

ruby -aF, -pe 'BEGIN{a=Hash.new(18)};sub(/\r?$/, "," + "%07d" % a[$F[1]]+=1)' input.txt

這些都使用$2 （第$2列）作為鍵，因為在你的樣本$1和$2是相關的，所以使用任何一個都可以。

Answer 3

你可以嘗試下面的。（沒有編輯線只需通過addiotnal數組的計數值打印）

awk 'BEGIN{FS=OFS=","} {printf("%s,%07d\n",$0,count[$2]++)}' Input_file

Answer 4

使用Perl

$ cat manoj.txt
12345678,Manoj,23,Developer
12345678,Manoj,34,Developer
12345678,Manoj,67,Developer
12345679,Vijay,12,Tester
12345679,Vijay,98,Tester
12345676,Samrat,100,Manager
12345676,Samrat,25,Manager
12345676,Samrat,28,Manager
$ perl -F, -lane ' $F[$#F]=~s/\r//g; $F[$#F+1]=sprintf("%07d",$kv{$F[0]}++);$,=",";  print @F ' manoj.txt
12345678,Manoj,23,Developer,0000000
12345678,Manoj,34,Developer,0000001
12345678,Manoj,67,Developer,0000002
12345679,Vijay,12,Tester,0000000
12345679,Vijay,98,Tester,0000001
12345676,Samrat,100,Manager,0000000
12345676,Samrat,25,Manager,0000001
12345676,Samrat,28,Manager,0000002
$

比較bash中文件中的行

問題描述

4 個解決方案

解決方案1
7 2019-01-28 06:51:30

解決方案2
2 已采納 2019-01-28 08:20:18

解決方案3
1 2019-01-28 08:35:39

解決方案4
1 2019-01-28 11:29:00

比較bash中文件中的行

問題描述

4 個解決方案

解決方案1 7 2019-01-28 06:51:30

解決方案2 2 已采納 2019-01-28 08:20:18

解決方案3 1 2019-01-28 08:35:39

解決方案4 1 2019-01-28 11:29:00

解決方案1
7 2019-01-28 06:51:30

解決方案2
2 已采納 2019-01-28 08:20:18

解決方案3
1 2019-01-28 08:35:39

解決方案4
1 2019-01-28 11:29:00