awk在第一个字段中替换字符串的一部分

Question

Please, I have a file that contains fields separated by the character | 请给我一个文件，其中包含用字符|分隔的字段| , and the first column contain a date and hour 2014-10-09/10:00:00.00 . ，并且第一列包含日期和小时2014-10-09/10:00:00.00 。 here is the file: 这是文件：

2014-10-09/10:01:00.27|  tha|  99|  awfkj|             kiuaj|   oauhhg|
2014-10-09/10:02:49.00|  okh|  69|  azakj|             wklkj|   hjjhhg| 
2014-10-09/10:15:30.06|  hnt|  19|  klkkj|             kjhkj|   okjhhg|

I want to change the format of date and replace the hour with "000000" it must be like this: 我想更改日期格式并将小时替换为“ 000000”，它必须是这样的：

09102014000000|  tha|  99|  awfkj|             kiuaj|   oauhhg|
09102014000000|  okh|  69|  azakj|             wklkj|   hjjhhg| 
09102014000000|  hnt|  19|  klkkj|             kjhkj|   okjhhg|

I don't know what I need to use. 我不知道我需要用什么。 For example this? 例如这个？

awk '{ gsub("..", "..", $1) ; print }'

thank you 谢谢

Answer 1

You could simply do this through sed, 您可以通过sed轻松完成此操作，

GNU sed, GNU sed，

$ sed -r 's~^([0-9]{4})-([0-9]{2})-([0-9]{2})[^\|]*~\3\2\1000000~' file
09102014000000|  tha|  99|  awfkj|             kiuaj|   oauhhg|
09102014000000|  okh|  69|  azakj|             wklkj|   hjjhhg| 
09102014000000|  hnt|  19|  klkkj|             kjhkj|   okjhhg|

Basic sed, 基本sed

$ sed 's~^\([0-9]\{4\}\)-\([0-9]\{2\}\)-\([0-9]\{2\}\)[^\|]*~\3\2\1000000~' file
09102014000000|  tha|  99|  awfkj|             kiuaj|   oauhhg|
09102014000000|  okh|  69|  azakj|             wklkj|   hjjhhg| 
09102014000000|  hnt|  19|  klkkj|             kjhkj|   okjhhg|

Answer 2

sed 's/\([0-9]*\)-\([0-9]*\)-\([0-9]*\)[^|]*/\3\2\1000000/'

Answer 3

尝试这个：

sed 's/^\(....\)-\(..\)-\(..\)\/\(..:..:.....\)/\3\2\1000000/' input.txt

Answer 4

As this is about handling dates, I would use a little bash script and call the date command. 由于这是关于日期的处理，因此我将使用一些bash脚本并调用date命令。 This way, you can tune it as you wish, just using the date format options: 这样，您可以使用date格式选项随意调整它：

while IFS="|" read -r a b
do
    a=$(date -d"${a%/*}" +"%d%m%Y")
    echo "${a}000000| $b"
done < file

a=$(date -d"${a%/*}" +"%d%m%Y") gets the first block of text, removes from the slash / and converst it into a date on the format DDMMYYYY . a=$(date -d"${a%/*}" +"%d%m%Y")获取第一个文本块，从斜杠中删除/并将其转换为DDMMYYYY格式的DDMMYYYY 。

Test 测试

$ while IFS="|" read -r a b; do a=$(date -d"${a%/*}" +"%d%m%Y"); echo "${a}000000| $b"; done < file
09102014000000|   tha|  99|  awfkj|             kiuaj|   oauhhg|
09102014000000|   okh|  69|  azakj|             wklkj|   hjjhhg| 
09102014000000|   hnt|  19|  klkkj|             kjhkj|   okjhhg|

Answer 5

$ sed -r 's/(^[0-9]{4})-([0-9]{2})-([0-9]{2}).{13}/\3\2\1000000|/g'

09102014000000|  tha|  99|  awfkj|             kiuaj|   oauhhg|
09102014000000|  okh|  69|  azakj|             wklkj|   hjjhhg|
09102014000000|  hnt|  19|  klkkj|             kjhkj|   okjhhg|

Answer 6

A gawk specific way gawk方式

awk '{a=gensub(/(.+)-(.+)-(.+)(\/.+)/,"\\3\\2\\1000000","g",$1);sub($1,a);print}' input.txt

Output: 输出：

09102014000000|  tha|  99|  awfkj|             kiuaj|   oauhhg|
09102014000000|  okh|  69|  azakj|             wklkj|   hjjhhg| 
09102014000000|  hnt|  19|  klkkj|             kjhkj|   okjhhg|

awk在第一个字段中替换字符串的一部分

问题描述

6 个解决方案

解决方案1
3 已采纳 2014-10-10 09:57:15

解决方案2
1 2014-10-10 09:56:30

解决方案3
1 2014-10-10 09:56:32

解决方案4
1 2014-10-10 10:05:09

Test 测试

解决方案5
0 2014-10-10 10:02:33

解决方案6
0 2014-10-10 10:47:27

awk在第一个字段中替换字符串的一部分

问题描述

6 个解决方案

解决方案1 3 已采纳 2014-10-10 09:57:15

解决方案2 1 2014-10-10 09:56:30

解决方案3 1 2014-10-10 09:56:32

解决方案4 1 2014-10-10 10:05:09

Test 测试

解决方案5 0 2014-10-10 10:02:33

解决方案6 0 2014-10-10 10:47:27

解决方案1
3 已采纳 2014-10-10 09:57:15

解决方案2
1 2014-10-10 09:56:30

解决方案3
1 2014-10-10 09:56:32

解决方案4
1 2014-10-10 10:05:09

解决方案5
0 2014-10-10 10:02:33

解决方案6
0 2014-10-10 10:47:27