[英]While editing a line of text in python, how do i avoid editing a specific part of text in quotation marks?
我有一个文件(一个 Apache 日志文件)需要转换为 csv。 所以空格必须用逗号代替。 但是其中一列的字段之间有空格。 但该特定字段用引号括起来。 我不想删除引号之间的文本中的空格。 我该怎么做?
日志中的行示例:
127.0.0.1 - - [17/8/2018:12:57:39 0530] “GET / mysoft-webappp /应用/ getNotifications数= 5&_ = 1534489899492&_hkstd = 52bf9c52845cecc32af837db8f8e7385c71b229f67f4ef7c42e9ed5c3c14bMTUzNDQ5MDg1OTYzNg == HTTP / 1.1?” 200 46 ECC40515BD09C8C2FE6FB9ECCFFB40 127.0.0.1
您可以使用pandas
读取它,它会自动处理这些情况(您甚至可以进一步手动调整其导入行为):
import pandas as pd
df = pd.read_table('/wherever/file/may/roam/yourfile.txt', sep=' ')
df.to_csv('/wherever/file/shall/roam/yourfile.csv')
sep=' '
将单个空格定义为源文件中的分隔符
df.to_csv
将目标文件保存为 csv,默认以逗号为分隔符,不加引号
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.