[英]parsing specific strings from list items in python
我在 python 中有以下代碼,其中包含調試 SSH 的日志消息。
for log_item in ssh_log:
print(log_item.rstrip())
#will show ...
2022-04-06 01:55:15,085 10.x Remote version/idstring: SSH-2.0-ConfD-4.3.11.4
2022-04-06 01:55:15,085 20.x Connected (version 2.0, client ConfD-4.3.11.4)
2022-04-06 01:55:15,161 10.x kex algos:['diffie-hellman-group14-sha1'] server key:['ssh-rsa']
...
獲取粗體值的方法是什么分配我的變量,可能是一些正則表達式作為 for 循環的一部分或其他東西來獲得以下內容:
idstring = SSH-2.0-ConfD-4.3.11.4
kex_algos = ['diffie-hellman-group14-sha1']
key_type = ['ssh-rsa']
如果所有數據的格式都與此處給出的數據相同,則可以使用以下正則表達式:
import re
a = """
2022-04-06 01:55:15,085 10.x Remote version/idstring: SSH-2.0-ConfD-4.3.11.4
2022-04-06 01:55:15,085 20.x Connected (version 2.0, client ConfD-4.3.11.4)
2022-04-06 01:55:15,161 10.x kex algos:['diffie-hellman-group14-sha1'] server key:['ssh-rsa']"""
idstring = re.findall("idstring: (.*)", a)[0] # Remove zero to get a list if
# multiple values are present
print(idstring)
kex_algos = re.findall("algos:\['(.*)'\] ", a)
print(kex_algos)
key_type = re.findall("key:\['(.*)'\]", a)
print(key_type)
Output:
'SSH-2.0-ConfD-4.3.11.4'
['diffie-hellman-group14-sha1']
['ssh-rsa']
沒有正則表達式的解決方案。 請參閱下面的內聯評論。
for log_item in ssh_log:
line = log_item.rstrip()
if 'idstring' in line:
print('idstring = ',line.split(':')[-1]) #Pick last value after ':'
if 'kex algos' in line:
print('kex algos = ', line[line.find('['):line.find(']')+1]) #find between first set of square brackets.
if 'key:' in line:
key = line.split('key:')[1] #Get values after 'key:'
print('key_type = ', key)
如果這是您的需要,您可以將打印更新為變量分配。
如果您的數據具有相似的結構,您還可以使用 ttp 模板來解析您的數據。
from ttp import ttp
import json
with open("log.txt") as f:
data_to_parse = f.read()
ttp_template = """
{{ignore}} {{ignore}} {{ignore}} {{ignore}} version/idstring: {{version_id_string}}
{{ignore}} {{ignore}} {{ignore}} {{ignore}} algos:{{key_algos}} server key:{{key_type}}
"""
parser = ttp(data=data_to_parse, template=ttp_template)
parser.parse()
# print result in JSON format
results = parser.result(format='json')[0]
# print(results)
result = json.loads(results)
# print(result)
for i in result:
print(i["key_algos"])
print(i["key_type"])
print(i["version_id_string"])
output 是:
['diffie-hellman-group14-sha1']
['ssh-rsa']
SSH-2.0-ConfD-4.3.11.4
使用文件中原始問題的 3 行示例數據,可以采用以下方法:
import re
with open('ssh.log') as sshlog:
for line in map(str.strip, sshlog):
_, _, _, kw, *rem = line.split()
match kw:
case 'Remote':
print(f'ID string = {rem[-1]}')
case 'kex':
m = re.findall("(?<=\[').+?(?='\])", line)
print(f'algos = {m[0]}')
print(f'type = {m[1]}')
case _:
pass
這里的假設是只有帶有關鍵字“Remote”或“kex”的行才有意義。
Output:
ID string = SSH-2.0-ConfD-4.3.11.4
algos = diffie-hellman-group14-sha1
type = ssh-rsa
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.