[英]Compare values between one text file and another for matching
我有一个文本文件(results.txt),其中包含哈希,URL,IP列表。
尝试去:
1.仅提取“匹配”值中也有键“类型”:“ URL”的网址
2.将所有URL与另一个包含已知域列表(Alexa.txt)的本地文本文件进行比较。
3.如果比较过程中存在匹配项,则从results.txt文件中删除URL行
文本文件示例:
{"path": "pastebin.com", "match": "http://firefox.com/eiKMths", "type": "URL", "page": 1, "file": "pastebin.com"}
{"path": "pastebin.com", "match": "http://amazon.com/m7GTLj59x7", "type": "URL", "page": 1, "file": "pastebin.com"}
{"path": "pastebin.com", "match": "109.228.9.122", "type": "IP", "page": 1, "file": "pastebin.com"}
{"path": "pastebin.com", "match": "ED9DF1625C1D981FE54490FAB7934BE36322E4C5C88A19F4C244307DF2523E52", "type": "SHA256", "page": 1, "file": "pastebin.com"}
因此,目标是进行比较: firefox.com和amazon.com与Alexa.txt进行比较。 如果存在匹配项,则从results.txt文件中删除URL行。
我的代码很不完善,很迷路...
这是一个广泛的问题,而不仅仅是一个问题。
对于初学者,您需要一个有效的JSON字符串,例如
[{"path": "pastebin.com", "match": "http://firefox.com/eiKMths", "type": "URL", "page": 1, "file": "pastebin.com"},
{"path": "pastebin.com", "match": "http://amazon.com/m7GTLj59x7", "type": "URL", "page": 1, "file": "pastebin.com"},
{"path": "pastebin.com", "match": "109.228.9.122", "type": "IP", "page": 1, "file": "pastebin.com"},
{"path": "pastebin.com", "match": "ED9DF1625C1D981FE54490FAB7934BE36322E4C5C88A19F4C244307DF2523E52", "type": "SHA256", "page": 1, "file": "pastebin.com"}]
使用此结构,您可以对类型== URL进行测试
import json
import pandas as pd
with open(r'C:\Users\User\Desktop\pyJSON.json') as datafile:
data = json.load(datafile)
print([f for f in data if f['type']=="URL"])
希望这可以使事情发生一点点变化。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.