比较一个文本文件和另一个文本文件中的值以进行匹配

Question

我有一个文本文件（results.txt），其中包含哈希，URL，IP列表。

尝试去：

1.仅提取“匹配”值中也有键“类型”：“ URL”的网址

2.将所有URL与另一个包含已知域列表（Alexa.txt）的本地文本文件进行比较。

3.如果比较过程中存在匹配项，则从results.txt文件中删除URL行

文本文件示例：

{"path": "pastebin.com", "match": "http://firefox.com/eiKMths", "type": "URL", "page": 1, "file": "pastebin.com"}
{"path": "pastebin.com", "match": "http://amazon.com/m7GTLj59x7", "type": "URL", "page": 1, "file": "pastebin.com"}
{"path": "pastebin.com", "match": "109.228.9.122", "type": "IP", "page": 1, "file": "pastebin.com"}
{"path": "pastebin.com", "match": "ED9DF1625C1D981FE54490FAB7934BE36322E4C5C88A19F4C244307DF2523E52", "type": "SHA256", "page": 1, "file": "pastebin.com"}

因此，目标是进行比较： firefox.com和amazon.com与Alexa.txt进行比较。 如果存在匹配项，则从results.txt文件中删除URL行。

我的代码很不完善，很迷路...

Answer 1

这是一个广泛的问题，而不仅仅是一个问题。

对于初学者，您需要一个有效的JSON字符串，例如

[{"path": "pastebin.com", "match": "http://firefox.com/eiKMths", "type": "URL", "page": 1, "file": "pastebin.com"},
{"path": "pastebin.com", "match": "http://amazon.com/m7GTLj59x7", "type": "URL", "page": 1, "file": "pastebin.com"},
{"path": "pastebin.com", "match": "109.228.9.122", "type": "IP", "page": 1, "file": "pastebin.com"},
{"path": "pastebin.com", "match": "ED9DF1625C1D981FE54490FAB7934BE36322E4C5C88A19F4C244307DF2523E52", "type": "SHA256", "page": 1, "file": "pastebin.com"}]

使用此结构，您可以对类型== URL进行测试

import json
import pandas as pd
with open(r'C:\Users\User\Desktop\pyJSON.json') as datafile:
    data = json.load(datafile)
print([f for f in data if f['type']=="URL"])

希望这可以使事情发生一点点变化。

比较一个文本文件和另一个文本文件中的值以进行匹配

问题描述

1 个解决方案

解决方案1
0 2018-11-22 13:54:56

比较一个文本文件和另一个文本文件中的值以进行匹配

问题描述

1 个解决方案

解决方案1 0 2018-11-22 13:54:56

解决方案1
0 2018-11-22 13:54:56