（PRAW）从评论中获取一个值，然后用另一列的数据作为答复，该数据与第一条数据在同一行

Question

这是CSV代码。

import praw
import time
import csv
import codecs
import re
from collections import defaultdict 

def read_csv():
with open('CPU-Bench.csv', 'r') as f:
    reader = csv.reader(f)
    for row in reader:
        import pandas as pd
        df = pd.read_csv('CPU-Bench.csv')
        saved_column = df.URL #you can also use df['column_name']
    print saved_column

saved_column = df.URL #you can also use df['column_name']


model_url_dict = read_csv()

CSV文件如下所示：

Type,Part Number,Brand,Model,Rank,Benchmark,Samples,URL
CPU,BX80671I76950X,Intel,Core i7-6950X,1,117,25,http://cpu.userbenchmark.com/Intel-Core-i7-6950X/Rating/3604
CPU,BX80671I76900K,Intel,Core i7-6900K,2,112,28,http://cpu.userbenchmark.com/Intel-Core-i7-6900K/Rating/3605
CPU,BX80671I76850K,Intel,Core i7-6850K,3,102,55,http://cpu.userbenchmark.com/Intel-Core-i7-6850K/Rating/3606
CPU,BX80648I75960X,Intel,Core i7-5960X,4,102,1651,http://cpu.userbenchmark.com/Intel-Core-i7-5960X/Rating/2580
CPU,BX80662I76700K,Intel,Core i7-6700K,5,98.5,21550,http://cpu.userbenchmark.com/Intel-Core-i7-6700K/Rating/3502
CPU,BX80671I76800K,Intel,Core i7-6800K,6,97,103,http://cpu.userbenchmark.com/Intel-Core-i7-6800K/Rating/3607

我想这样做，以便用户说“！benchmark i7 6950x”或“！benchmark i7-6950x”，“！benchmark Core i7-6950x”或“！benchmark Intel Core i7-6950x”，在！benchmark之后查找字符串（在本例中为i7 6950x），然后查找URL列，然后回复“此处有一些基准”

但是，代替的是所选的CPU（在这种情况下，再次为i7 6950x）

并且代替url_column的是该CPU的URL（在本例中为http://cpu.userbenchmark.com/Intel-Core-i7-6950X/Rating/3604 ）

抱歉，这很令人困惑，但是，我该怎么做？

Answer 1

您绝对需要设置reddit代理，将其作为设置中的reddit应用程序进行身份验证，以及对普通bot所做的所有其他操作。 哦，将数据帧解析为字典以方便查找也是一件好事（因为只有在bot启动后才进行查找，然后才有非常快的查找时间）。

因此，我们将需要像这样的字典{'Intel Core i7-6950x':'http://cpu.userbenchmark.com/Intel-Core-i7-6950X/Rating/3604', ...} ，考虑到这是非常琐碎的你已经读过了。

我们还需要一种解析用户实际想要进行基准测试的方法。 因此parse_models_from_comment(comment)会将praw.comment作为参数，并确保至少出现一次!benchmark 。 它可能必须与"\\!benchmark (.{0,10}) (i7|i5|i3)-(\\d)(X|K)"进行正则表达式匹配。 在看不到可能的数据的情况下无法撰写更具体的内容。 而且该函数显然会以正确的语法返回模型名称（就像它们是用字典编写的一样）

现在，通过此设置，主例程可能如下所示：

reddit_client = praw.Reddit(user_agent='<your user agent>'
#OAuth2 shenanigans here
d = {} #filled dictionary
answeredComments = []
while True:
    for comment in reddit_client.get_comments('subreddit'):
        if '!benchmark' not in comment.body.lower():
            continue
        if comment in answeredComments:
            continue
        models = parse_models_from_comment(comment)
        if len(models)==0:
            response = 'I was unable to find benchamrk for given query'
        else:
            response = 'Here are some benchmarks for:\n\n'
            for model in models:
                response += str(model) + ' ' + str(d[model])+'\n\n'
        save_this_comment(comment)
        comment.reply(response)
    time.sleep(900) #15 min break

因此，在我之前编写的内容之外，这是代码说明。

reddit_client.get_comments('subreddit')显然会返回最新注释，默认限制为25，最大限制为1000（API限制）。

首先， if检查此注释是否与bot相关，如果没有单个!benchmark ，它将跳过该注释。 第二项检查是确保尚未回答此评论。 出于此代码段的目的，它只是一个本地列表，但事实证明必须要有带有已答复注释的高速缓存文件，甚至是单个表数据库（使用sqlite或sth easy）。 这样做是为了使bot记住它已经回答了哪些评论。 否则，它将无休止地发送垃圾邮件。

现在，我们有一个评论，并保证该机器人应该能够找到一些模型。 因此，我们运行parse_models_from_comment(comment)函数以获取用户希望获取基准的cpu模型的列表。

如果len(models)==0则意味着用户指定了不在csv中的cpu，输入了错字，插入了错误的格式，正则表达式没有捕获它或其他。 无论如何，我们没有任何模型可以使用，因此我们应该准备一个有关机器人搜索失败的回复。

否则，我们需要处理一些事情，并且由于预先准备了字典以进行查找，因此可以快速准备具有任意数量链接的响应（也可以使用标记语法）

准备好响应后，首先我们需要登录到文件/数据库以确保该注释已得到回答，而下一次praw将其发送给我们时，我们应该跳过它。

最后，我们发布带有给定评论（无论是正面还是负面）的给定评论的回复。 请记住首先将注释记录到数据库，然后发布回复，然后（可选）检查api回复请求是否成功。 其他方法可能会证明是错误的。

（PRAW）从评论中获取一个值，然后用另一列的数据作为答复，该数据与第一条数据在同一行

问题描述

1 个解决方案

解决方案1
0 2016-07-05 11:11:31

（PRAW）从评论中获取一个值，然后用另一列的数据作为答复，该数据与第一条数据在同一行

问题描述

1 个解决方案

解决方案1 0 2016-07-05 11:11:31

解决方案1
0 2016-07-05 11:11:31