通過tweepy獲取推文

Question

我從USATODAY獲得了最大量的推文，這是3000。

現在我想創建一個腳本，以便在每天晚上11:59自動提取USATODAY的推文。

我打算使用流api然后我將不得不讓它保持運行一整天。

我是否可以了解如何創建一個腳本，每天晚上11:59運行REST API以獲取當天的推文？ 如果沒有，是否有人知道如何根據日期提取推文？

我正在考慮在我的for循環中放置一個ifelse語句，但這似乎效率低下，因為它必須每晚搜索3000條推文。

這就是我現在擁有的：

client = MongoClient('localhost', 27017)
db = client['twitter_db']
collection = db['usa_collection']
auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token_key, access_token_secret)

api = tweepy.API(auth)

for tweet in tweepy.Cursor(api.user_timeline,id='USATODAY').items():
    collection.insert(tweet._json)

Answer 1

您可以在頁面的幫助下簡單地檢索推文，現在在每個頁面上接收到您對推文進行迭代並提取使用tweet.created_at訪問的推文的創建時間，您可以找到提取日期和當前之間的差異日期，如果差異小於1天，那么它是一個有利的推文，否則你只是退出循環。

import tweepy, datetime, time

def get_tweets(api, username):
    page = 1
    deadend = False
    while True:
        tweets = api.user_timeline(username, page = page)

        for tweet in tweets:
            if (datetime.datetime.now() - tweet.created_at).days < 1:
                #Do processing here:

                print tweet.text.encode("utf-8")
            else:
                deadend = True
                return
        if not deadend:
            page+=1
            time.sleep(500)

get_tweets(api, "anmoluppal366")

注意：您沒有訪問該人的所有3000條推文，您只會迭代在啟動應用程序時 24小時內創建的推文。

Answer 2

其他方法：

def search(target, date, maxnum = 10):
    cursor = tweepy.Cursor(
        api.search,
        q = target,
        since = date[0],
        until = date[1],
        show_user = True)

    return cursor.items(maxnum)

if __name__ == '__main__':
    list_tweets = search(
    target = '서지수',
    date = ('2016-05-01', '2016-05-25'),
    maxnum = 100)
    print(list_tweets)

通過tweepy獲取推文

問題描述

2 個解決方案

解決方案1
10 已采納 2015-05-21 15:55:45

解決方案2
0 2019-09-07 20:14:36

通過tweepy獲取推文

問題描述

2 個解決方案

解決方案1 10 已采納 2015-05-21 15:55:45

解決方案2 0 2019-09-07 20:14:36

解決方案1
10 已采納 2015-05-21 15:55:45

解決方案2
0 2019-09-07 20:14:36