[英]Tweepy - Error 144 when populating a pandas dataframe column with tweet strings
[英]Tweepy. storing tweet text in python pandas dataframe
我正在關注在線教程( http://adilmoujahid.com/posts/2014/07/twitter-analytics/ ),盡管編寫了相同的python腳本,但我還是被卡住了。 我不太精通python,並且很難理解地圖上的文檔(本教程中使用過)。 現在,我收到“ valueError無法設置沒有定義索引和無法轉換為Series的值的框架”並且無法找出解決辦法。 我的印象是該數據框將具有3列。 一種帶有所有推文,一種帶有提及Facebook的推文,一種帶有所有提及Microsoft的推文。 我還意識到該教程已有兩年歷史,因此也許不贊成使用某些語法? 任何幫助表示贊賞
import json
import pandas as pd
import re
tweets_data_path = "Desktop/twit_dat/tweet1.txt"
tweets_data = []
tweets_file = open(tweets_data_path, "r")
for line in tweets_file:
try:
tweet = json.loads(line)
tweets_data.append(tweet)
except:
continue
tweets = pd.DataFrame()
tweets['text'] = map(lambda tweet: tweet['text'], tweets_data)
tweets['Facebook'] = tweets['text'].apply(lambda tweet: word_in_text('Facebook', tweet))
tweets['Microsoft'] = tweets['text'].apply(lambda tweet: word_in_text('Microsoft', tweet))
def word_in_text(word,text):
if text == None:
return False
word = word.lower()
text = text.lower()
match = re.search(word,text)
if match:
return True
else:
return False
這是我使用的數據示例: http : //charon.kean.edu/~jonathan/exampledata.txt
也許您的熊貓版本較低。 我復制代碼並在編譯器上正常工作。 看看這是否有幫助。
https://github.com/pandas-dev/pandas/issues/5632
-更多是評論,但我沒有特權-。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.