繁体   English   中英

使用python的Twitter情绪分析

[英]Twitter sentiment analysis using python

我正在尝试创建包含健康和不健康食品推文的数据集。我编写了两个脚本,这些脚本在流推文中输入了我指定的关键字,然后对其进行了情感分析,因此我很容易将其分类为健康并且不健康,但是对文本blob的情感分析并没有那么令人满意,并且脚本还获取了不包含这些关键字的推文。 如果有人知道食物推文数据集,那将非常有帮助。

from tweepy import Stream
from tweepy import OAuthHandler
from tweepy.streaming import StreamListener
import time
import os
from textblob import TextBlob
import json

ck`enter code here`ey = "xxx"
csecret = "xx"
atok`enter code here`en = "xx"
asecret = "xx"


class listener(StreamListener):
    def on_data(self, data):
        try:

            tweet = data.split(',"text":"')[1].split('","source')[0]
            print tweet
            saveThis = str(time.time()) + '::' + tweet
            #tweet = data.split(',"text":"')[1]
            analysis=TextBlob(tweet)
            polarity=analysis.sentiment.polarity
            print(polarity)
            if polarity <0 :
                #username = data["user"]["screen_name"]

                saveThis = tweet + '::' + str(polarity)
                out = open('out1.csv', 'a')
                out.write(saveThis)
                out.write('\n')
                out.close()
                #return (True)
                #saveThis = str(time.time()) + '::' + tweet + '::' + str(polarity)
                #saveFile = open('unhealthytweet1.json', 'a')
                #saveFile.write(saveThis)
                #saveFile.write('\n')
                #saveFile.close()
                return (True)
            elif polarity>0 :
                #username = data["user"]["screen_name"]

                 #username, " :: ",
                saveThis =tweet + '::' + str(polarity)
                out = open('out2.csv', 'a')
                out.write(saveThis)
                out.write('\n')
                out.close()
                # return (True)
                # saveThis = str(time.time()) + '::' + tweet + '::' + str(polarity)
                # saveFile = open('unhealthytweet1.json', 'a')
                # saveFile.write(saveThis)
                # saveFile.write('\n')
                # saveFile.close()
                return (True)
        except BaseException, e:
            print 'failed on_date,', str(e)
            time.sleep(5)
            pass


auth = OAuthHandler(ckey, csecret)
auth.set_access_token(atoken, asecret)

twitterStream = Stream(auth, listener())
twitterStream.filter(track=["vegetable soup", "fruits", "green tea", "vegetables", "fresh juice", "salad","sea food"], languages=['en'])
#

我真的是编程新手,但我也遇到类似的问题。 我发现的结果可能是不正确的,但它与我的程序兼容,是为关键字应用原始输入,将该变量通过侦听器传递,然后运行if in data ['text'] <¬¬顶部为带有编码('utf-8')的变量。

如果关键字不在其中,则只需通过。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM