繁体   English   中英

如何使用for循环修复函数而不迭代。 Python推荐系统

[英]How to fix function with for loop not iterating. Recommendation system in Python

我正在使用Python库Surprise开发推荐系统。 我试图制作一个遍历电影完整列表的函数,并根据调用该函数时定义的用户ID预测其排名值。

这适用于具有库功能和SVD算法的Python3。 数据集来自开源MovieLens: 链接到数据集

from surprise import Dataset
from surprise import Reader
from surprise import SVD
import pandas as pd

reader = Reader(line_format='user item rating timestamp', sep='\t')
data = Dataset.load_from_file('./dataset/ml-100k/u.data', reader=reader)
movies = pd.read_csv('./dataset/ml-100k/u.item',sep='|', encoding='latin-1', usecols=[0,1], names=['iid', 'name'])
algorithm = SVD()
trainset = data.build_full_trainset()
algorithm.fit(trainset)

def prediction(uid):
    ratings=[]
    for iid in movies['iid']:
        pred = algorithm.predict(uid, iid)
        ratings.append(pred[3])
    return ratings

prediction(321)

我希望该函数为每个项和函数调用中给定的单个用户建立一个等级列表(预测值[3]的预测值)。

[3.52986,
 3.69845,
 2.98954,
 3.00545,
 3.84254,
 ...]

但是实际的输出是一个列表,其长度等于电影列表的长度(可以),但是具有相同的评级,一遍又一遍地重复。

 [3.52986,
 3.52986,
 3.52986,
 3.52986,
 3.52986,
 3.52986,
 3.52986,
 3.52986,
 ...]

因此,考虑实际输出,我认为for循环存在问题,该循环迭代并附加结果,但在每次迭代中使用相同的iid。 我正在尝试创建一个函数,其中uid保持固定,但每次迭代的iid都会更改。

编辑:按照建议,我在循环内添加了print(iid),并正确地迭代了所有iid的打印。 但这在pred = algorithm.predict(uid,iid)行中不起作用

循环正常。 似乎我使用了不正确的方法来返回SVD算法的结果。 同时,我发现以下代码产生的结果与我自己的函数所寻找的结果有些相似。

感谢大家的时间和精力。

   from collections import defaultdict
   testset = trainset.build_anti_testset()
   predictions = algorithm.test(testset)

   def get_top_n(predictions, n=10):
   top_n = defaultdict(list)
   for uid, iid, true_r, est, _ in predictions:
       top_n[uid].append((iid, est))
   for uid, user_ratings in top_n.items():
       user_ratings.sort(key=lambda x: x[1], reverse=True)
       top_n[uid] = user_ratings[:n]
   return top_n

   top_n = get_top_n(predictions, n=10)

   for uid, user_ratings in top_n.items():
   print(uid, [iid for (iid, _) in user_ratings])
196 ['408', '127', '190', '187', '318', '64', '191', '357', '169', '272']
186 ['496', '165', '515', '923', '318', '313', '64', '223', '530', '478']
22 ['22', '205', '357', '100', '169', '923', '64', '269', '69', '285']
244 ['474', '127', '408', '483', '285', '12', '1142', '134', '493', '480']
166 ['318', '174', '408', '98', '483', '64', '480', '114', '169', '511']
298 ['64', '169', '12', '478', '114', '272', '166', '408', '513', '923']
115 ['408', '168', '114', '285', '483', '919', '169', '480', '179', '189']

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM