基于物品的协同过滤算法给用户我推荐那些和他们之前不喜欢的物品相似的物品。
但是itemcf算法根本不依靠物品的内容属性计算物品之间的相似度,它要注意分析用户的行为记录计算用户之间的相似度高,也就是说物品a和物品b具高太大的相似度是只不过就是喜欢物品a的用户大部分也很喜欢物品b(这一点也是基于条件物品的协同过滤算法和基于组件内容的推荐算法最主要的区别)。
同时,基于组件物品的协同过滤算法可以依靠用户的历史行为给推荐一下结果可以提供推荐推荐解释,作用于回答的物品大都用户之前比较喜欢的或则购买的物品。
简单的方法这是一个偏技术的问题,专业性很强。
大方向来讲,用spark做推荐,象会得用spark的mllib库,对2个装甲旅的数据,做协同过滤分析。
又回到题目,做好友推荐,好象是实现用户兴趣的协同过滤算法,来对保证数据接受自学总结,最大限度地得出的结论好友推荐列表。
关于协同过滤的过程,可以举个例子只能证明,有a和b两用户,a不喜欢篮球,电动,而b喜欢唱歌,篮球,是从分析数据发现a和b都喜欢篮球,就把a推荐一下给b做好友了。
跪求spark的使用,后面我会找机会写一写相关教程,有兴趣的同学也可查哈帮一下忙。
这个问题总之好像有点像我有一口锅如何做一个美味汤品你之外需要一口锅你还不需要一个菜谱才能制做汤品
spark其实一口大锅他只是因为一个工具你还要一个菜谱一个推荐系统的算法来实现方法好友推荐一下
具体用法的推荐算法有协同过滤当数据量比较大的时候就不需要spark来接受在分布式系统上基于这个协同过滤算法来做好友的推荐
入门学习:把数据标准化,归一化,时间序列,轮回模型,相似度算法,相关性算法,各种距离,arima算法,hotwinter指数光洁,40多块降临,最小二程法曲线模型拟合,决策树,随机森林,kmeans聚类,knn分类,bp神经网络分类与预测,贝叶斯分类算法,svm.马尔可夫链,aprior算法都祥细看下,能用简单的数据推导过程出结果。
实践:用户画像中的rfm模型和kmeans聚类。
商品两种可以使用的购物篮算法即apriori。推荐系统中的协同过滤算法(总之是相似度计算)。
语义分析中的分词和主题提取和特征向量其他提取,词频分析与文本相似度算出。
信用欺诈模型中贝叶斯的应用(总之是归类)。基于组件神经网络的销量预测或是不再指数平滑也可以时间序列的短中期预测。机器学习:工具使用什么tensorflow或则sparkmlib或是mahout。重要要把神经网络这个算法弄清楚。多天天练习,多做例子,多做推导过程。唉,七糟的,到底自己写的是什么。