数据分析算法 数据如何分析( 五 )


(3)进行路径优化分析 。例如:哪条路径是用户最多访问的;走到哪一步时,用户最容易流失 。
(4)通过路径识别用户行为特征 。例如:分析用户是用完即走的目标导向型,还是无目的浏览型 。
(5)对用户进行细分 。通常按照APP的使用目的来对用户进行分类 。如汽车APP的用户可以细分为关注型、意向型、购买型用户,并对每类用户进行不同访问任务的路径分析,比如意向型的用户,他进行不同车型的比较都有哪些路径,存在什么问题 。还有一种方法是利用算法,基于用户所有访问路径进行聚类分析,依据访问路径的相似性对用户进行分类,再对每类用户进行分析 。
以电商为例,买家从登录网站/APP到支付成功要经过首页浏览、搜索商品、加入购物车、提交订单、支付订单等过程 。而在用户真实的选购过程是一个交缠反复的过程,例如提交订单后,用户可能会返回首页继续搜索商品,也可能去取消订单,每一个路径背后都有不同的动机 。与其他分析模型配合进行深入分析后,能为找到快速用户动机,从而引领用户走向最优路径或者期望中的路径 。
用户行为路径图示例:
八、留存分析
用户留存指的是新会员/用户在经过一定时间之后,仍然具有访问、登录、使用或转化等特定属性和行为,留存用户占当时新用户的比例就是留存率 。留存率按照不同的周期分为三类,以登录行为认定的留存为例:
第一种 日留存,日留存又可以细分为以下几种:
(1)次日留存率:(当天新增的用户中,第2天还登录的用户数)/第一天新增总用户数
(2)第3日留存率:(第一天新增用户中,第3天还有登录的用户数)/第一天新增总用户数
(3)第7日留存率:(第一天新增用户中,第7天还有登录的用户数)/第一天新增总用户数
(4)第14日留存率:(第一天新增用户中,第14天还有登录的用户数)/第一天新增总用户数
(5)第30日留存率:(第一天新增用户中,第30天还有登录的用户数)/第一天新增总用户数
第二种 周留存,以周度为单位的留存率,指的是每个周相对于第一个周的新增用户中,仍然还有登录的用户数 。
第三种 月留存,以月度为单位的留存率,指的是每个月相对于第一个周的新增用户中,仍然还有登录的用户数 。留存率是针对新用户的,其结果是一个矩阵式半面报告(只有一半有数据),每个数据记录行是日期、列为对应的不同时间周期下的留存率 。正常情况下,留存率会随着时间周期的推移而逐渐降低 。下面以月留存为例生成的月用户留存曲线:
九、聚类分析
聚类分析属于探索性的数据分析方法 。通常,我们利用聚类分析将看似无序的对象进行分组、归类,以达到更好地理解研究对象的目的 。聚类结果要求组内对象相似性较高,组间对象相似性较低 。在用户研究中,很多问题可以借助聚类分析来解决,比如,网站的信息分类问题、网页的点击行为关联性问题以及用户分类问题等等 。其中,用户分类是最常见的情况 。
常见的聚类方法有不少,比如K均值(K-Means),谱聚类(Spectral Clustering),层次聚类(Hierarchical Clustering) 。以最为常见的K-means为例,如下图:
可以看到,数据可以被分到红蓝绿三个不同的簇(cluster)中,每个簇应有其特有的性质 。显然,聚类分析是一种无监督学习,是在缺乏标签的前提下的一种分类模型 。当我们对数据进行聚类后并得到簇后,一般会单独对每个簇进行深入分析,从而得到更加细致的结果 。
获取更多数据分析学习信息及资料,欢迎关注聚数云海同名公众号哦~