发布网友 发布时间:2022-04-20 05:47
共4个回答
热心网友 时间:2022-04-02 19:48
常见的分析方法有:分类分析,矩阵分析,漏斗分析,相关分析,逻辑树分析,趋势分析,行为轨迹分析,等等。 我用HR的工作来举例,说明上面这些分析要怎么做,才能得出洞见。
01) 分类分析
比如分成不同部门、不同岗位层级、不同年龄段,来分析人才流失率。比如发现某个部门流失率特别高,那么就可以去分析。
02) 矩阵分析
比如公司有价值观和能力的考核,那么可以把考核结果做出矩阵图,能力强价值匹配的员工、能力强价值不匹配的员工、能力弱价值匹配的员工、能力弱价值不匹配的员工各占多少比例,从而发现公司的人才健康度。
03) 漏斗分析
比如记录招聘数据,投递简历、通过初筛、通过一面、通过二面、通过终面、接下Offer、成功入职、通过试用期,这就是一个完整的招聘漏斗,从数据中,可以看到哪个环节还可以优化。
04) 相关分析
比如公司各个分店的人才流失率差异较大,那么可以把各个分店的员工流失率,跟分店的一些特性(地理位置、薪酬水平、福利水平、员工年龄、管理人员年龄等)要素进行相关性分析,找到最能够挽留员工的关键因素。
05) 逻辑树分析
比如近期发现员工的满意度有所降低,那么就进行拆解,满意度跟薪酬、福利、职业发展、工作氛围有关,然后薪酬分为基本薪资和奖金,这样层层拆解,找出满意度各个影响因素里面的变化因素,从而得出洞见。
06) 趋势分析
比如人才流失率过去12个月的变化趋势。
07)行为轨迹分析
比如跟踪一个销售人员的行为轨迹,从入职、到开始产生业绩、到业绩快速增长、到疲惫期、到逐渐稳定。
热心网友 时间:2022-04-02 21:06
数据分析的常规思路:
一、熟悉业务、了解数据来源
这一点是数据分析的前提。数据分析,除了我们面对的数据之外,更多的是这些数据背后隐藏的各种业务。对于业务深入的了解,有助于更好的发现分析的维度,快速锁定问题和原因。
二、明确分析的目的
数据分析不是模型算法和可视化的堆砌,而是有目的地发现某种现象,支撑某些决策。所以在分析之前,一定要明确自己分析的目的,切忌照搬其他的项目的分析内容,或者随意组合手上的分析模型算法,这样会导致分析结果华而不实。
三、多视角观察
要想达到某种分析目的,需要从多个视角观察数据,这样不仅可以对数据整体有个全面的了解,也有助于发现潜在的信息。
做好准备工作后,接下来就进入正题,开始分析:
一、它是什么?
数据分析一定是针对某一些对象的,就像消费记录针对的是某一店铺。那首先要做的,就是通过数据来描述这一对象。所以,主要从两个方面关注一个对象,整体描述和特征:
1、基础统计
统计是最直接的方法,而且应用起来也很简单。常用的方法有总和、平均数、最大最小值、中位数、方差、增长率、类型占比、分布、频率频次等等。这里不多做介绍。
2、聚类
“物以类聚,人以群分”,聚类属于非监督学习,聚类可以将一组数据分成多个类别,每个类别内部的数据相似,但两个类别之间相异。聚类有助于发现数据分布上的特点,可以大量减少分析的数据量。比如在轨迹分析和预测中,通过聚类,我们会发现某个人主要出现在三个地方,宿舍周围、食堂周围、教学楼周围,那么当我们预测他在哪的时候,就可以从对无数经纬度坐标的分析变成对三个地点的分析。
3、特征分析
特征工程是很庞大,正如描述的那样,数据和特征决定了机器学习的上限,而模型和算法只能*近这个上限而已。特征工程包含了特征提取和特征选择,由于其算法众多且比较复杂,这里不一一介绍。特征分析首先要明确分析的单位,包括时间、空间和类型等等。就像轨迹预测中,分析每十分钟的所在地要比分析每秒钟的经纬度坐标要实际得多,而分析每小时的所在地又太过粗糙。然后就是特征提取,特征提取的算法有很多,线性的PCA(主成分分析)、LDA(线性判别分析)、ICA(独立成分分析),文本的F-IDE、期望交叉熵,图像的HOG、LBP等。特征分析的主要目的是降维、减少冗余,提高存储计算能力。
二、它发生了什么?
它发生了什么包涵正常和异常,而我们通常会更加关注异常,这里也着重于异常分析。它发生了什么与它是什么在分析思路和方法上是一致的,只是针对不同的阶段,比如时间上本月与上月。对于异常分析,主要有两部分,发现异常和推送预警。推送预警比较简单,只要注意预警的级别和推送的人。而异常发现,除了能直接观察的异常,比如我们的学霸这次居然有一科没及格,更多的需要注意暗物质。所谓暗物质,就是无法直接观测的现象和关联。
在异常判断的时候,通常会根据具体的业务设置一些系数,通过这些系数的突变来发现潜在的异常。
三、为什么发生?
每当发生什么的时候,我们都会问一句为什么?为什么是对数据的深层次挖掘与诊断,精确的问题诊断有利于正确的决策。一般可以用到以下的方法:
1、趋势、同比环比
这是很简单的方法,既观察其过去和其他周期的情况,这里不多介绍。
2、下钻
下钻绝对是最常用且有效的找原因的办法,既一层层抽丝拨茧,直到找到最根源的原因。只是在下钻的过程中,一定要注意下钻的区域和方向,就像挖井一样,并不是随便找个地方向任何方向打下去就会出水的。我们可以分为多个层次下钻,既一开始只关注大的分类的变化,如服装、饮食等等,再从变化较大的类开始继续下钻。
3、相关分析
相关分析是对不同特征或数据间的关系进行分析,发现业务的关键影响和驱动因素。例如时间到春运了,车票就不好买了一样。相关分析常用的方法有协方差、相关系数、回归和信息熵等,其中相关系数和回归也可以用于下面将会提到的预测。其中相关是回归的前提,相关系数表示了两个变量有关系,而回归则表示两个变量是何种关系。其中相关系数与回归也可以延伸到典型相关分析(多元)与多元回归。例如经典的“啤酒和尿布”,如果想要知道啤酒销量为什么增加,可以分析下它与尿布销量的相关性。
四、它还会发生什么?
它还会发生什么就是纯粹的预测了,预测的算法有很多,但也并不是说所有的预测都需要借助难以理解的算法。比如万精油的趋势、增长率、同比环比、基本概率等,有的时候就很能说明问题。但在这里,还是介绍一些常用的预测方法:
1、特别的点
对于实时性和连续性要求不高的预测,这绝对是最省心省力的办法,但是这与具体的业务深度挂钩,所以,重要的事说多遍,一定要熟悉业务和多视角观察。
2、分类与回归
分类与回归都是通过已知的数据构建和验证一个函数f,使得y=f(x),对于未知的x,通过f预测y,不同在于回归的输出是连续的而分类的输出是离散的。例如,我们预测明天的温度是回归,而预测明天是下雨天还是晴天则是分类。分类方法有逻辑回归、决策树、支持向量机,而回归一般会用到线性回归。
当然,预测算法还有很多,只是需要根据预测的数据的具体情况选择正确的方法,这些可以从我们的算法工程师们那里得到很好的建议,当然前提是我们要将数据的特点和需要预测的东西准确的告诉他们。
五、该怎么办?
该怎么办是数据分析的最终目的。大多数情况下,当知道了问题出在哪,为什么出这个问题的时候,都知道接下来该怎么办了。那么接下来就介绍一些即使知道哪出问题了也不知道该怎么办的时候可以用的方法:
1、拟合与图论
这是在做路线规划的时候最常用的,比如某商场频发商品被偷的事件,我们发现有几个地方的商品特容易被偷,那可以将这些地方串连起来,拟合成一条巡逻的路线给保安。同样,也可以通过构建图并用求最短路径的算法(Dijkstra、Floyd等)构建巡逻的路径。
2、协同过滤
协同过滤属于是利用集体智慧的办法,就像那个经典的面试题一样,当你遇到一个谁也没遇到过的问题时,你该怎么办?那就是问那些比你更厉害的人他们会怎么办。
还有一种情况,也是数据分析师很常见的。就是当拿到数据,却完全没有目的,也就是探索性分析。这种情况借助数据分析工具,做一些大致的探索性分析,看一下数据趋势,逐步深入。
热心网友 时间:2022-04-02 22:40
1、明确思路
明确数据分析的目的以及思路是确保数据分析过程有效进行的首要条件。它作用的是可以为数据的收集、处理及分析提供清晰的指引方向。可以说思路是整个分析流程的起点。首先目的不明确则会导致方向性的错误。当明确目的后,就要建分析框架,把分析目的分解成若干个不同的分析要点,即如何具体开展数据分析,需要从哪几个角度进行分析,采用哪些分析指标。
2、收集数据
收集数据是按照确定的数据分析框架收集相关数据的过程,它为数据分析提供了素材和依据。这里所说的数据包括第一手数据与第二手数据,第一手数据主要指可直接获取的数据比如公司自己的业务数据库中的业务数据,第二手数据主要指经过加工整理后得到的数据例如一些公开出版物或者第三方的数据网站。
3、处理数据
处理数据是指对收集到的数据进行加工整理,形成适合数据分析的样式,它是数据分析前必不可少的阶段。数据处理的基本目的是从大量的、杂乱无章、难以理解的数据中,抽取并推导出对解决问题有价值、有意义的数据。数据处理主要包括数据清洗、数据转化、数据提取、数据计算等处理方法。
4、分析数据
分析数据是指用适当的分析方法及工具,对处理过的数据进行分析,提取有价值的信息,形成有效结论的过程。由于数据分析多是通过软件来完成的,这就要求数据分析师不仅要掌握各种数据分析方法,还要熟悉数据分析软件的操作。
5、可视化
一般情况下,数据是通过表格和图形的方式来呈现的,我们常说用图表说话就是这个意思。常用的数据图表包括饼图、柱形图、条形图、折线图、散点图、雷达图等,当然可以对这些图表进一步整理加工,使之变为我们所需要的图形,例如金字塔图、矩阵图、漏斗图等。
6、撰写报告
撰写数据分析报告其实是对整个数据分析过程的一个总结与呈现,通过清晰的结构和图文并茂的展现方式去展具有建设意义的解决方案。
热心网友 时间:2022-04-03 00:48
1、 看数据看维度
在对某一项业务或者业务的某个模块进行分析时,可以从大小两个角度去切入分析。
首先站在广阔的视角去看待一些数据。比如对某个产品(消费品),就要分析在大环境下是一个什么样的数据,如市场排名,市场占有率。还要记录市场整体波动情况,竞品的数据。这些一般可以通过第三方调研机构或者行业报告获得。
然后需要分析针对这个产品你内部关心的数据是什么。比如每月每周的销售量,各渠道的销售量,广告、促销活动、线下活动、联合活动等带来的销售的提升和品牌知名度的提升。
当了解完以上的数据,就应该对这个产品方方面面的情况有个宏观的了解,对需要提升哪些数据指标有了一个清晰的认识。之后就是细化到某个模块维度进一步分析,比如电商渠道需要关注的多一些,DAU、WAU、客单价、复购、用户流失等等,每个模块都可建立漏斗信息。实际分析时还要关注数据异常,做针对性分析。
2、 什么是好的数据指标?
并不是所有的数据字段都可以当做指标。在选择监测的数据指标前可以先问自己几个问题:
一对于这个产品你核心关注的是什么?比如销售增长率、市场占有率?
二这些指标能够反映这个产品的走向趋势么?如果这些指标变好了能否说明公司是在往好的方向上发展?
三这个指标是否可控,能否操作?如果有些指标你目前的技术根本无法统计到,那也是无济于事。
四指标系设立是否严谨不存在漏洞。描述一个产品的一定是有系列指标,这些会标是否能完全的说明情况,在验证你的假设结论时,是否能完全支撑。
再来说说指标的数据和分析。
有时候数据本身也存在欺骗性,比如这个月的销售额是600W,另外两家最大竞品分别是300W和250W,似乎加起来也没有我们大。但是事实上,我们上个月的销售是800W,竞品分别是200W和180W。数据看上去很漂亮,但是按对比和比率来讲我们远下降了。
所以,好的数据最好一定是以比率的形式存在,要有对比性质的相对数据。
单纯一个或几个数据情况是没有意义的,点连成线,线构成面去展示,用图表展示一段时间的整体趋势,才能客观评价产品的健康程度。通常我们用BI或者报表搭建数据看板(dashboard)监测重要的数据指标。
数据分析要有目的性,不要被数据迷惑。上面的数据就是只关注了销售额情况,但忽略了整体分析而导致的表面欺骗。
3、发现数据异常,该从哪几个维度去分析?
有时候总量的角度是无法看出问题的,比如销售额、UV下降了,我们需要进一步细化去分析。看销售额总量的时候明显是下降了,先确定大的市场有没有波动,竞争对手有没有动作,需要查看市场总额以及竞争对手每个品类的数据。然后分析自身,每个渠道的销售额情况监测,每个区域的销售额情况,每个时间段的销售情况,把活动时间比如五一的数据扣除拟合,将有问题的标记出来。如果是渠道问题优化渠道,如果是市场波动,需要全局考虑战略和市场对策。
所以如果是销售额的分析,需要从渠道、活动时间点、地域等情况去深入分析。比如,是不是因为十一的活动导致销量有个明显的上升趋势?是不是因为上周搞了促销活动,导致本周一线业务员有个消极缓冲的时段,整体销售额低迷。
另外,数据一场也不是什么坏事,如果再数据分析过程中发现某数据表现极好,比如某渠道的销售增长率很高,是不是可以思考为什么会这样,有什么好的经验借鉴,甚至是不是要考虑调整渠道的投放比率。
4、不同阶段的关键性指标应该是随着业务的变化而变化的
在做数据分析前,我们会确定分析的目标,每个阶段不同。以电商渠道为例,有时候是分析各类活动效果以进一步优化方案或者挑选最合适的方案,留下分析模型以便后续活动对比预测;有时候是研究广告投放,在预算能让营收最大化;有时候是增强用户粘性,提高用户活跃度。
所以不同阶段无论是关键性指标还是KPI都要做相应调整。比如产品投放初期,关注用户数、订单数,后续考虑用户活跃度,回购率,客单价等等。