数据分析的真正目的是,什么是数据分析(主要有什么目的,主要划分为哪几大步骤?)

 2022-10-23    96  

什么是数据分析?

数据分析是指以适度的统计分析对搜集来的大批数据展开分析,抽取管用信息和形成推论而对数据予以详尽科学研究和归纳归纳的过程。在新颖中,数据分析可帮助现代人做出推论,以期采行适度暴力行动。

数据分析的目地是什么?

数据分析的目地是把岩石圈在一大批直言杂乱的数据中的信息集中、纯化和提炼出出来,以找寻所科学研究第一类的外在规律性。

在新颖中,数据分析可帮助现代人做出推论,以期采行适度暴力行动。数据分析是组织有目地地搜集数据、分析数据,使之成为信息的过程。在产品的整个开发周期,包括从市场考察到售后服务和最终处理的各过程都需要适度利用数据分析过程,以提高有效率性。

在企业里头,数据分析能帮助他们掌握企业的运营情况,商品的转卖情况,用户的特征、产品的黏性、之类。

数据分析的关键步骤
数据分析的真正目的是,什么是数据分析(主要有什么目的,主要划分为哪几大步骤?) 什么 的是 目的 真正 分析 数据分析 数据 百科资讯 第1张

1. 首先明晰分析的路子和目地

数据分析一定的带着这种业务目地的。它可能将是要跟踪一个新产品上架后的用户采用情况;也可能将是观察用户在前段时间的存留情况,还有可能将是运营这种代金券与否有效率。带着一定的目地,确认要从马雷科个视角展开分析。接着找出能够说明目地的分项。

比如说想要校正运营前段时间的一大批代金券与否有效率。他们能从代金券的申领情况和代金券的采用情况两个方面分析,而代金券的申领情况的分项能细化为申领率;采用情况可细化为:采用率、客单价等。

2.数据的搜集

在确认了此次数据分析的核心分项后,要是特别针对数据分项做数据搜集。有些企业的数据准备非常充份,数据仓库、数据市集等匆匆忙忙就建设好。有许多企业在数据分析上比较滞后,那就需要他们自己做后期大批的数据搜集工作。比如说采用许多自己公司的或是服务器端的数据分析工具展开埋点,领到笔记。或是采用数据复本的原有数据,比如说订单数据、基础的用户信息之类。

3.数据处理

数据抽取出来后,要除去脏数据(冲洗),接着数据转化。在进行最基本的数据汇整、裂解后,他们就能领到比较单纯的表头相对丰富的数据宽表。

4.数据分析

数据分析是用适度的分析方法及工具,对处理过的数据展开分析,抽取有价值的信息,形成有效率推论的过程。

一般公司所需要观察的数据大致分为如下几类: 商业数据:付费金额,付费用户数,付费率客单价 运营数据:新增用户数,日活、周活、月活(AARRR模型) 产品数据:关键页面的PV、UV(漏斗模型) 用户数据:用户开发周期、用户存留、用户客单价、用户类型(RFM模型……) 商品数据:商品售卖情况,毛利分析……

随着数据的重要性的凸显,越来越多的公司已经认识到数据对于公司的经营是十分重要的。所以绝大部分企业都有专门的BI部门展开初步的数据加工、分析,以周报表的形式汇整给管理层做为日常数据所需以及企业决策采用。

在这里主要就介绍两个单纯的数据分析模型:

AARRR模型Acquisition(获取)、Activation(活跃)、Retention(存留)、Revenue(收益)、Refer(传播)

AARRR模型

(1)获取用户(Acquisition)

如何获取用户?线上通过网站通过SEO,SEM,app通过市场首发、ASO等方式获取。还有运营活动的H5页面,自媒体等方式。线下通过地推和传单展开获取用户。

(2)提高活跃度(Activation)

来了用户后,通过运营价格优惠、编辑内容等方式展开提高活跃度。把内容做多,商品做多,价格做到优惠,但需要控制在成本至上的有生长空间。这样的用户是最有价值展开活跃。

产品策略上,除了提供运营模块和内容深化。展开产品会员激励机制成长体制展开活跃用户。不仅商品优惠的,VIP等标示的ICON,对于长业务流程,展开流程激励体制,产品策略更具多元化。

(3)提高存留率(Retention)

提高活跃度的,有了忠实的用户,就开始慢慢沉淀下来了。运营上,采用内容,相互留言等社区用户共建UCG,摆脱初期的PCG模式。电商通过商品质量,O2O通过优质服务提高存留。这些都是业务层面的提高存留。

产品模式上,通过会员机制的签到和奖励的机制去提高存留。包括app推送和短信激活方式都是激活用户,提高存留的产品方式。通过日存留率、周存留率、月存留率等分项监控应用的用户流失情况,并采行相应的手段在用户流失之前,激励这些用户继续采用应用。

(4)获取收入(Revenue)

获取收入其实是应用运营最核心的一块。即使是免费应用,也应该有其盈利的模式。

收入来源主要就有三种:付费应用、应用内付费、以及广告。付费应用在国内的接受程度很低,包括Google Play Store在中国也只推免费应用。在国内,广告是大部分开发者的收入来源,而应用内付费目前在游戏行业应用比较多。

前面所提的提高活跃度、提高留存率,对获取收入来说,是必需的基础。用户基数大了,收入才有可能将上量。

(5)自传播(Refer)

以前的运营模型到第四个层次就结束了,但是社交网络的兴起,使得运营增加了一个方面,就是基于社交网络的病毒式传播,这已经成为获取用户的一个新途径。这个方式的成本很低,而且效果有可能将非常好;唯一的前提是产品自身要足够好,有很好的口碑。

从自传播到再次获取新用户,应用运营形成了一个螺旋式上升的轨道。而那些优秀的应用就很好地利用了这个轨道,不断扩大自己的用户群体。

漏斗模型

用户访问的路径

漏斗模型

漏斗模型广泛应用于流量监控、产品目标转化等日常数据运营工作中。之所以称为漏斗,就是因为用户(或是流量)集中从某个功能点进入(这是能根据业务需求来自行设定的),可能将会通过产品本身设定的流程完成操作。

按照流程操作的用户展开各转化层级上的监控,寻找每个层级的可优化点;对没有按照流程操作的用户绘制他们的转化路径,找出可提高用户体验,缩短路径的空间。利用漏斗模型比较典型的案例就是电商网站的转化,用户在选购商品的时候必然会按照预先设计好的购买流程展开下单,最终完成支付。

需要注意的是:单一的漏斗模型对于分析来说没有任何意义,他们不能单从一个漏斗模型中评价网站某个关键流程中各关键步骤的转化率的好坏,所以必须通过趋势、比较和细分的方法对流程中各关键步骤的转化率展开分析: 趋势(Trend):从时间轴的变化情况展开分析,适用于对某一流程或其中某个关键步骤展开改进或优化的效果监控; 比较(Compare):通过比较类似产品或服务间购买或采用流程的转化率,发现某些产品或应用中存在的问题; 细分(Segment):细分来源或不同的客户类型在转化率上的表现,发现许多高质量的来源或客户,通常用于分析网站的广告或推广的效果及ROI。

5.数据展现

数据可视化是关于数据视觉表现形式的科学技术科学研究。其中,这种数据的视觉表现形式被定义为,一种以这种概要形式抽提出来的信息,包括相应信息单位的各种属性和变量。

图表是"数据可视化"的常用手段,其中又以基本图表----柱状图、折线图、饼图之类----最为常用。

有人觉得,基本图表太单纯、太原始,不高端,不大气,因此追求更复杂的图表。但是,越单纯的图表,越容易理解,而快速易懂地理解数据,不正是"数据可视化"的最重要目地和最高追求吗?

所以,请不要小看这些基本图表。因为用户最熟悉它们,所以只要是适用的场合,就应该考虑优先采用。

柱状图(Bar Chart) 柱状图是最常见的图表,也最容易解读。

它的适用场合是二维数据集(每个数据点包括两个值x和y),但只有一个维度需要比较。年销售额就是二维数据,"年份"和"销售额"就是它的两个维度,但只需要比较"销售额"这一个维度。

柱状图利用柱子的高度,反映数据的差异。肉眼对高度差异很敏感,辨识效果非常好。柱状图的局限在于只适用中小规模的数据集。通常来说,柱状图的X轴是时间维,用户习惯性认为存在时间趋势。如果遇到X轴不是时间维的情况,建议用颜色区分每根柱子,改变用户对时间趋势的关注。

上图是英国足球联赛某个年度各队的赢球场数,X轴代表不同球队,Y轴代表赢球数。

折线图(Line Chart)数据折线图适合二维的大数据集,尤其是那些趋势比单个数据点更重要的场合。

它还适合多个二维数据集的比较。

上图是两个二维数据集(大气中二氧化碳浓度,地表平均气温)的折线图。

饼图(Pie Chart) 饼图是一种应该避免采用的图表,因为肉眼对面积大小不敏感。

饼图

柱状图

上图中,左侧饼图的五个色块的面积排序,不容易看出来。换成柱状图,就容易多了。

一般情况下,总是应该用柱状图替代饼图。但是有一个例外,就是反映某个部分占整体的比重,比如说贫穷人口占总人口的百分比。

饼图

散点图(Scatter Chart) 散点图适用于三维数据集,但其中只有两维需要比较。

散点图

上图是各国的医疗支出与预期寿命,三个维度分别为国家、医疗支出、预期寿命,只有后两个维度需要比较。

为了识别第三维,能为每个点加上文字标示,或是不同颜色。

散点图

气泡图(Bubble Chart) 气泡图是散点图的一种变体,通过每个点的面积大小,反映第三维。

气泡图

上图是卡特里娜飓风的路径,三个维度分别为经度、纬度、强度。点的面积越大,就代表强度越大。因为用户不善于推论面积大小,所以气泡图只适用不要求精确辨识第三维的场合。如果为气泡加上不同颜色(或文字标签),气泡图就可用来表达四维数据。比如说下图就是通过颜色,表示每个点的风力等级。

气泡图

雷达图(Radar Chart)雷达图适用于多维数据(四维以上),且每个维度必须能排序(国籍就不能排序)。但是,它有一个局限,就是数据点最多6个,否则无法辨别,因此适用场合有限。下面是迈阿密热火队首发的五名篮球选手的数据。除了姓名,每个数据点有五个维度,分别是得分、篮板、助攻、抢断、封盖。

雷达图

画成雷达图,就是下面这样。

雷达图

面积越大的数据点,就表示越重要。很显然,勒布朗·詹姆斯(红色区域)是热火队最重要的选手。需要注意的时候,用户不熟悉雷达图,解读有困难。采用时尽量加上说明,减轻解读负担。

归纳

原文链接:https://zazhiba.com.cn/post/4052.html

=========================================

https://zazhiba.com.cn/ 为 “自由随风” 唯一官方服务平台,请勿相信其他任何渠道。