总做描述性统计,深入的数据分析到底怎么做?

在数据分析领域,许多初学者常常陷入描述性统计的困境,难以深入挖掘数据背后的真实价值。本文通过清晰的层次划分,从0级深度到4级深度逐步剖析,帮助大家理解如何从简单的单维度对比,逐步过渡到多维度分析、假设验证、测试验证,最终结合长期数据评估问题的根源。
很多同学都有困惑:
*怎么做才算有深度的分析?
*为什么我做的分析被嫌弃没深度?
我们今天用倒序的方式,先看什么叫“分析很浅”。对比分析很浅,大家自然之道,怎么做才能变深。就让我们从0级深度开始
0级深度
最浅的分析,就是单维度做对比。比如分析为啥业绩没达标,用公司维度一对比,发现:5个分公司,有2家没达标。此时,结论就是:“因为2个分公司没达标,所以业绩没达标”
当然,这时候还可以量化每个分公司的影响。比如:计算每个分公司差距,看其拖累了多少整体业绩(如下图)这是最浅的分析了。
1级深度
比单维度有深度的,当然是2+个维度一起看。比如分析业绩为啥没达标?产品、用户、分公司等维度,都拉出来作对比,看哪个维度差异大(如下图)
注意,A、C、E三个分公司卖不好,背后可能有同样原因:他们都是甲产品的主要销售地,而甲产品做烂了……这种联系,可以通过两个维度交叉对比发现,如下图所示,先展示分公司差异,找到共同点:甲产品占比高。
2级深度
如果想进一步深入分析,可以追问:为啥甲产品会做烂?这时会有更多假设,比如:
- 产品质量量不过关
- 产品推广没有做到位
- 产品脱销缺货了
- 竞品价格更低
注意!到这一步,问题发生变化。不管是“先天质量不过关”还是“后期运营不到位”,都没法直接拿一个指标来衡量。我们需要引入更多指标。
比如“先天质量不行”,这里有两个点:
1、什么叫质量
2、怎么算不行
衡量质量,可以从产品性能、配置等硬件角度(需要二手资料收集),也可以从用户体验、口碑等角度(需要调研/舆情数据采集),先把指标定下来。衡量“不行”则得找到参照物,可以参照自己的上一代产品,或竞争对手同期产品进行对比
“产品推广不到位”,也是同理,可以进一步拆分,通过数据量化:
1、推广质量如何(各推广渠道转化漏斗)?
2、促销力度如何(优惠力度/整体资源投入)?
3、商品周转如何(是否有渠道缺货/积压)?
此时,因为分析维度更多且不断有新数据引入,所以先画出如下图分析逻辑,能帮助我们清晰思路,逐一鉴别假设。
3级深度
如果我们真找到了问题源头,那么:
- 有这个原因的时候,问题存在
- 没有这个原因的时候,问题消失
两边都成立,才能称之为“真正的源头”,因此如果只做到2级深度,领导经常会反问:“那是不是我换个包装/降个价/换个文案,它业绩就能好啊”说这话的同时,语气中好充满了不信任。
此时终结问题的最好办法,就是:安排一次测试。哪怕是先小范围的测试,确认能解决问题也行。注意,不同问题假设,测试难度不一样。比如都是产品问题,包装问题相对难改,价格和推广是很相对容易改的,直接上活动即可。做测试的时候,一般会选择容易改的下手,尽快获得反馈。
比如价格问题,可以就近找个节日,安排一次节日促销,动一下价格看看效果。这里有两个点要注意:
1、测试得可控,不能不留后手。比如调价,万一全面降价,商品销量还是没起色,咋办!不留后手,只会逼死自己。
2、测试要注意控制其他变量。比如测价格,肯定会通过渠道投广告,那渠道运营就不能太烂,至少拿一些之前表现相对好的渠道来做。不然又扯不清,到底渠道和价格各自影响多少。
4级深度
做到3级深度,很多同学会觉得:这下终于无死角了吧。其实还是有个潜在的问题,就是:短期和长期的矛盾。短期内的重点问题,不代表长期内也是重点问题。比如短期内促销一下就能拉起销量。可长期来看,上的促销越来越多,产品力越来越弱。最后经费烧尽,企业就完蛋了……
因此,短期测试/验证的结果,需要长期累计的数据做支持,以评估长期效应。这样做数据逇时候,就不能“头疼医头,脚疼医脚”而是得做长期观测。把每一次遇到问题的假设列清单,记录下来,然后观察长期内:
1、是不是某些问题反复出现
2、是不是有些问题持续很长
3、是不是解决问题手段趋于单一
4、是不是解决问题成本越来越高
如果是,那就说明存在长期问题。
此时,那些反复出现、长时间持续的问题,就可以成为突破口。虽然短期内它们不是重点,会被促销等掩盖,但长期存在本身就是问题,就得推动业务去解决它。
本文由运营派作者【接地气的陈老师】,微信公众号:【接地气的陈老师】,原创/授权 发布于运营派,未经许可,禁止转载。
题图来自 Unsplash,基于 CC0 协议。
很实用,似乎马上就可以用在工作中了,感谢作者。
昨天晚上睡前还思考了这个问题,好巧
文章的结构也很清晰,是一篇不可多得的好文。
看完这篇文章,我对这个话题有了更全面的了解,作者的分析很有逻辑,很有说服力。
作者的经验很丰富,文章中提到了很多实用的方法和技巧