极客时间已完结课程限时免费阅读

10 | 指数和KPI:智商是怎么计算出来的?

10 | 指数和KPI:智商是怎么计算出来的?-极客时间

10 | 指数和KPI:智商是怎么计算出来的?

讲述:郭炜

时长14:11大小12.96M

数据给你一双看透本质的眼睛,这里是《数据分析思维课》,我是郭炜。
在日常生活中,我们经常希望用一个数字去衡量一个特别复杂的事物,这样即使是外行也能一下就了解某件事情的程度和分布。
那什么数字可以满足这个苛刻的要求呢?答案是指数。
简单来讲,凡是用指数描述的东西,都是一个长期存在或者需要大范围衡量的事情。指数就像一把尺子,把指数放在这里一量,你就能知道现在这个事情所处的状态是怎样的。于是我们经常在生活当中看到各种各样的指数,从空气的污染指数到股票的上证指数,从用户忠诚度指数到智力指数(IQ)等等均是如此。
指数本身的定义很简单,就是变量值除以标准值再乘以 100。
接下来你可以想想,如果让你来设计一个数字去代表上海证券交易所整体的行情,你会怎么做呢?
如果你只选一只股票来代表整个上海证券交易所的行情,就会出现很多问题。比如你找的这家公司的股票退市了,那怎么办?或者是它进行了一些股票的增发 / 除权,突然之间价格变化非常大,那它能代表着当时所有股票的行情吗?
很明显单只股票是无法代表整体行情的,这个时候就轮到指数登场了。

简单的指数:上证指数

接下来我就以上证指数为例,带你看一下一个标准的指数应该由什么构成。
首先它得有标准值,也就是分母。你要注意,这个标准值不仅是一个数字值,也代表一个具体的时间点。比如,新的上证综合指数就是以 2005 年 12 月 30 日为基日(即基准日),以当日所有样本股票的市值总值为基期,以 1000 点为基点来做的分母。
其次,一个指数还要有一个加权的计算公式,这个计算公式是这样子的。
也就是以基期和计算日的股票收盘价 (如当日无成交,沿用上一日收盘价) 分别乘以发行股数,相加后求得基期和计算日市价总值,再相除后乘以 100 即得股价指数。
看上去很简单,就是当前市值除以基期市值,但这还没完,上证指数还有一套修正的规则,这是非常重要的。因为一个指数不仅仅是一个数学公式,它背后还代表着一套管理规则。
所以对于上证指数来说,股票要有样本池,样本池可不是闭眼随便一选,而是需要由上海证券交易所选择的若干只大盘股和蓝筹股综合计算。
仅仅用上面这个公式还不够,因为样本池中的单一股票会由于非市场交易因素发生变动(例如配股和送股等),但是这些非交易因素发生变动而产生的价格变动都不计算在这个指数的变化范围内,这个时候就得用下面这个公式来做一下修正。
通过上证指数这个小例子希望你能够明白,其实指数公式本身很简单,关键在于指数公式的背后,你要如何去制定一个能够保持指数有效性的规则。指数不是一条一使劲就变长的橡皮筋,而是一把相对精准的尺子。

较复杂的指数:用户忠诚度指数

我们现在来看一个比上证指数要更复杂一些的例子。在互联网分析当中,我们经常会看到一个数据叫做用户忠诚度指数。
用户忠诚度指数顾名思义,它用来衡量用户做某种行为的忠诚度。这个指数和上证指数就不太一样了,它和大多数日常使用的指标一样,复杂度在于你对于业务的定义。例如我把忠诚度定义为第 N 日 / 周 / 月后回访的用户行为指标对于初始行为指标的占比,那么这个忠诚度指数就会变成下面这个样子。
这个公式看上去也很简单,但是这个公式在理解层面上相比于上证指数的公式,其实更难了。
比如说,什么叫初始行为指标?例如我们把这个行为定义成访问这个 App 或者网站的活跃用户数,这个忠诚度指数就是留存率。
但是问题又来了,什么是活跃用户数呢?我打开视频 App 看一秒钟算活跃吗?我要是第二秒就退出了,那我应该不是一个活跃用户。那是不是看五秒钟以上的用户就可以算活跃用户了呢?这些问题其实非常复杂。
并且对于用户忠诚度而言,我也可以说我今天在京东上面买了大闸蟹,我过了一周又去京东上买了大闸蟹,那么我在京东上对大闸蟹的用户忠诚度就很高。就像下图里一样,我们可以选择各种各样的条件来进行用户忠诚度分析。
类似用户忠诚度这样的指数,在我们日常工作当中经常会出现。这样的指数往往会有这样一个明显的特征:看上去公式很容易定义,但是对于公式的解释往往非常复杂,而且需要大量业务经验的人员和经验通过“数据治理”这个过程才能把它定义好。
而这个数据治理的过程可以用外部专家或者内部项目,建立一套每年要有公司级别的共识和变化的策略(和上证指数修正方法类似),才可以把一个指数真的延续下去。

复杂的指数:智商(IQ)

刚刚我们讲的上证指数和用户忠诚度指数都是用一个数字去衡量一组数字,那么现在难题来了:我们怎样用数字化手段去衡量一个复杂的事物呢?比如我们要怎样去衡量一个人的聪明程度?
这件事情听上去就更复杂了。首先,就像我们前面提到的,制定某些维度去衡量一个人本身就是比较困难的。其次,人不是一成不变的,随着年龄的增长人的聪明程度也会发生变化。
我们能用一个固定公式来去囊括所有年龄的人吗?显然是不可行的。因为如果用大人的聪明程度去死板地衡量一个孩子,很可能就把一些特殊的聪明孩子给耽误了。
在 20 世纪初,法国心理学家比奈和他的学生编写了世界上第一套智力量表,后来心理学家推孟把这套量表介绍到美国,将其修订为斯坦福 - 比奈量表,并用标准测试题得出的心理年龄与生理年龄之比,作为评定智力水平的指数,这个比被称为智商。
上面这个公式就是现在网上大多数人会告诉你的智商的算法,但这个算法其实是不对的。通过这个公式我们虽然能看到神童的 IQ 很高,但也会发现随着我们经验阅历的增长,用这个公式算出来的智商反而越低,也就是说我们人会越活越笨,这不符合实际情况啊。
所以目前最流行的智商计算方法是叫做韦克斯勒的离差智商,它的基本原理就如同正态分布的原理一样。
韦克斯勒的量表是一个平均值为 100,标准差为 15 的一个正态分布曲线。在用韦克斯勒的方法测量智商的时候,你得先做一组标准的测验题,然后再将你的得分套用到韦克斯勒正态分布表(韦氏量表)中对应,这样就能得出你的智商值了。
当然,由于年龄差异的问题,韦氏量表也分为韦氏成人智力量表、韦氏儿童智力量表和韦氏幼儿智力量表这三套量表,可以用于检测所有年龄段的智商。
根据前面标准差的知识可知,正负 3 个标准差也就是 6 个σ能覆盖人类 99.97% 的情况。也就是说,100±15×3(也就是 55 到 145 之间)是大多数人的智商分布。所以当你的智商测试得分在 100 分以上,可以说你已经比较聪明了;如果是 130 分,你已经是相当聪明;如果你是 150 分,感谢你还在看我的专栏,因为你就是那个 6 个σ万世不遇的奇才,这就是现代智商的算法。
学到这,相信你也发现了,智商的计算在指数计算中是非常复杂的:既要有复杂的标准测试题,还要和全人类的实际情况进行比对,最终才能够得到一个合理的标准分值。
要做一把尺子来衡量人这种复杂动物的聪明程度,很难。
所以在咱们工作和生活当中,当我们要制定某个指数,比方说设定 KPI 的时候,我们要注意不要光看公式的建立,而是要把一系列定义调整的制度算法规定出来,否则很多 KPI 项目最后 KPI 完成了,但其实公司目的并没有达成。
可能这么说你还是有些不清楚,给你讲个小故事。话说有一天,小王发现路边上有两个人在热火朝天地干活:一个人在前面挖坑,土坑挖完后,后面的那个人赶紧跑上去把坑重新填上。小王就很疑惑,这不纯属在瞎忙活嘛!于是小王上前询问二人为什么要这么干。最后一问发现,原来是负责种树的那个人请假了,只剩下挖土填坑二人组自己完成自己的 KPI,而没有完成种树这个目标。
所以最近新流行的管理方法 OKR,其实是为了规避 KPI 管理的一些缺点,在某种程度上借鉴了指数建立和调整的规则:建立好目标 O 之后, KR 可以进行动态监测和调整,并为之建立一套分层和计算调整体系。这里最关键的是对 K(也就是 key messuarement)的定义和相关的针对 O 的调整方法,和今天所讲的指标的定义和管理方法很类似,这套方法没定义好,不管是 KPI 还是 OKR 都很难有好的管理效果。

小结

讲到这,我们今天的这节课也就接近尾声了,最后我来给你总结一下今天的要点。
我们今天讲了指数,指数其实是把我们现实社会数字化的最常用的一种方式。仔细想一想,其实从我们个人的高考标准分到衡量我们每一个人工作的 OKR 或者 KPI,再到现在衡量国家发展状况的居民消费价格指数 CPI,其实这些数字都是指数在各种不同场景的表现。
我们聊了三个具体的指数例子,希望你能明白指数不是一个简简单单的加权平均值,它背后映射了一套管理的思维逻辑。即使是像上证指数一样有着复杂多变的股票的情况下,我们也得有一个标准的规则来去统计。而对于更复杂的情况(比如我们要衡量人的时候),我们更需要结合前面所学的多种数据分析方法和工具,来设计一个基于实验结果的指数计算方法,这样才能够客观地把活生生的人变成一组数字。
但在我们的生活和工作中,很多人往往会为了做一个可衡量的数字,不负责任地拍脑袋决策出一个结果。比如说我知道很多公司在做员工 360 度评估的时候,就是简单地套用一个标准公式,这样的评估往往是失败的。一定要基于细致的业务流程和实验,才能得到合理科学的结果。
因此我希望今天你学了指数这节课后,一方面当你在衡量一个事物的时候,不要轻易地拍脑袋造出一组数字来代表它。另一方面,希望你能够更加坚定地相信,数字是可以衡量这个世间所有事物的。毕竟如此复杂的我们都可以用数字来衡量,还有什么是不能衡量的呢?

课后思考

最后我们一块来做个思考题吧。你在日常生活和工作当中还会遇到哪些指数呢?它们属于我们这节课讲的指数类型的哪一种?它的定义和调整规则是什么?欢迎你分享出来,我们一起提高。
分享给需要的人,Ta购买本课程,你将得18
生成海报并分享

赞 29

提建议

上一篇
09 | 数据抽样:大数据来了还需要抽样么?
下一篇
11 | 因果倒置:星座真的可以判定你的性格吗?
unpreview
 写留言

精选留言(17)

  • mtfelix
    2021-08-19
    数字中国,最关键的是各种指数的定义和修正机制的建设啊!

    作者回复: 同意!

    9
  • 80分
    2021-09-18
    德鲁克说过,如果一件事你无法衡量它,你就无法增长它。指数的作用便是如此。

    作者回复: 是的,一看您就是属于管理者,视角不同

    8
  • 艺霖子
    2021-08-18
    今天课程拔高了。 老师能给我们学院建立一个QQ社群嘛,这样我们学习的过程,也可以互相交流啥的。

    作者回复: 有微信群,课程介绍里有,可以添加工作人员

    共 3 条评论
    2
  • 那时刻
    2021-08-18
    用户留存的计算,可以以自然日作为计算,后来发现有的统计方法是以玩家注册时候24小时来计算。同一个指数指标,因维度不同,而差异蛮大的。

    作者回复: 是的,其实都没有对错,都可以做分析

    共 2 条评论
    2
  • Haoz
    2021-10-24
    指数本质上是对复杂数字以及事物的抽象,用一个相关合理的规则以及动态调整的角度来衡量复杂的东西,从而化繁为简。但如何确定这指数背后的公式,而让它能够真正反映数字背后的信息和价值是非常难的事情,也是需要不断演进和迭代的。
    1
  • SVV
    2021-09-10
    想到两个案例,一是现在的天气应用,不局限于提供天气数据本身,还会结合日常生活以及其他数据,提供类似“穿衣指数”“感冒指数”“出行指数”这样的指数,在想要传达的意图上容易理解,但背后的机制往往容易让用户困惑、怀疑其可靠性;二是有些健康监测类产品,在科学的健康数据基础上,通过复杂算法预测出很多难以直接获取的健康指数,比如“内分泌指数”“心肺功能指数”,这种指数的机制不透明是可以理解的,只要满足精确度、有效性即可。

    作者回复: 其实,都需要严谨的计算和推理,要不很容易做手脚,例如,企业360度评估分数,就很难公允的

    1
  • 进化菌
    2021-08-18
    指数,马上想到的是指数基金,果不其然,有说到上证指数~ 指数是个复杂抽象的逻辑值。比如贫富差异的购买力指数?比如天气预报? 说到kpi和okr,不禁觉得公司同时践行这两货的不舒服点。月度、季度的okr指标完成了,却算不上绩效,绩效是okr之外额外的成果……

    作者回复: 绩效和OKR不一样?这有点坑…

    1
  • 漠帆
    2023-01-28 来自广东
    老师,怎么去确认制定的指数是合理还是不合理的呢?
  • fahsa
    2022-08-26 来自浙江
    上证指数的,“以 1000 点为基点来做的分母”,这个基点是做哪个的分母啊?上证指数计算公式里根本没有提到这个基点吧。
  • 行与修
    2022-03-23
    复杂的指数:焦虑指数。怎么去定义,规则如何调整呢?
  • piboye
    2021-12-21
    怎么建立一个指数呢?
  • 不再是入门水平pytho...
    2021-11-24
    数据分析,指标定义,指数可以来描述复杂的业务场景和现实,但是一定不要硬套标准,要结合实际情况
  • geigei
    2021-10-27
    制定指数或者说评价标准的目的是为了让事物可衡量,但环境是不断变化的,所以指标也需要与时俱进,不断更新。
  • Geek5965
    2021-10-09
    也就是以基期和计算日的股票收盘价. 以基日和计算日。
    共 1 条评论
  • TeddyPM
    2021-08-23
    那这么说招蚊子的人就比不招蚊子的人要健康了

    作者回复: 哈哈哈哈,那应该结果导向,咬的包多的人更健康么?

  • TeddyPM
    2021-08-21
    对于投资来说,买指数就是买国运。指数是衡量一个国家兴衰经济发展的情况。 而对于一件事情要不要拍脑袋的照一堆数据出来。前提是你得有能力造得出来这数字在说吧。

    作者回复: 是,不要因果倒置

  • kingcall
    2021-08-19
    老师想问一个问题那就是标签和指数之间的关系,或者说是我给用户打了一个标签,但是我怎么去衡量这个程度呢?

    作者回复: 你打标签是用的什么算法呢?逻辑是怎样的,你可以看下聚类那一章,可以计算一些距离来给出分数