极客时间已完结课程限时免费阅读

导读 | 万物背后的规律都是数据

导读 | 万物背后的规律都是数据-极客时间

导读 | 万物背后的规律都是数据

讲述:郭炜

时长10:25大小9.52M

你好,我是郭炜。我是一个特别热爱数据的人,我自己有一个座右铭:“数据是有灵魂的,我将用我的一生去追寻他。”
从小学开始你就一直在学习和考试,用分数定排名,这些计算离不开数据;你工作了,开始自己挣工资,KPI 的评估、年终奖的计算也离不开数据;你结婚了,要去买房,你开始思考等额本息和等额本金哪种贷款方式更适合你,这也是数据;平时和朋友玩牌,牌面现在有两张红桃、一张黑桃,你手里有一张红桃,你开始判断拿到全部红桃的概率、应不应该加注,这也是数据。
我们生命的点点滴滴,其实都是用数据在记录的。在当今这个时代,我可以说,人这一辈子都离不开数据。

万物背后的规律都是数据

数据无处不在,每个人都会觉得自己多多少少懂一些数据。但细究起来,你能够拍着胸脯说自己真正懂数据吗?
就拿我自己来讲,小时候我和小伙伴赌抛硬币,我觉得硬币有两面,是抛 20 次至少应该有 8、9 次是正面向上的,我就跑去和别人打赌抛 20 次至少 8 次向上,最后我输得很惨,请了好几顿冰棍。同样地,现在你去澳门赌场去赌大小,大概率也会输得很惨。这背后其实有深层次的数据逻辑和数学理论,你会在接下来的课程里具体学到这个理论——“大数定律”。
在管理中,我也曾听到部下和我吹嘘,竞争对手现在的平均客单价只有 10 万,我们的平均客单价有 100 万,我们服务的都是高端客户。但是我做了用户访谈后发现,我们三、五万客单价的单子还有很多,原来是背后一个 1000 万的单子拉高了整体的平均值。
如果我没有做深入的用户调研,可能我就会按照 100 万客单价级别的战略去做相关的规划,进而对公司造成影响。
我当时由于对平均值理解得不够,差点出了差错。同样,如果你不了解这些数字背后的逻辑,你也很可能会做出错误的决策。基于这件事,我在下节课讲平均值的时候就会告诉你,你天天“被幸福”、“被加薪”就是这样的错误的理念在作怪。
另外,现在有很多“数据科学家”会给你各种算法预测,更有甚者,直接给你画出一条“增长曲线”告诉你未来投资回报率会有多高,要求你进行基金投资或者你所在的部门增大投入,并告诉根据“大数据算法”进行这些投入之后,就能带你或者公司来多少回报。
但等你真的投入之后,你才发现这根本就不是一回事。于是,你会下结论说“数据预测”都不靠谱,其实这也是不正确的。毕竟在人家给你的数据报告中既可能有“幸存者偏差”,还有“因果倒置”。所以在接下来的课程里,我希望用通俗易懂的例子让你充分了解这些基本知识,这样在下次“数据科学家”给你号脉的时候,你就可以知道他是“真科学家”还是“伪科学家”。
所以你看,数据无处不在,你需要很好地去认识数据,这样才能让数据更好地指导你的生活。而数据背后的规律是什么呢?它是算法。

数据背后的规律是算法

现在的数据算法分析和过去的数据算法分析又有所不同,现在有了大数据和小数据之分。有人说,大数据加上人工智能才是一切,而又有人认为小而传统的逻辑数据才是真理。那谁才是对的呢?
我既做过小数据也做过大数据,在我看来,这两种趋势的结论其实都是对的,只是它的应用场景不同。
在大数据里面我们针对的是个人的数据,这些数据量虽然很大,但是每行数据蕴含的信息量(也叫熵)很小,所以我们会用很多人工智能的数据挖掘算法,来帮我们在浩如烟海的数据里找到其中的珍珠。
而小数据往往是在企业经营范围内产生的,他们的数据量很小,但是他们蕴含的数据价值(熵)会非常大,所以分析的时候要更讲究,因为每一个数据背后都蕴含着大量的知识,我们要了解它背后的规律才能掌握数据的命脉。
我来给你举个大数据和小数据的例子。从大数据的方向来说,抖音的推荐算法就是典型的大数据代表。抖音需要在复杂多变的环境找到你喜爱的视频并推荐给你,不断增强你的体验,从而让你爱不释手。如果抖音没有一个很好的推荐算法,其实是很难达到今天的地位的。
但是对于抖音背后的母公司字节跳动来讲,它的上市数据、经营收入、人员成本这些小数据同样重要。这些小数据会影响字节跳动的整体估值,以及每个员工所持有股票最后变现的金额。
所以你看,就算对于字节跳动这样大数据浩如烟海的一线大厂来说,大数据和小数据依旧要两手抓。大数据是业务支撑,小数据是内核动力,两者缺一不可,只是应用的场景不同。
在这门课里,我既会教你一些小数据的基本概念,也会教你大数据算法的基本原理,让你不再对那些奇怪的专用名词和算法感到陌生,帮你初步迈进数据分析和算法的门槛。

数据重要的是分析和表达

但是,光知道算法还远远不够。数据有它的复杂性,同样的数据往往可以从很多不同的角度诠释,诠释得特别好的人,我们就可以叫他数据分析师了。此外,作为管理者,也必须要有数据分析的常识,才能透过现象看本质。
我跟你讲一个典故:平江人李元度本来是一个书生,根本不知道领兵作战。曾国藩命令他领兵出战,每打一次仗便败一次。曾国藩很生气,准备写奏折弹劾他。在他的奏折上便有“屡战屡败”这样的词语。后来曾国藩的幕僚中有人为李元度求情,把“屡战屡败”改为“屡败屡战”,最后李元度因此被免罪。
你看,同样都是 100% 的失败,但是不同的解释会让结果完全不同。数据也是如此,你如何看待这个数据和它背后的解释,往往会让你得到完全不同的结果。
所以当我们有了数据和算法后,就好比手里拿了一块“璞玉”,还不能够完全发挥作用。我们要通过有效地分析数据、表达数据,从而让数据最终影响到人。在我们整个课程里,我会带着你学习怎样把数据表达得更为清晰,让你成为别人眼里的“数据分析师”。

小结

好了,这节课到这里也就接近尾声了。这节课其实相当于我们正式进入正课内容的一个小预习,通过这节课,我想告诉你,我们很多人平时很容易对数据想当然,但究根结底,我们对数据还需要进一步的认识。万物背后都是数据,不是我想出来的噱头,数据就是这么无处不在。
光认识数据对我们的生活很重要还不够,数据背后的规律是算法。就像客观世界背后蕴含着哲理一样,学了这门课程你能够从数据算法中同样领会到生活的哲理。比如在接下来的课程中你会发现,原来“物以类聚人以群分”这句话里面是有数学算法支持的,而《飘》里面提到的“tomorrow is another day”其实也是有数据算法根据的。我希望你学了这门课程,不要把它仅仅当成一个知识库来对待,而是通过这门课来培养一个时时思考数据规律的习惯。
最后,当你有了对数据思考的习惯,我希望你能够进一步去表达数据,用数据正确地影响他人,跨入数据分析师的门槛。在这样一个纷繁复杂的世界里,你要是能够有一个清晰、优雅的数据观,那么你能够把一件事情更好地想明白、说清楚。
数据就是外行看热闹,内行看门道。看清数据真谛的人才能真正把握自己的命运,把握自己企业的命脉,最终获得生活和事业的成功。所以希望你能够通过这门课,能够对自己的生活有一个新的认知,看到数据背后的逻辑和趋势。在接下来的课程学习中,你如果有任何的思考和疑问,一定要在留言区大胆提出来,我们共同成长。

课后思考

你在生活或工作中有曾经被哪些数据骗了的经历吗?明白之后又有哪些收获呢?可以写在这里,我们一起来讨论一下。
分享给需要的人,Ta购买本课程,你将得18
生成海报并分享

赞 55

提建议

上一篇
开篇词 | 数据给你一双看透本质的眼睛
下一篇
01 | 平均值:不要被骗了,它不能代表整体水平
unpreview
 写留言

精选留言(47)

  • 置顶
    2021-07-31
    买东西最低五折,只有少量商品是这样,还是过季商品,是极端值影响

    作者回复: 是的,消费者被骗了就不再相信这个套路了。所以,有商家反其道行之,就是整体是正态分布,给出底均价,那就是十元店。美国的2家十元店叫dollargeneral和dollertree都进入世界500强了,反观这些最低五折的企业有多少能进入世界500强?坚持均值的长期主义才会胜利。

    18
  • mtfelix
    2021-08-01
    熵越大,越均匀,信息量越小吧?

    作者回复: 你说的这个,很多小伙伴都很晕的,其实是把时间状态搞混了,具体可以参考Daya mining这个概念的提出者Han Jiawei老师Data Mining这本书的概念。简单来说: 概率与信息熵成反比关系(未发生), 信息熵与信息量成正比关系(已发生)。

    19
  • Flychen
    2021-08-06
    数据分析不是工具,而是要深入业务,有业务结果。 非常有启发的一句话
    15
  • Aaron
    2021-08-02
    基金定价100,第一年末跌到90,第二年末涨回100,结果基金描述和我说,2年的平均增长率是正的…

    作者回复: 哈哈,的确,数字是争取的,但是数字的逻辑是错误的

    13
  • 芳菲
    2021-07-29
    商家经常打着广告说本店59元起,进去一看只有一件商品是59,其余商品可能在500以上;卖房也是,说188万起,实际只有一套,其他都在三五百万甚至更高;

    作者回复: 哈哈,是的,不过这个其实是比较简单的数据运用方法,会造成很多虚假繁荣,转化率不高。有效的应该是设定价格锚点,转化有效流量。

    9
  • 谢晶
    2021-08-02
    典型的是辛普森悖论,从整体占比和分组占比的角度,可以得出相反的结果

    作者回复: 是的,这个在第一章有详细的讨论,赢得每场战役,不一定可以赢的整场战争

    共 2 条评论
    7
  • MerryJI
    2021-08-02
    分享一下会骗人的数据。KPI有人完成好,有人完成不好,只体现占比,会被呵斥,毕竟完成目标不同,细节不过多描述,需要报表全面。骗人的数据也和不熟悉业务这个坑相关,很多时候做的数据成为了背锅,业务人员看到数据不懂业务,分析结果没有参考意义,领导只说自己想,招你还要教?这时候多和实际业务接触,自己闷头干吧……没有指点的方向,数据分析很难找到价值。

    作者回复: 是的,这个在如果做一次有效的数据分析那节课会涉及到一部分,数据分析不是工具,而是要深入业务,有业务结果

    5
  • Reeves
    2021-09-14
    电商套路,满减,折扣(先涨再折),大数据杀熟~
    5
  • AcE
    2021-08-18
    老师,听了您的课受益匪浅,想更深入的了解数据思维,您有没有推荐的书籍呢?

    作者回复: 后面的课程中介绍一些,我也在筹划成书

    3
  • Jove
    2021-08-02
    《黑天鹅》里的火鸡思维

    作者回复: 是,其实也是大数定律的一个表现,整体数字不够大的时候,看上去的规律其实都是偶然而已。

    3
  • 小呀么小二郎
    2021-07-31
    希望自己学完之后能用数据思维来观察周围的事物,加油!

    作者回复: 加油!!更是避免自己进去数据误区。

    3
  • 冯莹莹
    2021-09-10
    房地产开发商通过变相拉低整栋楼的均价来达到政府的房地产备案预售的要求,开发上通过挖地下增加地下建筑面积(地下单价低,地上单价高),平均备案价3w,可能地上是4W+,地下1W以内;摔!

    作者回复: 哈哈哈,的确,做生意不懂数据分析怎么行

    2
  • 公号-技术夜未眠
    2021-07-30
    基于科学的方法对数据进行分析,形成有效决策指导实际工作与生活。同时,可以规避很多的认知偏见。

    作者回复: 是的,欢迎也分享给他人,一起进步

    2
  • truth_hunter
    2021-11-15
    生活中大部分人是靠直觉去做判断,遇到事情的时候算一算往往能够让我们规避很多的陷阱。
    1
  • SVV
    2021-09-09
    想到两个关于数据解释的有趣现象,一是商家的花样营销,比如第二件半价,让人感受上是半价优惠,其实只是七五折;二是学历分布,有的人说“硕士遍地走,学士不如狗”,其实是忽略了总体占比和地区分布,比如在一线城市的核心区,只看周围确实很容易有这种误解。

    作者回复: 哈哈,是的!例子很好,多思考,不要被数据所欺骗

    共 2 条评论
    1
  • Geek_2517a5
    2021-09-09
    性能测试使用均值作为度量方法,掩盖了很多问题,使用中位数来度量会好不少。

    作者回复: 是,不过在考分例子里中位数也不行,还是看数据分布。

    1
  • 进化菌
    2021-07-31
    万物皆数据,小到数量的计算,大到宏观科学的分析。 我们要培养的是数据背后的思维,多一分思考,决策更有可能优选,使得利益更大化~

    作者回复: 是的,要透过现象看本质

    1
  • Geek_34ee39
    2021-07-30
    叔叔,如果英科方面能力差劲,应该怎么补救

    作者回复: 英科是啥

    1
  • Geek_fbe1ea
    2021-07-30
    哥,你的课程给迷茫的突然又有了一股劲。培养一个时时思考数据规律的习惯,加油

    作者回复: 一起加油

    1
  • 马妙然
    2022-08-25 来自北京
    工作中遇到最大的问题是,人们会通过预先的假设,去提取能支撑假设的数据,最后验证预先的假设。把数据用成方案、业务的论据。非常危险。
    共 1 条评论