04 | 随机对照试验:章鱼保罗真的是“预言帝”么?
04 | 随机对照试验:章鱼保罗真的是“预言帝”么?
讲述:郭炜
时长15:24大小14.08M
你认为的随机其实都是“伪随机”
随机对照试验帮助你去伪存真
幸存者偏差并不是随机对照试验
总结
思考题
赞 50
提建议
精选留言(53)
- 回会灰2021-08-18知乎上人均年薪百万就是典型的幸存者偏差吧?
作者回复: 是,积极发言的人都是有成就的人
共 2 条评论31 - 那时刻2021-08-04请问老师,文中提到随机分组遵从双盲设计的前提条件,也就是研究者和受试者双方均无法知晓分组结果。在女士品茶的实验中,费希尔是研究者,而受试者是女士,例子中貌似费希尔是知道分组结果的?我的理解是他知道哪些奶茶先放红茶?不知哪里哪里有误解。
作者回复: 你说的对! 这个实验中的确有这个瑕疵,它是第一次起源,所以还没有后续那么严格的要求,是逐步发展到现在很科学定义的。
共 2 条评论17 - 芳菲2021-08-06“中考有50%的人上不了高中”很多人看到这个结论都觉得不可思议,说现在上高中怎么这么难了,不像自己以前大家都能上高中。 这其实就是幸存者偏差,高中升学率一直是差不多50%,只是因为身边的人都上了就误以为原来升学率高,现在低。
作者回复: 是的,如何解读数据,其实更重要
11 - Geek_7ef8cd2021-10-15在《原因与结果的经济学》这本书中有系统的了解随机对照试验的出现背景和使用目的。面对一件事情的发生,人类总想要探究这件事发生的原因。于是人们基于推理判断认为可能是某个原因A导致了B事件的发生,如果有一个平行时空,那我们在另一个平行时空中观察一下,如果没有A,B就不会发生,那么可以说明A是B事件发生的原因。但是,现实世界没有平行时空,怎么创造与事实相反的反事实呢?方案就是创造随机对照试验,随机分为两个组,一个实验组,一个对照组。实验组就是模拟平行时空的“反事实”。重要的在于,如何科学分组,让两个组内的样本水平在各维度一致。展开
作者回复: 补充的好!
8 - Flychen2021-08-07我们村二狗子大学毕业找不到工作,去工地搬砖了个,所以上学无用 用单个个体得出某结论,非常荒谬,这个过程忽略了沉默的数据 还有女博士,前几年似乎被黑的也挺狠展开
作者回复: 是的,新闻就是为了博取眼球,不仔细鉴别的话,大家就落入数据陷阱当中了。
8 - 轮子制造者2021-08-21事实上,“沉默的数据”永远要比实验数据更多,一定意义上来说我们得到的结论都存在一定的“偏差”,也就是通俗意义上讲的“认知局限”,只不过随着大数据的不断发展,这种局限性和偏差越来越小。
作者回复: 是的!
7 - 钱鹏 Allen2021-08-14为什么大美女的男朋友都很丑?标题下一通分析,其实该选题就选择了一个大家都很诧异的点,因为我们倾向俊男靓女。 为什么考试没过?为什么他拿到offer了?这些问题不是好奇问题的答案,更多是想宣泄情绪。 用数据分析自己的结果,我们更能理性从容面对结果。展开
作者回复: 是的!
7 - 微秒2021-08-04老师,我们以奶茶实验作为例子,这里的随机性我理解是通过随机排列和单次概率为50%构成的,但是对照组体现在哪里呢??
作者回复: 对照组是那些区分不出来奶茶的妇人们,这个实验瑕疵是实验者可能知道结果,不算双盲,不过作为提出思路的鼻祖,规则都是后期完善的
共 2 条评论7 - Reeves2021-09-26随机对照受限数据采集的样本数,但是抛开这一点,我们采集到的数据的真实性或有效性也很关键,特别是在做调研或访谈的时候,往往人们表现出来的东西都是自我过滤过的,这是心理学层面上的了,我们一直说数据不会说谎,但是数据可能本身就是错误的。这种现象怎么处理呢?我个人比较倾向于从行为上去获取数据而不是从语言表述上。
作者回复: 同意!不要看别人说了什么,而要看对方做了什么
5 - geigei2021-10-26比尔盖茨、扎克伯格都是大学没毕业,然后创业成功的 很多大学生想沿着他们的路径走然后达到人生巅峰 哈哈 殊不知有多少大学肄业的人最后没出来呀4
- 不再是入门水平pytho...2021-08-23记得大学毕业毕业论文答辩的时候,我做的是问卷调查的形式,答辩那天老师问我,你如何保证你做的问卷是随机的有效的?当时我的论文是关于校园贷的一个话题,我说我随机在不同宿舍楼、图书馆发放问卷,结合老师这次讲的内容,我想了想,当时我的问卷能够完整给出“答案”,形成“有效”样本的数据其实都是伪随机的,因为完整填问卷的就是可能对网贷有了解的,没有了解的同学可能并没有怎么好好填。
作者回复: 是的,准确调研问卷调查是一个学问,心理学,统计学和业务综合才可以做的很优秀,否则就不会走这么多调研公司存在了
4 - mtfelix2021-08-09工作中分析调查问卷、客服数据,这些都可能是某种幸存者偏差,沉默的数据应该更有用。但是,沉默数据无法获取,怎么才能做到客观全面的分析呢?
作者回复: 在抽样那一节课有一些介绍,数据获取主要是成本问题,成本足够情况下,是有办法获取的。沉默用户访谈,拜访,离职员工和流失用户访谈都是办法
3 - Geek_83c4342022-04-23热微博搜也是幸存者偏差,我们能看到的都是别人想要给我们看得2
- Geek_cad89f2022-04-21幸存者偏差和小数陷阱有什么区别呢共 1 条评论2
- Jeff2022-04-14看到自己毕业的同学都是人生赢家,其实是因为来参加同学会的都是取得了一些不错的成绩的,还有许多没那么如意的同学已经不参加同学会了,这也是一种幸存者偏差。2
- xHua2021-12-23我选了15 一直都喜欢这个数字
作者回复: 😄,这么多读者你是第一个选中的人
2 - gogocx1232021-11-28郭老师看罗辑思维吗?记得上大学的时候,很喜欢罗振宇,几乎每期都会看,觉得他的很多的理论与正常的不同。后来在网上看到有个《桃源论道》的小伙子反驳罗的理论,说罗的很多观念都是先给结论,然后给出一堆例子来进行论证,后来再翻罗的视频,就觉得很有道理。这种跟 上面的幸存者偏差很类似啊,其实就是研究方法上出了问题,从现象推到本质,而非先下结论,然后拿所谓的证据来证明自己的观点
作者回复: 哈哈,有时候规律本身很难把握的
共 2 条评论2 - 小蜗2021-08-04随机对照试验的构造,类似计量经济学中的因果推断,其中,比较典型的方法是双重差分模型did,比如:如何确定国家实施”海洋强国”战略以来,对我国海洋科技创新水平影响的测度2
- 蓝色调2021-11-01在工资方面,我们往往会关注到比自己更高的人群,产生的印象比少于自己的更久,所以知乎给人的感觉是人人百万,再加上只有薪水高的才会发声。
作者回复: 是的!好例子!
1 - bkkkkkk2021-10-28我是应届生,最近在找工作,看薪酬的时候发现网上大多数的人月薪都在1万5以上,可是自己却很难找到月薪这么高的工作,这也是幸存者偏差了
作者回复: 看你自己的学校背景,可以搜一个小程序offershow看下别人的情况和背景,就知道自己是如何的了。
1 - Tracy2021-09-23网上搜索目前是否买房,说要买的大部分是房产中介😃1
- AnMin2021-08-16A/B Test很重要,可以很好的规避一些由于幸存者偏差造成的假现象,学到了共 1 条评论1
- Geek_0c37cd2021-08-06不知道这种偏差算不算。比如通过地铁上下班高峰人口年龄结构判断中国老龄化或生产能力 ୧⍢⃝୨
作者回复: 有偏差,有人公交,有人开车,更多的人是体力劳动者,这个抽样场景有问题,可以去看下抽样那一章
1 - 海林Lin2021-08-04热衷买彩票的人受幸存者偏差的影响。经常和身边人说彩票不值得买,得到的是答复大多是花点小钱万一中了呢?更有把身边中大奖的事例挂在嘴边的人
作者回复: 可以用散点图计算一下累计投入和回报率,你会发现还不如把钱存银行…
1 - Geek_0632fe2023-01-10 来自中国台湾這一二年有人靠航運投資一二個月就身價上仟萬上億,也是倖存者偏差,能連續投資十次股票買賣還能賺錢的,才是真正有實力
- Geek_1dedbd2022-12-12 来自四川我真的想了15
- 守破离2022-08-25 来自广东通过研究成功的产品找到产品成功的规律,是一种在职场中常见的幸存者偏差
- 陈增荣2022-08-13 来自广东马云创立阿里巴巴,因为马老师不是学霸,就是认为学历都互联网创业不重要,这是也属于幸存者偏差吧!比如小米雷军、百度李彦宏、京东刘强东、拼多多黄争、腾讯小马哥每个都是学霸
- Geek_90016a2022-08-05 来自广东我司是搞婚恋社交的,网上看到的负面评论居多,然我们的红娘也成就了很多佳缘(这些“成了的”不愿意分享自己在我们平台成功找到对象的经历,而“没成的”的很乐意在网上抨击说我们服务不行)
- 数据分析星球2022-07-28现在看来,所有的调查问卷都存在幸存者偏差的问题,如何做好随机,收集到真实的数据,是分析之前更为重要的事情。
- Kate2022-05-03发小们都考上了大学,大学同学也来自各地,因此我觉着上大学是正常的人生经历,而大家都是接受义务教育,至于能上多好的大学,更重要的是个人努力。 可是看了老师的文章,我在想上大学是否也是幸存者偏差,教育水平可能还是有很大差距的,我只是从能上大学的那波人去预估整体了。 可能成功的样子都差不多,失败的样子却各种各样。
- 小Mae2022-04-18出现顶部信号的个股结果创新高了,这支个股就是幸存者偏差,也就是小概率事件。绝大部分出现顶部信号时回调是相当厉害的,也就是大概率事件。 不要拿小概率幸存者事件去做错误的决定。
- 刚毅坚卓2022-04-15考试的时候一道压轴选择题做出来的概率很低,然而有些人蒙对了
- 陈浩2022-04-06然让我想起来被数学概率支配的恐惧!!第n次重复事件发生的概率与第一次发生的概率相同
- 初级勇士Lv.12021-12-23我想到的是,我们人类认为其他星球上也一定存在着生物存在着文明,是不是也是一种“我们已经存在文明”了的幸存者偏差。
作者回复: 说得好?宇宙黑暗森林法则,我们是不是唯一智慧真的的不知道哦
- 石云升2021-12-12还想到一个,我们经常看到xxx出轨导致离婚,就以为出轨是离婚的最大的原因,实际上,大部分离婚原因是家庭生活细节。
作者回复: 根本上是价值观和家庭观没有磨合好,哈哈
- 石云升2021-12-12我们经常看到创业者分享成功心得,比如京东、亚马逊创始人都说到,要坚持做自己认为正确的事。但这里有个假设前提,你怎么知道自己坚持的是正确的?只不过是事后总结罢了。
作者回复: 其实,相对于成功,我更愿意听失败经验的分享,那才是干货,成功总有它的偶然和必然,你所面临的情况可能不一样。
- 李永静2021-12-08读书无用论,因为有这种想法的人,看到的只是周围没有通过教育获取成功的人,看不到真正通过教育走出来的人。
- CHOOSE2021-12-01老师一定是看了《女士品茶》吧哈哈哈哈
- 敏🌸2021-11-07最近做一个关于有奖推荐活动的问卷调研,推荐指数4.5左右,满分5分,跟我对行业的认知大相径庭,本来计划用问卷驳倒这个路径设计,结果把自己滑倒了。现在想想应该用幸存者偏差来解释这个结论。
- 六六2021-11-07请问老师,随机试验为什么要设置成双盲?只要被试者不知道分组结果不行么?
作者回复: 观察者带着有色眼镜看问题,疑人盗斧的故事听过吧
- 卢梦圆2021-10-27别忽略了“沉默的数据”
- 小菜狗2021-10-23假设我的目标就是找出年轻人的主要消费场景,发问卷给年轻人,虽然接受问卷填写的人也存在幸存者偏差,但这时候形成的结论也是可靠的,对吗?
作者回复: 抽样方法可以在后面的课程中学到
- 贾贾2021-10-21巴菲特应该怎么更好地解释呀?
作者回复: 他履行的大数定律,最近他出了一本书《snow ball》可以去看看
- 贾贾2021-10-21章鱼保罗是大数定律里诸多样本中的“小数陷阱”吧?共 1 条评论
- 80分2021-09-13辨析了「随机对照试验」和「幸存者偏差」。幸存者偏差本质上是因为挑选了样本,已经不算随机对照试验了。 这段话没看明白:“所以我们要验证章鱼保罗能力的话,我们应该从一开始就把它安置在一个没有任何信号干扰的环境里让它连续预测十次,这样它的成功概率是 1%,我们还可以提高预测次数来检测它是不是真的有那么神奇的预测能力。” 请问这个1%是怎么计算出来的?连续预测10次,每次都正确,不应该是1/2的10次方吗?展开
- SVV2021-09-10想到最深刻的例子是大家对社会事件的看法,有的人会感叹“社会越来越乱”,其实就是一种幸存者偏差,曾经很多事情因为信息传播不便,加上有的被恶意隐瞒,最终被大家知晓的并不多;现在无论是信息传播还是社会环境都有了很多改善,所以一丁点风吹草动都很容易浮现到全国人民的眼前,大家对这类内容更为敏感,也就造成了“老是发生坏事”的错觉,而忽略了整体上的事件发生数量、频率的改变。
作者回复: 哈哈,和新闻报道和微博热搜有比较大的关系
- 一2021-08-28越来越感觉是在上统计课了🤭大学时候统计听不懂,各种蹭听学了三遍,毕业后又去别的学校学了一遍。感觉很好,但是不知道怎么应用到生活和工作中。这几年数据分析被鼓吹的很厉害的样子,感觉自己差了十万八千里。听完这几节课,突然就很有信心了。赶紧复习梳理起来,跟生活场景结合起来,也能去职场吹一波了🤣
作者回复: 是的,中国教育教的都是理论,其实知识要学以致用,后面还有算法课呢,持续提高,哈哈哈
- 脆脆脆宝宝🐣2021-08-25为什么abtest能规避偏差呢 比如一个产品的满意度问卷 怎么能够有效 随机呢 而不是感兴趣的人才填写
作者回复: 好问题,其实只靠互联网调查问卷一定程度是偏颇的,所以真正的调研公司是有一套方法,包括主动、被动,线上线下电话综合调研访谈,所以不要被NPS骗了。
- TeddyPM2021-08-17上节课不是说期望值等于嗯,心里想想法乘以概率吗?那大家希望有赌神的存在,那是不是赌神存在的可能性就有了呢?
作者回复: 根据大数据定律,人生命太短暂了,赌神概率几乎为0,再如何期望也不行啊
共 2 条评论 - kingcall2021-08-10章鱼保罗 就是忽略了沉默的数据是吧
作者回复: 是的😊
- 小雨2021-08-05想到一个知道算不算,疫情在年龄大的群体更容易感染,如果从年纪上统计,数量多,得出的结论,更应该关注的是年龄大群体,为什么感染的多,可能因为自身免疫力差,是否也有可能,因为防护不到位,不听相关人员指引操作,不愿意正确佩戴口罩,不愿意居家隔离等因素,导致只根据年龄划分,被感染的概率,是不准确的
作者回复: 这个还不算,因为这个是整体统计的,尽管你说的原因是存在的,但是从结果来看,不是幸存者倒推的,而是整体均匀统计的。
- 进化菌2021-08-04奶茶那里的随机对照试验有点难理解,都能猜对是偶然,而且实验使用的是伪随机~ 幸存者偏差,想起的是别人眼中的“电竞“赚钱,却不知道活下来的人万里挑一。
作者回复: 嗯,的确,奶茶实验作为起源有很多还没完善的地方。幸存者偏差,明星也是,赌神其实也是,不要想着侥幸,踏踏实实的生活