极客时间已完结课程限时免费阅读

35 | 说说信息流的前世今生

35 | 说说信息流的前世今生-极客时间

35 | 说说信息流的前世今生

讲述:黄洲君

时长09:38大小5.52M

信息流,就是 Feed,包括社交动态信息流,也有图文资讯信息流,短视频信息流。
在前面说过,推荐系统是一种注意力存储器,注意力是信息经济时代的稀缺商品,广告商向平台方购买注意力,平台方把存储的注意力分一点给广告商,然后通过推荐系统收集更多注意力补充回来。
在今天,最厉害的注意力存储器就是信息流,尤其是个性化信息流,也叫做兴趣 Feed,这也是推荐系统的一种。

前世今生

说信息流,就不得不提到 NewsFeed。2004 年,Facebook 问世,2006 年,信息流鼻祖 NewsFeed 横空出世,经过十多年,NewsFeed 已经是日收入几千万美金的现金大牛。
在 NewsFeed 上线前,经历过两个抗议阶段,第一个是把新鲜事公布出来,原先的新鲜事被大家认为是隐私,在时间线中呈现出来被好友看见不妥,而事实是,每个人在意的除了自己的隐私被公布,更在意的是朋友的八卦,数据表明新鲜事被公布后,用户活跃度大幅上涨。
第二个就是 NewsFeed 上线,用户广泛抗议,原来按照时间先后顺序阅读新鲜事,现在却按照重要程度阅读,非常不习惯,然而数据表明,用户互动行为再一次大幅度提高。
这些年来,NewsFeed 有数不清的改进,甚至每天线上会同时部署很多算法版本进行 AB 测试。后来的故事大家都知道了,Facebook 上市,股价逐年上涨。
NewsFeed 的成功,验证了几个常识:
数据驱动比舆论驱动靠谱,别听人们嘴上是怎么说的,只看人们是如何行动的;
窥探隐私,向群体靠拢,害怕孤单是普遍人性,把新鲜事公开这件事验证了这一点;
注意力非常有限,用推荐系统的方法更好地储存注意力,基于兴趣的信息流验证了这一点。
后来,Twitter,微博,Instagram,老牌的时间线信息流方式如今都换成了按照兴趣筛选内容,原因都是信息泛滥,用户错过的信息量越来越多,注意力耗散很多,无法将耗散的注意力变现成了这些平台最大的痛。
今天,搜索公司 Google、百度,都已经押注了信息流,更不说那辆行驶在注意力收割航道里的短视频新兴巨轮。
这些公司,尤其是其中的上市公司,在财报里也会提及信息流,可以说,信息流在今天已经是红透了半边天。

配套设施

信息流是一个低衰减的注意力存储器,但是光有信息流是不完整的,最大的问题可能有两个:
内容源不足,无法形成信息过载,注意力就不会稀缺,注意力是无法待价而沽的商品;
在注意力变成稀缺的事物后,存储的注意力无法变现,反哺平台自身。
针对这两个问题,完整的信息流产品还需要配套设施。以 NewsFeed 为例,讲讲信息流的配套设施。

1. 内容源

内容源是注意力的重要间接影响因素。“内容哪里来”是信息流要不断思考的问题,对于 NewsFeed 来说,就是社交关系上的人发布新鲜事。
NewsFeed 存在的前提是要依赖用户建立大量的社交联系,这样才会出现信息过载,因此 NewsFeed 的一个重要的配套设施就是“你可能感兴趣的人”推荐系统。
这是一个我们在产品形式上比较熟悉的推荐系统,它是一套大规模矩阵分解算法,在前面的专栏已经专门讲过,这套推荐系统希望用户和用户,用户和 App、公共主页等都建立起大量的连接。
建立起连接,相当于变相地增加了内容源,这些用户发布的新鲜事,App 产生的内容,公共主页发布的帖子,都会通过这些连接流进用户的个人信息流。
社交信息流中,内容源依赖于社交关系的数量。而图文资讯信息流,则更多依赖爬虫技术,“不生产内容,只是内容的搬运工”。
依赖爬虫的信息流内容源,质量非常不可控,会有涉黄、涉政、涉暴力等敏感内容,甄别工作量非常巨大,而且一旦控制不好就是社会事件,代价惨重,这一点在 2018 年,你一定感受很深。
内容源是信息流的一种重要基础设施,要想尽办法建设好。内容源应该考虑下面几种。
质量:虽然群体喜欢消费低质量的内容,便宜商品,但是一旦出现敏感内容, 不合格的商品等,代价还是很高昂。
多样性:信息只有多样了才有信息量,有了多样性才能满足更多的用户,才能在存储海量注意力时不衰减。
数量:数量自不必说,推荐系统解决信息过载问题,没有信息过载问题怎么办呢?就是先制造信息过载问题,要制造信息过载,信息的数量就要有保障。

2. 广告系统

NewsFeed 还有另一个配套设施,也是它为什么每天能吸金几千万刀的原因:那就是广告系统。
Facebook 的广告形态多样。
Suggested Page (你可能喜欢的公众页)
Page Post (公众号帖子推广)
Suggested App (你可能喜欢的应用)
Video Ads (视频广告)
广告主花钱购买信息流存储的注意力,俗称信息流变现。实际上就是信息流产品供应注意力,广告主消费注意力。注意这枚硬币的另一面:广告主供应的什么,用户是否消费了,则是另外一套看待角度。
以前,Facebook 鼓励商业机构花钱投广告增加粉丝,彼时的 NewsFeed 算法允许随意发广告,看上去就是公共主页发布了新鲜事。
这一阶段对应着增加用户和内容源之间的连接阶段,是一个非常必要的步骤。看上去广告主增加了自己的粉丝,用户增加了内容源,而本质上则是让注意力买主先看到他种草的商品,这个阶段只让广告主每天摸摸自己种草的商品,并不是真的给他。
直到后来,平台方开始严格限制商业广告与普通用户触达,不只是 Facebook,任何的信息流平台,在广告主吸引了足够粉丝之后,都会果断限制广告无节制地触达用户。种草的商品突然提价,广告主就只能剁手买买买,这就是广告系统了。
跟据某个专门做 NewsFeed 推广的公司追踪结果,1000 个公共主页的 50000 条内容以原生方式触达用户的比例,从 2012 年 16% 降低到了 2014 年的 6.51%,降了一倍还多。
当然也可能是因为用户平均关注的公共主页增多了,而本质上的原因就是,注意力市场开市了。
在注意力这边,存储注意力要做的事就是基于兴趣筛选信息流,重新排序展示,这样的好处就是用户不会错过自己感兴趣的,而本质上就是留住注意力,不要衰减。在注意力购买方这边,通过广告系统,大家去购买自己看中的注意力。
信息流,看上去就是这么一个简单的商业逻辑。广告主这边一开始和信息流平台方有非常甜蜜的日子,直到要花钱购买自己帮忙存储的注意力时,就会有怨言了。
曾经就有广告主对 Facebook 抗议道:那你干脆不要干涉 NewsFeed 排序啊,按时间线自然展示,用户错过就错过,大家都公平。对此 Facebook 的解释则是:数据显示,重排序后的 NewsFeed 可以让用户阅读积极性提高很多。这句话的意思是:这样做才能存储注意力啊。
关于到底要不要重排序的争吵,我们要看清楚,双方都是商业机构:一边是要消费注意力,一边在销售注意力。
这本身就是买卖嘛,不要谈什么情怀,商业社会永远是逐利的,逐利的手段就是制造信息不对称,并且在制造过程中不断提高效率和降低成本。
显然,“大家一起穷,完全拼人品”的时间线,不符合基本商业逻辑,信息流才符合商业逻辑。
世界上最遥远的距离就是:手握大把粉丝,却不能随心所欲地曝光自己的产品。

总结和展望

具体信息流会怎么发展,我们无法预测,但是可以肯定的有三点:
信息流是推荐系统在商业上最成功的应用;
完全依赖数据驱动的信息流会面临黑天鹅事件,所以人和算法协同进化的信息流会是最有生命力的;
数量上,注意力已被大厂囤在自己了手中,那么下一步要关注的是注意力的质量,这是信息流平台方的商品,毕竟广告主购买了注意力后,发现是地摊货,生意也不会长久的。
今天和你聊了信息流前世今生和未来,其中有很多我的个人观点,不一定对,咱们可以互相切磋。感谢你的收听,我们下期再见。
分享给需要的人,Ta购买本课程,你将得18
生成海报并分享

赞 3

提建议

上一篇
34 | 推荐系统在互联网产品商业链条中的地位
下一篇
36 | 组建推荐团队及工程师的学习路径
unpreview
 写留言

精选留言(12)

  • shangqiu86
    2019-05-09
    讲feed流老师引入了注意力的定义,感觉很新颖也很贴切,老师能否在书里面介绍下今日头条的算法,据我所知,今日头条更多的是标签匹配,做了很多维度的标签匹配,同时时间段也划分的很细,形成网格式的多样化推荐,基于标签的推荐,老师好像没有涉及呢

    作者回复: 不会妄议未公开的做法。

    4
  • 大哥
    2018-05-24
    目前公开的信息流的技术资料可能要数曹欢欢的ppt了,邢老师能否给出一些技术的干货呢😊 ?
    5
  • neko
    2019-06-21
    老师,我不太理解这句话,请问能稍稍解释一下吗?谢谢! ”种草的商品突然提价,广告主就只能剁手买买买,这就是广告系统了。”
    1
  • 田佳伟
    2019-12-09
    老师您好,我们公司做的就是类似于头条的资讯app,feed流就是简单的指数排序加过滤用户已读文章,现在面临一个问题:现在用的是联表查询来实现已读文章过滤,给数据库造成了很大压力,请问有没有好的过滤文章的方案呢?
    共 1 条评论
  • 帅帅
    2018-09-25
    突然意识到我们要做一个信息流,内容只有几百个几千个,远远没有信息过载; 那好,我可以先放弃召回阶段,只做一个CTR排序好了;
  • @lala0124
    2018-06-29
    老师觉得信息流这种商业模式能够存在多久?

    作者回复: 不好乱说。

  • @lala0124
    2018-06-29
    老师觉得信息流这种商业模式能够存在多久呢?
  • 好球
    2018-05-25
    老师愿意过来一起做推荐不?
  • 惜心(伟祺)
    2018-05-24
    老师可以 分享一些推荐系统常用开源工具嘛
  • 大哥
    2018-05-24
    最成功的案例,不应该是电商如阿里亚马逊吗?
  • 张凯江
    2018-05-23
    到头了吗。不会吧
  • 张哲
    2018-05-23
    感谢老师!