Josherich's Blog

HOME SHORTS TRANSCRIPT SOFTWARE DRAWING ABOUT RSS

风霁:优化体验,还是塑造现实?平台推荐算法探秘

10 Jan 2026

风霁:优化体验,还是塑造现实?平台推荐算法探秘

今天的嘉宾风霁老师是一位资深的推荐算法工程师。风霁在国内的几家大厂的推荐算法场景有八年的研究工作经验。他参与了推荐算法的基础模型复杂化的整个进程,从最早的简单机器学习、深度学习,到目前大模型相关的技术在推荐场景下的各种结合应用,涉及到了用户体验层面的诸多问题,比如信息检索、社区内容生态、流量公平性等等。

和风霁的这次对话远远超出了我个人的知识范围,但是我和汉阳还是鼓起勇气追问了很多问题,包括技术的事实层面,也包括了一些科技和文化领域的交叉。风霁老师给我最大的触动在于他解释和分析问题时所采取的一种非常非常注重数据规模和结构的视角

如果你在听我们提出问题的时候,不妨可以暂停一下,想一想你自己的想法,然后再继续听他的回答,你可能会觉得非常非常不同。这种嘉宾带来的陌生视角,正是我们做这场节目非常享受也非常向往的事情。

我们都生活在这个算法驱动的信息时代,算法塑造我们的现实,它远远不只是一个工程问题。希望这期节目能够给你带来多一点的了解和思考。


风济老师今天能邀请到你,是我俩终于满足了一个很长时间的愿望。我们想找这个算法工程师来聊一期,就是关于今天社会上大家都特别关心的这么一个很风口的一个事情。但是我们发现这些工程师都被公司保护得太好了,这个事情本身也太敏感了,感觉是不是利益牵涉太大了。一直没有找到一个能够比较放开的、比较轻松的、能聊的对象。

所以今天能够请到您,我俩都特别高兴。

“对,这是我俩上来服务天地的时候就想聊的话题。”

“对对对,从第一期就想聊的话题。”

因为我是觉得算法工程师尤其是推荐算法,这个并不是一个古典的程序员或者工程师的岗位。它是一个在某一个时间点才慢慢出现的。尤其是推荐算法,作为内容分发的一个支配性的、特别核心的东西,它的历史时间并不是特别长。您也在不止一家公司的里面干过,能不能跟我们讲讲就是你自己的从业经验,以及你伴随着的这个行业本身的一个变化,可以大概给我们还原一下?


“就是从我的视角我觉得它本质就是在做信息检索。”

是,包括我们推荐相关的论文其实发表在信息检索会议上。所以说其实我觉得我们做的事情并不特殊,因为互联网本身就是为了信息检索而诞生的。

从第一代的推荐,其实定义的话,可能是25年前。当时的推荐业务大部分都是编辑做的,随着门户网站的诞生,中间可能会有一些基于规则做的匹配,比如说”我看了这个,我要推这个”,其实都是人工定义的规则。大概25年前,但我没有参与过这个阶段。

大约在2005年到第一二年左右,深度学习、机器学习开始有一波热潮。这波热潮之后,推荐领域也有一些应用,比如网易、亚马逊,当时用的是GBDT(树模型)、神经网络,包括线性回归、矩阵分解,做一些比较初级的推荐领域的工作。这是大家第一次开始个性化推荐,比如”猜你想看”等。

我记得那个时间点,大部分人还不明白,更精准的匹配这个事可以成为一个互联网公司的特别核心能力。


“但是当时我看人工智能发展史的材料时看到的一个事实:ImageNet并不是Hinton拿过的第一个震惊世人的奖项,它早在那之前几年就在Netflix的算法比赛里拿过奖。”

是,是,是。虽然它比第二名可能高一点点,是用他的玻尔兹曼机,但那个已经是Netflix每年拿出奖金让全世界高手比拼的比赛。

Netflix这个比赛对于推荐的助力还是蛮大的,里面诞生过一些相当于经典算法。从12年开始到16年,这段时间其实是传统技术和机器学习方法应用于推荐领域的阶段。


16年,谷歌发表了一篇论文名为Wide and Deep,把神经网络应用在YouTube的推荐中。Wide and Deep是”宽”和”深”的意思:

  • Wide:逻辑回归,12年到16年间推荐场景常用的简单算法,主要靠复杂特征组合来挖掘信号。
  • Deep:深度神经网络。

当时百度可能有几十号人手工挖特征做特征组合,这个模型虽然简单,但通过挖复杂信号让推荐精准度提升。

但这种方法显然不是长期解决方案,所以谷歌的Wide and Deep结合简单模型和神经网络。


我大概在17年进入推荐领域,18年时,我主导了神经网络在推荐上的应用。可以说是开荒的工作。更早的话,推荐领域多用挖信号的方法:

  • 喜欢看的东西作为用户特征
  • 视频的品类做交叉匹配
  • 匹配上了就是一个特征,匹配不上是另一个特征

推荐是技术最容易变现的场景,电商推荐、搜索广告,都依赖推荐系统。推荐和广告在业务上的影响力,某种逻辑上可能比广告更多,因为搜索是低频需求。


大概在18、19年,做视频迭代时,基本只优化一个目标–CTR(点击率)。但上线神经网络后,点击率会涨10%到20%,同时也放大了一些标题党、封面党的问题。

所以,大约18年开始把时长、点赞、生态治理等多目标融入推荐系统,也做了包括封面党、标题党、软色情等内容的打压。

那时候我们已经开始用类似于今天大模型里面的MOE(多专家模型),但在18、19年就是在推荐上开始布局这些多目标优化。


你经历过的事是:

  • 一开始没人做
  • 你是第一批做的人
  • 做完后指标飞涨,整个公司都为之震动
  • 工作价值巨大

对团队来说,这是非常振奋人心的时刻。


推荐对业务非常重要。很多公司把它看作推荐器,随着业务快速增长,每年业务翻倍,涨10%只是其中一部分。但对于个人和团队来说,是非常振奋和开心的事情。


推荐对业务非常重要。很多公司把它看作增长引擎,随着业务快速增长,每年业务翻倍,涨10%只是其中一部分。但对于个人和团队来说,是非常振奋和开心的事情。


“我听风济聊这个事,我俩的职业经历有部分重合。我也做过CVE,15、16年做过推荐算法,但时间很短。”

很简单,就是给东西打标签,看相似内容,做简单推荐。比如我做剧类推荐,给作品打标签,推相似内容,效果其实没那么好。


但后来你会意识到,推荐算法当时来的多猛烈以及重要。因为当时互联网用户从电脑转向移动互联网,很多原本不上的网用户加入,掩盖了不同事情间权重的区别。感觉做什么都是有效的,但其实真work的关键只有几个,推荐算法是其中之一。


“你看现在就没有了几个东西:

  • 最早上网时论坛首页是人工推荐,编辑能拿内容放首页,权力巨大。
  • 现在05后小孩可能没见过这个,没人做人工推荐了。
  • 后来新闻后端火了,会有让人烦的纯标题党,这种事以前很多,现在刷抖音、小红书时这种事很少见。

这就是个例子,说明推荐改变了内容分发的形态。


本质来说,推荐是信息检索,信息检索的产品形态和技术发生了翻天覆地的变化。比如现在一天能看的视频,如果没有这个技术,可能花一百倍时间也找不到目标视频。


我对那段时间印象深刻,当时我在创业,感觉字节跳动仿佛是”middle of nowhere”中诞生的一个巨大生物,出来之前没人觉得它有做的价值。腾讯新闻和网易新闻都很火,网易新闻还有跟帖功能。字节跳动出现时,周围创业者都觉得没意义。

但忽然间,它彻底赢了,其他产品都没了。


“我反过来采访你:

  • 你觉得当时你们理解的新闻推荐和头条做的有什么区别?
  • 为什么他们赢了,而你们判断他们是不行的呢?”

实际上,我后来做自动驾驶,没有一直做推荐但经常跟相关人员聊天。我们做自动驾驶很早意识到神经网络是必需的。即使17、18年时,因为性能问题未完全上线神经网络,但大家都知道神经网络是未来,只是时间问题,没有人否认。


不过很多新闻、内容行业的人认为推荐算法不work,因为他们打心眼里不相信算法能力,认为这是个人品味的事情,只跟人的审美有关。他们说:

“你们看哪两家新闻平台能做起来,是因为当年电视台非常优秀的几个编辑跳过去了,他们能赢。”

他们相信这事是”跟主编直接挂钩”的事,关乎专业能力和品位。所以大家谈论主编去哪了,却不谈推荐算法,因为这个在他们眼里不是个大问题,甚至是个不可见的东西。


“我完全懂你的点。”大家觉得互联网内容媒体跟做报纸区别是没有成本分发给更多人,但没意识到可以实现千人千面、一人一面的个性化能力。


“按照我们现在的大模型Skinningup逻辑:

  • 编辑推荐点击率大约1%
  • 推荐算法可以做到2%
  • 未来还能做到20%

总编根本不重要。”


就在你说的同时,张一鸣也在各种场合给投资人Pitch(推销)。现在已经成了江湖传说,包括他最早的商业计划,关于…… 他避而不谈的那个商业计划出现。 对,对,你都能看。

就是具体措辞我已经不记得了,但是他说的那个意思就是,类似地他就是在讲千人千面这个,就是把内容和用户偏好的匹配

这是一个真正的,就是这个公司的核心。 对,然后其他人就是可能还更多的在认为,你是在做DN家一个新闻门户,其实很合理。

你想如果在18年的时候,我跟你说大语言模型,未来可能对于很多的文本工作者来说,就是咱们短期来说肉眼可以见的,都可能就是文本工作者可能会风险很大。

你可能会想象不出来这个事情,现在还有很多人不相信。但是这个东西没法线性外推。

你现在就是回想,你在脑海中有很多看过那个GPT2的新闻,就GPT1和GPT2,当年有一些很幼稚的应用,就是说它帮助一些财经记者写了一些套路化的什么财经的报道。

一个公司年报出来,它写一个简单的格式,然后你看这个新闻,你就一滑就过去了。就是没有潜力。 你看见,现在有一个东西叫GPT,它第二代,然后就这点事。

然后写出来东西,你要是亲手一用,就发现跟笑话一样。没人能够从这个阶段的, 就是这个进程,这个progress,当下的这个状态能看见他的潜力。

是,等到3.5出来的时候,就感觉像是一个

“五雷轰顶的一个事” 是,是,是。

这个引发了,我就好多回忆就想起来了,就不知道你有没有,当时有那个印象。

我在北京,当时我在中安村那边创业。

“中国创业的不都在这吗?”

对,那个创业口品牌了。 对,就是你知道,每个年代都对于创业者有很多共同的玩笑,就是每个年代的玩笑不一样,但很多时候,这一个年代会是一样的玩笑。

比如当时对于推荐系统,很多人就会说,

“千人千面这个事,就是纯是创业者在吹牛。”

就是每次你打开的时候,发现99%是一样的,就那一个不一样,他们也会愣着头皮滚着叫千人千面。 就那个时候千人千面是一个,咱们说是因为我们真的信,但是你对于很多投资人来说,千人千面就在唬他们的。

就像是,

“你五年前跟人说大模型起来,他们会觉得这就是扯淡的。”

一样,就是没有人信千人千面。直到突然有一天,真的每人千人面的时候,大家会觉得这就是天一地义的。

但是那个时候的内容端,他也没有任何一个产品,就是形成规模。

就是我的意思是千人千面的土壤,就是你能够体会到千人千面,你需要有像像网飞的骗库一样。

我觉得那个咱们今天聊这个话题,可能听我们这个播客的人90%是没法感同谁说的,就是推荐能力做到千人千面,这不是一个应该的事情吗?

就是甚至说我现在也有点恍惚,就是我在没有推荐的时候,我是怎么看信息的。我觉得应该回忆起来,应该是我看贴吧的时候,就是你顶上去的看那个帖子嘛,然后至于说那个,按照最后回复来排序,

  • 按照最后回复来排序
  • 按照最后回复来排序
  • 按照最后回复来排序

可能会是什么样的,对?

以及说那个, 其实咱们如果去翻一些公开公司的一些财报,比如说B站的财报,您会发现人均市场它现在应该最新,已经到一百多分钟,还一百一十分钟,我忘了,但最早应该几年前,应该可能只有四五十分钟。

每天嘛, 啊对,每天人均,DAU人均,就是人均日活,它可能每天在上面花的时间。

那这个东西,就像咱们刚刚说千人千面,其实有两个,有两个图上:

  1. 从供给层面上来说,就是今天有多少人在创作。
  2. 如果说今天只有十个人创作,比如说最早,来说这个平台只有一百个人创作,那你一个人就可以把这今天的新的东西给刷完了。

是否千人千面,根本无所谓。

比如说我们,如果过去在一些小的贴吧,一天可能就二十几个人发贴,你完全可以把它刷完。

比如说一些小的论坛,那你可能这个论坛就几千人,咱们发贴的那些人都认识。

这事就是算法可以发挥的空间,空间就更不大。所以就变成一个寄生蛋诞生机的问题。

就是好像你要先,就是如果不,不要求远见的话,那么就是等着内容端先有特别特别多的东西,Overwhelming了,然后我们再需要一个。

但是就是真正做这个东西的那个走在前面的人,他就要提前想到这个, 对。

所以从一般一方面来说,是所以咱们今天在聊这个事,是因为它成了,它成了是因为在过去的某个时间点,它各种条件也都充飞了,都成熟了,就是自然之力,自然之力会合在一起。

对。

一个物种如果存去,那它一定是因为它有它的生存之道,而且更就是让人感慨的是说,这个推荐算法的这个东西,是一个在工程的现场,就是在做这个事,然后通过提升转化率,然后得到实际的好处,然后再加大投入。

然后在工程里面,是不断的去迭代提升过程。它跟其他的领域不太一样。

你像同样是拿诺贝尔奖,同样是AI,那可能那个,比如说AlphaFold或者是基因编辑,他就是一个一小撮科学家可以在他的办公室里面做出来的事。

但是推荐算法更像是一个群体智慧,就群体智能的一个结果。

对。

这个生态里面,是有很多人在一起玩的,就是比如说:

  • 有消费者,用户在里面消费
  • 有创作者,在里面创作作品
  • 有平台

我们可能会有一些,就是比如说自己的一些题材主张,比如说那个对于B站来说,他可能游戏、二次元,比如说对于小红书来说,可能会把一些生活的一些知识发在里面。

他其实是说各家一起在里面玩,然后把这个生态给一起做做大的。

对。 对,确实是这个过程。

那要说回到您个人呢,就是所以就是这个风口,那个就成为了一个现实之后,就是各家都开始做这个事,然后那个就是两头都变得很大了,然后这个用户端也非常大,内容创作端也非常大。

然后那个就是回到您个人的经历,接下来就是你做了什么,然后就经历了。

大概在18年、19年吧,阿里发了一篇论文——Deep Interest Network,发了一篇论文。

就是DIN,他做的设计是什么呢?

  • 兴趣网络
  • 深度兴趣网络

有点这个意思,对兴趣网络。

他其实做的就是跟我们现在大模型有点关系。

他其实是,比如说一个用户有1000个历史行为,然后我从中间找到,比如说30个。

然后跟这个东西做一次,就是看里面有哪些跟我是相关的,跟这个候选的视频是相关的,然后根据这些你历史看的视频,然后判断你对哪些视频感兴趣。

就是我们推荐里面叫做序列建模

就是从这个角度来说,其实阿里发论文,他可能的动机叫做,比如说你同时在淘宝,我买衣服对吧,我也去再买一些生活物品。

然后现在,比如说他的这个推荐页面,我是想要判断这个衣服你喜不喜欢。

那我要把你的过去生活物品的购买技术拿过来去参考,这没有意义。

所以他就会把你过去买的衣服跟这个衣服做一下比较,如果发现都是白领穿的衣服,那可能你去购买的概率更大。

如果说它是个工装,那明显你可能就不太想看。

然后这个其实是延续了我们大概从19年到23年做的–就是很多的工作,就是推荐上的工作都是在做虚拟的建模,以及多目标。

但比如说多目标我们可能会做得更加复杂,比如说准时常点赞、关注,包括像全屏分享。

我们会把用户的使用过程中所有的行为都做拆解。

然后我们首先考虑的是说哪些行为到底是反映这个用户对这个视频是满意的,是买账的。

那哪些动作又能反映这个东西,它其实是在骗用户,骗这个平台。

所以其实我们是希望能够把用户给服务好。

因为某种逻辑在说:

“只有用户对你这个内容消费满意,用户才会留在这个平台。”

其实我们再说回来,就是我们做推荐的工作,其实分几部分的:

  1. 第一部分叫做用户体验
  2. 第二部分叫做做做的体验,就是按我们的就叫B端和C端
  3. 第三部分可能叫做生态工作

比如说像C端的话,我们会考虑你推的用户准不准,比如说用户看这个视频会不会秒退。

那如果秒退,那说明比如说封面条标准好,用户可能体验不好。用户会不会点不喜欢。

那如果到B端这一块,就是中间是包括作者和生态的。

作者就是说这个用户,这个作者他如果创作的好作品,他有没有拿到足够多的流量。

如果拿不到足够的流量,它是什么原因,我们要把这个问题解决好。

第二部分就是说生态,就是有哪些作品,它不好,但是拿到比较流量,我们其实也要对它制定。

其实就推荐是一个,大家看到的就是我这个页面出的那个内容,其实里面涉及到那个技术,包括非常多那个我们对这个生态的理解,包括制定的工作,其实非常多。

是, 就是听你说这么多,里面隐含的意思就是它的目标比我们以为的要复杂,会非常复杂,非常复杂。

我们只是觉得这个互联网公司就是要不择手段的把我留在这,增加我的用户时长和粘性。

但是其实里面,就是内涵了不一样的目标。我听起来像是这样。

对。

就是说我觉得首先就是,而比较坦白来说,就是各大互联网公司肯定是希望我用你,用我的APP,对吧。

就是希望你们在我这边时长更多。

但是我们极端来说,我觉得具体到某一天,或者说我们在优化目标的时候,其实我们并没有那么极致的去优化市场。

至少对我个人在带团队的时候,是,我是不太看重涨时长这个事的。

涨时长这个事不是绝对,就是至尊重要唯一的目标,是吗?这个看团队,就是看那个公司。

但至少我个人对这个事情没那么看到,或者我对这个事情理解是说,我们最终目标是用户,就是比如说一年之后,还用我这个APP。

对,或者说我这个APP能够能不能陪伴这个用户,还非常久。

那我们就不能只看今天。 对。

对,这个里面隐藏的东西,我觉得就是接下来都会涉及到,就是说你如果你想办法让用户多点一次,或者多停留一分钟,跟一年以后他依然对你这个平台有好印象,这个事不一定总是一致的,不一定是一致的。

对。

就比如说那个,我今天让这个用户多看十分钟,我觉得这个事情到底有意义吗?我觉得意义不一定大。

那我就是为什么有的团队他会急着说,我争取得一分钟。

因为,对,其实他会觉得,假定你在这个平台多用一分钟,你会多看。

那其实不一定,因为大家都能看到一些用户case,就是说用户觉得,我太沉迷这个APP了,我把它卸载了吧。

那你其实可能多了一天的活跃度,但你损失了,一年365天,比如说50%的价值。

所以说,比如说现在我们会更关注用户有没有发生有效的互动,比如说我看这个视频是只看了只花了时间,还是说我们同时也有点赞关注,甚至说:

  • 我有没有在发评论
  • 有没有去夸这个作者
  • 有没有去就这个内容展开讨论

甚至说那个,比如说现在在推荐里面,最近年三年,我们做那个长期价值节目,这个事情会应用的比较多。

就是我们会去考虑说,你跟这个作者会不会,比如说在未来180天,你们会看他180天看几天。

那你也想想,就是如果说这个作者他自己只是一个营销场,标记场自己,其实没有什么厉害。

那他顶多让你看两天,看三天,但你不可能看180天。

那如果180天你还看他,那倒推我们去看这些内容。

那倒推我们去看这些内容,都是作者非常用心创作浅,非常有人格魅力的一些作者。

所以我觉得,就现在反过来说,那反过的话,如果一个用户如果看一个作品看180天,那当然也会在这个平台上。 活跃180天

那反过来说,如果一个作者,如果这种作者,你能看非常时间吗?我觉得你很难看非常时间,你很难看非常时间。

因为这种作品,你可能需要花很多的脑细胞,对吧?你这种作品,你看三个,你今天可能你的劳力就已经花完了。

是。但是就是说,我们的推荐系统也是一个,就是什么,萝卜青菜都有。是,就是我们既有严肃内容,也有那个阳春白雪

就是因为其实我个人觉得,视频内容消费这个事情,就跟我们的生活一样,我们既要有学习的一部分,也要有工作的一部分,也要有娱乐的一部分。

所以说,其实我们的整个推荐里面,是多种价值兼容的。我刚刚说的一种价值,就是强调的是学习类的价值。那我们可能也要有轻松娱乐类的价值。

对,我也要去让一幕的人在这里获得快乐。是,对,我也需要,也在工作的丧失能量,在这恢复能量。

所以说,我们的推荐那种体系里面,既会有那种非常长期价值,也会有短期价值。但短期价值一定不只有时差,我们一定会考虑:

  • 你一分钟,比如说一个小时内,你有没有发生基本的互动?

如果你一次点赞都没有,纯实用,那是不是他就是在给你洗了?那是不是也不OK?是不是也是同样的一个内容创作里面,他给你差那个?

所以我自己的一个视角,就是说,从现在视角里面,我永远可能在考虑一个问题,叫做:

“OK,你看舞蹈,这没问题,那这个舞蹈跟跳的同样一个舞,有没有人比这个视频跳得更好?”

那这个没问题,那这个视频、那个更好的视频,为什么没有推荐给你?那更好的是?这是从我们的用户视角看这个问题的。

那从作者视角来看,那个跳得更好,那个作者有没有拿到更多的播放量?是,对,但问题是,这个人,他就是真实的人。他是,他又想学英语,他又想看那个擦边舞蹈,他又想看一些见证,反正就是一个人,有多种多样的需求。

但是最终,在我们这个天天使用的产品里面,他都被无情地押进了一个往下滑的时间线里面,就是在一个瀑布流里面。

对,在这个信息流里面,所有的东西,不可比较的东西,被无可避免地要进行比较,并且呈现为一个单一的那个序列。

就是我想问你这个概念,就是在很多年前的那个,就是字节跳动的一个网页上,他首次公开算法,但是这个已经好多年前了。

就是说他提出一概念,在我看来,就是一个特别科幻的概念。这是什么东西呢?就是他们会说:

算法推荐本质上是优化一个用户满意度的函数

对,但是人心这么复杂,用户满意度的函数就像是什么?就是他能写的,就是他能写成一个函数吗?他里面有限个变量,然后我们都能够解释得清楚。你的工作就是在优化这么一个东西。

这听起来很不可思议。我觉得,这是一个那个分制问题,它有几个层啊。

就是说如果我们最终给你了,你一个推荐的展现账表,然后你满不满意。其实底层是,我们不考虑推荐它有几个环节,我们就聊那个最车向逻辑。

对,因为我们刚聊了,其实我们会建模用模型去融合很多的目标。

对,那如果你对这个视频不满意,那会有两层:

  • 第一层叫做你这个目标融合得不好,就是你这个模型的算力给得不够,你这个模型结构不够复杂。对应像现在大模型,我们有7B的,对吧,300B的。

    这个东西它是一个进化的过程。比如说我们觉得你会点击,但你实际没有点击。

    这是第一个逻辑,就是我们的这个目标是唯一的,但是模型的算力,我们就说唯一的话就是算力,就是模型的能力不够。这个是一个始终迭代的过程。这是形成这个满意度的基础。

  • 第二个逻辑叫做我要不停地增加不同维度的目标。

    对,就是我过去最开始可能只有点击率,后来有时长,后来有点赞,后来可能有关注,后来可能还有一些组合目标,再后来可能有一些长价值目标。我去判断你跟这个作者未来可能交互多少天,累计一年可能播放多少时长。

在上面,第三层就是说,在这一刻哪个目标的权重应该是多少,最大的。

对,所以这三层就是我们其实这三件事情是分开做的。

  • 第一件事情可能是团队中某些同学来做。
  • 第二件事情就是做新的目标,那我们可能跟,就是也是一件单独的事情。
  • 第三件事情叫做这些目标之间权衡,如何权衡。

过去来说,有的公司它是用算法自动地去决定这个权重应该是什么样的。

对,但是我个人的价值主张就是说对每个人来说,这个就是不一样的。

所以说我们会通过一些方法来对不同的用户生效不同的不一样的目标,然后现在有些算法是会根据你的未来几天的活跃度来反推这些目标应该生效的权重。

这些目标应该生效的权重,但是这个算法现在非常不成熟。

因为用户,比如说你明天用不用这个APP,这个原因很复杂,有可能是因为你跟朋友约出去玩了。

所以对,就是它并不全是你这个APP本身表现的好不好。

对,你会发现越是前面的,它越简单越直接越干净。你说那个第一层,就是那个模型的那个参数量越大算力越大。那这是个绝对的概念,绝对改进就是越好。

然后第二层就不一定了。

第二层不一定,比如一个简单的案例:

  • 我们过去调研了一个叫全屏播放目标

    这个目标非常有意思。我们发现这个目标率最高的一些稿件是一个视频放了自己的初中毕业的合照照片。

    为什么大家全屏率高呢?因为大家全屏之后找这个照片里面有没有自己,才能看见自己。

    那这个视频好不好呢?我们实验阶段后发现,这个视频比如是A初中的,那个初中总共才100个人,它可能推给了10万人,那个10万人可能体验就被打扰了。

    这就是一个不好的目标,对那些人来说是个莫名其妙的。

我自己有个现实的例子,就是有一次,有一年我们拍过一个影集,叫海拉尔的存证

那是个纯艺术作品。

但是因为它触发了地域关键词,推给了几乎全海拉尔的人,全是来骂我们的。

十多万阅读,全是骂我们的。

他们说海拉尔怎么可能不存在,因为你把一个纯艺术的标题,推给了海拉尔人,海拉尔人就觉得被冒犯了。

被冒犯了。

对啊,我们怎么不存在了。

对,就这种事每天都在发生。

这是一个非科技的语境,由于技术本身和工程层面的优化,然后就混成声的就呼啦挫开了。

对。

所以说我们在加目标的时候非常谨慎。

比如说全屏这个目标,我可能要结合它的播放时长要足够长,我觉得才是个有效的全屏,而不是一个无效的全屏。

在这里可能是一层,我需要保证我从目标层面来说,它可能有一些by the case。

就是说这个目标它发生了,但是用户体验不好,我们需要保证它这个屏率是尽量低的。

是,否则你可能就是我80%变好了,20%变差了。

这不是个电车难题吗?

对,我觉得电车难题无解,但是我觉得咱们在做这个算法的时候,尽量还是得让它有解,贴合它实际的情况。

对。

这里面我感觉很有意思。

当年咱们刚做,比如说刚做总驾驶,人们会对总驾驶有一个非常乐观的估计。

是因为交规是有限的。

对,如果交规是有限的,车就能自动驾驶,因为你只要学会有限的规则就可以。

对,但当人们让车学会有限的规则之后,这事很难,因为现实各种各样的情况是无限的。

对。

所以就让我联想到一个事。

你刚才,如果大家听这个节目,从开始一直听到现在,会一直知道推荐算法是一套一直在进化的系统。

对。

它是想一个生物在不断适应环境。

对,但反过来来说,推荐算法制造了一个大自然,就是很多内容创作者会觉得推荐算法是一个东西。

就是说这个每个,就你刚才这句话,可以那个颠倒,那个anagram。

推荐算法制造了一个环境,让人适应。

对。

其实不是。

我想解释这个事,这个事很难用语言说清楚,我来仔细说一下。

就是说首先,很多像我这样的内容创作者,会认为网上有版本,就是这个版本火这样的内容,这个版本火那样的内容。

某种程度来说,这是对的。是因为推荐系统确实在更新,某一个更新确实有一种权重,这个权重可能就是一个版本。

但如果,就像那个海岸线效应,你远看海岸线是不浪的,那你近看全是巨齿。

如果你离近看推荐系统,它也是一样的。

虽然一个大版本有一个固有的目标,但是这里面每个分支里面,那个具体目标就不一样。

对。

所以它不是一个版本的神推荐系统,它是一个大,一个完全的自然环境。

这个自然环境中有很多很多不同的进化方向。

只不过我们总体感觉生物是往一个方向进化,但你到具体的那个进化数的一个分叉,你会知道原来它们都不一样。

但是这里面有一个很有意思的地方,就是大自然是个纯被动的事。

就是今天这个大自然变成什么样,跟宇宙拉伯拉是直接挂钩的。

对吧。

但是推荐系统是个人造的东西。

对,就是人们在往里面思考,人们需要什么别的东西能往里加很多东西。

对。

那当你往里加到一定多的参数的时候,你怎么能确保你加的参数,是这个参数直接影响的这个版本呢?

我感觉它不可能确保,它只能就是闯。

我觉得闯一点小坑是他们工作的日常。

我再解释一下这个事。

就是说创作者觉得推荐算法是一个版本,我只要适应这个版本就行。

对。

但这个在咱们做技术上来看是不可能的。

是因为这个算法具体到某一个具体的项目和具体的用户身上的时候,它是完全有一套不同的逻辑的。

但反过来这套不同的逻辑,它会让参数变得越来越多,导致最后做内容的人不知道我怎么做能被推荐。

那有没有可能做推荐的人也不太知道,我动哪个事能造成什么样的影响?

我觉得两个问题:

  • 第一个问题叫做创作者应该怎么去创作
  • 第二个逻辑叫做做一个算法工程师,我对于自己的推荐系统是否足够control

对。

我觉得第一个点来说,就是刚刚聊过来大家应该也知道,就是说我们做这个事情的本质,其实是让用户看到自己满意的内容,然后作者就是好的创作者创作的好内容,得到他应有的分发。

对。

所以说我们在迭代过程中,实际上用户应该是越来越满意的,作者也应该是越来越满意的,越来越满意的。

但这个用户策略应该是完全没有问题的,作者策略其实要分档的,叫做好的作者越来越满意。

但是比如说就是有一些灰黑产,包括一些就是现在有很多低成本的一些创作,这些人他可能是不满意的。

对。

所以说,某种来说,如果说你的作品用户都喜欢,那你不应该担心一代版本一代神,你应该是永远的神。

相反,如果说如果下个版本你不行了,那是不是说明你过去是靠那个过去那个版本的bug拿出了流量。

对。

就是我不知道有什么意思。

明白明白。

所以说作为一个创作者来说,肯定是说你优化了一些自己技巧,你可能可以涨百分之十二十的流量,但他不会决定你直接少百分之九十的流量。

如果少百分之九十的流量,可能是你换题材了。

还有一个逻辑就是说,我说如果你的作品足够好,你一定能拿到对应的流量。

还有一个潜在的风险叫做18年能火作品,25年还能不能火。

就是说用户的需求已经发生变化了,咱们竞争环境也发生变化了。

所以说一代版本一代神,如果沉溺的话,我觉得推荐算法的影响应该是比不上需求和作品之间竞争力的变化来的影响大。

对,有道理。

就是说如果从短期来看,就先不考虑用户需求的根本性的变迁。 就是你的内容的绝对品质。这个事可以说是一个公道自在人心的事,就好东西肯定比不好东西要好。

就是如果对应系统在正常眼睛,就是你的作品又是比如说在整个所有作品你是Top100的,那你只应该比过去拿到更多的流量。就是说你不会因为你对这个版本迭代的这个事缺乏了解而失去自己的基本盘,就一下子就没人看了或者怎么样。对,有可能比如说有一定影响,但我理解,我个人觉得这个影响应该在比如说10%到20%以内,是一个比较合理的状态。

比较合理的状态,就是因为它就算是一个潮汐。举个例子来说我们看周末跟周中,跟周中大家看的那种就完全不一样。比如说游戏类的视频,周末的时候看的人就非常多,因为大家周末的时候才能玩游戏,那玩游戏才能看游戏。那比如说音频播客周末人听特别少,因为人家实际可以用眼睛娱乐了。

就是我们发现周末的周中的时候,晚上大家比如12点大家看什么视频,就是助眠视频。对,工作一天大佬还在兴奋睡不着怎么办?是,是,是,对吧,来听个播客助个眠吧。

所以说我觉得我们创作者对于扭量来说,就是如果要成为一个幸福的创作者,还是要顿感一点。但是如果降太多,那我们可能还是要看看,还是对吧。

但是话说回来,如果要是因为版本迭代,而让风平浪静的内容创作者就是屡屡要遭受断崖式的,我觉得断崖式是不应该的。如果是这样的话,那我觉得这个产品是出问题了。对,那它自然这个产品就会被淘汰了。

因为做创作者也是,就是好像明面上是用户选择了平台,但我觉得底层是创作者选择平台,但他们是一个互为因果的。如果今天你这个平台创作者都走了,那用户是不可能独存的。一个用户一定会跟着创作者走。

但是话说回来,就是这个事不是一个开关,对吧,不是一个非黑即白的问题。它不是一个线性的。就是说我想说的是,那种完全就是浑然天成的、特别有机的原创的创作者,只占创作人群里的很小一部分。

那些灰黑产也只是一部分。其实还有很多是在介于它俩中间的。就是说它自己有没有点创作的出发点,它是有的,素人也有,但是它总的来说是在观察,现在做什么样的视频是能够被推荐的,然后就照着这个很精兴致勃勃的,就在这块学,在这抄。

这个我觉得占的比例是非常大的,所以他们其实是要面对两边的:

  • 用户本身需求的变化,那它就得低头去学新东西,
  • 然后这个算法版本迭代的变化,有可能会对它造成比较大的扰动。

你觉得是这样?就是这样的。

就是我们在B端,就是那个生态端会做一个事,叫做能启动。一般来说每个平台策略不一样,但一般都是有这个策。就是说如果你是一个平台的新作者,你上场的前几个稿件会给一个比较高的流量,会保底流量,会给它比如说1000播放,明白?

或者500播放。如果说你创作能力比较好,后面就是首先你不会被埋没,你不会因为你是个数人创作者,所以没有用户看你,你得不到表现机会。以及说未来你每一篇的投稿都会有一些保底能量,比如说300播放。

然后如果是300个用户去验你,如果300个人验你,你的表现,这个视频的表现都一般,那就是我们还是回归自身,对吧?如果说300个表现更好,那你当然就是整个推荐系统就已经能,你就学习到你的这种好内容,就会给你更多的流量。

所以说,大概是这个逻辑,就是不用担心说你没有机会。其实这个系统,推荐系统本身有随机性,我们会做很多工作去降低这个随机性,去降低这个随机性,对。

然后当然,我也理解你另外一个点,就是说是不是说这个推荐系统的版本是”一代天子一道成”,就是说是不是我某天推荐算法做了一个上限之后,我原来可以拿到十万播放的,现在可能只能拿到一万播放?

不会这样的,因为我们非常多的解代它可能一次解代只能有千一千二十场的变化,然后对于某个品类来说,它可能只有比如说千五千六的变化。就是一年当中能够产生大流量变化的迭代会非常少。

然后这个大的流量变化,比如说全局来说,可能也就百一百二这样的一个幅度变化。OK,这应该对所有公司都这样的。如果不是这样的,那一定是因为这公司的量级太小了,然后技术的极限太低了。

就别说创作者,就是你们自己也不想经历这么大的风浪或者这种伤筋动骨的变化,因为谁知道这个结果是好的。对,如果是一个特别大的变化,那一定是会走这个逐级的去推选,就是我会拉长这个时间线逐渐地去影响,Smooth curve

对对,然后另外一个逻辑来说,我们想做这么大影响的迭代也很难,因为这个技术它这个缓慢推进。比如说一年这个平台可以做百分之就是AB,我们说AB就是我们自己的累加实验。

我们刚其实还有另外一个事:

第一个就是作者测应该的。
第二个就是平台是怎么保证我们是可追溯的一个迭代的。

第二个就是说我们真的想有这么大版本的迭代,其实很难的。一年中这样大的一个技术突破,应该是一双手可以数出来,或者一只手可以数出来的。

就不会有那么多大的影响的迭代的。大家的所有公司应该都是相当于小步快跑的躲击在做迭代。然后就算是有大的迭代,就是同时的话我们有非常多的指标去trace这个系统的稳定性。

比如说:

  • 一万分的这个作者它平均的播放量是多少,
  • 每一个品类的稿件它的流量占比是多少,
  • 包括用户的平均使用时长,
  • 用户的平均使用时长,
  • 平均的播放,
  • 平均的兴趣数,

有非常多的健康指标在这边trace。我们是希望这些指标都是往好的在变的。

所以说原则上来说,就算有大的变动,也是往好的去变的。因为一个公司它一定是变好,对吧?它的整个内容平台变好,一定是作者侧变好,用户侧变好。

那不会有公司说我上线以后,内容就是用户侧和作者侧变差了。不排除有这种公司,但是应该肯定是少数,这公司肯定也活不久。

对吧。我可不可以认为在你的价值观里面,用户审美的变化对这事的影响力要远远大于推现算法的影响力

我觉得是这样的。就比如说从最开始的抖音,它刚开始可能就是跟拍,对吧,模仿明星这样的内容。那后来有一些剧情像的内容,有一些那个三龙的内容,这些都是新的需求和新的创作者来了。

对吧?那假设我们的用户量级不变,原来的那些内容是不是看的人更少呢?对吧,它一定是会有几站的。

但是这个事情对用户是不是好的呢?对用户是好的,因为它有更多丰富的内容可以看的。对平台来说,我有更丰富的作品,更多的用户。

那对原来的那些品类的作者来说好不好呢?我觉得也会好。因为我们就是当然是一分时间点,比如说18年这个时间点来看这个事,因为需求的增加,所以用户量级可能十倍百倍的增加。

所以虽然说我的占比下降了,但我的绝对量上升了。

但今天来也一样,比如说今年来说,AI大模型的进展是个新话题吧,那它一定是挤压了过去的一些作品。

那对用户来说是不是好事呢?是好事。对于某些作者,比如说做大模型赛道的作者,太多好事

但是麦比可能有一些,用户的时间它增长是有限的,一定是有些需求没了或者变少了。

所以说我直接说,那个有些需求没了,我一时半会想不到,但是我说有需求增加了,大家已经认知到了。

那反过来说,一定有很多需求大家已经不看了。对,但就是这个道理。

我相信大家如果理性思考的话,是能认同的。对。

但是大家就是还是会紧不住想,或者想要去责备这个平台本身,因为它看上去像是平台去推动的一种变化。

因为就是从算法的那个角度,人们会想象说,“OK,这是算法在引导我们”,就有点像幼儿园老师在教我们去模仿一个东西。

我觉得不会,就不是这样的,我觉得不会。

就是我们做的一些事,会不会对大的趋势有影响?对,会有。

比如说我们假设这个系统过去是没有收藏目标的,我现在加了一个收藏目标,那明显的我的那些知识课程类的就会变多。

这个会带来一些影响,但是理论上我们这种迭代是能应加的目标,已经就是相当于都加完了。

以及说这种相当于说它带的是一个面,它不会对于某个话题有太多的影响。

还有就是,一个平台会不会主动的带你这个趋势呢?它会尝试做这个事。

比如说过去小红书,它可能想要把露营这种生活带给大家,它运营可能做一些动作。

但我觉得这事情就是它能够影响的非常少,它们的所有的运营一起加起来可能能推几万个投稿。

但是今天来说,几万个投稿是带不来一个趋势的。对。

所以说那我们,比如说这几万个投稿就是比如说让平台用百五的能量去推这个事。

那如果这个平台的用户没有这个需求,那意味着什么?意味着用户的时长可能会掉百三,这个平台会损失百亿的用户。

首先算法一定不会做这个事。对。

我们可能尝试带来一些,但是我们不会做一些明确的一些相当于这样的引导。

运营可能会做一些这样的事,运营可能会比如说,比如说B站看到视频播客,我是不是聊拨一下这个领域

是不是可能野火燎原,是个从零到一的一个点火的过程。

对,它有可能就点起来了,有可能不一定。

但如果说就是比如说今天,比如说回到十年前,我觉得就是播客这个事你根本了不起来。是,是。

就是我就不说视频播,我就纯说播客这个事,他也了不起来。

但今天播客这个事情明显就是在起来了一个过程当中。对。

用户闲暇和用户心智的变化是根本的。对。

它不是说你互联网公司想调一下退给一下改出来的。

因为我觉得这个逻辑上来说,是过去七到十年吧,就是碎片化的知识对大家冲击太透了。

我现在再听碎片知识获得干已经比时间前弱了,那我今天就是需要更多的深度知识。

这现在也是我觉得将到优质的视频播客,播客优质的中长视频的一个机会。

它可能是一个最终是一个渗透。

就比如说,大家可能对于短视频的这个要求也是也更高了。

  • 我需要可能看更专业的舞蹈,
  • 我需要这个剧情没有那么尬,
  • 跟大家自然,

这都是一个自然眼睛的趋势。

那我听到这我很好奇一个事。就是你看那个这些博主,包括我们自己,我们流量好了,尤其新人阶段,那个大的博主不说,我就没当过大博主。

就是一个新人阶段,游戏啊,希望游戏。

你看,我如果数据好了,我会说运营推了我。对,我会感谢运营。

我数据不好,我会说算法现在不推我了。

对,所以就是你们和运营岗位他在很多创作者眼中他就是得模糊。就是这俩人是不是一伙人。

当他表扬和骂的时候,他其实会很明确地知道这俩东西好像不是一伙人。

就是我不知道你们在工作中你们和运营是什么关系。

就是那创作者好都感谢运营推,不好都赖算法不推他。

那你们在这其中不很冤枉吗?

那我肯定,我作为一个创作者我肯定永远都不愿意去承认是需求端,就是是我的受众抛弃了我。

那肯定是抖音抛弃了我。

对,抖音被抛弃我,那就是必然抛弃了我,要不就小夫抛弃了。对。

但绝对不能是我的观众抛弃了我。

对,我的观众抛弃我,是因为算法没推他们我的视频,他拦住了我,他拦住了我。

对,而不是因为他们不喜欢我。

而且很多时候他就是这样。就是他并不是,就这个事有的时候是真的。

就是我当年就不用知乎,我从一个特别活跃的知乎用户到就是断崖式的不用。对。

就是说因为当时就是我不想回答问题,我知乎上了一个叫什么知乎专栏,就不是回,就是一个blog,就可以直接写文章。

然后就是这个知乎专栏就死活不给我分放,他就是不给流量,就是你做的专栏,他不给你的专栏,他不给你分发。

就是你的关注你的followers说不到这个,就是他看不见。

你要做,就活着生把我逼走。

那这个事也是真的。

你知道知乎把我逼走,最后一会儿到扫市场。

就我们这节目不知道能。 哎,反正咱自己的节目,你们自己可以接。

对,就是我们当时2020年开始拍纪录片。我们当时拍纪录片,几个人加一起,绝对是知乎最最最最头部的一群人了。然后知乎也希望我们把视频投到场上,他在推视频。

对,结果投完就说我们还没有在,然后他说是因为没推呢。我当时就很纳闷,就是我们他们加一起一百多万关注,那时候在知乎一百多万很多了,已经2020年的时候,那很多了,我只有四个在还是十四个在。

然后他就给我们解释说,这个正常,是我们还没开始推呢,这个不正常。

对,我当时一钟脑火就上了:”那咋?那我们一百多万关注者是啥?”我觉得你刚讲的这个,就是你刚才说的这个事的那个反面的案例,就有点像是你这个运营劫持了你这个流量。这流量相当于你要跟地主的这几个代理人去求爷告奶的,就是我要求你赏给我一样,就是变成这样。

就是我觉得几个事,我觉得咱们再聊几个事。第一就是说那个,咱们聊了几个事,我感觉跟事件挺多的。

对,不是你看知乎这个事,其实就把这个事揉到一起了。就是说我的视频在你的推荐,就是他当时那个选择就是说,我给你推的你就有流量,但我们理解的意思是,那我这些关注者没有意义,是因为你不推我就没有流量。

但这个里面,创造者他摸不清的一点,是运营和算法之间的关系,都因为在那。

OK,就是我先聊第一个问题,就是运营和算法的关系是什么样的

就是我们内容日常的协作,应该主要是运营会帮我们去,比如说他有一些年类合作之类日常的,比如说他可能对接的一些作者流量不正常了,然后找我们我们帮他check一下,发生了什么,到底是链路中有些bug,还是说作品确实有些问题,我们会帮他去洞察一下。

第二个就是说我们刚才不是说我们日常会分析一下生态营的问题?

对,比如说我们分析一下头部里面拿到很大流量的那些作品,到底是因为我们现在的系统还不够健壮,还是说他真的好

真的好,当然没问题;不够健壮,我们要去完善我们的系统。

然后这个视频是不是好,那这种东西我们要,我们要引运营的专业能力,帮我们一起来reveal审美的。因为比如说我游戏的可能我能判断,但是无良有累的,我确实没有这个天赋,我也看不懂,那需要他帮我们一起评鉴一下。

那就应该我们的,就是还有一些可能,比如说今天,比如说,假设我们的平台是想把视频播客做好,对吧?

那我们可能跟运营一起合作,去订视频播客的标准,对吧?我们可能一起想,比如说把就是一些那个视频播客的一些,怎么让很多用户种草,能让他的这个用户在这个平台里面,大家把这个需求做好,大家可能会一起联动做一些事。

大概是这样的一个逻辑。

然后至于说,我们把罪都归于算法,然后把工都归于运营,我觉得不重要。

对,因为那个就是你们毕竟沟通的时候,是跟运营沟通的,你们这边友好一点,友善一点,无所谓,然后大家只要不知道”我是谁”,我为了平台工作,不要来打我,那其实我无所谓。

对,或者说,我觉得这个逻辑也没错吧,因为你也能看到,就是最终流量的上限,或者说这个系统的上限应该还是有算法决定的。

那当然,如果说你的视频足够好,但是推的不好,那当然是推荐的问题。那某种逻辑来说,那某种逻辑来说,那个运营,那个运营的工作就是帮作者去解决问题

那在这个角色分工中,他一定是百分之百这个好人,只不过他这个好人的角色有没有达到你自己的,对于好人的预期,那是另外一个问题。

所以我大概是这么看这个问题的。

至于知乎那个问题,就是我就不太要发表。对对对,这没什么好,这没什么好回答,这都是成年成骨子浪麻子的事。

我只是想说,就是我听你说了这么多之后,我和我自己的认知,和我自己的认知最大的一个不一样,或者是一个改变,是你让我意识到,就是一个以算法推荐为核心的一个内容分发的巨大的平台,它比我以为的要稳重的多。

就是它不会允许在每一个, 就是在任何一个维度上出现很武断的,就是突然天翻地覆的变化。它即使它要推动一个深刻的或者是一个比较大的变化,它也要一步一步来。

对对,这就回到我刚刚说的第二个点,就是我们的算法怎么确保我们的每一次迭代是OK的。

对,就是首先就是科普一下,就是我们做的每一次迭代,我们都会上实验。这个实验是一个均等的流量。

比如说我们比如说会分一次实验分10%的流量,5%的用户生效的是过去的策略,5%的用户生效的是我们的改动。

然后一次改动它是简单清晰可解释的,然后这5% 10%的流量上面,我们去看非常多的指标:

  • 用户测指标
  • 作者测指标
  • 生态测指标

包括我们会去看头部的这个出的稿件是什么呀,然后中腰部出的稿件是什么,甚至有一些专项迭代里面,我们会看涨分多的作者是谁,涨分少的作者是谁。

如果说这些指标都好,OK,那我们就会放更大的量去验这个事。

如果也OK,我们就推浅了,那就会发现我们的表格里面多了一项,某某次迭代做了什么,带来的结果是什么呀,都参数是可记录的。

就是因为我和汉阳都是做播客的。我们做的这个媒介本身,其实是个非常小的媒介,就是跟短视频相比,而短视频的这个量就是极其巨大,以至于这个推荐算法本身这个能力处在这个事的特别核心的位置。

但是就是播客这个事,就好像还是一个很田园木格的,就是很小众的一个东西

就是我做了一个东西可能你觉得好,那可能大部分,就是大概率别人也都觉得还不错。就是所以对于我来说,就是理解一下这个尺度的概念,可能是能帮助我俩理解算法这个事的意义和重要性特别重要的一个事。

就是我觉得播客今天还没有起来的一个很重要的原因,就是说播客还没有充分分发给他应该分发的人。但这不一定是推荐系统的问题,而有可能是说:

  • 第一,播客的供给可能是不足够充沛的。
  • 第二个,真实需要播客内容的人还没有养成看播客的习惯。

这两个事情可能是相辅相成的。

比如说今天假如只有一万个播客,一个用户他需要播客,他可能是需要那底十万个播客才能覆盖他的需求。

但我觉得你的这个视角是我们这些人不可能有的,因为在汉阳和我眼里看来,播客已经太多了,已经多到令人呕吐的程度了

但是从你的角度来看,这才哪到哪。

就是这个多样性或者是这个供给端,就是这个内容端的这个体的量级,对于消费端到底是什么意义,你能再展开说说吗?

因为在我们看来已经全部都是同质化的,因为去年应该,我看出去去年应该多了五万五千多档节目。

咱们看来五万五千多档节目可多了。

就是五万五千档节目,我觉得太少了。

就是首先我觉得一个事情,最原始的一定是先有的。

这还真不好说,先有的需求还是先有的供给,但这个事情不重要,不重要。

但是你想如果一个事情,就是今天我们说播客,这个播客是不是人人都需要,这个我觉得有可能人人都需要。

对吧?

那播客的内容更有深度,那我假设今天,比如说我要服务十亿的短视频用户,我需要多少的短视频?

我假设只要他花五十分钟,我觉得至少需要一百万的短视频,因为虽然短视频更泛化。

对吧,就大家一个短视频你可能爱看,我可能也爱看。

但一个播客它会比短视频更挑人。

那也就意味着潜在播客,他可能至少需要到短视频这个量级。

他这种冷酷的客观,让我感到有点难受。

就是他这个量级是,没有办法通过你少数内容的绝对质量的好,来弥补的这个意思。

对,但是也可能不是通过内容量级来解决这个问题。

就是我们现在聊,感觉播客的内容质量和它,我们是在说全网的播放量,我觉得就是我个人觉得,个人觉得是不匹配的。

就是我们花了这么多期,比如说今天咱们录播客,可能要花好几个小时,甚至就是我们传局,包括我们全面做大纲,可能要花很久的时间。

但是我们拿到播放量,我觉得可能是不相称的。

那潜在的原因是什么呢?

  • 没有那么多用户知道自己要消费播客。
  • 那他要消费播客,要怎么办?
  • 他要有一个他的本命播客,我随便起的名字,让他进入消费播客这个习惯里面。

那这个本命播客,就是一定需要我们播客的本体,就是我的库存要足够多。

我觉得一万十万肯定是不够的。

就是这个年轻人的第一款播客,不能是一个绝对品质好的一个播客,肯定是不行的,肯定是不行的。

我觉得现在非常少,最起码我小宇宙我日常逛的,我日常逛的,我现在就是咱们俩都刚生完嘛,我没刷到过什么,就是介绍,就是作为一个零到三个月的爸爸,或者零到六个月的爸爸了,心态怎么样的。

因为播客普遍的潮流是不结婚不成孩子。

对,就是他,比如小宇宙里面,要不然就是买保险,要不然就是理财,要不然就是黑暗,要不然就是心理情感,就这么几类。

真挺难受。

就是如果你就这么几类,那我可以我再问你一个问题:

那我作为一个40岁的就是三线女人,我应该看什么播客?

如果我这个人群都没有了,那我的受众是不是就砍掉一块?

那我作为一个60岁的大爷,我开始看什么播客?

如果我今天只服务24岁到30岁一线,摆你,那我的人群是多少?

那我是不是就只有短视频的1%的人群了?

那我能有多少的播放量级呢?

就如果你战术耗养的品一品,这事真是挺明显的。

但是你作为那个当事人,你作为那个创作者本人,你会觉得“老子已经做了这么好的东西,为什么全中国人没有都来看我,都来听我?”

但你想如果说今天有播客消费习惯的人,是今天100倍,对吧?

你的作品又过好,虽然你很垂,但你的播放量级一定会比现在,比如说大了10倍。

对,一定是这样的。

就是现在播客的问题叫什么呢?

播客好的播客太多了

对,就是带着肠尾的播客是稀缺的。

是。

那问题是什么?

你这个好的播客够多,但是能够养出那么多的潜在消费群点,我觉得maybe是可以的,但是需要:

  • 一个好的产品形式
  • 加一个好的生态

就是,我觉得品类一定会变多的,现在品类太,我没有去分析太多了,我觉得还是有点,太,太,头部太聚集了。

我听你说,就是我感觉到的,这个隐含在你的这个逻辑里面的那个东西,还是,就是播客作为一种特定的媒介,它得有一个群体智能。

它通过大量的实验,就是大量的需求和供给,对,来对碰。

然后就是碰不上,碰上了碰不上,然后好去推动这个东西的这个去往前走。

如果你只是小打小闹的很少的供给跟很少的需求。

但我觉得乐观的是说,现在设备的变化,包括创作门槛的降低,包括现在就是自媒体,大家对于这个环境的一些认知的变化,也可以看到大家现在做播客的人越来越多了。

所以说这个事情不是可以比奇功于异的。

如果它增长我们看上去就好了。

然后就是它可能需要一年两年,一年两年甚至更久去浮化。

比如海外播客比国内播客要更繁荣,它也不是一天成的,它也是慢慢形成这个。

所以说我们做这些,比如说就跟美国比吧,美国的渗透率是20%多,就是美国人口有20%多的人听播客,咱离人家那还差的90%多。

那你比如说你如果能够达到美国的渗透,那现在的播客的播放量,头部的播放量,它可能不是涨10倍,它可能涨的是50倍。

但我现在感觉就是这个事里面,就是如果播客到了那一天,那绝对把播客带到那一天的人,不是今天做播客的人,就像是把短视频变成今天做短视频的人,不是当年开电视台的人。

对。

今天的播客,因为你可能不在这个圈子里面,你不知道今天的播客主播还在争论要不要做视频呢。

我觉得是一定要做视频的。

但这个事可不是天一地一的,我录节目咱们今天是多少?咱们今天是11月底,我11月底有一个那个播客大会,我就要在里面作为那个支持方去支持做视频播客。

我还有反对方呢,就是我反对方,逻辑是什么。

但我不是公理啊,我只是从我从业者的逻辑说我觉得… 播客为什么不做视频呢?

就是如果一个视频没有画面,我觉得它就有消费价值呀。那反过来说,我播客为什么要拒绝视频主流平台的流量呢?就是它没有任何逻辑。

其实就我的视角,今天播客我银成本,我就贴一个那个乱托,就是贴个字幕上去,我觉得我就可以上传了。那我比我只在播客平台上面拿到流量更多,拿到流量更多,我自己有更多的变现价值,以及说能让更多的用户用播客。

那这个事本身就是对播客整个生态,包括对我自己,都是有利的事情

那为什么不做呢?那这是你没法带入的,明白吗?就是人家会说:

“那不是真正的播客,这不是真摇会。”

就是就跟那个彩电进入千家万户之后,然后那个就是文化评论家会说,这不是电视剧,不是真正的电影,这是一种很庸俗的东西,什么之类的。就是whatever,这不是咱们今天要讨论的话题。

但我想追着这个你刚才讲的这个规模的逻辑,就是想问你一些客观的事实。


短视频平台的规模是什么样的?

  • 比如说每天,或者每年,有多少视频上传?
  • 有多少人在做视频?
  • 有多少人在看视频?
  • 你每天这个分发,要做多少次?

这是个啥概念?我们看中国互联网,每天新上传的视频肯定是数量级的。

每天新上传的视频个数,这个国家才几亿人上网,这怎么可能呢?就不可思议!每天有上亿的视频在上传。

而咱们博客还在感叹,我们一年新增五万五千档节目。然后人家一天有上亿的博客。就是咱们录节目的这段时间,中国人产足的视频数量已经超过了中文博客一年的量了。


你想一下,你就是咱们,不考虑投稿这个事,就是人均我们拍几个视频每天?我觉得我至少人均每天要拍一条视频。

我今天中午去健身,我还拍了一下自己肌肉状态,那我不又拍了吗?那我们就是我比较理性,假设每天人均拍一个视频,那你有百分之多少的概率上传到某个平台呢?我们假设百分之十

那这就已经到了一量级了,是,是。

那我们再考虑比如说中老年人或者有一些社交需求的人,那他这个量级就更多了。

我感觉我正在一个麦肯锡那种管理咨询公司的面试里边,就是你估一个数的量级。


观看数量呢?那观看数量就得更大了。

我觉得观看数量,如果我们就是每个用户,如果多个平台加一起,我觉得人均至少是看一百个视频。基本上,也就是说就是可能是千亿级别的。

因为抖音和快手这些平台加一起的用户量已经破十亿了,所以基本上可以等于短视频就等于中国人。


然后,如果每个平均每个中国人每天看一百个短视频,这个我就完全合理的。

那这个量,今天有多少人在看博客?我累积量有多少?

对,但那个就,他俩甚至不能一起比了。

因为博客对于这个短视频播放量的增幅,就类似于统计上可以忽略不计的笑。

没人再在博客,不要再谈论之来。


不是,但是百亿级的观看,一天,这是一個千亿级的观看

不是!就是人均就一百个,一百个,就是可能就是一百分钟。你知道吗?


我那个,前几天去呼伦贝尔,在一个扎兰腿的地方,去了一个中秒博物馆,然后那个博物馆是个群民间博物馆,当地政府给他的一个就是没人的幼儿园,然后做他的博物馆的展厅。

然后我们去的时候,博物馆馆主的儿子就给我们拍一堆照。他咋给我们的照片?他不是给我们照片,他是直接给我们短视频。

那个短视频AI帮他做的,里面有照片和AI生成的照片和照片之间的故事。

然后我后来就看了一下这个人的订阅号,他是微信发的,他每天狂发一堆这个东西。

就是这个东西,这个东西是他的社交属性了,已经不只是,对,我觉得某种逻辑来说,就是现在我们拍个视频就跟那个比如说三十年前大家那个夏天,在那个陈娘,一起聚到那个村口大树下,娘席一躺,然后大家开始八卦,吹个牛,吹个牛,吹个牛。

这现在就变成了刷视频和那个投稿。


就是你某种逻辑来说,可以认为这就是信息社会在村口聚会,然后聊天八卦,然后获取信息,同时听一下那个村委的那个广播在说今天的新闻联播,大概什么样子。

中国人每天消费一千亿次短视频!

这不是一个我小脑瓜能体会的东西,我被播客读还太久了。对,不然我每天也能听典三个播客,是,是,是。

但你看,所以这个就回到,但我典三个播客,可能是一百分钟。

但咱们回到川沈那个话题,就是说推荐算法是跟时代涨起来的。推荐算法在服务的是一个千亿量级的市场,每天。


然后但这个千亿量级市场,是因为手机成本下降了,摄像头成本下降了,算法成本下降了,网络成本下降了,所有东西全部一起来,才到的。

对。

所以回看这段路,咱们从过去十年,咱走了多长一条路,这就是最简单来说,十年前的模型是服务不好。

比如说一级投稿,包括签一次这个播放,就是咱们整个中国互联网是服务不好的。

最简单来说,过去我刚入行的时候,模型的大小就是物理层层,就是4到5GB大小,4到5G。

然后今天就是在业内这类做得比较好的推荐模型,它占的存储量是几十T大小


就是这一个模型,这个深度神经网络的模型是几十T大小的。

就是存储不了,就是你家里的那个硬盘是放不下我们的这个模型。

就是因为15年我做这个的时候,不知道你,就我至少15年,我确定我们那服务器上只有一台服务器才管这个推荐。

对,因为它完全管得过来,就是一台服务器的计算量而已。

对,也就是说今天能处理这么复杂的信息,也是技术进步的结果。

就是很多事情都ready了,才能走到现在这个情况。

反过来说,我觉得推荐算法一定代表着社会的进步。


某种逻辑来说,今天大模型的进步,每天有那么多的新闻。

对吧,假设今天我们是一个16年的推荐系统,或者说再早没有推荐系统,再说刷贴吧。

那你今天可能根本跟不上,就是大模型进步的速度。

你根本不知道今天开了发布会,你不知道它现在有什么能力,你也不会去使用它。

那会产生什么情况?会发现信息可能是少数人的特权。


那今天来说,推荐系统做到了你想关心的信息。

推荐系统都因为满意度优化,让你都知道了。

你不会因为信息跟这个社会特权,就相当于这每天签一次的这个访问的这个配对,供给端跟需求端的那个配对,都就是一点一点的。

就是,它其实不是签一次,你想它,它其实计算的复杂度是什么?是更更高的。


就是签一次,在一级别,甚至更高的稿件库里面,双向做一个匹配。

那你先理解它是要相成的,但是实际上不会做这么做。

我们会通过一些工程方法去把这个计算复杂度降下来。

对,但是你刚才说的这个让我意识到,你说的这个巨大的参数量的模型实际上是沉淀了:

  • 中国人或者人类每一段上传的视频
  • 和被看的视频里面所隐含的
  • 对人性或者是人对于内容需求的知识,这些
  • 我们甚至说不出来、无法言说的明说的知识,全部都在这个模型里面。

这个倒也没有那么恐怖,因为这个参数量里面可能是:

  • 上百亿的参数
  • 甚至千亿的参数
  • 甚至万亿级别的参数

它里面都是数字,我也其实不知道它里面代表什么。这是可产生性的问题。

但它无可避免地成为了人所有这些密集的手机交互行为的一种沉淀

就是一种对喜好的沉淀。

但是现在推荐算法的一个问题就是大家也看到推荐算法的这个稠密计算,其实现在只有大模型的百分之一甚至千分之一这个量级,但有些公司可能是万亿或者十万分之一这个量级。


所以说,现在推荐模型其实没有大模型那么厉害。

大模型可以有很复杂的逻辑,包括可以输入给你。

但是大模型底层其实沉淀的可能还是很多估计性的信息,它没有到很多犯法知识。

但是我们其实是希望能往那一步走。

我觉得往那一步走,而用户可能匹配效益的效率更高。


你刚才提到了一些我俩不太理解,也有可能你理解但我不理解,我都不理解。

比如说那个什么稠密计算稀疏计算,咱们就是觉得这是一个三言两语能给人解释清楚的概念,可以。

然后另外就是顺着这个咱们可不可以完全科普向的描述一下,就在你们的服务器机房里面正在发生的事情是什么。


视频上传到服务器后发生了什么?

  • 一个视频被传上来
  • 经过处理
  • 最后被用户看到

我们在这个模型里面,需要对每个用户做一个表征。

那你想你在那个模型里面是什么呢?

其实是一串数字。


这个数字大概是,比如说不同平台不一样,但一般来说可能是几百个数字或几千个数字

我就是我这个用户ID,我就是我这个用户ID。

你是一个几千个的浮点数,这代表你这个用户。跟我的感觉比还挺少的,挺节约的感觉。


你接着说。

对,然后当然了,是挺节约的。

同时的话,我们可能会把你,比如说你在抖音、B站、小红书,可能在上面发生了几万个或者上百万个行为。

这个行为,每一个行为是一个几十位到几百位的数字。

然后这所有的行为,也会被记录下来。这是永久的,对吧?

比如说我没点赞、没评论,倒也不一定是永久的,看各家的算法。


OK,然后这个用户如果只从用户的表征来看,那是几百位到几千位的数字。

然后一个视频可能在这个系统里面,是几百位的一个复合数字。

然后中间比如说一些视频的标签,包括一个作者,也可能是个几百位的表征。

然后这些表征大概占了模型存储的大头,这叫我们叫稀疏表征


为啥这是稀疏的呢?因为它没有计算。

当我们在模型的info的过程中,tiny的过程中,第一步是把所有的这些项凑在一起,然后塞到模型里面。

这个总共加在一起,可能是几千维、几万维或者几十万维的数字,然后一起放到模型里面去。

听起来像那个字变量,就像函数里的查字点,你输入进去。

为什么它是系统性量,它没有计算?

我通过查字点,得到了几十万个数字,复合数字。

它只有查询,有少量计算,所以我们叫做系数存储。

它很占存储。


就是说一个用户就要存一个,一个视频也要存一个。

这个加在一起,可能就是即时T大小,或者几个T大小。

你那函数解出来是什么ACM4,然后相当于它很占存储,但不怎么占计算。


然后第二步就是说,我把这些数字凑起来,然后放到模型里面。

这里面就会做浮点数计算。

然后我刚刚说的几十兆、几百兆上币,这就是跟大模型的几币的算力对齐的。

其实大模型如果按照我这个概念,也是要分西数项量和稠密计算的。


但是呢,比如说一个大模型,它底下磁表的量就是几万到几十万个。

然后比如说我说这一个单词或者Hello World,这个单词可能在词表里面就是一个token。

它对应的存储是比如说四千尾,但数量只有十万个。

所以在模型的存储中也就占几十计。

所以虽然查表,但这部分参数忽略不计。


它后面的稠密计算可能是几百币大小。

就不知道有没有说明这个概念。

OK,然后我要开始跟你追问一连串特别弱智的问题。 你就是容忍一下,不弱智,他问了你再决定。弱智是必须的,就是OK。

你刚才说的这个,关于用户的那个表征,就是它是什么。比如说,你会有一张大表格,关于重轻吗?就比如我,就比如汉阳,就是汉阳是男的,然后汉阳是多大岁数,然后它喜欢网球,喜欢钓鱼,喜欢旅游,它不喜欢。

它会有一张这样的表吗?它是一个隐含系统,是一个自动学习出来的数字。我们不知道它里面代表什么,所以没有我刚才说的那个表头,就是网球旅行,没有。它是自动学习的。

比如说今天跟大模型一样,我们的原理跟大模型是一样的。今天大模型,它可能比如说,是一个64层的一个,就是那种结构。那你随便出了这一层,它是几万维的一个数字。

那这数字代表什么呢?也不知道,并不代表我们可以直接理解。包括比如说男他女他,在大模型里面,它分别代表了一个向量,然后向量是比如说是磁纤维的。那你这个磁纤维,就是你这个,其实你不知道,这个哪一个维代表男他女他,也不知道什么含义。

那这个和打标签的关系是什么呢?

  • 比如说你看你的那个,根据美国的法律还是欧盟的法律,你去你的谷歌账户,谷歌必须说明白他给你打的标签是什么。
  • 就是他推荐广告的时候,他基于什么理由给你推的。
  • 比如我在谷歌,我看过,我是一个40到45岁之间的,离异单身母亲,正在学习日语。

我不知道为什么我打这个标签,明显很多都是错的。你是跟那个大模型,就是不是不是直接去谷歌的设置页面,有个东西能看见这个标签和你说的那堆数字他俩的关系是什么呢?

就是你们不可能没有存储任何的显示,就是explicit的,会有一些统计。比如说,我们统计你过去一个月看的内容,它的标签是什么样的。

它是,就是我们刚刚那个词表,它有那个你个人维度的,也有就是你的兴趣,就是兴趣点。它每个兴趣点是对应一个项量。然后比如说你有60个兴趣,这个60个兴趣加在一起拿过来,或者做一个平均值,然后输入到模型里面去。

然后比如说你的性别,也可能对应一个项量。然后模型它是都是做数学计算的,它只能处理项量。就你们说的这个明文信息,它是处理不了的。

它会在吸收存储里面通过查询,变成一些数字,无论说明这个意思,然后这个数字又怎么来了,这个数字是那个模型自动去backword出来。

那随着汉阳这个ID,就是这个用户不断的有新的行为,它的数字会不一定的变化,它那个编码会有点一点一点的在跟着变化。

对,OK。但是如果现在我就Ctrl+C Ctrl+V出来这几千个字节的关于汉阳的这个这个字符串吧,就给你,你什么都读不出来吗?

我读不出来,我读不出来。就是我只能知道这个数字,但我不知道数字是什么含义,或者说我为什么要读这个数字呢?

但是它里面肯定是我们知道它是性别,包括它过去统计来看,它是不是爱看小姐姐,还是爱看猫狗,还是爱看爬虫,还是看恐怖故事,这个是有些统计的。它是模型里面的一个输入。

但是现在来说,这些输入的重要性越来越低了,我现在更倾向于说,因为这些都是12年到17年之间做的特征工程,因为汉阳你们之前做过类似,对我们做的就是你说这个,所以我这事都很意外。

因为我当年我就要制造这些东西,然后我们现在更多的是预来序列建模,比如说,我们就是把你过去看的一万个行为都拿出来,直接作为数字放到模型里面计算。

所以你并不能就生成一个关于汉阳这个人的理解,就是他是个啥样的人,就是profile。

如果要做这个是只能人工写色课写规则理解出来,就是去跑这个模型,然后去看跑的结果。就是跟这个模型没关系,你做的是统计的工作,就是人工的把它的历史上所有的行为都复盘一遍,都总结一遍。

对,就是这不涉及这个模型。推荐如果要做这个事,不会特别重的做这个事,然后以及这个模型里面是不会有这个信息的。就是你输入里面可能通过人工的一些挖掘,可能会制造这些信息。

所以这个工作不是数据挖掘的工作,因为数据挖掘工作是他说的那个,就把人变成标签。

对,但是推荐并没有在对人做数据挖掘,他只是在计算一堆数。

一直都这样吗?还是只有最近两年才?

就是一二一七年的时候,主要是做这块工作。然后呢,就是大概一七年到一九年的时候,我们说的那个用户的项量,稿件的项量,作者的项量,在中间重要程度越来越高。

同时B型的也开始一些就是挖掘的工作,但是频率会变小。

然后一年之后,就是序列相关的工作。我们直接把你过去的历史行为放到模型里面的工作比重越来越大。 从刚开始,我们可能检索用户最近一百个行为,到后来我们可能检索一千个、检索一万个。

以及到现在可能过去你一百万的历史行为都可以,相当于某种逻辑的通过一些工程方式参与到这个模型的计算过程中。

就是人工挖掘的相当于重要性,是越来越低的,或者说我们之所以要用神经网络,某种逻辑就是不希望大家再做很多这类的工作,因为它是非常低效浅,就是你应该懂的。

所以就是人们脑中对于推荐系统的想象,是说这个系统会给我打成一堆标签,这个标签说我喜欢,有可能打错对吧?

  • 对,而且有可能打错。
  • 而且它可能也就是几十种标签。

对,这个事其实已经完全不是现在的现实了,现在完全不是。还有一部分,但比重没那么重,越来越低了,就越来越低,就应该会越来越低。

那就是我胡说八道,就假设我是你领导,我现在跟你提了一个要求,你先不用管我,我这要求是不是很无理?

我现在我就想要这个露营有关的内容,给我使劲的往上提。

但是如果它都不是明文,那你的抓手是什么的,你怎么让这个推荐算法,就把露营这个主题,但我这个视频是不是露营,我还是制造的。

那这个就是不是在模型的层面去发挥作用的,你就是带有这个标签的。

就是我们刚刚说好,就是这个是一个拆解的非常干净的一个系统,就是模型只负责,就是预估你可能发生各个行为的概率。

这是一套非常,就是干净的系统,每一块就负责每一块的事,就是我们不可能在模型中做这个事的。

所以你听他说完这些,在思考有些网站,包括当年的主流的方式是,你要选投稿的区域,以及自己给视频打标签。

这个事和现在这套推荐系统之间的差距,就像是一个拿着毛,一个拿着手枪的人之间的差距一样,完全不是一个时代。

要不回头来我来说一下?

对,整个投稿中间都发生了什么。

对,就是用户在投稿之后,在投稿的时候,应该首先这个系统能够给你推荐一个封面,然后以及说,你有可能推荐标题,但不一定。

然后你可能自己先起个标题,然后上传上去。

现在比较新的一些技术,就是直接用大模型去提取你的音频,提取你的视频,抽针,然后把你的文字提取出来,然后我们去过大模型,然后去识别,你这个有没有违反这个基本的一些法律道德的一些内容。

这个应该每个平台都会有一些明文规定,相当于先审查,然后再进,先过基审。

然后这个基审,如果说我们发现有一定风险的内容,我们会到育营那边,育营那边可能有一些工作机制,比如说他一个视频可能要两个人一起评。

如果两个人都觉得这个视频有问题,那视频就会被打回,然后作者可能要重新操作。

如果都觉得没问题,那就会,就是相当于进入这个推荐系统的池子进行分发。

然后,这个中间还有一个点,就是说,这个视频未来应该说,比如说他到了一定播放量,可能还会再会让运营人审一遍,确保这个视频不是一个反社会,以及说不是一个传达错误知识的一个视频。

然后大概这样是一个视频机制。

然后这之后,这个视频还会经过内容理解的模型,比如说CVMP大模型,会对这些模型打上一些标签。

就比如说你刚刚这是一个露营的,还是猫狗的,然后对于这个视频描述,这样的描述既有标签这样的,也有向量维度的。

向量维度就是它又变成一个比如说几百维度数字,也有标签的,比如说它是露营、猫狗,或者我才爱我这样一个东西。

然后这些东西会送到我们的模型里面去。

就传统的推荐链路它第一环是一个召回,我会从几百、上亿、几千万和几百万的一个池子里面,我通过我的这个刚刚说的这个向量输入找出跟你最匹配、可能匹配的几万个,或者几千个或者几百个视频。

然后后续我才通过我刚刚说的多目标的排序模型,我输出各个目标的预估分数,比如说你点击的概率、点赞的概率、长期价值的概率。

然后这个多个概率再经过一个融合函数,这个融合函数可能是个模型,简单的模型,也可能是一个规则,也可能是一个简单的数据公式。

然后加权在一起,然后对所有的几百个视频作排序,最后展现给你。

当然中间还有一层,叫做重拍层。

这个重拍层有可能是模型,也有可能是策略,它是保证:

  1. 这些视频中间,它是有多样性的。
  2. 就是我不可能都给你出游戏,这样你的体验也很怪。比如说你保证每一个主题可能都出一两个。

然后就是这样。

同时我们可能也会衍生,比如说一些兴趣探索的目标,就是保证你的兴趣不是在一直收窄,最后退化成一两个兴趣,而希望你的兴趣最好是越来越多的。

比如说还有一些,这些视频就是,比如说你一直点着不看的,我可能就把你给退场掉。

这是一个混排层。

然后再上面可能还会有一层,就是把那些多业务,我刚刚说的是视频的,但你比如说还要跟广告、直播、短剧这些多个题材,还要有一层,把它们中间一起传扎一个合适的比例,让公司在用户体验和营收上面达到一个平衡。

然后最后,这个用户就会看到这个稿件。

因为看到这个稿件之后呢,它发生互动,那用户的行为就被回传到这个系统当中去,这个系统当中去。

就会把我们刚刚说的这些特征加这个互动结合在一起,作为模型的输入来训练这个模型,让这个模型逐渐去学习到这个用户的编号,以及去逐渐积累这个视频、这个系统对这个视频的看法,对于这个视频的看法。

所以这也是我们,就是这个大概是一个正向的工作。

然后中间还是有非常多机制的,比如说我们刚刚说的,如果一个新作者,我们可能会给他一个相对还可以的播放量,让整个系统,给他有一些机会,让这个系统学习到它这个作者创作手法是什么样的。

它的这个用户对它认可度是什么样的,哪些用户认可它。

以及说一个新稿件,也会有这个新稿件,可能相对的播放量、相对给它保底的量会更少一些。

你刚才说的所有的这一切发生在多长时间里?

每公司不一样,但我觉得可能对业界的这个水平来说,快的话可能就几分钟,慢的话可能也就是一两个小时。

相当于整个这个算法体系,对这个新上传的视频做了各种方面的体检和评估。

对。

突然想到有一次,我上一个网站,一个新网站,那个网站的推荐算法没有时间这个维度,所以永远是发的最早,那个东西是最火的,因为它积累的最多数据。然后那个网站,就是一直没修这个bug,但那网站现在已经死了。

就你理解它没有死,但我想到,对。

所以说一个平台,它一定是需要对作者和用户独固友好,而且包括它要发挥社会价值。

它在咱周镇走的比较长,我要接着问弱智问题。

OK。

所以现在,现在就过去这24小时里面有一个视频传上来,然后我要看其中的100个,你们不可能为我把那1亿个视频排一个序吧?

不可能吧?

你们是不是就随便抽了一点点?

不是随便,就是我们相当于说,会有个模糊计算的过程。这个模糊计算会从中间抽出几万个,然后这几万个挨个会跟你计算一次。

几万个是几千个,挨个会跟你计算一次。

所以我得到的服务是,你们先,就是模糊计算,就是先帮我,从这1亿个里面。 拿了几万个放桌面,然后再来给我排一遍。对,几万个是几千个,几万个放这些计算,然后这个模糊计算,它大概是这样一个逻辑。

我们把,如果把,就是这是现在一些传统算法,就不是所有算法。比如说我们会把这个视频,你可以想象成一个,有很多枝叉,你的意思是有很多枝叉。比如说这个树有十层,然后每层可能有几十个分岔。

那我可能会,就是这个系统会在,首先从这个根上面去比较,你在哪个分岔里面,然后一直往前走,中间可能会有些策略,然后在这个分岔,最分岔里面可能拉到一些视频。所以理论上是相当于是全计算,但是它其实是个模糊计算,但是现在这是过去的技术。

然后新的技术来说,我们也在有一些落地,就是业界有一些落地。就是说我们在做生日式推浅,就跟大模型一样,我们直接去端到端去。就是比如说我们把所有的视频放在一个编码里面。

过去来说,大家视频都会有对应的一个ID,这个ID是没有语义的,就是一个随机ID。那现在我们会给每个视频去赋予一个有语义的ID,跟你ID相近的视频,都是跟你差不多内容的视频。

比如说它是个三,就是三层的四个数字,这个每个数字,比如说是一万,那就是一万一万一万一万一万,就是四个一万的数字。那这四个一万数字,你能上可以表征所有的视频,对吧。

那我们现在可能的一种生日式推荐的方法,就是说:

  • 我预估你想看的四个数字是什么。

但现在业界也不是特别成熟,说实话应该还没有。你刚说了一个比较前沿的东西,就比较前沿。就是二三年到现在,我们正在做的事情,有一些局部落地,然后业界也在探索。

它跟我们现在的这个念路,其实没有,没有beat我们现在念路。它可能作为我们现在念路一个组成部分,但这些东西,因为都被你们就是条块分割的特别清楚,以至于你可以拿一小块的流量去测一测试一试。

对,以及说我们系统中某些模块是用这种方法做的,或者某些的流量用这个方法做的。

那你们现在的所有计算,还是基于GPU的,就是不同公司不一样,但是就是理论上,现在那种非常复杂的计算,应该都是在GPU上算的。

那肯定用的。对。

你刚才说的那个引起我的注意,是说你比如说,就假设我作为一个创作者,我传了一个关于俄乌战争最新形式的点评,对,然后我自己聊了五分钟,我对这个国家看法怎么怎么样,战争局势的看法。

我会进入到,就是最近上传的所有的跟俄乌战争有关的,就是这种谈论、评估战争形式的那个视频放在一起。然后再比较一下我的质量。

我们不会有一个人工过程,那肯定没有,就是模型实际上隐世的做了这个事,做了这个事。对。

第一就是说,模型做了几件事:

  1. 模型它会识别到这个用户对哪些话题感兴趣。
  2. 然后这个话题的兴趣视频里面,他会挑一个就是互动指标最好的。

但这个互动指标咱们知道是一个很复杂的满意度的一个公式,或者说也不能叫最好的,这个用户觉得最好的。

就是相当于我们其实都是非常工程的去让用户的偏好被建模。

那其实你比如说,你其实对政治不感兴趣,那你还是有可能受到政治,但你受到政治的概率,可能是大盘的十分之一,然后是喜欢政治的人万分之一的概率受到这个政治视频。

你可能希望这个是个长视频,它细节的分析这个战神走势,同时你喜欢点赞,那你可能收到的是长视频里面点赞最高的。

那反过来说,你其实不太喜欢看长视频,你可能收到就是短视频里面,30秒跟你说一下这些局势。

不是,你能想象这么细的事。你看你刚才说的是个特别特别细的事。

就假设我感兴趣一万个事,其中有一个事是俄乌战争。对,然后我对俄乌战争的感兴趣法,还跟别的军事迷的感兴趣方式还不一样。

对,我对这一万个事的感兴趣的,就是怎么感兴趣,以及感兴趣到什么程度,就都被压缩在一个,就是几千个字符的一个,就是一个不直接,就是你历史上所有行为。

对,比如说,如果说你发生了十万个行为,你这个十万个行为都会通过一些工程计算,最终变成几十万或者几千个的数字,变成进入这个模型。

所以这也说明就是,我不可能自己做这个事,我今天猜你想什么。对。

但是攻击,你攻击不到,就没有办法做任何这个事。对。

就假设你今天只有一个播客讲的俄乌战争。对,那我只能推这个播客。

但是问题是说,那你对俄乌战争的口味,就是大家对那个颗粒度是达不到的,达不到的。

就是说,比如说今天你觉得,就是美国几年,就应该有一个局部纷争,他只不过今天是俄乌,明天可能是另外一个,他就是个很合理的事。

我是中性的态度,还有个叫做,我觉得OK,他可能也分摊了一些国际集市,未必也OK。

那你每个态度,如果说今天只有一个态度给到你,你当然满意会跟有十个不同的态度的稿件给你。那十个可能你的满意度更高。

那你想你要是一个十个态度都有,那你成为播客受众的概率是不是更高,但只有一个,那意味着你不是这个受众,那你不会看播客。

但是问题是,就是这种大公司,就是短视频推荐算法的这个参数量,已经可以沉淀到这么细的程度。

就是太可怕了,就是他的能力强到了,可以去理解一个人对于万千事物中的一件事情里面的非常细微的偏好。

我觉得这个是不可怕,就那个汉瑶应该知道,就是你以前用挖掘也可以做到这样。

对实际上是,就不需要他这么复杂的能力,在十年前就做,过去都是人去挖的。

现在是自动去做这个事。对。

但这个依然有个量变引发质变的过程,对吧。

因为当年我们做挖掘,就是很费劲很费劲的事,就是当年他是人工做了挖多少,过去比如说他挖了播客偏好,他才能学到播客偏好。

现在我直接把用户的历史行为放进去,他就学到这个事,不用有那么多人工工作了。

所以确实跟汉瑶之前不是一个时代,对我们是刀中火种,现在的机械化作业。对。

就你都是种地,但是你知道他种的不一定。我觉得可能比机械化作业,可能还要再往前一点。

我要接着问一些弱智问题,就是你刚才说的那个,就是在模糊计算,从那个一亿个候选的视频里面,给我拿了一点点,可能几万个或者几千个,来给我做排序。

对,这几万个视频,是不是你拿着我的偏好,就有点像是有一个篮子,有一个购物清单,然后去到超市里面,就是通过这个计算的过程帮我挑的这些candidate。

对,是这么一个过程。对。

所以就是我的总的偏好,就是我可能感兴趣的事,已经在这个确认候选人来参赛的这些选手。对。

你可以理解,就是如果没有进这几万个,第一个可能就是未来会进来,因为你消费了,那可能就是有得有新的进来。

还有就是说那些大概你就不是很感兴趣,我肯定就,对。

就是放在你面前你也不感兴趣,就是我们就是之前我们为了做一个事,就是说其实推荐系统一直在做,因为大家一直抱怨那个信息茧房这个事情。

就是我们其实做一个事,就是说我们可能拿千一的流量去做随机分发。

这个随机分发,当然也不是说从几亿个随机分发,比如说我们可能挑一些主题完全不一样的稿件,它可能是比如说万级别的这个稿件。

然后我不走后面的就是这个粗匹配,就是模糊匹配,也不走精细计算,我从那些随机从里面几万个,你挑一个给你展现。

那它这个点击率,可能是大盘点击率的百分之一,差这么多,差这么多。

也意味着什么呢,今天如果没有推荐系统,我就随机随机给你发视频,那你想要找到一个视频的难度,至少是现在的一百倍,而且应该不止一百倍。

因为虽然它点击率是百分之一,但它后面的播放是这样,播放是这样,完播率、点赞率也是变低的。

如果你从满意度层面来看,它可能是千分之一。

所以说如果没有推荐系统,你基本可以理解,你在这个内容极度爆发的时代,你是没办法去看内容的。

就是说我就会直接丧失用抖音的兴趣,就是我就不会再用这个了,基本上。

那你要掉百分之九十多的话,如果没有推荐系统这个东西的话,面对每天亿级别的一个内容供给,你其实是没有任何办法。

就是说这个内容,你是直接任何一个你都看不了。对。

所以换句话说,就是如果没有推荐系统,那你面对这个亿级的视频,你看的是个平均数,就是中国用不制作视频的平均水平。

就是说这么说吧,你随便抽一个视频,你可能就抽到了你们小区的一个大爷,拍了一个视频,他自拍了一个视频,他自拍了一个视频,可能是怼念自拍了一个视频。

我不是说这个视频不好,但大概你不感兴趣。

这个事你稍微往里边品,它是一个尺度的问题,就是它是一个,你就刚才说的颗粒度的问题。

就是说我当然知道,把这一亿个视频,直接抓究纯平均的分发给这一千亿个播放行为,肯定是完全弱智的,这肯定是没有人想要的。

这个我知道,但是从这个平行宇宙的这个版本和咱们今天这个版本,中间还有一个很长的颗粒度的那个渐变的过程。

就是比如说,我可以想象一个中间状态,是说:

  • OK,这个人对政治的话题感兴趣。
  • 但是呢,我不允许我的这个推荐算法的系统识别到它非常非常细微的价值观和观念。

我们没有那么细微的价值观,但是你刚描述,给人感觉已经很细了。

而且就是,按照你刚才说,它都是向量化的,你也不知道,它只是不断在积累。

我想说的是,我们完全可以想象一个我刚才说那个,就是不差异化,不推荐,就是纯平均随机的推送和那个今天这种特别有效的推送的中间状态。

这状态,这状态就是,就是让人们看一个大概它感兴趣的范围,但是不去究其究竟。

就是让,就是不完全迎合到它特别细微的东西,只迎合到一个大概,只迎合到一个大概。

你比如说这个人喜欢看化妆,那我们就从这五千万个化妆的那个视频里边,都给它随机扔。

肯定效果会差一些,但是是不是也勉强可以接受的。

就是我的意思是,这里边有没有一个可以画的界线,就是过了这条线,就差不多得了。

实际上那个,我们是做了很多事。

比如,就是我觉得这个事的话,首先第一道,就是我们在内容审核的时候,我们是遵从国家规定,道德约束,平台底线的。

也就是说如果它违反这些,它其实根本就得不到推荐。

所以可推荐的基本上是观点大众可接受的。明白。

第二个叫做,我们在这个分发的过程中,我们是不会做到那么细致的。

同时的话,我们的推荐里面,是有一部分的流量,或者说有一部分的目标。

我们刚刚说很多目标,一部分的目标是鼓励探索,你过去没看到内容的。

就是在咱们最开头说的那个第二层的目标里,有一个权重,不是有一个,有挺多权重,是探索你过去没看过的,没看过的东西。

对,相当于它是一个拔河比赛。

就是你刚刚说batch的过程,其实推荐系统里面是有的。

因为你想从长期价值来看,你到底是希望这个系统短期让你更懂,还是说长期能够帮你发现新事情。

我们都知道,你在这边能发现你过去没有看过的东西,你长期才会用这个平台。

因为人的需求总是会退场的。

所以说今天如果我只盯着你一个的需求去服务,那你其实未来可能是在平台就扭适了。

所以我们很关注说,你在这个平台能不能发现你过去未曾看过的观点,然后没看过的内容方向,甚至题材,我们去不停的探索。

然后动态来说,我理解大部分的公司在做这个事情的时候,都希望自己的用户的兴趣、人均兴趣量、看的量是越来越多的。

这个逻辑上来,一个就是从平台自己的视角,是要这样的。

然后从执行上面来,目标层面,也有很多目标是为这个服务的。

我们可能有一个目标叫做:

我们会看跟你差不多的用户,在搜索什么稿。

那这个他搜索稿可能就变成你,比如说跟你一样画像的人,他可能看的跟你有不一样。

那他搜索的一定代表着推荐系统。 还没有使标到的。那我们可能会猜他想搜什么,然后把这个视频推荐给你。你这个观点和内容,可能都是你过去没有接触到的。OK

因为之前我聊到的,就是说应该那个国外的,有一个心理学家,他们做过一个实验,就是完全的随机分发和看推荐,最后来看,可能就是完全随机分发,用户可能看的更极端。是吗?

对,用户可能更极端。因为用户虽然你没有做这个筛选过程,但是用户还是会筛选,只不过他的筛选率会变低而已。

你的意思是,虽然你随机给他发了均等的所有东西,但他会不停地往下滑、滑、滑,他仍然还是挑,停留在更单一和更极端的内容。

同时如果推荐系统做这个事,他会推一个跟你原来看的不一样,可能关键不一样,但是你还会看下去的东西。

如果随机分发,他的等率一定更低。那也就是说,我推一个跟你观点不一样的,你虽然看到了,但你可能根本不会点,或者点进去你可能也快速去退出了。

那其实也一样,或者某种逻辑来说,假设咱们都是村口大爷,咱们都是见证的,然后我跟你的见证观点不一样,你以后还跟我聊天吗?

但是假设我是一个很有人格魅力的人,我观点跟你不一样,你可能因为我说话好听,还是给我聊,然后潜移默化你可能也不分认同的观点,你的观点反而差异化了。

所以我觉得这个事情,就是求存存异,这是人类在支持的本质。就是大模型这一波的开篇论。

就是今天的心理学实验,假设今天这个屋子,屋子它的后面那个墙是绿色的,对吧?你突然问问一个问题:

“你现在老海,你什么艳色?”

我现在不说后面的绿色,我现在问你什么?你现在大脑里面响应的应该是绿色。

对,大家都是会根据自己的知识储备,包括最近行为去观念自己的知识。

所以说,就像海台上的叶一样,人类知识的检索就是天然检索,会检索自己偏好的内容,然后模型学习的也是这个偏好。

但是跟人类不一样,就是说,我们在做推荐系统的时候,会加很多模块,去揪偏这个偏好。

就是你从长期来说,揪这个偏好,对于用户在这个平台留存,是不是个好事?我理解是个好事。

因为我们做过,业界或者说大家应该有这个共识,我做一些兴趣探索的实验,对长期留存是正向的。

那就平台没有必要把你坐在这个检索房里面,平台是希望你能够更open地看这个世界的,或者反过来。

聊这个事,就是我最开始举的那个例子:

假如你今天沉迷在一个APP,然后每天用三个小时,你是不是物极必反?有一天你说:

“我不用了,对我生活太影响了。”

然后我就可能就卸载了,很多人也这样,实际上就是这样。

那就是,现在像抖音或者其他平台,都会做一些反沉迷的事。

当然一方面肯定是有社会责任感的,另一方面就是说极度贪婪并不是一个长期主义的或者最好的策略。

对。

就是我听你说下来,我感觉到就是我的直觉,总是还是想着:

算法是一种干预,算法是在应用他的策略来做他认为我应该看的东西的选择。

所以从这个角度来看,放松这个算法,或者是引入随机和平均,和很random的给我一些,是会缓解一些什么让我视野特别狭窄之类的问题。

但是你说的意思是所有我顾虑的,我关心的,我认为可以变得更好的,最好的这些事,都可以在你的目标的设计里面充分反映,并且能够在你的算法的第二个层面里面。

我举个例子,我们之前做了随机的实验,然后我们得到了一批样本,就是用户行为。

我们用这个行为去反过来去验现在的模型,是不是对有些内容应该分发没有分发,对,然后对他就偏。

比如说:

  • 现在有个热点,你其实根本不爱看,但是因为推的多你看了;
  • 或者有一些比较冷门的知识,你想看,但是因为它不是大众,所以没个影响。

我可能通过,就是我看到一些研究方向,它就是通过随机流量,去对大盘的模型进行揪偏。

对。

如果随机分发,你可能会开什么,然后用这个知识再反过来纠正模型。

这也是我们相当于在研究的事。

对。

但是我们在考虑的,比如说:

  • 多样性
  • 减防
  • 包括长期价值
  • 包括用户的一些好的视频有没有得合理分发
  • 包括有一些会给营销号

这些所有的东西,其实在我的过去经验里面其实都有做过、思考过。

就是它整个是一个大的体系。

但是你说我们有没有百分之百做的好呢?那当然肯定我们做的不是,每个点都是一百分。

但是每个点上面都有人,有算法在考虑,有动立即想办法做好。

并不是说我们就是极端化的要做用户市场。

对,我明白。

对。

因为极端化用户市场,就是它是一个,你可以理解,是一个18年前之前的事。

就是它,这个非常早期,它甚至从你的立场来看也是无效的,或者是效率很差,这个不是一个有效的事。

对。

这个我觉得已经不用再,不用再情况。

因为这事最有说服力的是它经济上没有回报。

就是说,让人们尽可能地花更多时间看短视频,这个事在经济上是不合理的。

对于短视频公司来讲,对。

所以它就是从根本性上打消了。

如果你还顾虑这个事,那你也不能跟钱过不去。

是,是。

但我还是要发表更多的那个,就是那个幼稚愚蠢的进步言论了。

就是,你看,你刚才说的这些事,其实是一种非常积极进取的态度

对。

这个积极进取的态度,是表现为:

OK,现在我们的推荐算法特别特别的有效。

有的时候因为它过于有效,而产生了一个两个三个的社会问题,会被识别为这个是有问题的。

要么就是人们视野狭隘,要么就是什么…

没有没有我知道没有。

因为我们永远不是100分。

对你听我说嘛。

就是产生了这样的问题之后,我刚才就是我作为一个用户,在我完全对这套系统无知的情况下,我的直觉反应是:你少做点,就是你们现在已经很精心化的去做,用很多很大量的那个参数来帮我去计算去排序。

对。

然后如果你少做点,就是让它更随机更平均一点,就是能缓解这些问题。

但是你跟我说的是说在你的目标设定里面,就这些东西其实没有什么是在你们考虑不了的,你们都可以反映在这个综合的复杂的函数里面。

它是一个积极有为的一个过程。

就是如果我们发现一个问题,我们就把它作为–如果这个问题严重到一定的程度,比如说:

  • 咱这个推荐算法傻了吧唧的,
  • 老是给人推色情或者是暴力
  • 或者是特别宣扬极端言论的东西,

那我们就是把这个事作为,如果这个事已经顽固到,是一个社会问题,那我们就把它作为一个目标,纳入到我们的那个复杂的、我们要追求的这个东西里面,就这个系统里面。

但是我的问题是,这个东西听起来像是

  • 它肯定是滞后的,
  • 叫做要先出问题,你才知道,所以你要过一段时间。

也没有。

我们是会前置地去考虑。

比如说我一定是前置考虑很多问题,不可能等事情发生,比如说我们加一个目标,我其实就知道它可能有哪些风险,那些风险我会弄好之后我们再去上线。

但是我也不可能是百分之百什么问题都能看到。

那有些问题可能是后置之内,或者说有些问题可能不是上线的时候发生的。

比如说我们在上点赞目标,比如说它要很久之后,比如说1819年我们上点赞目标,就是可能一年之后出了一些视频,叫做:

“你点一个赞,我就做个俯活称。” “或者说你如果点个赞,你今天就有一天好运。”

你们应该刷到过这种视频吧。

那现在你看不到这类视频,那是因为它是:

当我们有这个点,当有一些作者,有一些黑影销号、回黑产,他知道点赞欲高能有流量,他反过来去hack这个事情。

对hack这个事情,我们后置的就要去处理这个事,我们去识别这类稿件,对吧?以及说把这些无效的用户行为给过滤掉。

对。

或者说我觉得大家觉得我这个事情做的很多,或者我往前看,我们最简单的系统就是那个汉阳最开始做推荐系统

那它刚开始上的时候,大家很开心,感觉个性化,千人千面。

但你过了段时间之后,发现封面党标题党来了。

是。

然后我们砸了一些多目标点赞,有些播放,把封面党标题党给下去了。

然后封面党标题党点赞来了之后呢,又有一些hack点赞的,骗赞的一些行为。

骗赞行为来了之后,可能会有一些又有一些其他行为的hack。

所以说,就是这个系统,是一个道高一尺,魔高一丈的,是一个工房的事情。

就是工房分点方面:

第一方面就是说

  • 你的创作者并不是都是好人,
  • 你的用户也并不都是正常需求。

这些就是:

  • 创作者你要不要管,就是他的不是好的创作者,他们有一些必须得管;
  • 你要不要干预,你要不要做优化。

反过来说:

  • 你的用户,那些东西,之所以作者有立场,还是有的用户信了,还是给他点赞,拿好运的。
  • 有些用户还是希望那些用户为他们做服务成的。

对吧,对。

那这些是你管不完。

还有一个逻辑就是说:

  • 你的竞品就是优化得更好,做得更准了,你要不要做?

那就是商业竞争,是这一切的基础。

对。

就是某种逻辑来说,今天如果不迭代,这个系统就在变差。

因为用户有额外的需求,有好的有差的,作者也有好的作品上传,也有差的作品上传。

所以这个逻辑你就要,而且社会整体的偏好和文化在演进,演进。

然后包括你从,今天是一级的,每天是一级的,这个全网有一级的视频上传。

那可能早十年只有百万两级千万两级。

那么这么多量级的变化,你整个系统要不要演进?

相当于,比如说,十年前的这个推荐系统,一定是处理不好的,今天的这个事情。

那这都没问题。

就是这个事情,它是咱没办法说,说我回到铁源木戈的那个时代,就是必须得做。

或者说它不能,我想,

我刚才在纠结的点是,它不符合我的直觉,但是我并不是说不认同你,我只是感觉到就是似乎没有一个无为而至的、就往后退一步的架构。

它必须得再往前走,我们还是要遇到问题,我们要充分地理解问题,然后把它反映在我们的目标设定和函数里面。

对。

我必须要反映一个价值观。

就是在日常大家的工作管理当中,就是会有一个问题,为什么是这样的?它为什么不是更完美的一个状态?

但我想说:

万事万物理论上都是从零到一,从一到十,从一到一百的过程。

很多问题并不是新增的,而是本来就不是一个完美的情况,它本来是个理议,你慢慢爬攀上来的。

只是你比过去提了更高的要求而已。

所以你觉得它是个问题。

是的,这个我认同,我认同,我认同。

我觉得很多时候,我跌位一点,我觉得很多时候大家的一些争议或者沟通,就是没有认知到问题不是新增的,而是过去具有的。

只是说大家的要求比过去更高了。

比如说我们要求东西比以前更便宜,东西比以前更好,以及说我们的内容比以前更新颖,推荐比以前更窄。

其实推荐系统是更好的,你大家可能想象不出来十年前的推荐系统大家什么体验了。

对,对。

但是我只能从我的技术层面来说,以及看了这么多年case的层面来说,各个家的推荐系统一定是在往体验更好的方向走。

但是你肯定也能共情公众,对于就是不了解这些incident的公众,能共情到。

就是公众会认为这个都是你的责任或者是,是的。

或者某种意义来说,用户的要求一定是越来越高的。

对。

就是我如果这一套系统,我用了十年,用了一年之后,他推荐那种我已经不满意了。

对。

就这么来说。

但是问题是在现实中,你不可能体会到,如果推荐算法停滞不前,停滞不前,你的体验变糟糕,不会有这么一个糟糕的alternative来给你做比较。

不会有。 因为这商业竞争它不容许。要这样的话,这公司肯定死。这就像那个,如果一家餐厅,它就是三道菜,永远是三道菜,是好吃,就是牙齐非常好吃,它也开不了十年,是,是,是,它得迭代了,它得迭代了。

因为大众的口味的变化,因为现在重口味,大家重口味,这也是近几年的时间。早近年大家其实并不重口味的,然后包括现在大家可能又流行清淡饮食了,那这也是一个生活方式或者健康理念的一个变化,对吧。

我就想到那个,早年中国有一个著名的问答网站,我就不说明了,刚才已经说过了。很多人会,就是它在某一年不突然变不好了吗?对,很多人会抱怨说是因为以前的编辑比现在的好,然后换了批编辑就逐渐就不好了。

但是这个也是客观求见了,是因为你的内容供给量,已经超过了人力编辑能运营的量了。对,所以你不管这个好编辑走不走,他都管不了这么多内容,但你又没有新的推荐策法上来,然后人们只会纷纷感叹,“以前的编辑好,现在编辑不好。”

因为这个听起来像是一种遗老发言,就是我想回到过去,我想回到天文木格的时代。对,很多人会这么感觉。对,但是你的供给量,你复杂度上来,因为他每天看的东西量是不变的。

对,他每天都看一百片,但他忽略了以前的供给是一百万,现在供给是一千万的时候,给你挑一百片,这事变得明显更难了。然后他会觉得说,给我挑好内容的人离职了,那我就看不到好东西了。

然后用户也变多了,用户也变多了,他想玩一怀旧服,就是停留在大灾变,或者是燃烧的远征,然后就不往前走了。

就是说我做的那个事,就咱们退万步来说,大灾变那个时代的那个游戏,魔术世界那个游戏,就是客观来说,它跟黑神话无空比。假设你现在回到15岁,你看介绍这个点游戏,你喜欢哪一个?

对,就是其实这种抱怨,他不是在抱怨这个规则不好,他就是想活在过去,他想让受众端和作者端和所有的事儿都停留在一个时间点。我理解他是希望他的快乐回到过去。

对,是,但是他没有考虑到他自己的审美,或者说对于快乐,预值在提升。就是我们一说越长大越孤单,越难感受到快乐,是因为我们小时候感受到快乐更多了。大家越长大越孤单,可以出现在这个节目里,太奇怪了。

就是说你刚才有点,很多时候,大家现在很难吃到很多美食,那因为我们过去为很多美食开心过。那你日常如果美食是一个有限集合,那你体验的集合在变多,那你的未体验的集合在变少,那你的快乐概率在变低。

对,所以就可以想象,如果博客到了咱们刚才聊的那个样子,就是一个极大丰富的供给,然后渗透到中国的渗透率有20%。现在此刻的博客听众一定会感叹:

  • 还是当年好
  • 当年我听不在场的时候,我他妈多牛比
  • 现在这节目不行了

但实际上,所以就我说活在过去就是这些,它是一种怀旧。怀旧不是关于你这个系统的一个控诉,就是今天这些技术一定比实验强,强多了,就是个人为都强。

实际上,在魔术世界里面,我们还真的获得过一次这个感受。就是那个怀旧服开这个东西,那个时间是一个历史性的时刻。就是它那一瞬间全世界,就是从小时候玩过魔术世界的人全回去了。

但是就在那一天,有90%以上的人,就是第二次被淘汰。我就是那90%的人,就是我跟着大家一起冲进去,冲以后,一玩发现,然后我才想起来,对这个游戏所蕴含的东西是什么。

就是因为在我玩不到旧版本的时候,我闹海中都是些贼美好的事情,然后我进去后,我发现我要在这么低脸的画面里面,然后杀500只野猪,就是我要一只一只的杀。

我要杀第234只野猪,然后再杀第235只,然后回去买面包,就是这种非常非常少的情况,就是让你what if,就是回到过去。回到过去是更好的这个事,你可以体会一下。

然后体会一下,以后就所有的人就都走了,只留下就是最枯瘦、最硬核的那个人才去玩这个东西。

对,就是他可能确实有情怀,对,但是你说体验,是游戏的游戏性来说,就不能说今天游戏性都好。但是肯定是说有些好的作品的游戏性,就是最好的作品的游戏性。

今天最好的作品的游戏性一定比过去10年最好的作品的游戏性要高,所以我们不能比那个君子,但是咱们就聊巅峰一定是更好的。

但是那个最好的游戏,它一定会有一套全新的问题,就解决它,再有更新的问题。

所以说10年后,10年后的那个就是那个玩家,他可能不觉得今天那个作品足够好,但我还是要再拉回,就是第10次拉回来,“play the devil’s advocate。”

就是说有非常非常多的这样的叙事,它像人心理的伤害一样。大家会想到,你比如说那个最经典的研究,就是应该是几年前,有科学家搞了100多个青少年的账号,就是他实际是那个bots,然后他去测这个社交网络。

他测出来以后就发现,就是只是在这点点点点点,然后他就会收敛到,很容易收敛到很小女孩的账号,很容易收敛到那个极端减肥跟节食的这种内容里面。

包括那个就是Francis Hogan,就是前几年出来吹哨的那个关于Facebook的那个算法,里面的那个最让人感觉糟糕的东西,就是说Facebook这个公司里面。

他就是名,他内部有这个就泄露出来的那个内部研究报告,直接证实了:

就是你Instagram现在的推荐算法里面,有这个就是鼓动少女进一步增强他们身材焦虑的这个效果,而且这个效果非常非常严重。

然而这个效果就是在提高用户engagement的大目标的面前,它是有利的。就是因为你让他焦虑他会看更多。

所以呢,就是他就是尽管他这个公司已经知道了,但是他依然是这么做了两三年的时间。

就是像这些事就是在公共的叙事里面,大家会解读为这些东西加在一起,其实就是在说明互联网公司的算法。它就是当然可以在你刚才说那个第二层里面包容更多的目标。

但是归根结底,就是对人有害的东西,如果它足够的有利于用户的粘性,或者是那些更基本的目标,然后这些公司还是就不另于去作恶的。

就是这个,这是人们很,很多人心里面的一种深处的一种最底层的不信任。

就是你会怎么看这些事?我觉得如果我听到你说的这个报道的话,我是理解大家的不信任的。

对,但是我理解就是如果做得好,我觉得这个事还是可以选择做或者不做。

就是第一就是,为什么这个就是首先那个实验,我不知道它具有部署什么,所以我不知道它做的严不严重,所以我就不予评价。

但是确实有可能,比如说,我们就是更犯话鸟这个事,就是有没有跟女性推减肥的视频,或者减肥教程,我觉得一定会有。

比如说像疫情的时候,柳根很火了,那这种跳操就很多,对吧。

那你就单纯看跳操这个事,它对不对,这没什么好评价。

但是如果说有一些视频叫教你催吐,那这个视频理论上在今天的中国互联网,应该是被管理的,或者我某种逻辑在说。

中国,我觉得在互联网里,大家对于内容的风险和尺度,我觉得是拔的、严的。

就是明显有风险内容,理论上我们都是不过神的。

或者如果我们在头部发现,它二神三神也是过不了的,就是它是根本进不了热门的。

但是如果说你去搜索,那可能能搜到一些,就是没干干净的。

对,但推荐里面有减肥的,我觉得应该都是相对比较正常的。

是,包括像擦鞭的,那它尺度一定是在范围以上的。

比如说像在现在各个平台,大家对于说你这个袜子都拉你有没有穿底裤,这个都是有明确规定的。

如果不符合,其实你都相当于过不了审核这一道。

相当于我理解中国这一块,在这一块尺度是很高的。

所以这是第一个点吧。

第二个点来说,就是其实这个事儿没那么单纯。

就是像这种有一定风险下的内容来说,一部分是用户上传的,其实很大比例是灰黑产,有意图的一些人去专门上传拉流量。

比如说刚刚那种减肥结实的,它其实可能对应的是减肥药,或者说一些非法的减肥机构。

所以说其实国内,或者我们,就是我至少我在的一些工作经历上来说,实际上是有一些相当于针对这些灰黑产,有利益相关的治理的一些经验。

针对平台也是不利的,就是大家是连点。

第一点来说,其实国内大家是更加有底线的,但这个底线不管是主动还是被动的。

第二个就是说,其实背后其实不一定那么简单,不一定完全是用户的需求带来的。

其实是有一些负向思想的一些利益得者在里面。

所以换句话说,推荐算法不能是个纯市场经济,当然不能。

它必须是有一定的监管在里面,我觉得是这样的。

就是我们推荐算法,就是说对于你的分发里面,最终还是要我让你的满意度来建模

但是我们其实是需要有自己的一个底线的。

就是推荐算法,没办法决定,我们不应该决策到底A观点对的还是B观点对的。

我觉得推荐不应该负责这个事,或者平台也不应该负责这个事。

但是我觉得推荐算法应该管理好一个下限,这个下限应该是符合法制法规和道德约束的。

对,就是那个底线,我觉得这个底线会是什么呢?

就是这个底线会比我们假设今天没有推荐系统,然后是一个完全裸的库,我觉得推荐系统会比完全裸的库,除了效率之外,还有这一层好的点。

就是我们会在这地方做一层依赖中国法律法规的一个规定,去完善这个信息的逻辑。

对,明白。

那个你刚才讲的这个,就是整个的过程,就是从上传到分发的这个里面,我还有一个小白问题,就是想再尊问一句。

其实你刚才稍微有点涉及到了,但没展开。

就是它是一个不可比较的东西。

你怎么比较?

我能理解一个就是更好的小猫的视频和一个更差的小猫视频的排序,你应该优先推那个好的。

对,但是如果是一个见证视频,一个擦边舞蹈视频,一个机器学习的教程视频,和这个小猫的视频,你咋拍呢?

它明明是一个不可比较的东西。

就是说我们刚才说,其实最终展现的时候,就是它们都是要展现的。

就是不可能都给你出小猫视频,因为这样你也看不下去。

对。

所以说如果说小猫,就如果你一定要出小猫视频的话。

假设你兴趣在的时候,小猫这个最强的兴趣,小猫只会跟小猫PK。

PK完了剩下的那个,比如说百分之二十流量出小猫,百分之八十流量是其他的。

那可能是先是兴趣和兴趣之间去PK,比如说先出第一兴趣,再出第二兴趣,再出第三兴趣,再出第四兴趣,然后兴趣类别大家时长差不多。

那兴趣之间呢,其实你可以说总价值来说,你点击率时长其实大家就可比了。

但实际上我说的是这个逻辑,但实际上在比较的时候,你可以认为大家是在一起比的。

只不过说会有一个力度约束,这个力度约束就导致说你一个频率不可能无限出,然后你最强的频率出完了之后,你可以理解潜在的会出第二兴趣,第二兴趣就是这件PK,再潜在出第三兴趣。

但这个事情并不是,就是按照我这个逻辑出发的,就是按我这个逻辑的运行,但潜在是按这个逻辑运行的。

明白。

那我是多问一句,就是如果是这种逻辑的话,那对于主题不明确的视频,就很有劣势了。

没有,主题不明确也是有主题的。

就是说怎么着都归了一个主题。

就是你可以理解:

  1. 你怎么着你这个视频也会打上一个标签。
  2. 其次的话,你怎么着,你也有一个几百维的线上。

对于你这个视频,它可能是我们用户不理解的一个主题,但它也有个主题。

比如说,今天我的视频就是我开车,然后这个开车就是开车的一个前景的一个录像,那它其实是一个有主题的事,只不过你觉得没有意思而已。 它一定是有主题。比如说今天我拍的这个星空,如果你不感兴趣,它就是没有主题。但是你感兴趣,它就是一个星空的一个, 就是相当于说那个慢镜头拍摄,对吧。

所以那个主题或者分类不模糊不鲜明,本身并不一定会成为一个内容本身的劣势。但是你反过来可能要看,我觉得一个视频最终能看了播放量,其实你的上限决定。上限决定于说,你这个视频的主题潜在收容有多少

第二是说,你这个视频或者说你这个内容,在你同样题材里面,它竞争力是什么样的。我理解是这两个维度。

  • 大盘先得选一个足够大的食堂
  • 然后你在这个足够大的食堂里面竞争

当然一只能吃掉所有的鱼,但反过来聊,足够大的食堂也有个问题,叫做里面竞争者也很多。

所以说如果今天你在某个品内做到第一代,你能量不够,你只能做一件事:托你的主题。但反过来聊,就是如果你在一个狭窄的主题里面你都做不到前面,那说明:

  • 要不然你这个主题不擅长
  • 要不然就是你不擅长创作能力

可能就是因为你,我们假设创作是两个维度决定的:

  1. 你自己的知识
  2. 你表达能力或者创作能力

那要不然就是你在这个里面,知识触不够深入,需要一步步提升,要不然就是创作能力不够。

这个事就是我们自己也是创作者,但我们也得说这个事是个泥潭。因为你的内容不被别人看见。

你永远可以把它阐释为一个公平问题,就是你被压迫了,就是别人占了别人,你吃了苦,你投三家。如果三家都不行,那就什么来说,全都压迫你。

那要不然就是你这个题材不适合中国,不适合中国的法律法规。

我跟你说,其实这几家知识平台背后有个联盟,它们会偷偷说,这个案子有人不行,然后你穿哪都给你账、给你打个招牵,就是不给你推流。

咱就插到这了,咱被签上名单了。

但是,不是他在开玩笑,是我知道。

但是你也可以想象一个人非常伤感地坐在马路牙子上,喝着啤酒,然后跟朋友发微信说:

“这个算法他就是不懂我,他就是不懂我。”

就是,我这个作品实际是很好。

对,没有能懂我的人。

但是问题,假设只有十个人懂你,十个人都看了,那怎么办呢?

就是:

  • 你现在是年百播放量
  • 你真正懂你的人,真正懂你的人只有一百个人

现在已经超标了,怎么办?

就是到底是你改变适应更多的人呢?还是让世界有更多懂你的人呢?

那怎么让世界懂你更多的人呢?

那当然把责任推给推荐算法总是容易的,把责任规计到自己这总是难的。

我觉得现在就是,这个平台也很多嘛,如果这家都不适合,那总不至于说这家有联盟嘛。

我听过的那个最委婉的关于这个事的说法是那个Jack Conti,就是那个Patreon的老板。

Patreon就是一个内容创作者的赞助平台,你可以给他每个月捐五美元,然后你可以获得一些粉丝福利什么的。

然后他被别人问到,说你剥削你的创作者吗?其实也没有,他会收个百分之十左右的佣金,合理合理。

或者就是说你做这个产品是让创作者有可能挣到钱,但你最开始许诺了能让我挣到很多钱,但你许诺我可以脱产成为一个全职的创作者,你没有兑现。

然后他说:

“这是the one thing that I can’t fix。” 如果有人足够多的就是我的平台,如果真的有很多人喜欢你,没有把它找到并且给他们,那是我的问题。但如果假如我的平台就没有这些人呢?

对,他是这么说的,我听过的关于这事最委婉的说法了。

需求是一个问题。

但是我还是胡说的来说,我觉得现在这个系统肯定没那么完美,就是说肯定还是有人,肯定还是有人说,比如说他应该拿到100万播放量,实际上只拿到30万播放量

我觉得是有可能,但不可能一个100万播放量的稿件出来只拿到1000播放量,这不合理。

对,这不可能。

或者说你自己家拿不到,你另外一家你总应该拿到10万播放量。

然后就是他可能拿到流量,比自己应有的表现低一个量级,但不可能低好几个量级。

是。

这个事我相信,这里面肯定有不够公平、不够平等,或者说我们肯定是有算法今天不是100分。

但是呢,这事已经,当我们去较证这个的时候,我们已经进入到一个没法评估的。

对,你没法证伪。

是不是有一个世界上有一个100分的平台,我在这个100分的平台上其实我是那个No.1。

但这个事情是说,现在只有这么几个平台,你如果挨个证明了一下都不适合,那你就等着呗,就是等那个No.1的平台出现。

如果有人就是这样对平台有一个这种看法,认为自己在被整个系统所压迫的话,那么他就想办法找角度去证明。

实际上有很多的研究或者很多的文化、政治阵营在指责彼此的时候,就是在干这个事,他们会做各种各样的实验来证明算法是偏袒敌人,然后压迫他自己。

就是会有很多打仗的过程。

但总的来说,创作者在抱怨没有人能看见自己的东西的时候,我认同你刚才说的这个:

  • 也许这里面有不到100分的,
  • 还有再提升的空间,
  • 但那已经是没法评估的。

有可能比如说一个应该成为10万分的,现在可能是3万分,是,但不太可能一个100万分的,现在还是3万分。

就是追腻囊中。

大家应该能够感受到这个事。

我觉得大家都是创作者,至少能感受到。

咱这期视频至少1000万播放量,我接受这个平台给我少一个数量级的错误。

对,就少一个数量级,我觉得还是有可能的。

但你少两个数量级,我觉得就…

所以如果这期视频播放量没有到100万,那肯定是平台的迫害,我已经准备好明天早上起来就是被所有平台迫害了。

因为我就是这个世界上最好的创作者,咋整?你是咋整?他说互相指责这个。

确实我自己有经历,我当天玩那个问答网站的时候,因为朋友什么都有。

你跟不同朋友聊天,他们都在指责这个网站的高层是某一个政治倾向或者某一个立场倾向的人,所以他在系统性迫害他反对的那个倾向。

但是当你认识的朋友足够多,聊得够多,你会知道每个倾向都在被迫害,每个观点都不受这个平台提示。

或者这么说吧,企业经营最重要的是效率。

对公司来说,根本没有那么多时间去搞这些事。

因为系统性–不是说迫害–系统性的反对你这个网站上一半人,对你这个网站来说没有任何利益,也没必要做这个事。

它就是,或者说这个算法来说,我很多时候都在考虑效率问题。

我理解公司经营也是在考虑效率问题,没必要去做那么多多余的动作。

但你说这个是没有办法缓解他们的怨气,因为他们就会认为你对效率的追求符合支持他们眼中的那个敌人。

他们就是会这么认为。

对,我跟你讲,这不是模样。我最后说一句:

如果今天你是一道美食,我们开一家三厅。

如果你是一个非常了不起的大厨,做的菜特别好吃,我没有什么逻辑不把你放上菜单里,并且放在头盘里面让游客看到,那这样…

咱们做一个思维实验:

  • 这种文化战争记得在美国很长一段时间有,现在天天在网上炒。

咱们替他做一个实验:

假设你是一个社交网站公司的老板

你的平台每天有:

  • 五千万的上传量
  • 五十五百亿的播放量

你现在想系统性地把你的思维、立场植入推荐算法中,然后你们公司有一万人,你该怎么做?

首先这个事没法下指令,公司不是两个人的公司。

你要把这个指令下下去。

所以开思维实验,其实整个公司的人都知道了。

那公司的人知道了,等于全社会都知道了。

那这个事情知道了,就没法执行。

但是现在大家就在讲这样的故事:

可能不同的阵营在相信不同的叙事,他们是彼此矛盾的。

就比如说,Elon Musk私有化了推特

我举例:美国的公司,我其实不了解,做没做这个事我不好说。

但是他们会讲:

Elon Musk私有化了推特之后,他会说推特之前的老板的治理下,他通过一些目标的设定形成了系统性的偏见。

他说:

假设你的平台,60%的人是主张粽子要站堂的,40%的人主张不站堂。

现在同时上转两个视频,大家有一次点赞的权利。

点赞最高的一定会是站堂的,因为60%的人都会站堂。

所以说,它有可能是一个用户结构的结果。

但是,人们会争这个事,就说:

  • 有60%的人认为应该站堂,
  • 40%的人认为不应该站堂。

但是接下来可能在你这个平台上反映为99%的关于粽子视频的推荐都是推荐站堂的。

其实它只是60和40的关系。

所以说,推荐系统里面研究的一个课题叫做纠偏

比如说业界有一些做法:

  • 比如说随机分发一部分流量,不走推荐,随机分发。

那这时候点赞是站堂还是不站堂,我们刚刚说的,这种情况用户反而会更激化。

它反而不站堂,可能就退了。

我们知道用户如果不带热度的话,他会看哪个视频,然后用这个信号去推荐里面做纠偏。

比如说如果你刚刚说的那个逻辑是对的,不做任何措施,本来是六四开,可能热门里面变成九一开、九一开。

但是实际上推荐系统是在做很多工作,去把它掰回来。

你看,掰这个事情,首先用户满意度提高,其次系统得利。

因为你给不爱吃甜的人推了粽子站堂的,其实用户不爱看。

所以说,除非是美国那个什么样的,我不知道。

我觉得国内不会去那样揪偏执。

其实大家都是想要去纠偏。

割偏执应该说非常早,可能我的工作经验,19年就有这类工作开战了。

我关注美国的社会新闻,看到关于推荐算法争到那种程度,甚至人们打的战场都已经切换了。

原来大家互相指责,比如民主党的支持者会说:

你们共和党的支持者用了卑鄙的方法,污染了算法,或者走后门、用信息站的方式,让这个时间线更偏袒于他们。

明明你们只有40%的支持者,我有60%支持者,但被你们卑鄙的搅浑水或者下毒后,变成了更多有利于你的话,或者更极端的言论有利于传播。

这是第一个版本。

这个版本线已经过去了。

这个版本是说互相指责对方下黑手,利用算法。

今天已经变成大家完全可以接受的现实。

这个现实其实就是咱们过去两个小时一直在说的:

算法是社会的反应,社会有冲突矛盾,它必须像一面镜子一样反应在算法里。

大家已经接受这个事了,接受以后还能争什么呢?

就是争:

你那边有45%的人,我这边有55%。

但我们做一堆事。

我看过一些论文做这个研究,就是你这45%代表的东西,往我这55%人的阵营里面渗透。 比我这边的内容往你那边渗透的多,说明这个算法偏袒了你。就是说大家接受了45%那边,就是是你的,咱俩个安天命,就谁也别惹谁。

但是你这个孙子说的那个就是我讨厌的话,就是想要勾引我的人去叛变到你那个阵营的,比我去渗透你那边勾引你的要多。就是人们已经在争这个事了,就有点像变成一个化僵而至流亡相语了,就变成这样。

就是我觉得就像你说,他是一个就是政治斗争的一个延续。就是说他今天如果不是推卸系统,他是报纸呢,那我们也在真正民主党和构团,谁控制的报纸数量更多倍。

对,但是你如果是报纸的话,你是不是更容易控制?对,但是还是,其实咱们已经在不同的那个点上面设计了好几遍公平的问题了,因为公平是个无止境的问题。

就是我觉得它更多是一个,就是说你说今天什么是公平,比如说我们本来是六四开。对,我最后这个观点按六四开分发,到底合不合理,或者这么说吧,从过去未来十年看,就是共和党和民主党有没有一派的这个政治观点是更对的。如果从未来十年看,是不是有一个可能对美国发展更好?

那到过来今天,实际上我应该支持了一个正确的观点,那今天我们不知道,这就打乱仗了,因为所以说我觉得就是首先什么是公平,就是一个就是按照现在流量分。

所以现在流量分还有一个问题,就是现在我觉得它是四六开,真的是四六开吗?对,就是这个问卷到底合理吗?

所以说这个事,我理解它是一个吵架的事,它某种东西在说不是一个技术的事,甚至说它不是个企业运营的事。你做的再好,它仍然还有人来去吵这个事,因为只要你不符合某些人的观点,大家就会来吵。

而且我们,就是不是因为你这个技术方案足够公平合理,大家都认可了,这事就解了,不是这样的。因为我们现在已经说了,至少有这么一对互相矛盾但是我们都想要的东西了。

你看:

  • 如果你想要那个站堂和不站堂的那个阵营,谁也不勾引谁,谁也不说服谁,都各安天命的话,
  • 那你就是想要一个信息检方特别扎实的地方,
  • 然后你又不想要信息检方,
  • 你想让人接触不同的观点,
  • 反正人们接触不同的观点的时候,你又说你在不公平的地方。

所以说我们其实是把它解构成两个问题:

  1. 实际上对已经高热的内容,我们其实是去揪偏,就是说如果说它不是高热的内容,你还会不会看?其实我们尝试就是推荐技术上面尝试去解构这个问题。
  2. 另一个问题叫做,如果我们希望你的兴趣是在发散的,不是在收窄的。

所以说我们拆成两个独立维度的问题,但这两个同时在线上运行,它最后是什么样的呢?其实不好说,但我理解只能说,我们都考虑到,它现在是不是一个完美极客的方案,我觉得只能说比过去好,明白。

那我追问一下这个问题,首先我同时爱吃闲粽子和战堂的粽子,我必须说明白。对,就是你们打仗说没有用,没有用。就是你在今天这个时代上来说自己理科中,然后就能缓解别人对你的攻击,是没有用的。

我分别一下,我不爱吃粽子,这个可能还稍微有点用。战堂不战堂,战堂,看他谁得罪的。我不是一个虚伪的,在每个事上踩平和木的虚伪的人,主要是我这个想赚点提纸,所以这个粽子我确实好几天不吃了,确实确实。

那我就问,刚才你说高热内容的纠片,我就想知道一个事情,就是说在你看来:

  • 一个马上效应,一个火的视频,会让他自己变得更火,
  • 因为看的人多,大家都都会因为他火所以才看的,
  • 所以你们要反而尝试让一个火的视频抛开自己火的环境,再被人重新测试一遍,对吧?

对,所以那代表你们,对你们自己的,就是或者不是说你们吧,就是推荐系统,对于自己推荐出来的东西,也不敢保证百分之百的自信。

我举个经典,就是那个也就是上个月吧,应该就是那个大模型做过一个测试,就是测试,就是把这个不是有人种吗,比如说美国人、中国人、日本人,把各个国家的人,比如说今天有个电车蓝铁,如果要就是只有死一个人,然后才能挽救全世界。

然后他发现,每个模型,就是大部分的模型,就是美国白人是最先被牺牲的。

是,为什么呢?因为,比如说那个美国黑人和那个,是政治正确,所以说他们在调教大模型的时候,都会没有直接输入这个人的价值排序,实际潜在做调教的时候,在做纠偏,只不过纠过了,纠过头了,纠过头了。

所以说变成黑人黄人多头了,就是说任何的系统,就是任何基于统计学的一个系统,你可以理解神经模型本质原理也是基于统计,当然我们会统计来做的,那它一定会有统计偏执。

所以大模型也存在这个偏执,那当然推荐模型也存在这个偏执。

那怎么去解决统计偏执呢?那数学书界有一个,叫做因果推断,就是一个事情到底是相关性还是因果性。

假设我们发现,个子高的人可能更富,这到底是因为:

  • 个子高的人智商更高,
  • 还是个子高的人,他原生家庭更富,给他买了更多有营养的东西,导致了他那个家庭给他的机会更多,导致他后来财富更高?

如果是前者–身高导致智商高,导致财富更多,这是一个因果性。

但是反过来,我们刚刚说第二个点,智商高是因为原生家庭可能更富,导致他有更多的机会成本,这就不是因果性。

然后,基于统计学学习的来说,它是区分不了因果性、因果相关性和相关性的。

但什么情况下能学习?

  • 第一,样本量足够大,模型足够复杂,它渐渐地就能够从统计性到因果性去泛化出来,就是你的参数量够高,你能上它的。
  • 这相当于说它的一些猜测、人的幻想可能会好一点。
  • 另外第二个逻辑是我们用一些反事实样本来给它纠偏。

我刚刚说的随机样本,就是一个反事实逻辑。

比如说,我把这些高热稿件投给你,随机投给你,发现点击率只有百三,然后大盘其实相当于就是预估的时候,你点击率是百十。

那我们就知道,其实大盘之内有高热偏制,可能就要做一层纠偏。这是一种解法。

不一定都是这么做的,有可能有,就是这种做法很多,但是其实大家都或多或少都做了类似的事。

它来自技术的本质,但其实我们更深一层来说,它来自于信息的本质。是更来说,就是我们按商的原理来说,它可能是宇宙的本质。

关于对你的工作进行无耻的攻击,我还有最后一小盘,咱们聊完这个就可以收尾。

这么快吗?

就是最后一个问题,是关于情绪的问题。

我觉得情绪是一个最近两年人们开始谈论的,之前说的更多的是Misinformation,就是虚假的事实、阴谋论和造谣,这个是大家对推荐算法的批判比较多。

现在是说情绪变成一个即时化情绪,就是并不一定说是在鼓动人们撒谎,或者相信错误的东西,而是在挑动情绪。

而情绪它并不是任何–我很难想象情绪在那个标签里面能够存在,因为情绪它不是你的兴趣类型,比如说不是网球攀岩,它不是个实在的东西,它只是一个冷和热,或者一个人积极和消极。

或者它甚至都连积极和消极都太粗了,不能去描述它。

它可能是,比如说一个很丧的,或者是埋怨社会的,或者是一种特别社达,就是觉得弱者应该去死的。

或者他有一些情绪,就是它会,它并不一定是关于事实的判断。

所以在这个情况下,就是推荐算法本身,推荐算法本身对情绪做什么事情,或者说是有意识地去管理意志,或者是酝酿,或者是更提倡一些特定的社会情绪,这是一个可以做的事情。

你有主张吗?

我没有。

你觉得推荐系统应该怎么样?

我没有。

我从上一part就已经没主张,我从上一part开始就已经觉得这事没有办法,就是它是社会的嘴剔,它自己没啥主张。

我觉得这个事的话,我只能说每个平台应该不一样。

我们可以认为这个是一个社区工作

社区工作,我认为它是推荐的社区向工作。

有的社区它是鼓励讨论的。

对,鼓励那个就是两方来对垒的。

我觉得至少在我过去的工作中,可能我更加主张观点接受差异化,但是要就事论事,然后友善的态度来讨论这个问题。

心灵气和呢,就是心灵气和是好事。

对,就是过去来说,如果一个视频它是以引发争议来获得流量的话,它没有自己实际的内容,那我们倾向于说我们就是会建模这块的价值。

比如说它的评论区都是喷擦的,这个可以通过大模型来变成0/1的标签,适合/否的标签。

如果这个视频,我们知道这个视频是通过它没有其他价值,只有引发争议的价值,那它其实在我们的综合目标里面,它相当于说是不占优势的。

所以一个模型它就是专门擅长吸引别人骂它。

对,它在算法里面是不会得到有优待。

相反说,如果你的评论区是关于你视频的延展讨论,就是大家顺着是在讨论这个。

甚至说,来说这个作者你说的非常好,我有感触,包括说你这个说的这个事,我童年时候也经历过,我也有这样一个故事。

就是现在有些算法是通过把这一类东西通过大模型识别出来,变成一个友善标签,然后整体去鼓励友善这个事。

我只能说这个事,就我的经验来说,我们是往这个方向去鼓励的,因为其实还是老老。

因为逻辑上来说,就是一样的。

就是说一个社区,从效率逻辑来说,大家希望它是一个观众认为它有口碑的社区,这个对于平台发展是更好的。

我们很难想象一个平台,会认为自己的社区因为有争议,明天大家还来吵架,结果这个平台能长得很好。

咱们之前那个上一次电话会的时候,你提到一个词叫画风,就是说平台其实会很在意用户对于自己整个这个平台,整个这个产品有一个整体的看法,而不只是对内容的看法。

对,这是一个也可以反映在你的推荐算法的工作里的。

就是它这块的工作很多时候,其实是反映在我们认为什么是下限,以及说我们在认为什么是用户满意的时候,它的指标的衡量。

比如说今天你是一个主要做图文的,对吧,你可能会比较重视点击,你可能不会再去重视时长。

对吧。

画风是我这个词,是我自己的一个产品观念,跟推荐没有关系。

OK。

我觉得那个用户会认为一个产品是满足用户的某种需求。

比如说今天用户用抖音、用B站、用小红书,它应该会有可能同时用,现在都用,包括用快手,都用的人应该很多。

那它在什么时间点打开这个APP,什么场合打开什么APP,什么心情更倾向于打开,什么心情打开这个APP,都有一个原因,对吧?

对。

那这个原因是什么呢?

我觉得就是意图

那满足这个意图的内容,我觉得就是画风。

所以它其实是一个产品的增长逻辑。

假设我希望满足某种用户意图,竟然要带来这个APP的一个增长,或者我做一个什么样的APP,满足什么样的用户意图,实际上是在定义我的产品功能。

所以反过来说,如果我想要定义一个产品,然后要推荐服务这个产品,自然就会有画风这个事。

它其实是这样一个逻辑。

所以说那什么样的推荐能满足这个画风的要求,然后最近衍生让用户觉得这个APP服务于它什么样的意图,那反正就是个很专业的事情了。

就是感觉今天就咱们可能不用细聊。

是,是,是。

就是远远超出推荐算法本身了。

对,它更多是一个,就产品逻辑,然后甚至可能是一个产品整个公司的一个逻辑了在里面。

就比如说今天这一个事情可以做,就比如说对于一个内容公司来说,一个之前有个,就是你有忙忙多的机会可以做,今天这个事你要不要做。

就是有可能你要选择不做,有可能要做。

那个逻辑仅取于说你定义你这个产品的赛道,你公司的赛道是什么,它道理是。 对于你这个公司的价值是个增量还是一个非增量,但是无数微小的选择最后会移出一个很大的结果。最后你会觉得,这家公司是这样的,虽然我不知道怎么形容,但是这家公司明显跟另外一家公司不一样,不一样,不一样。

这个事应该这家公司会做,这家公司另外一家公司一定是做不了这个事的。你不一定有意识的总结,对,但是就是我们说的“我们要形成用户对AP的认知”

实际上,比如在推荐里面,实际上是一个非常高的能力需求。它不是一个,就是我们刚刚说的拆解这三阶段里面任一个阶段,它是一个整体的一个思考和布局的一个事。

我想最后对就是把所有的那个我对于你工作的抨击,做一个最后的总结。其实它是不是一个,它像一种一种挥之不去的担忧。这种担忧,如果推的特别特别极端的话,就是那种赛博朋克的小说里面的东西。

就像我刚才说的这个情绪的问题,实际上也有实际的例子。就是在很多年前,这个应该是更早,可能是2016、18年的时候,那个Facebook,他上过,在那个赞和踩的基础上,上了那个愤怒和大笑的那个按钮。

然后这两个按钮能够比赞和踩更好地反映出更强烈的情绪。

当时他们的那个算法水平里,他们就给了这两个按钮(这是事后回顾出来的相关论文)。他研究的结果就是,当时的Facebook给这个情绪表达的愤怒和大笑的权重,远远高于他的那个赞和踩。

他的那个赞和踩,并且确实起到了一个提高用户engagement的非常大的效果。

但是接下来用了两年的时间才观察到其中的恶果,它是逐渐累积发生的。就是因为你这么整完以后,仇恨言论和刺激人、上火和发火以及互相攻击的东西,最后全都冒出来了。最后他们才踩了刹车。

这大概是一个两年时间的过程。

我觉得你说这个点特别好。

所以我们刚刚说我们优化的时候,实际上是分用户体验作者和生态的价值

我自己把推荐系统价值可能分为三块,但也不完全是三块,比如就是我们认为用户价值最容易去表达的就是活跃度。

然后是生态价值,它其实就是一个解构化的,比如说我现在这个平台有多少品类,这个品类里面每个品类有多少作者在贡献,然后每个品类的作者质量又是怎么样的,这就是生态价值。

它是很难、很难定义它的价值,但是你的每一次迭代其实也在影响它的。

第三个就是社区价值,就是我们刚刚说的你的评论区、弹幕,包括你的社交口碑,对于这个APP是怎么描述的,大家怎么看待你。

我们刚聊到,我在做推荐工作,这三部分工作我都会做,也就是希望三个都好。

最容易量化的就是我们刚说的用户价值,因为用户的DAU涨了你是知道的。

但是你伤害另外两个价值,你是很难观测的。

所以我的判断是,另外两个是底线,凡是伤到了社区价值和生态价值,就不能做。

对。

因为那两个价值都是非常长期才能观测的。

用户价值,你有很多手段可以找,因为用户满意度永远没有,远远没有达到上限。

咱们关于减防的问题,我觉得用户他觉得他减防了,就没有毛病。

可能有的用户确实,大家心里数数在涨,但某些用户他可能确实是遇到这个问题。

那就是这些用户,你提升他的活力度会涨,但从未来的逻辑来说,今天这个用户活力度多少,不是未来,而是说你的生态和社区价值是不是在一直涨,才是未来。

才是未来。

比某种逻辑来说,如果今天抖音、小火术、B站谁一年后相比今天,体量没有更多的跟拍,没有更多的话题诞生,他还是去年那些话题,那他一定是相对有风险的,他的生态就停止了。

一样的,如果看第三方的一些口碑,如果口碑下降了,是不是潜在的传播人群也会下降。

它不直接反映在今天的运营活跃度里面,但是潜在也在下降。

所以我觉得FB那个是他不是几年之后才能看到的,他应该在过程中就能发现这个问题。这三个价值如果统一来看,实际上应该能发现这个问题,不用等几年后。

是,但是可能这个就是跟他整个的文化环境和他的国家的整个综合状态相关。

但是我也是在那个七年后的世界,我七年后有这个认知。

是,是。

但七年前我也没有这个认知,当时业界也没有这个认知。

我忘了。

我觉得万事万物,万事万物都是从相对野蛮到相对文明的演化过程,都是一个进化过程

对。

我刚才想说的就是像刚才这样的故事,一个接一个,让公众或者是关注这种问题的人,在心里累加出了这么一个画像,或者这样一个故事。

这个故事就是说,推荐算法这个事,他明显就是对人的影响非常非常大。他在塑造世界,他在塑造现实。

很多人90%的经验是通过手机屏幕来的。

所以这个事他对人的影响非常非常大。

但另一方面,因为推荐算法优化的目标,或者这套目标,虽然听你描述这么多,它是非常积极有为的,尽量综合的,和把利弊都囊括进去。

但它毕竟是一个事后的反应,就是出了问题然后我们去反应的。

所以我们在优化的过程中就容易出现刚才说的那种情况:现在你觉得这个按钮挺有用,提高了engagement,但结果又导致各种各样的问题。

而大公司有可能不在意,或者意识到以后,觉得

“我还是要提高我的用户时差,或者怎么样,更重要。”

这事就整体盖住了,变成了一个特别闭合的东西,就是非常行为心理或者非常控制论的一个东西。

当年维纳发明那个控制论,他说:

“你要把炮的旋转角度和炮弹考虑成一个系统。”

那么换算到我们的这个语境,就是我们要把用户和对用户做的事情考虑成一个整体系统,然后不断优化它。

但是在这个过程中,它有一个逻辑上的背谬:

  • 一方面互联网公司想把自己摘出来,说这都是社会问题,社会是啥样就是啥样,这是一个镜子,反映了这个事。

  • 另一方面,优化时完全把它变成控制论的角度来看,作为整体不断去优化。

因为你嵌套在人们的社会生活和文化演进的过程里面,你本身也在塑造现实。

所以它产生了一个问题:

当你遇到一个没法解决的问题,比如文化战争是真实世界的战争,算法是虚拟世界里的延伸,它是无法掰清楚的。

这个时候互联网公司就有冲动说:

“这不能是算法的责任,算法左右不了,这仅仅是用户所在社会的直接映射,是直接反应。”

所以我们是黑盒,我们黑盒不用承担责任。

但如果你这么说,那么你就不能干预任何事,它只是顺其自然。

但显而易见你又不是,因为你必须干预。

但是如果你有一个手术刀式的干预方式,就要负责任。

因为它是整体,所以你塑造社会,影响漂浮在社会里面的气氛和情绪,所有东西跟你有关。

你要么变成完全没有责任,但也不能干预;

要么责任无穷大,什么都赖你。

对,either way你不可能舒服。

这个事无可避免地反映互联网公司的意图,但又想自我辩解说

“我是清白的,因为总体上比如抖音、B站、知乎它只是一个互联网空间,它在映射真实世界。”

但有时候又不想负责任,又需要去干扰。

这本身是扯不清的关系,是非常困难的事。

对于互联网公司来说,不可能有干净一刀切,切完了后你在安全区里说:

“我负责这些,你们别赖我,多了也别赖我。”

这是纯粹工程的问题。

如果我是你,我会觉得这个工作极其困难,因为切割不行。

我作为你的朋友,也希望你的工作是单纯的事实、价值判断无涉的工程问题

但它不是。

它就不是。

怎么办?

就说完了,可能有点像抱怨,但这不是问题,我感觉你在替我抱怨。

我觉得推荐算法其实本质还是一个信息解锁技术

比如我之前研究生同学,有人是图书管理专业,他负责的是–

这应该在2018年左右,在英国有一个相当于学科,就是我有一万册图书,我怎么把它做好编排,让大家在图书馆里面尽快拿到想要的书。

这是最早的、最low的或者说最基础的信息检索系统。

是,是,是。

比如它第一步:

  • 我要按科目去分这个书。

第二步:

  • 我要按ABCD排序分这个书。

其实现在推荐我们刚刚说的粗山阶段,本质是一个原因。

因为现在信息比18世纪的信息多得多。

所以某种逻辑上是需求诞生的技术,不是说我开发了一个技术满足用户还不了解的需求。

而是当时内容量确实爆炸,需要技术。

所以延伸出来的,比如最早的搜索算法,谷歌、百度出来了。

搜索算法延伸到:

“是不是用户不搜的时候,我能不能给他推荐?我个性化推荐系统。”

但如果是纯粹搜索系统或者图书管理系统有没有刚刚说的所有问题?

也会有。

我把哪个书放在前面,也会有这个问题。

只是现在这个问题放大了,因为信息在人的获取中比重越来越重要了。

对。

因为太重要了,所以会接受更多审视和要求。

我觉得这没问题。

在我看来,这是OK的,我们也应该满足社会对我们的更公平要求。

还有个边界,哪些是我们推荐系统可以有自己主张的,哪些不应该有主张。

我觉得涉及社会法律规范和工学良俗相关的我们不碰。

对。

但是比如:

  • 这个平台到底倾向于短视频、长视频,还是图文?

  • 希望用户在评论区是更轻松一点,还是做深度讨论?

  • 还是大家提供更多额外信息量?

这是我们可以自己主张的。

但前提是大家平静(peace and know),不违反事实地讨论。

这可以是我们主张自己的”画风”和满足用户意图。

这是可以主张的。

我觉得第一,推荐技术一定是随着社会实在倒逼出来的技术。

然后之所以被赋予更多要求,是因为信息越来越重要。

对。

我们站在这个位置,当然享受发展的红利,也要接受挑战。

第三是边界。

我觉得边界在于,有可能对我们的要求越来越高,留给我们的空间可能越来越少。

但我想说的是:

如果它对大家足够重要,我当然希望我的……这个也是一个逐渐认识的过程。

比如过去我们在社区和生态价值的…… 和生态价值的认知没那么齐,有可能是十年前没那么齐。那我们现在也逐渐建议了自己的一个认知体系,比如我们刚刚说心理探索和减防这个矛盾的体系。现在我们可能定义的指标,但是它们中间应该什么样是更好的,实际上我觉得它不是技术上面没有认知清楚,而可能是社会的工序粮素道德没有对它形成统一的一个认知。

对,如果它形成统一认知,OK,那一天我们也就解决这个问题。所以我觉得很多情况下,它是一个互相推荐的过程。我不知道有没有回答这个问题。对,就是那些悬而未决的问题,就是战场的最前线,人们在打呢,他打的时候他就会怪你。我觉得接受他,我可以这么理解。

就听完今天所有的东西,我就最后回到他这个问题。我理解到,我们要说内容和形式这两个东西。对,就是说形式是推荐算法,大概率上它是可以去干扰的,比如说我想要短视频,我想要长视频,对,对吧,对。

但是这个形式下面的内容,是推荐算法不见得能控制得了的。比如说短视频里面,人们更喜欢重资战堂,长视频里面,人们更喜欢,就喜欢长视频的人更喜欢吃闲粽子。这个事是推荐算法很难控制的,我是没法利用我喜好来做的,对。

但是推荐算法我可以选择不服务你,这个需求我不服务了,你这个需求我觉得违背共产党,我不服务你。对,但如果我服务你,我是没法抢搬你的天后。

所以我理解就是说,是否推短视频,这是一个推荐算法可以做可以讨论的事,但这个不是推荐算法的事,这是属于人们对短视频的讨论了。但是这个短视频里面的内容,这个容器里面包着什么,是一个推荐算法确实很难完全自己做控制的事。

今天这个事,它很多时候争吵和打架,是打那个内容和形式分不出来的东西。比如说短视频会不会让人更上瘾,然后更浪费了更多时间,但这不是推荐算法的事,因为是那个形式的事,大家没决定好,然后人们在炒这个事。

但没有推荐算法的短视频,夜还是短视频,夜还是短视频,但是不那么work的短视频,对不那么work,但是夜还是短视频。

但是就是因为人们对短视频来说是个新东西,对这个媒介绍。

这么说,比如说咱们,我不知道你们有经历过,就是曾经我们暑假的时候卫视会联播电视剧,电视剧大放送,就那几个而已,就是几个西游记,几个红隆,包括金庸的那几个。对,就是在那循环播。

那咱们是不是也沉迷了一个暑假,直到爸妈回来,然后不让咱们看,咱们在那看。

所以我觉得,就是今天跟短视频,就是它没有本质需求,就是无差的是什么,仍然是人类对娱乐的需求。对。

但是怎么更好地去管理好,比如说小孩子们看这个事,就是如果没有资质能力的人,怎么管理这个事,以及说怎么更好地去服务好大家的信息需求。

信息需求里面也分很多种类:

  • 有那个补充能量的
  • 有那个补充知识的
  • 可能还有社交的
  • 可能还有其他的
  • 可能还有创作的需求
  • 分享的需求

那这些需求,怎么去很好的去balance。那这个东西可能就像我刚才说,他这个还没有定论那个事,大家也还在摸索的事。

是,我觉得咱们可以聊一聊未来了。比如说接下来的两到三年,或者你眼前就是那个你在较真,你在研究,你在就是往前看的东西。

就是比如说接下来两到三年,或者三到五年,会有什么就在你的领域,会有什么大事发生,以及你就你觉得,你会花很大的精力在什么事上,然后以及有些什么新的问题要应对和有希望解决的什么之类的。

就这些都可以面向未来的。

我觉得AI现在让我对未来是没有判断的,为什么?就是大家能想象出来五年后人类跟AI是怎么相处的吗?不知道。

就如果今天知道了,我今天不应该在公司工作,我应该去创业,然后提前站住这个坑。

你的意思是,AI对于人类社会本身的振动都太大了,以至于你想要想自己的这个服务的公司以及这个业务的那个都缺乏前提了,缺乏一个稳定的环境和前提。

是这个意思吗?

那某种逻辑来说,是的,它可能会影响非常大,因为它会影响,同时影响用户需求、供给。

对,也会影响推键系统。

就是用户需求,就是在今天的AI下面,搜索需求其实是极度介绍了。

比如说有没有可能,现在就是视频内容需求,视频内容需求很多情况下是服务知识类的。

对,未来可能还会服务知识的,但是很多知识类也会被AI吃掉。

对,那这个会带来什么影响?

那第二个就是供给上面,今天我们有那个很多基于AI的一些内容提效的工作,有可能是工作流,有可能直接的是一个APP,那这个是在今天有很具体变化。

明年变化只会更大,后年你就不知道是什么样的。

那可能大家就是说,今天的供给量,或者说高层上的供给,可能会比今天,今天可能不能想象,包括可能明年就播发了。

在现在的工具内容下,我十年前就没人跟我说明年不喝播发。

对,这个是不知道。

为什么?

不要提这个脏东西。

你接着说。

然后在这个逻辑下来说,如果未来的创作视频质量都比今天更好,那用户对于这个视频的判断和需求跟今天又会有什么样的区别呢?

我们也不知道。

不知道。

所以说这些都是蓝体。

对。

那我们只从推荐技术层面来说,我觉得可能我们有很多新的助力。

就是过去来说,我们对于一个视频的理解是单薄的,因为过去的内容理解技术是差的。

那未来我们可能从,就是过去我们表证一个视频的维度,可能就几百维,那未来可能更多,也更充沛,基于现在的大模型的技术。

第二个就是说,我们现在大模型其实,就是我们推荐,其实也用了很多大模型的技术,可是也在尝试,直接用大模型去搜尾推荐。

所以我们技术上面,就是我们刚刚说,可能比十年前我们推荐的技术能力可能有十倍以上提升。

那我觉得,在未来可能我们是在积极探索这一块的技术。

那第三块,就是我觉得,推荐的交互形式也是我积极在探索的。

就是现在我们是这样一个形式,我们是通过用户的行为去决定我的推荐结果的,这不就已经是最先进,不可能更先进了。

那有没有可能,我能够通过我领来让我有个理想态,对吧。

我之所以对这个推荐系统不满意,是因为我大脑中有一个画面,它是个理想态,它跟我的现在推荐系统不符合。

对,但是你除了它行为以外,还有什么更显露的?

那如果我能把这个画面用文字描述,并且告诉推荐系统,它能不能达到这个状态,那这个挺有意思。

这个等于是往回走了。

因为我十多年前,在那个就是广告行业的咨询公司上过班,就是用那个问卷,就用那种几个小时、几千道题的那种问卷,来获得那个用户的偏好和那个媒介行为使用习惯,然后给广告公司做投放,去做那个数据的知识。

对。

然后就是过去的这十多年,我一直觉得自己做过一个古代的工作,因为那个用户行为,对于用户的profiling和对于用户未来行为的预测,是远远好于用户的声明。

就是用户的,就是你问他,你喜欢什么,然后就是显得过去我做的那种基于问卷的、基于那个声明式的,现在推荐系统里面,其实有些困难问题,都是在通过问卷时间。

比如说你看抖音小王说,他都会提提一些问卷。

比如说:

  • 你觉得这是不是广告?
  • 你觉得这是不是个营销内容?
  • 你觉得是不是个优质内容?

是,其实这些问题都是,因为我们现在有很多目标,这些目标其实都是假设你发生那个行为,然后你觉得这个内容怎么样。

对,但我们根本知道可能是需要客观的知道,就是你大脑里面认为。

所以我们会发一些问卷,所以这些也会成为我们节目的目标。

所以说我刚刚其实说的第三块,不是实际的一个做法,我想说推荐系统的交互形式也可能会发生变化,然后我刚刚只是一个举个例子,也可能 maybe 是其他的。

但我觉得,那我也可以胡说八道。

我想象的是一个类似于特别聪明的一个智能,那个智能的助理,然后我往这一坐,就我开手机,我跟他说话,我说今天怎么怎么样,然后他听着我的话,一边听着我话一边跟我闹磕,一边给我推一些东西。

这不就是把那个声明式的那个都挖掘给综合进去了。

对,可能就是我刚刚说的那个逻辑,这一块也是open,带探索这样。

所以说,我刚刚逻辑就是说,可能在三块:

  • 在我们对这个视频本身的理解上面,如果我对这个内容理解得更深,那我当然应该推得更准。
  • 第二块就是说整个推荐的技术,就是过去来说,我们去借鉴推荐大模型,或者说直接用大模型,跟现在的推荐系统,可能会有一个涅变,但是这个也在探索当中,就是还在黎明之前,但也不知道黎明之后还是黑暗,是还是说它是一个展现的明天,大家在乐观探索当中。
  • 第三块就是说基于大模型的交互能力,是不是有可能在交互动线上面,有可能有新的可能性。

对。

然后以及说这三个东西,有没有可能今天我们说很多矛盾的问题,就是有一定的缓解,自然的解决掉,或者说是用一种方式超越掉。

但我原则上觉得,是超越不了的,因为模式逻辑来,我们讨论的是社会问题、哲学问题,是长久的,并不是技术问题。

对。

其实你刚才说的那个最后一点,我特别心有气息,就是你说能不能够再重新找一种新的方式,让用户直接表达出来他想要的东西,这个特别回应我一个,就是我一个心里的一个东西。

是说,这个行为偏好这个事在我看来,它背后隐藏的这个判断,是一个特别,就是完事不公的一个东西。

我给你举个例子,比如说推荐挖掘你的行为偏好这个事,就是这个命题是这意思,就是说所以一个人的行为,是百分之百诚实的,完全反映了这个人想要的,这个人的欲望,这个人的所有的一切,而他说的话都放屁,因为他说的话他根本不了解自己,因为他是一个身体。

就是嘴上说的天花乱坠,但是他身体很很诚实,就是人的行为表现出了这个人的真正的本质。

对,这个事是一个非常非常Cynical的东西。

就对于我来说,就是我会想象,就是我有一群人,我大概跟你的点,就是言行不一。

对。

所以到底是认为言是人还是行是人,就是行是百分之百,言是百分之零。

这个事就在我看来,就是这个推荐算法背后隐藏的这个价值判断,是在骂我,实在就是你不要这样,你先听我的话。

对。

就是纯打比方,我有一个群友,就是大伙在笑和他,这是一个愉快的夜晚。

有一个群友说,他说:

我最近在刷机器学习的教程,因为我在学什么什么,就是拍拖子或者什么,然后他说我搜了好多,我点了好多,好多。

但是每一个机器学习算法的视频下面,还是一串的擦标舞,擦标舞蹈,相关推荐是吧。

对,就是他猜你喜欢,就下面的相关的其他的算法,然后他的时间线经过他这几天对机器学习的搜索,依然没有改变,还都是擦标舞蹈。

然后这个时候群里面,就是他在抱怨这个事,为什么不鼓励我我想学的东西呢。

然后群里面所有人都在狂欢,因为所有人就都在说,因为你就是喜欢擦标舞蹈,就是你天天在这块。

当个白莲花,对我们宣称,你想学东西,但其实你就想看小工程跳舞。

然后对方说,我是想看小工程跳舞,但我也想学machine learning。

就我想说的是这种cinicism是在告诉我们,一人的主观的愿望,一人想要成为的样子,是完全不重要的,而他行为暴露了一切。

就是我不想完全,就我说的是个特别感性,就是完全不是一个工程师有用。

我觉得我是有公众逻辑,说这个声,就是不是一个工程师有意义要回答的东西,但我就想把它给说出来。

我不想沉浮于这种逻辑,就这个意思就是说,我就只是一个动物,我就是一个狗改不了吃屎,就是你的过去。 究竟决定的未来。

对。假设一个用户说“我要看这个”,但是你给他推了,如果他确实没看,那你要不要做这些?明白。明白。这个是挺经典的。

比如说,推荐里面经典的会做搜的推荐。比如说你搜索了一个东西,之后未来会在推荐里面多出一些这些东西。比如说你搜了机器学习,然后未来在你的推荐里面多出了一些机器学习,然后你选择了一个都不看,那我们很……就是三天之后,肯定再也不会给你推荐。

对,感觉这两个都是,都不应该。那问题是说,那一开始那个机器学习不推的,你不看那几个推荐系,我是不是仍要给你推?你觉得?我不知道。我不知道。

就是我们现在选择是给你推。OK,我明白。就是我们现在选择给你推。就是说你说“我要看这个”,我们是肯定是说,系统层面是要设计这个机制,就试探一下你是不是真的习惯,就是你给他机会了。对。

我是觉得,或者说我是觉得如果这个事,是我来考虑这个问题。就是说你说我想变好,那我们要配合你变好,但是发现,就是这个词不太好,就是你说你想学习,我们配合你学习,但是过了一段时间发现,你真实需求不是学习,那我们觉得还是要满足你的真实需求。

对,或者说你下次再想表现学习,我们还是再来满足你学习好了。就是我觉得,首先这个系统,如果你表现了想学习,系统没响应,我觉得这系统做得不好。对,这是客观一定要说的。

但是反过来说,如果你表达了学习,同时过了一段时间持续还是不学习,推荐还要给你让学习,这也是做得不好的表现。所以我觉得,它不是一个你的状态是要一个能闭环的一个合理状态。

但是你做的这个样子,一定还是有用户会来骂你。就是我只是搜了一下学习,我并不是希望你在推荐,我希望我其实搜索学习,推荐你了,我类型是有这个分工的,你不要乱动我的推荐。

对,会有用户来这么说这个。其实有非常多人在说这个。其实有非常多人在说这个。对。

那还有人说,我搜了学习了,虽然你给我推学习是不错的,但是虽然我没看,但我只是现在没心情,但我最终会看的。对,我最终会看的。这么最终你怎么就不推了呢?

就是说所以说我觉得,所以我自己看这个事就是,OK,我还是给你机会,这是我个人的观点,但是每个平台他可能对待的事情的态度是不一样的。就是我只代表我个人,不代表任何平台。

或者有时候会主动训练这个推荐算法,比如说我最近,大家会管用产品叫养号,就是这个事,大家对于什么是正确的养号方式,见解也不错。我只能说我们做最大公约数,明白。

就是因为你总要做一个选择,我把这个逻辑跟你说,你觉得没问题,然后80%的都没问题,但还好就是它不是一个特别冲突的事,就是不是一个大头的问题。

我就自己最近做了一个尝试。因为我要拿黑白相机拍,只能拍黑白相机拍佛像。对,所以我就想知道怎么拍的更好,所以我会在小红书上搜很多这个东西。对。

然后我会刻意地点很多我觉得不好看的黑白照片,来让他给我推更多黑白照片来养这个号。所以我就一直有个理论,我觉得如果俩人相亲,对,啥也别说,给对方看你社交人家首页,看你这首页推啥。

我觉得有可能是,比相亲的简历要更,对,更没sense的,又是一个行为派和表达派的。但我站在相亲这个角度,我有点战俘。

就是说,如果就是因为推荐是很是一个个人品味的,两个人在一起,是需要两个人对内容的品味一致吗?不需要。就是这是两个婚姻逻辑:

  • 两个人要相似所以结婚
  • 两个人要互补才能结婚

那两个逻辑我一个人都成立。逻辑我一个人都成立。

所以你刚刚那个相信逻辑我不再讨论,或者都不成立,或者都不成立。最大的问题是相亲系统直到今天都没有用上图现算法

对,他是最原始的。他们可能用的,但人家的收益路径可能不是你的满意度。对,因为那个婚姻中介本质上还是最原始的数据挖掘。对,就是我挖掘你的需求,我给你找一个匹配的。

或者说他很难获得真实类别,你们到底是约会了,还是结婚了,还是结婚满七年之后才算是完美。是,是。有可能现在匹配的是说,你们约会了就可以,因为那个可能结婚就很稀疏了。

就是看来根本不够他训练这个系统的。对。

所以我的这个幼稚的心灵里面的那个不服的那个东西,其实并不是在产品或者算法上的有任何的实质的意见。

我只是觉得,人自己希望成为的样子,应该是有一份权重的。就是说我想要成为什么样,但是我确实,我就,我还是很庸俗,我就是抵抗不住什么东西,所以我的行为就是身体很诚实。

所以我就觉得前者,应该能够反映在我的我所接受的信息,我的经验里面。我觉得你不用纠结。

就是,我们希望成为的那个人,他是我们的那个动力和目标。对。

然后那个,我们平日常的生活,他是,他就是我们的生活,他是滋养我们的。是,他是给我们补能的,我这是这么主要。

就是,这些东西给你补能的,你全部,就是补能完成了之后,你才能去做自己的梦想。对吧?是啊。

所以说,不相吃,不相吃,或者逗地来说,你这个意图,可以通过搜索来满足。

对,对。就是我们模仲来的来说,是希望推荐满足我们的一切。

我觉得过去,比如十年线这个事情是不太可能的,然后我觉得按照时间线已经,它可能越来越可能,它可能越来越可能。

对啊,我刚才讲的,全部的那种怀旧情绪,就是对于人们主动行为,然后被彻底的,因为算法太牛逼,太完美了,然后被彻底的,就是替换成了一个完全被动的行为。

就是从你有目的的去,但反过来你,你完全可以自主选择退化到十年前。是,但我也不愿意。

你可以自主的选择搜索。对,你甚至可以用订阅的方式,连工去看你关注那个,因为它就在那,我每天都可以用的。

只是因为它不如现在更好的系统来说。是的,对。

难道,但是就是理论上,就是你没办法招生,是个世界不进步,所以它还是个必然世界。

是,或者说你今天不进步,那美国的信息系统就进步了。对吧,那待会中国人去用美国推荐系统,这也不太可能。对吧,明白。

关于这一切,我还有最后一个问题,就是关于你的工作,可能稍微有点私人。

就是,你有没有一些时刻,或者一些情况,或者你能回忆到的一件事,在那个时刻,那个地点,你会有一种挺骄傲的感觉。

就是你会觉得你的工作挺有价值的。因为我们刚才说了很多非常非常沉重的事,你就在这个相当于社会所有的矛盾综合成的一个漩涡里面。

然后你当一个无辜的工程师,但是社会对于推荐算法的看法是就不依不饶的。

所以听起来像是一个有点沉重的这么一件事情。但你在你的工作里面,有没有一个时刻,你会觉得自己确实是承担了一些责任,并且你觉得自己挺棒的。

那个东西是什么?

就是我们,我曾经附作过一个场景的这个推荐算法吧。就是说,我们可能把这个推荐算法效率优化很多,但是更好的是说,就是这个产品的口碑,它非常好,就是大家认可这个推荐的是好内容,是他们需要的内容。

对。

然后,当然也会有一个积极节点,就是可能比如说最终,就是公司会觉得,这个是做的蛮不错的,然后可能有一个……那个,我在那个节点就是会觉得,其实我再做一个产品,其实我觉得,然后这个产品对于至少对于机器人用户来说,是有那个社会价值的。

对。

然后我会觉得应该还是蛮骄傲的。其实我觉得推荐给我带来蛮多快乐的。

就是说:

  • 两个层面,一个层面是技术的迭代,因为推荐技术这么多年,技术一直在非常快的迭代,然后我在这个中间参与了很多技术迭代的升级,它其实相当于获得了工程式的快乐。
  • 另外一个逻辑就是说,随着我自己的发展,越来越多的去决定一个产品它能长什么样,那中间这个产品满足的是一类文化一类意图,这让我感觉自己在做一些文化产品,这会让我感觉我在做一些非常难忧的事情。

就是说,我们在改变世界嘛,就是这个非常难忧的事情。这是非常难忧的话。

你有时候会觉得,至少我在做的这个社,对有些人来说,它是认可的,然后就是它获得很多的信息和知识。我会觉得,就是特别是说这个产品,是我在中间推荐的,从零到零素的,而不是说在技术上,这个事情对我来说可能意义很大。

我觉得可能你们做创业,可能对这一点可能会有一些共鸣,这个没法太细说那个感觉。

对,就是它很微妙,但也不是一个大喜悦,但是你会知道我再改变一些东西,然后我再做一些事,它不一定对我说经济上有什么回报,但是我会知道我再做一些,就是我再改变一些东西。

我觉得就是我们在生活,我们生活在一个多么的cynical的世界里面,以至于人们说我在改变世界,这个话是非常羞耻的,说不出口难以启齿的。

对,我觉得就是,十年前我们还可以很大胆地说这个话,就是还是有点羞耻。对,还是有点羞耻。

对,就是正能量羞耻。

行吧,最后一个问题我问,你来吧,我们结果每次所有嘉宾都有最后一个问题。

就因为我俩的主要工作,是在全球给建筑做建模,那如果今天让你选择一个建筑永久地保存在互联网上,人们永远都能看见它,即使它消失了,人们也能知道它长什么样,它有它的故事。

你会选择什么建筑?什么都行。就我们有说古建筑的,有说现代建筑的,有说自己家的,有说自己宿舍的,什么都可以。

就是为人类留一个建筑,是吧?对,就从你的角度来说,为人类留一个,而不是从人类的角度来说,你也不管为谁留。

就是说因为大部分东西是留不下来的,所以如果你现在有这个权利,你指定一个地方,是是什么?不用管为什么或者什么价值,就是你心里的,你想留下的东西就行。

我觉得可能是,就是如果要为人类留下一个东西吧,我觉得可能是一本岩石的书籍,然后里面但是并没有什么内容。

对,因为你的题可能是其他的,可能是我自己想要留什么精神。

但是我自己可能觉得社会的生活,包括咱们的情绪,本质还是做一个信息传播,本质是一个信息传播和交流。

我想就是人类留下什么,其实没有,我就不是想要给其他人证明什么,而是说可能我一本书就证明就是人类存在过,有过文明,就是就OK了。

就是不是那种留什么遗产,就在哪就可以了。

然后如果一定要有什么标志性的,我觉得可能那本书,但不一定是什么书,可能就是代表着有这么东西。

可能下一代的人类,下一个物种,他不知道是什么东西,但我觉得OK,Just it就可以了

就是让他脱离语境和脱离人们可理解他的前置条件,把一个东西保存下来,就OK了。

对,我觉得就是不用强行升华,就是很发展,我也没有什么逻辑。

就是聊这个事,挺好。

我不知道其他人可能是说一个什么东西,但你这个非常好,我非常喜欢。

对,没问题。

好,好,这些,感谢冯继,感谢感谢,这些没少录,挺好。