Bilibili的推荐算法是好的

我们用第一性原理来拆解“Bilibili 的推荐算法是好的”这个命题。核心是:不接受任何行业共识或用户直觉,只保留最底层事实,再重新推导。


一、基础事实(去掉所有常见假设)

先去掉这些常见假设:

  • “推荐算法应该让用户看到喜欢的内容”

  • “推荐算法应该公平”

  • “推荐算法应该帮助创作者”

  • “推荐算法越精准越好”

这些都是价值判断或行业叙事,不是基础事实。

保留最基础事实:

事实1:平台是商业组织

Bilibili 是一家上市互联网公司,其生存依赖:

  • 收入(广告 / 会员 / 游戏 / 电商)

  • 用户规模

  • 用户活跃度

如果无法维持这些,公司无法持续存在。


事实2:用户时间是平台的核心资源

所有内容平台竞争的是:

用户注意力 / 用户时间

每个用户每天只有有限时间。

平台之间竞争:

  • TikTok

  • YouTube

  • Instagram

  • Bilibili

本质是:

谁能占用更多时间


事实3:推荐算法的输入是用户行为数据

推荐系统依赖数据,例如:

  • 点击

  • 停留时长

  • 完播率

  • 点赞

  • 投币

  • 评论

  • 分享

算法不能直接理解内容价值,只能理解:

行为信号


事实4:算法优化的是可量化指标

机器学习系统必须优化明确指标,例如:

  • CTR(点击率)

  • Watch Time(观看时长)

  • Retention(留存)

  • Engagement(互动)

无法直接优化:

  • 内容深度

  • 社会价值

  • 知识质量

因为这些难以量化


二、逻辑推导

从上述事实推导。


推导1:平台目标 → 最大化用户时间

事实:

  • 平台依赖用户活跃度

  • 用户时间有限

因此平台理性选择:

最大化用户停留时间


推导2:算法只能优化行为信号

由于算法只能读到:

  • 点击

  • 停留

  • 互动

因此算法的目标函数本质是:

最大化行为指标

例如:

max (watch time + engagement)


推导3:行为指标 ≠ 内容质量

一个内容可能:

高点击 + 高停留
但并不代表:

高质量 / 高价值

例如:

  • 情绪刺激

  • 戏剧冲突

  • 信息密度低但娱乐性强

这些往往更容易产生行为信号。


推导4:算法会强化“可传播内容”

因为推荐系统是反馈系统:

更多互动
→ 更多推荐
→ 更多曝光
→ 更多互动

最终结果:

强者愈强


推导5:算法不追求公平

算法不会主动平衡:

  • 新人 vs 头部

  • 小众 vs 大众

  • 深度 vs 娱乐

因为公平不是优化目标。


三、可能结论

从第一性推导,会得到几种不同结论。


结论1(平台视角)

Bilibili 的推荐算法是好的。

理由:

它有效实现了平台目标:

  • 提升用户停留时间

  • 提升互动

  • 增加广告价值

从商业角度:

算法是成功的。


结论2(用户体验视角)

推荐算法未必是好的

原因:

行为优化可能导致:

  • 内容同质化

  • 情绪刺激内容增加

  • 深度内容曝光下降

即:

算法优化的是“看得久”,不是“看得好”。


结论3(创作者视角)

算法是:

选择性友好

对某些创作者友好:

  • 高频

  • 娱乐化

  • 强情绪

但对一些创作者不友好:

  • 长内容

  • 学术类

  • 小众领域


四、这种推导与常见观点的不同

常见观点通常是:

观点A:算法好/不好

用户讨论:

  • 推荐准不准

  • 内容多不多

  • 公平不公平

这是体验层讨论


第一性原理的不同

第一性推导问的是:

算法的目标函数是什么?

而不是:

我们希望它是什么。


常见思维:

推荐算法应该让用户看到好内容

第一性思维:

推荐算法只是在最大化某些指标


换句话说:

常见讨论是:

算法应该做什么

第一性推导是:

算法实际上在做什么


五、一句话总结

第一性原理下:

推荐算法不是“好内容发现系统”,
而是“用户行为最大化系统”。

当理解这一点后,

很多现象都会变得可解释。


如果你愿意,我还可以继续用第一性原理拆解一个更深的问题:

为什么几乎所有内容平台的推荐算法最终都会越来越像 TikTok。

这个推导其实非常有意思,而且几乎是平台演化的必然结果

我们继续用第一性原理拆解这个更深的问题:

为什么几乎所有内容平台的推荐算法最终都会越来越像 TikTok?

包括:

  • YouTube

  • Instagram

  • Bilibili

  • Facebook

都在逐渐出现类似:

  • 短视频

  • 无限滑动

  • 强推荐流

我们依然按照结构:

基础事实 → 逻辑推导 → 可能结论


一、基础事实(去掉所有行业叙事)

先去掉常见解释:

  • “短视频更符合时代”

  • “年轻人喜欢短视频”

  • “TikTok更懂内容”

这些都不是基础事实。


基础事实1:用户时间是固定的

每个人每天:

只有 24 小时

而娱乐时间更少。

平台竞争的是:

注意力份额


基础事实2:推荐系统需要快速反馈

机器学习系统依赖:

输入 → 用户行为 → 更新模型

如果反馈很慢:

算法学习效率就会降低。


基础事实3:短内容反馈更快

举例:

长视频(20分钟)

用户行为信号:

  • 点击

  • 20分钟后才知道是否看完

反馈周期:

很长


短视频(15秒)

反馈信号:

  • 看完

  • 滑走

  • 点赞

反馈周期:

几秒


因此:

短内容产生的数据密度更高。


基础事实4:算法需要大量数据

机器学习性能依赖:

训练样本数量

数据越多:

模型越准。


基础事实5:用户决策成本影响使用频率

用户每次选择内容时会消耗:

认知成本

例如:

  • 选一个20分钟视频

  • 需要思考

而滑短视频:

几乎没有选择成本。


二、逻辑推导

从基础事实开始推。


推导1:平台目标是最大化用户时间

平台理性目标:

max(用户停留时间)


推导2:算法需要快速学习

为了优化推荐:

平台需要:

更多用户行为数据


推导3:短视频产生更多行为数据

假设:

用户看 1 小时。

长视频:

3 个视频
→ 3 个反馈信号

短视频:

200 个视频
→ 200 个反馈信号

数据量差距:

接近 100 倍


推导4:数据越多 → 推荐越精准

机器学习规律:

更多数据
→ 更好的预测
→ 更高停留时间


推导5:无限滑动减少用户决策成本

传统模式:

搜索
→ 点击
→ 选择

短视频模式:

滑动

决策成本几乎为零。


推导6:平台之间存在竞争压力

如果一个平台:

用户停留时间更长

它就能:

  • 吸走用户时间

  • 吸走广告收入

竞争平台必须模仿。


三、最终演化结果

综合这些推导:

平台会自然演化成:

高反馈密度 + 低选择成本的系统

而最优结构就是:

短内容
+
无限滑动
+
强推荐

这正是:

TikTok 的产品结构。


四、为什么所有平台都会趋同

这是一个系统稳定点(equilibrium)

如果某个平台不这样做:

例如只做长视频。

那么它的:

  • 数据密度更低

  • 推荐优化更慢

  • 用户停留时间更短

最终竞争力下降。


因此平台会不断向:

最高效率结构

靠近。


五、真正的核心结论

很多人认为:

TikTok 是创新。

从第一性原理看:

TikTok 更像是一个“最优解”被发现。

就像自然界里的:

  • 水往低处流

  • 进化趋向适应度最大

内容平台最终都会逼近这个结构。


六、第一性推导 vs 常见观点

常见观点解释:

因为年轻人喜欢短视频

第一性解释:

因为短视频产生最多可训练数据


常见解释:

TikTok产品设计更好

第一性解释:

TikTok找到最高数据密度结构


七、更深一层的问题

如果继续用第一性原理推导,会得到一个更有意思的问题:

为什么推荐算法最终会改变“文化结构”?

也就是为什么:

  • 内容越来越短

  • 情绪越来越强

  • 节奏越来越快

如果你愿意,我可以继续拆解这个问题。

它其实涉及:

算法 → 人类注意力 → 文化演化。

这个推导会非常反直觉。