我们用第一性原理来拆解“Bilibili 的推荐算法是好的”这个命题。核心是:不接受任何行业共识或用户直觉,只保留最底层事实,再重新推导。
一、基础事实(去掉所有常见假设)
先去掉这些常见假设:
-
“推荐算法应该让用户看到喜欢的内容”
-
“推荐算法应该公平”
-
“推荐算法应该帮助创作者”
-
“推荐算法越精准越好”
这些都是价值判断或行业叙事,不是基础事实。
保留最基础事实:
事实1:平台是商业组织
Bilibili 是一家上市互联网公司,其生存依赖:
-
收入(广告 / 会员 / 游戏 / 电商)
-
用户规模
-
用户活跃度
如果无法维持这些,公司无法持续存在。
事实2:用户时间是平台的核心资源
所有内容平台竞争的是:
用户注意力 / 用户时间
每个用户每天只有有限时间。
平台之间竞争:
-
TikTok
-
YouTube
-
Instagram
-
Bilibili
本质是:
谁能占用更多时间
事实3:推荐算法的输入是用户行为数据
推荐系统依赖数据,例如:
-
点击
-
停留时长
-
完播率
-
点赞
-
投币
-
评论
-
分享
算法不能直接理解内容价值,只能理解:
行为信号
事实4:算法优化的是可量化指标
机器学习系统必须优化明确指标,例如:
-
CTR(点击率)
-
Watch Time(观看时长)
-
Retention(留存)
-
Engagement(互动)
无法直接优化:
-
内容深度
-
社会价值
-
知识质量
因为这些难以量化。
二、逻辑推导
从上述事实推导。
推导1:平台目标 → 最大化用户时间
事实:
-
平台依赖用户活跃度
-
用户时间有限
因此平台理性选择:
最大化用户停留时间
推导2:算法只能优化行为信号
由于算法只能读到:
-
点击
-
停留
-
互动
因此算法的目标函数本质是:
最大化行为指标
例如:
max (watch time + engagement)
推导3:行为指标 ≠ 内容质量
一个内容可能:
高点击 + 高停留
但并不代表:
高质量 / 高价值
例如:
-
情绪刺激
-
戏剧冲突
-
信息密度低但娱乐性强
这些往往更容易产生行为信号。
推导4:算法会强化“可传播内容”
因为推荐系统是反馈系统:
更多互动
→ 更多推荐
→ 更多曝光
→ 更多互动
最终结果:
强者愈强
推导5:算法不追求公平
算法不会主动平衡:
-
新人 vs 头部
-
小众 vs 大众
-
深度 vs 娱乐
因为公平不是优化目标。
三、可能结论
从第一性推导,会得到几种不同结论。
结论1(平台视角)
Bilibili 的推荐算法是好的。
理由:
它有效实现了平台目标:
-
提升用户停留时间
-
提升互动
-
增加广告价值
从商业角度:
算法是成功的。
结论2(用户体验视角)
推荐算法未必是好的。
原因:
行为优化可能导致:
-
内容同质化
-
情绪刺激内容增加
-
深度内容曝光下降
即:
算法优化的是“看得久”,不是“看得好”。
结论3(创作者视角)
算法是:
选择性友好
对某些创作者友好:
-
高频
-
娱乐化
-
强情绪
但对一些创作者不友好:
-
长内容
-
学术类
-
小众领域
四、这种推导与常见观点的不同
常见观点通常是:
观点A:算法好/不好
用户讨论:
-
推荐准不准
-
内容多不多
-
公平不公平
这是体验层讨论。
第一性原理的不同
第一性推导问的是:
算法的目标函数是什么?
而不是:
我们希望它是什么。
常见思维:
推荐算法应该让用户看到好内容
第一性思维:
推荐算法只是在最大化某些指标
换句话说:
常见讨论是:
算法应该做什么
第一性推导是:
算法实际上在做什么
五、一句话总结
第一性原理下:
推荐算法不是“好内容发现系统”,
而是“用户行为最大化系统”。
当理解这一点后,
很多现象都会变得可解释。
如果你愿意,我还可以继续用第一性原理拆解一个更深的问题:
为什么几乎所有内容平台的推荐算法最终都会越来越像 TikTok。
这个推导其实非常有意思,而且几乎是平台演化的必然结果。