Bilibili的推荐算法是好的

promptonce · 2026 年3 月 15 日 04:05

我们用第一性原理来拆解“Bilibili 的推荐算法是好的”这个命题。核心是：不接受任何行业共识或用户直觉，只保留最底层事实，再重新推导。

一、基础事实（去掉所有常见假设）

先去掉这些常见假设：

“推荐算法应该让用户看到喜欢的内容”
“推荐算法应该公平”
“推荐算法应该帮助创作者”
“推荐算法越精准越好”

这些都是价值判断或行业叙事，不是基础事实。

保留最基础事实：

事实1：平台是商业组织

Bilibili 是一家上市互联网公司，其生存依赖：

收入（广告 / 会员 / 游戏 / 电商）
用户规模
用户活跃度

如果无法维持这些，公司无法持续存在。

事实2：用户时间是平台的核心资源

所有内容平台竞争的是：

用户注意力 / 用户时间

每个用户每天只有有限时间。

平台之间竞争：

TikTok
YouTube
Instagram
Bilibili

本质是：

谁能占用更多时间

事实3：推荐算法的输入是用户行为数据

推荐系统依赖数据，例如：

点击
停留时长
完播率
点赞
投币
评论
分享

算法不能直接理解内容价值，只能理解：

行为信号

事实4：算法优化的是可量化指标

机器学习系统必须优化明确指标，例如：

CTR（点击率）
Watch Time（观看时长）
Retention（留存）
Engagement（互动）

无法直接优化：

内容深度
社会价值
知识质量

因为这些难以量化。

二、逻辑推导

从上述事实推导。

推导1：平台目标 → 最大化用户时间

事实：

平台依赖用户活跃度
用户时间有限

因此平台理性选择：

最大化用户停留时间

推导2：算法只能优化行为信号

由于算法只能读到：

点击
停留
互动

因此算法的目标函数本质是：

最大化行为指标

例如：

max (watch time + engagement)

推导3：行为指标 ≠ 内容质量

一个内容可能：

高点击 + 高停留
但并不代表：

高质量 / 高价值

例如：

情绪刺激
戏剧冲突
信息密度低但娱乐性强

这些往往更容易产生行为信号。

推导4：算法会强化“可传播内容”

因为推荐系统是反馈系统：

更多互动
→ 更多推荐
→ 更多曝光
→ 更多互动

最终结果：

强者愈强

推导5：算法不追求公平

算法不会主动平衡：

新人 vs 头部
小众 vs 大众
深度 vs 娱乐

因为公平不是优化目标。

三、可能结论

从第一性推导，会得到几种不同结论。

结论1（平台视角）

Bilibili 的推荐算法是好的。

理由：

它有效实现了平台目标：

提升用户停留时间
提升互动
增加广告价值

从商业角度：

算法是成功的。

结论2（用户体验视角）

推荐算法未必是好的。

原因：

行为优化可能导致：

内容同质化
情绪刺激内容增加
深度内容曝光下降

即：

算法优化的是“看得久”，不是“看得好”。

结论3（创作者视角）

算法是：

选择性友好

对某些创作者友好：

高频
娱乐化
强情绪

但对一些创作者不友好：

长内容
学术类
小众领域

四、这种推导与常见观点的不同

常见观点通常是：

观点A：算法好/不好

用户讨论：

推荐准不准
内容多不多
公平不公平

这是体验层讨论。

第一性原理的不同

第一性推导问的是：

算法的目标函数是什么？

而不是：

我们希望它是什么。

常见思维：

推荐算法应该让用户看到好内容

第一性思维：

推荐算法只是在最大化某些指标

换句话说：

常见讨论是：

算法应该做什么

第一性推导是：

算法实际上在做什么

五、一句话总结

第一性原理下：

推荐算法不是“好内容发现系统”，
而是“用户行为最大化系统”。

当理解这一点后，

很多现象都会变得可解释。

如果你愿意，我还可以继续用第一性原理拆解一个更深的问题：

为什么几乎所有内容平台的推荐算法最终都会越来越像 TikTok。

这个推导其实非常有意思，而且几乎是平台演化的必然结果。

promptonce · 2026 年3 月 15 日 04:06

我们继续用第一性原理拆解这个更深的问题：

为什么几乎所有内容平台的推荐算法最终都会越来越像 TikTok？

包括：

YouTube
Instagram
Bilibili
Facebook

都在逐渐出现类似：

短视频
无限滑动
强推荐流

我们依然按照结构：

基础事实 → 逻辑推导 → 可能结论

一、基础事实（去掉所有行业叙事）

先去掉常见解释：

“短视频更符合时代”
“年轻人喜欢短视频”
“TikTok更懂内容”

这些都不是基础事实。

基础事实1：用户时间是固定的

每个人每天：

只有 24 小时

而娱乐时间更少。

平台竞争的是：

注意力份额

基础事实2：推荐系统需要快速反馈

机器学习系统依赖：

输入 → 用户行为 → 更新模型

如果反馈很慢：

算法学习效率就会降低。

基础事实3：短内容反馈更快

举例：

长视频（20分钟）

用户行为信号：

点击
20分钟后才知道是否看完

反馈周期：

很长

短视频（15秒）

反馈信号：

看完
滑走
点赞

反馈周期：

几秒

因此：

短内容产生的数据密度更高。

基础事实4：算法需要大量数据

机器学习性能依赖：

训练样本数量

数据越多：

模型越准。

基础事实5：用户决策成本影响使用频率

用户每次选择内容时会消耗：

认知成本

例如：

选一个20分钟视频
需要思考

而滑短视频：

几乎没有选择成本。

二、逻辑推导

从基础事实开始推。

推导1：平台目标是最大化用户时间

平台理性目标：

max(用户停留时间)

推导2：算法需要快速学习

为了优化推荐：

平台需要：

更多用户行为数据

推导3：短视频产生更多行为数据

假设：

用户看 1 小时。

长视频：

3 个视频
→ 3 个反馈信号

短视频：

200 个视频
→ 200 个反馈信号

数据量差距：

接近 100 倍

推导4：数据越多 → 推荐越精准

机器学习规律：

更多数据
→ 更好的预测
→ 更高停留时间

推导5：无限滑动减少用户决策成本

传统模式：

搜索
→ 点击
→ 选择

短视频模式：

滑动

决策成本几乎为零。

推导6：平台之间存在竞争压力

如果一个平台：

用户停留时间更长

它就能：

吸走用户时间
吸走广告收入

竞争平台必须模仿。

三、最终演化结果

综合这些推导：

平台会自然演化成：

高反馈密度 + 低选择成本的系统

而最优结构就是：

短内容
+
无限滑动
+
强推荐

这正是：

TikTok 的产品结构。

四、为什么所有平台都会趋同

这是一个系统稳定点（equilibrium）。

如果某个平台不这样做：

例如只做长视频。

那么它的：

数据密度更低
推荐优化更慢
用户停留时间更短

最终竞争力下降。

因此平台会不断向：

最高效率结构

靠近。

五、真正的核心结论

很多人认为：

TikTok 是创新。

从第一性原理看：

TikTok 更像是一个“最优解”被发现。

就像自然界里的：

水往低处流
进化趋向适应度最大

内容平台最终都会逼近这个结构。

六、第一性推导 vs 常见观点

常见观点解释：

因为年轻人喜欢短视频

第一性解释：

因为短视频产生最多可训练数据

常见解释：

TikTok产品设计更好

第一性解释：

TikTok找到最高数据密度结构

七、更深一层的问题

如果继续用第一性原理推导，会得到一个更有意思的问题：

为什么推荐算法最终会改变“文化结构”？

也就是为什么：

内容越来越短
情绪越来越强
节奏越来越快

如果你愿意，我可以继续拆解这个问题。

它其实涉及：

算法 → 人类注意力 → 文化演化。

这个推导会非常反直觉。