
OneRec系统的核心是利用Encoder压缩用户全生命周期行为序列实现兴趣建模,同时基于MoE架构的Decoder实现超大规模参数扩展,确保短视频推荐的端到端精准生成。配合定制化强化学习框架和极致的训练/推理优化,使模型实现了效果和效率的双赢。这个系统的优点在于它可以让推荐效果显著提高,同时降低运营成本。
近日,这个系统在快手App和快手极速版双端服务所有用户,承接约25%的QPS,带动App停留时长提升0.54%/1.24%,关键指标7日用户生命周期(LT7)显著增长。这个系统的成功应用为推荐系统从传统Pipeline迈向端到端生成式架构提供了首个工业级可行方案。
OneRec系统还在训练阶段采用了一系列创新性突破,包括计算压缩、embedding加速优化等核心优化技术,同时在推理阶段通过计算复用、算子优化等策略提高了效率。通过这些系统性的优化策略,OneRec在训练和推理的MFU分别达到了23.7%和28.8%,相比传统推荐模型有了大幅改善。
除了短视频推荐的消费场景外,OneRec在快手本地生活服务场景同样表现出色,GMV、订单量、购买用户数等指标均有显著提升。目前,该业务线已实现100%流量全量切换,验证了OneRec在不同业务场景的泛化能力。
尽管OneRec取得了显著的成果,但仍有一些待完善的地方。未来,快手技术团队将进一步完善推理能力、构建多模态桥接以及设计更完备的Reward System。他们期望利用这些能力引导模型更好地理解用户偏好和业务需求,提供更优的推荐体验。可以预见未来补全更多AI能力的OneRec无疑会更强大释放出更大的价值引领整个行业的变革与发展。
