实验干扰 :: 运筹OR帷幄直播汇总 - Example site for hugo-theme-tailwind

[Tech Talk #41] 哥大彭天翼：当A/B实验平台遇上强化学习

A/B测试面临实验干扰问题，影响结果可靠性。我们提出基于强化学习的"Difference-in-Q"(DQ)估计器，通过求解Q值差分估计treatment effect。理论上，DQ在偏差-方差权衡方面表现出色，显著降低偏差，方差指数级缩减。与抖音合作应用于大规模商业场景，均方误差减少99%以上，展现卓越性能。

应用统计
A/B测试
实验设计
实验干扰
off-policy evaluation
强化学习

2023-09-03

阅读时长1分钟

[Tech Talk #41] 哥大 彭天翼：当A/B实验平台遇上强化学习

[Tech Talk #41] 哥大彭天翼：当A/B实验平台遇上强化学习