Techtalks

[Tech Talk #41] 哥大彭天翼：当A/B实验平台遇上强化学习

A/B测试面临实验干扰问题，影响结果可靠性。我们提出基于强化学习的"Difference-in-Q"(DQ)估计器，通过求解Q值差分估计treatment effect。理论上，DQ在偏差-方差权衡方面表现出色，显著降低偏差，方差指数级缩减。与抖音合作应用于大规模商业场景，均方误差减少99%以上，展现卓越性能。

2023-09-03

阅读时长1分钟

[Tech Talk #40] 针对双边约束的在线资源分配问题的接近最优算法

本次分享中，陈再毅博士将介绍在线资源分配问题中的接近最优算法，特别是在存在双边约束的情况下。他将讨论算法的设计思路、理论分析以及在供应链和物流领域的应用实践。

2023-05-27

阅读时长1分钟

[Tech Talk #39] 开源FinRL和FinGPT

本次分享中，刘小洋博士将介绍FinGPT——金融领域的大模型架构，并重点分享金融强化学习中由于金融数据的高度动态性而呈现出独特的挑战及其解决方案。

2023-05-12

阅读时长1分钟

[Tech Talk #38] 精确算法，精准决策：用“交互式优化”解决学校上下学时间问题

本次分享中，连真博士将介绍使用交互式优化算法在美国首次实现学校时间更改的实践经验。

2023-03-11

阅读时长1分钟

[Tech Talk #41] 哥大 彭天翼：当A/B实验平台遇上强化学习

[Tech Talk #40] 针对双边约束的在线资源分配问题的接近最优算法

[Tech Talk #39] 开源FinRL和FinGPT

[Tech Talk #38] 精确算法，精准决策：用“交互式优化”解决学校上下学时间问题

[Tech Talk #41] 哥大彭天翼：当A/B实验平台遇上强化学习