HANQI ZHANG. Counterfactual Learning-to-Rank for Ads: Off-Policy Evaluation on the Open Bandit Dataset. Journal of Advanced Computing Systems , [S. l.], v. 5, n. 12, p. 1–11, 2025. DOI: 10.69987/JACS.2025.51201. Disponível em: https://scipublication.com/index.php/JACS/article/view/271.. Acesso em: 15 jun. 2026.