[1]

T.-V. PRICOPE, “HardML: A Benchmark for Evaluating Data Science and Machine Learning Knowledge and Reasoning in AI”, Studia UBB Informatica, vol. 69, no. 2, pp. 59–76, Mar. 2025.