Validarea încrucișată (cross-validation) este o tehnică statistică utilizată în învățarea automată pentru a evalua capacitatea unui model de a generaliza pe date noi. Aceasta implică împărțirea setului de date în mai multe subseturi (numite „fold-uri”), antrenând modelul pe o parte dintre ele și testându-l pe restul, într-un mod repetitiv și sistematic. Cel mai des folosită este varianta k-fold cross-validation, unde datele sunt împărțite în k părți egale.
Scopul validării încrucișate este de a preveni suprainvățarea (overfitting) sau subantrenarea (underfitting), oferind o estimare mai realistă a performanței modelului. Această metodă este esențială în selecția modelelor, ajustarea hiperparametrilor și compararea între algoritmi. Prin utilizarea eficientă a tuturor datelor disponibile, validarea încrucișată contribuie la construirea unor modele robuste și bine calibrate pentru predicții pe date neîntâlnite anterior.