YOLO (You Only Look Once) este un algoritm de detecție a obiectelor în imagini și secvențe video, bazat pe rețele neuronale convoluționale (CNN), care realizează identificarea și localizarea obiectelor într-o singură trecere prin rețea. Spre deosebire de metodele tradiționale care utilizează etape separate pentru propunerea regiunilor și clasificarea obiectelor YOLO tratează problema detecției ca pe o sarcină unificată de regresie. Imaginea este împărțită în grile, iar pentru fiecare celulă se prezic direct coordonatele bounding box-urilor, scorurile de încredere și clasele obiectelor detectate, ceea ce reduce semnificativ latența procesării.
Principala caracteristică a YOLO este viteza ridicată, care îl face potrivit pentru aplicații în timp real, precum monitorizare video, sisteme de asistență la conducere și robotică. De-a lungul timpului, algoritmul a evoluat prin mai multe versiuni (YOLOv1, YOLOv2, YOLOv3, până la iterațiile recente YOLOv8 și YOLO-NAS), fiecare aducând îmbunătățiri în precizia detecției, suportul pentru obiecte de dimensiuni variate și optimizarea performanței pe dispozitive cu resurse limitate.