Vectorizarea este un proces esențial în inteligența artificială și procesarea limbajului natural (NLP), prin care datele textuale, imaginile sau alte tipuri de informații nestructurate sunt transformate în reprezentări numerice (vectori). Acești vectori permit modelelor de învățare automată să proceseze și să interpreteze datele într-un mod matematic și computabil.
În NLP, vectorizarea este folosită pentru a converti cuvintele sau propozițiile în formate precum Bag of Words, TF-IDF, Word2Vec, GloVe sau embedding-uri contextualizate (ex: BERT). În viziunea computerizată, imaginile sunt vectorizate prin extragerea caracteristicilor relevante folosind rețele neuronale convoluționale. Vectorizarea face posibilă compararea, clasificarea, căutarea sau analiza semantică a datelor, reprezentând o etapă crucială în construcția sistemelor AI eficiente.