Scoprite la potenza del rilevamento degli oggetti: identificate e localizzate gli oggetti nelle immagini o nei video con modelli all'avanguardia come YOLO. Esplorate le applicazioni del mondo reale!
Il rilevamento degli oggetti è un'attività fondamentale della computer vision (CV) che prevede l'identificazione e la localizzazione di uno o più oggetti all'interno di un'immagine o di un video. L'obiettivo non è solo quello di classificare gli oggetti, ma anche di determinarne la posizione, in genere disegnando un rettangolo di selezione intorno a ciascuno di essi. Questa tecnologia è alla base di molte applicazioni avanzate di intelligenza artificiale (AI), in quanto consente alle macchine di percepire e interpretare l'ambiente fisico circostante con un elevato grado di comprensione.
I modelli di rilevamento degli oggetti sono in genere costruiti utilizzando il deep learning (DL), in particolare le reti neurali convoluzionali (CNN). Il processo prevede l'inserimento di un'immagine nella rete, che produce un elenco di oggetti rilevati, ciascuno con un'etichetta di classe (ad esempio, "persona", "auto", "cane"), un punteggio di confidenza e le coordinate del suo rettangolo di gioco.
Le moderne architetture di rilevamento degli oggetti sono costituite da due parti principali: una struttura portante per l'estrazione delle caratteristiche dall'immagine di ingresso e una testa di rilevamento per la previsione dei riquadri di delimitazione e delle classi. Queste architetture sono spesso classificate come rilevatori a uno o due stadi.
È importante distinguere il rilevamento degli oggetti da altre attività di computer vision correlate:
Il rilevamento degli oggetti è una tecnologia trasformativa utilizzata in molti settori.
Lo sviluppo e la distribuzione di modelli di rilevamento degli oggetti comporta un ricco ecosistema di strumenti e tecniche.