Come iniziare con la visione artificiale nel 2023?

May 09 2023
Una tabella di marcia da zero a diversa da zero per diventare un ingegnere o ricercatore di visione artificiale nel 2023. Scopri cosa imparare e come applicare le competenze apprese in progetti del mondo reale per entrare nell'industria o nel mondo accademico.

Una tabella di marcia da zero a diversa da zero per diventare un ingegnere o ricercatore di visione artificiale nel 2023. Scopri cosa imparare e come applicare le competenze apprese in progetti del mondo reale per entrare nell'industria o nel mondo accademico.

Fonte: immagine di possessionedphotography su Unsplash.

Motivazione

La visione artificiale (CompVis) è un campo dell'intelligenza artificiale (AI) che prevede l'addestramento dei computer per interpretare e comprendere immagini e video . Le applicazioni pratiche di CompVis spaziano dai robot di produzione industriale, alle auto a guida autonoma e alla videosorveglianza, all'imaging medico e alla realtà aumentata. In molti casi, CompVis può automatizzare le attività e fa risparmiare tempo e fatica a noi uomini di Neanderthal , il che lo rende utile per applicazioni pratiche. Inoltre, in alcuni casi, supera anche gli umani, rendendo CompVis uno strumento vitale per molti settori. [1]

In questo articolo, condividerò una tabella di marcia che puoi utilizzare per iniziare con CompVis, sia nell'industria che nel mondo accademico. Innanzitutto, condividerò alcune risorse di apprendimento gratuite e disponibili pubblicamente. Quindi parlerò di piattaforme in cui puoi applicare le abilità apprese per costruire il tuo portfolio. Se sei nuovo o hai una certa esperienza, questa guida può potenzialmente renderti ancora migliore in questo campo molto eccitante e in rapida evoluzione!

Questo articolo è organizzato come segue:

  1. Risorse di apprendimento
  2. Concorsi online
  3. Collaborazioni tra industria e ricerca

Risorse di apprendimento

In questa sezione, esaminerò tre risorse che dovresti prendere in considerazione per ottenere una buona comprensione della teoria e della pratica alla base della costruzione di sistemi CompVis. Questo per aumentare la tua profondità come professionista CompVis. I prossimi due saranno quelli che dovresti esaminare per avere un'idea dei vari compiti e dei paradigmi di apprendimento in CompVis. Questo per aumentare la tua ampiezza.

La specializzazione Deep Learning consiste in un totale di cinque corsi che ti insegneranno le basi del deep learning applicato a CompVis, l'elaborazione del linguaggio naturale, ecc. Copre concetti sia teorici che pratici per costruire, addestrare e testare modelli di deep learning. Potrai costruire e addestrare i tuoi modelli tramite i compiti del corso. Prenditi il ​​​​tuo tempo per finire sinceramente tutti e cinque i corsi!

CS231n: Deep Learning for Computer Vision approfondisce i dettagli delle architetture di classificazione delle immagini con particolare attenzione all'apprendimento dei modelli end-to-end. Consiste in incarichi pratici che ti consentono di implementare e addestrare i tuoi modelli CompVis su un problema reale di tua scelta. Fornisce inoltre dettagli per suggerimenti tecnici pratici e trucchi per la formazione e la messa a punto dei modelli di deep learning.

Deep Learning in Computer Vision con PyTorch ti offre una procedura rapida e semplice per addestrare e testare la classificazione delle immagini e gli algoritmi di segmentazione semantica sui tuoi set di dati . Infine, ti mostra come costruire ed eseguire una semplice interfaccia web in modo che chiunque possa utilizzare i tuoi modelli appena addestrati. ( Spudorata auto-pubblicità! )

Deep Learning for Computer Vision, Justin Johnson copre l'implementazione, la formazione e il debug delle reti neurali e fornisce una comprensione approfondita della ricerca all'avanguardia in CompVis. Copre attività CompVis come rilevamento di oggetti, segmentazione semantica, visione 3D e modelli generativi, nonché apprendimento per rinforzo.

Deep Learning in Computer Vision, Prof. Kosta Derpanis è un corso più recente che copre una vasta gamma di argomenti come il riconoscimento dell'azione, la visione e il linguaggio, le reti neurali dei grafici. Copre anche paradigmi di apprendimento come l'apprendimento metrico e l'apprendimento auto-supervisionato.

Fonte: foto dell'autore. Certificato di specializzazione Deep Learning. I cinque percorsi rappresentano cinque pietre dell'infinito! Qual è il sesto? ;)

Alcune altre risorse di apprendimento che potrebbero essere utili da guardare:

  1. Tutorial Roboflow sull'utilizzo dei modelli di visione artificiale SOTA
  2. Compiti che abbracciano il viso
  3. Tutorial sui trasformatori di Hugging Face

Concorsi online

Successivamente, enumererò alcune precedenti competizioni/sfide che puoi fare tu stesso e applicare le tue abilità apprese dai corsi sopra menzionati. Questo ti aiuterà anche a farti un'idea di come funzionano le competizioni online (ad esempio, ottenere dati , addestrare modelli , testare e analizzare , inviare risultati e iterare ). Quindi, menzionerò i nomi delle piattaforme di competizione che ospitano anche sfide delle famose conferenze CompVis dove potresti eventualmente iniziare la tua prima competizione online!

Cani contro gatti : un'attività di classificazione delle immagini in cui costruirai un modello per prevedere cani e gatti dalle immagini.

Classificazione dei fiori con TPU : compito simile a Cani contro gatti ma molte classi. Questo è noto come classificazione delle immagini multiclasse . Qui costruirai un modello per classificare oltre 100 tipi di fiori. Invece di utilizzare le GPU, acquisirai familiarità con l'utilizzo delle TPU.

Carvana Image Masking Challenge : un'attività di segmentazione semantica in cui l'obiettivo è sviluppare un modello per rimuovere lo sfondo dello studio fotografico dall'auto. È simile alla classificazione delle immagini ma a livello di pixel in cui a ogni pixel viene assegnata un'etichetta di classe che porta a una maschera di output finale dell'oggetto desiderato (ad esempio, un'auto).

Rilevamento globale del grano : un problema di rilevamento di oggetti in cui l'obiettivo è costruire un modello per localizzare (ad esempio, disegnare riquadri di delimitazione) su teste di grano da immagini esterne di piante di grano.

Rilevamento dell'embolia polmonare RSNA STR : le precedenti attività di classificazione si occupano di immagini 2D; in questa sfida, l'obiettivo è rilevare e classificare le anomalie dalle scansioni TC del torace che sono immagini 3D. Questa è la classificazione delle immagini 3D .

Piattaforme delle competizioni ML : le competizioni di cui sopra sono ospitate su Kaggle, che è la piattaforma di competizione più popolare. Esistono altre piattaforme in cui ospitano diverse competizioni a cui potresti prendere parte. Ne esaminerò alcune:

  1. Grande sfida : Principalmente per problemi di imaging biomedico. Convegni workshop in MICCAI ospitano concorsi qui.
  2. AIcrowd : aziende, università, agenzie governative o ONG ospitano diverse sfide. Le competizioni sono anche ospitate da NeurIPS come workshop.

Industria e collaborazioni accademiche

Ora, in questa sezione finale, parlerò dei modi che consentono collaborazioni accademiche e industriali . Dopo aver partecipato ad alcune delle competizioni online, costruiscono la tua intuizione sulla creazione di sistemi CompVis, poiché si basano principalmente su dati del mondo reale. Da lì, puoi andare verso l'industria per lavorare su problemi aziendali o il mondo accademico per condurre ricerche.

Omdena AI : Ho chiesto a perplexity.ai cos'è Omdena, e questo è quello che ha detto:

Omdena AI è una piattaforma collaborativa che crea soluzioni di intelligenza artificiale e data science per problemi del mondo reale. È una prima organizzazione della comunità che consente agli ingegneri di intelligenza artificiale di tutto il mondo di diventare responsabili del cambiamento e aiuta le organizzazioni e le startup orientate alla missione a creare soluzioni di intelligenza artificiale di grande impatto attraverso la collaborazione globale. Omdena AI conduce sfide che riuniscono data scientist di tutto il mondo per lavorare su progetti specifici, come il rilevamento di incendi in Amazzonia.

Fondamentalmente, è una piattaforma in cui puoi lavorare con le aziende su problemi del mondo reale. Un avvertimento è che, all'inizio, il lavoro che farai non è retribuito. Tuttavia, quando finisci un paio di progetti (ciascuno con una società diversa), costruisci il tuo portfolio e puoi entrare nel programma Omdena Top Talent , dove vieni pagato per lavorare su progetti o addirittura lavorare a tempo pieno! Per cominciare, penso che questo sia quanto di più vicino puoi lavorare con persone del settore, a parte ottenere uno stage! Questo è un modo efficace per qualcuno (anche tu!) di acquisire esperienza sui problemi del mondo reale e entrare nel settore .

La tua Università: Esatto, sei universitario! Questo sembra molto ovvio, ma lo capisco molto. Puoi collaborare con i tuoi professori universitari, possibilmente come assistente di ricerca, se vuoi concentrarti maggiormente sulla ricerca CompVis e puntare a buone pubblicazioni. Questo ha funzionato per me quando ho iniziato la ricerca su CompVis. Lascerò quella storia per un altro pezzo! Ecco cosa puoi fare. Innanzitutto, restringi i professori della tua università con cui vorresti lavorare. Dai un'occhiata al loro profilo di ricerca, su quali argomenti lavorano e vedi se sei effettivamente interessato a quelli. Quindi, invia un'e-mail a tutti dicendo che ti piacerebbe lavorare con loro, è bello menzionare quali argomenti. Va bene se non senti la maggior parte di loro. Questo diventa un po' facile se li conosci già di persona e hai seguito le loro lezioni; basta andare nei loro uffici! Ed è così che entriaccademico !

Conclusione

In questo post, ho parlato dei modi per iniziare con la visione artificiale come principiante e entrare nel settore o nel mondo accademico. Ho menzionato risorse per apprendere i fondamenti della visione artificiale, nonché piattaforme per applicare le tue nuove conoscenze tramite concorsi online e persino entrare in collaborazioni industriali / accademiche.

Attualmente sto scrivendo questo pezzo durante una sosta a Doha mentre viaggio da Montreal, in Canada, a Dhaka, in Bangladesh. Per le persone che mi hanno chiesto "come iniziare con la visione artificiale", questo è per te! Buona fortuna.

Circa l'autore

Ahah! Sono un dottorato di ricerca. candidato alla Concordia University di Montreal, Canada, lavorando su problemi di visione artificiale. Lavoro anche part-time presso Décathlon, dove aiuto a creare strumenti basati sui dati per trasformare immagini e video sportivi in ​​intelligenza fruibile. Se sei interessato a saperne di più su di me, visita la mia pagina web qui .

Riferimenti

[1] Harl, Max., et al. "Una luce nell'oscurità: pratiche di apprendimento approfondito per la visione artificiale industriale". In arXiv, 2022.