2023'te Bilgisayarla Görmeye Nasıl Başlanır?

May 09 2023
2023'te bir bilgisayar görüntü mühendisi veya araştırmacısı olmak için sıfırdan sıfıra olmayan bir yol haritası. Endüstriye veya akademiye girmek için ne öğreneceğinizi ve öğrenilen becerileri gerçek dünya projelerinde nasıl uygulayacağınızı bilin.

2023'te bir bilgisayar görüntü mühendisi veya araştırmacısı olmak için sıfırdan sıfıra olmayan bir yol haritası. Endüstriye veya akademiye girmek için ne öğreneceğinizi ve öğrenilen becerileri gerçek dünya projelerinde nasıl uygulayacağınızı bilin.

Kaynak: Unsplash'ta ownedphotography tarafından görüntü.

Motivasyon

Bilgisayar görüşü (CompVis) , görüntüleri ve videoları yorumlamak ve anlamak için bilgisayarları eğitmeyi içeren bir yapay zeka (AI) alanıdır . CompVis'in pratik uygulamaları, endüstriyel üretim robotları, sürücüsüz arabalar ve video gözetiminden tıbbi görüntüleme ve artırılmış gerçekliğe kadar uzanır. Çoğu durumda, CompVis görevleri otomatikleştirebilir ve biz Neandertaller için zamandan ve emekten tasarruf sağlar , bu da onu pratik uygulamalar için kullanışlı kılar. Ek olarak, bazı durumlarda insanlardan daha iyi performans göstererek CompVis'i birçok sektör için hayati bir araç haline getiriyor. [1]

Bu yazıda, endüstride veya akademide CompVis'e başlamak için kullanabileceğiniz bir yol haritası paylaşacağım. İlk olarak, bazı ücretsiz ve herkese açık öğrenme kaynaklarını paylaşacağım. Ardından, portföyünüzü oluşturmak için öğrendiğiniz becerileri uygulayabileceğiniz platformlardan bahsedeceğim. Yeniyseniz veya biraz deneyiminiz varsa, bu kılavuz sizi bu çok heyecan verici ve hızla gelişen alanda potansiyel olarak daha da iyi hale getirebilir!

Bu makale şu şekilde düzenlenmiştir:

  1. Öğrenme kaynakları
  2. Çevrimiçi yarışmalar
  3. Sanayi ve araştırma işbirlikleri

Öğrenme kaynakları

Bu bölümde, CompVis sistemlerini oluşturmanın ardındaki teori ve pratiği iyi bir şekilde anlamak için almayı düşünmeniz gereken üç kaynağın üzerinden geçeceğim. Bu, bir CompVis uygulayıcısı olarak derinliğinizi artırmak içindir. Sonraki ikisi, CompVis'teki çeşitli görevler ve öğrenme paradigmaları hakkında bir fikir edinmek için gözden geçirmeniz gerekenler olacaktır. Bu, genişliğinizi artırmak içindir.

Derin Öğrenme Uzmanlığı, size CompVis'e uygulanan derin öğrenmenin temellerini, doğal dil işlemeyi vb. öğretecek toplam beş kurstan oluşur. Derin öğrenme modelleri oluşturmak, eğitmek ve test etmek için hem teorik hem de pratik kavramlarıkapsar . Kurs ödevleri aracılığıyla kendi modellerinizi oluşturup eğitebileceksiniz. Beş kursu da içtenlikle bitirmek için zaman ayırın!

CS231n: Bilgisayarla Görü için Derin Öğrenme, uçtan uca modelleri öğrenmeye odaklanarak görüntü sınıflandırma mimarilerinin ayrıntılarına derinlemesine dalar. Seçtiğiniz gerçek dünya probleminde kendi CompVis modellerinizi uygulamanıza ve eğitmenize izin veren uygulamalı ödevlerden oluşur. Ayrıca derin öğrenme modellerini eğitmek ve ince ayar yapmak için pratik mühendislik ipuçları ve püf noktaları için ayrıntılar sağlar.

PyTorch ile Görüntü İşlemesinde Derin Öğrenme, kendi veri kümeleriniz üzerinde görüntü sınıflandırma ve semantik segmentasyon algoritmalarını eğitme ve test etme konusunda size hızlı ve kolay bir yol sunar. Son olarak, yeni eğitilmiş modellerinizi herkesin kullanabilmesi için basit bir web arayüzünün nasıl oluşturulacağını ve çalıştırılacağını gösterir( Utanmazca kendini tanıtma! )

Bilgisayarla Görme için Derin Öğrenme, Justin Johnson sinir ağlarının uygulanmasını, eğitimini ve hata ayıklamasını kapsar ve CompVis'teki son teknoloji araştırmaların derinlemesine anlaşılmasını sağlar. Nesne algılama, semantik bölümleme, 3B görme ve üretken modeller gibi CompVis görevlerinin yanı sıra pekiştirmeli öğrenmeyi kapsar.

Bilgisayarla Görmede Derin Öğrenme, Prof. Kosta Derpanis, eylem tanıma, görme ve dil, grafik sinir ağları gibi bir dizi konuyu kapsayan daha yeni bir kurstur. Ayrıca, metrik öğrenme ve kendi kendini denetleyen öğrenme gibi öğrenme paradigmalarını da kapsar.

Kaynak: Yazarın fotoğrafı. Derin Öğrenme Uzmanlık Sertifikası. Beş kurs, beş sonsuzluk taşını temsil ediyor! Altıncı nedir? ;)

Bakılması yararlı olabilecek diğer bazı öğrenme kaynakları:

  1. SOTA bilgisayar görme modellerini kullanma hakkında Roboflow eğitimleri
  2. Yüze Sarılma Görevleri
  3. Sarılma Yüzü Transformers Öğreticileri

Çevrimiçi yarışmalar

Daha sonra, kendi başınıza yapabileceğiniz ve yukarıda belirtilen kurslardan öğrendiğiniz becerileri uygulayabileceğiniz bazı önceki yarışmaları/meydan okumaları sıralayacağım. Bu aynı zamanda çevrimiçi yarışmaların nasıl çalıştığına dair bir fikir edinmenize de yardımcı olacaktır (ör. veri alma , modelleri eğitme , test etme ve analiz etme , sonuçları gönderme ve yineleme ). Ardından, muhtemelen ilk çevrimiçi yarışmanızı başlatabileceğiniz popüler CompVis konferanslarından yarışmalara ev sahipliği yapan yarışma platformlarının isimlerinden bahsedeceğim!

Köpekler ve Kediler :Görüntülerden köpekleri ve kedileri tahmin etmek için bir model oluşturacağınız bir görüntü sınıflandırma görevi .

TPU'larla Çiçek Sınıflandırması : Köpekler ve Kediler ile benzer bir görev ancak birçok sınıf. Bu, çok sınıflı görüntü sınıflandırması olarak bilinir. Burada 100'den fazla çiçek türünü sınıflandırmak için bir model oluşturacaksınız. GPU'ları kullanmak yerine TPU'ları kullanmayı öğreneceksiniz.

Carvana Image Masking Challenge :Amacın arabadan fotoğraf stüdyosu arka planını kaldırmak için bir model geliştirmek olduğu semantik bir bölümleme görevi. Bu, görüntü sınıflandırmasına benzer, ancak piksel düzeyinde, her piksele, istenen nesnenin (yani, arabanın) nihai çıktı maskesine götüren bir sınıf etiketi atanır.

Küresel Buğday Tespiti :Hedefin, buğday bitkilerinin dış mekan görüntülerinden buğday başlarını yerelleştirmek (örneğin sınırlayıcı kutular çizmek) için bir model oluşturmak olduğu bir nesne algılama problemi.

RSNA STR Pulmoner Emboli Tespiti : Önceki sınıflandırma görevleri 2D görüntülerle ilgilidir; Bu zorlukta amaç, 3D görüntüler olan göğüs BT taramalarındaki anormallikleri tespit etmek ve sınıflandırmaktır. Bu, 3D görüntü sınıflandırmasıdır .

ML Yarışma Platformları : Yukarıdaki yarışmalar, en popüler yarışma platformu olan Kaggle'da barındırılmaktadır. Katılabileceğiniz farklı yarışmalara ev sahipliği yapan başka platformlar da var. Birkaçına değineceğim:

  1. Büyük Zorluk : Çoğunlukla biyomedikal görüntüleme sorunları için. MICCAI'deki konferans atölyeleri burada yarışmalara ev sahipliği yapar.
  2. AIcrowd : İşletmeler, üniversiteler, devlet kurumları veya STK'lar çeşitli zorluklara ev sahipliği yapar. Yarışmalar ayrıca NeurIPS tarafından atölye çalışmaları olarak düzenlenmektedir.

Sanayi ve akademik işbirlikleri

Şimdi bu son bölümde, endüstri ve akademik işbirliklerini mümkün kılan yollardan bahsedeceğim . Çevrimiçi yarışmalardan birkaçını yaptıktan sonra, çoğunlukla gerçek dünya verilerine dayandıkları için CompVis sistemlerini oluşturma konusundaki sezginizi geliştirirler. Oradan, iş sorunları üzerinde çalışmak için endüstriye veya araştırma yapmak için akademiye gidebilirsiniz.

Omdena AI : Perplexity.ai'ye Omdena'nın ne olduğunu sordumve şöyle dedi:

Omdena AI, gerçek dünya sorunlarına yapay zeka ve veri bilimi çözümleri oluşturan iş birliğine dayalı bir platformdur. Dünya çapında yapay zeka mühendislerini değişim yaratıcıları olmaları için güçlendiren ve misyon odaklı kuruluşların ve yeni başlayanların küresel iş birliği yoluyla etkili yapay zeka çözümleri oluşturmasına yardımcı olan, önce topluluk olan bir kuruluştur. Omdena AI, Amazon'daki orman yangınlarını tespit etmek gibi belirli projeler üzerinde çalışmak üzere dünyanın dört bir yanından veri bilimcilerini bir araya getiren zorluklar yürütür.

Temel olarak, gerçek dünya sorunları üzerinde şirketlerle çalışabileceğiniz bir platformdur. Bir uyarı, başlangıçta yapacağınız işin ücretsiz olmasıdır. Ancak, (her biri farklı bir şirkete sahip) birkaç projeyi bitirdiğinizde, portföyünüzü oluşturursunuz ve projeler üzerinde çalışmanız ve hatta tam zamanlı çalışmanız için para aldığınız Omdena En İyi Yetenek programına girebilirsiniz! Bir başlangıç ​​olarak, bence bu, staj dışında sektördeki insanlarla çalışabileceğiniz en yakın nokta! Bu, birisinin (sizin bile!) gerçek dünya sorunları üzerinde deneyim kazanması ve sektöre girmesi için etkili bir yoldur .

Senin üniversiten: Doğru, sen üniversitelisin! Bu çok açık görünüyor, ama bunu çok anlıyorum. CompVis araştırmalarına daha fazla odaklanmak ve iyi yayınlar yapmak istiyorsanız, muhtemelen araştırma görevlisi olarak üniversite hocalarınızla işbirliği yapabilirsiniz. Bu, CompVis araştırmasına ilk başladığımda benim için çalıştı. O hikayeyi başka bir parçaya bırakacağım! İşte yapabilecekleriniz. İlk olarak, üniversitenizde çalışmak istediğiniz profesörleri daraltın. Araştırma profillerine, hangi konularda çalıştıklarına bir göz atın ve bunlarla gerçekten ilgilenip ilgilenmediğinizi görün. Ardından, hepsiyle birlikte çalışmak istediğinizi belirten bir e-posta gönderin, hangi konulardan bahsetmek güzel. Çoğundan haber almasan da sorun değil. Onları şahsen tanıyorsanız ve derslerini aldıysanız, bu biraz kolaylaşır; sadece ofislerine git! Ve işte böyle giriyorsunakademi !

Çözüm

Bu gönderide, yeni başlayan biri olarak bilgisayar görüşüne başlamanın ve sektöre ya da akademi dünyasına adım atmanın yollarından bahsettim. Bilgisayar vizyonunun temellerini öğrenmek için kaynakların yanı sıra yeni bilgilerinizi çevrimiçi yarışmalar aracılığıyla uygulamak ve hatta endüstri/akademik işbirliklerine girmek için platformlardan bahsettim.

Şu anda bu yazıyı Kanada'nın Montreal kentinden Bangladeş'in Dhaka kentine seyahat ederken Doha'da bir konaklama sırasında yazıyorum. Bana "bilgisayar görüşüne nasıl başlarım" diye soranlara, bu sizin için! İyi şanlar.

Yazar hakkında

Aloha! Ben bir Ph.D. Kanada'nın Montreal kentindeki Concordia Üniversitesi'nde bilgisayarla görme sorunları üzerinde çalışan bir aday. Ayrıca Décathlon'da yarı zamanlı çalışıyorum ve burada spor resimlerini ve videolarını eyleme geçirilebilir istihbarata dönüştürmek için veriye dayalı araçlar geliştirmeye yardımcı oluyorum. Hakkımda daha fazla bilgi edinmek istiyorsanız, lütfen web sayfamı buradan ziyaret edin .

Referanslar

[1] Harl, Max., et al. "Karanlıkta Bir Işık: Endüstriyel Bilgisayar Görüsü için Derin Öğrenme Uygulamaları". arXiv'de, 2022.