Czy możliwe jest wstępne przeszkolenie CNN w sposób samokontroli, aby można było później użyć go do rozwiązania zadania segmentacji instancji?
Chciałbym użyć samokontrolowanego uczenia się (SSL), aby uczyć się funkcji z obrazów (zestaw danych składa się z podobnych obrazów z niewielkimi różnicami), a następnie użyć wynikowego wytrenowanego modelu do załadowania zadania segmentacji instancji.
Myślę o użyciu Faster R-CNN, Mask R-CNN lub ResNet do zadania segmentacji instancji, które jest wstępnie trenowane w sposób SSL poprzez rozwiązanie zadania pretekstowego, w celu uzyskania większej dokładności, a także naucz CNN z mniejszą liczbą przykładów podczas dalszego zadania.
Czy można użyć SSL do wstępnego szkolenia, np. Szybszego R-CNN w zadaniu pretekstowym (na przykład rotacja), a następnie użyć tego wstępnie wytrenowanego modelu, na przykład segmentacji w celu uzyskania lepszej dokładności?
Odpowiedzi
Czy można użyć SSL do wstępnego szkolenia, np. Szybszego R-CNN w zadaniu pretekstowym (na przykład rotacja), a następnie użyć tego wstępnie wytrenowanego modelu, na przykład segmentacji w celu uzyskania lepszej dokładności?
Tak, jest to możliwe i zostało to już zrobione. Nie znam szczegółów (ponieważ nie czytałem jeszcze tych artykułów), ale podam kilka linków do niektórych potencjalnie przydatnych artykułów (na podstawie ich tytułów i streszczeń) i związanego z nimi kodu.
- Segmentacja instancji szkoleniowych według interakcji ( kod , 2018)
- Samokontrolowana nauka transferu dla segmentacji instancji poprzez interakcję fizyczną ( kod , 2019)
- Segmentacja przewodu białej materii z samodzielnym uczeniem się ( kod , 2020)
- Samonadzorowane oszacowanie głębokości w celu uregulowania segmentacji semantycznej w artroskopii kolana ( kod , 2020)
- Symulacja resekcji mózgu w celu segmentacji ubytków z wykorzystaniem uczenia się samokontrolowanego i częściowo nadzorowanego ( kod , 2020)
Prawdopodobnie możesz znaleźć więcej odpowiednich artykułów tutaj , gdzie znalazłem również niektóre z właśnie cytowanych artykułów.
Zadania przedtekstowe zaprojektowane w tych artykułach mogą być przydatne w twoim przypadku, ale może się również okazać, że będziesz musiał opracować inne zadania przedtekstowe lub połączyć ich wiele.
Może możesz zacząć od jakiegoś wcześniej wyszkolonego, szybszego R-CNN lub jakiegoś odpowiedniego modelu, na przykład segmentacji (który możesz znaleźć w Internecie, na przykład tutaj ), który został wstępnie przeszkolony na niektórych danych zdjęciowych podobnych do twoich (albo z SSL lub w inny sposób), a następnie spróbuj dostroić ten model za pomocą oznaczonego zestawu danych, na przykład segmentacji, i zobacz, czy uzyskasz lepsze wyniki niż tylko trenowanie szybszego R-CNN od zera. Ostatecznie, jeśli ten wstępnie wytrenowany model nie prowadzi do wyższej wydajności, możesz go wstępnie wyszkolić za pomocą jakiejś techniki SSL, którą możesz wymyślić lub takiej, która jest opisana w literaturze. Oczywiście prawdopodobnie powinieneś użyć wstępnie wytrenowanego modelu, który został wstępnie przeszkolony z danymi, które są istotne dla twojego dalszego zadania (tj. Zadania segmentacji instancji). Nie opisałeś szczegółów swoich nieoznakowanych i oznaczonych danych, więc nie mogę być bardziej szczegółowy (a obecnie nie byłbym w stanie, w każdym razie, ponieważ nie przeczytałem w pełni tych dokumentów, a moje doświadczenie z SSL techniki są głównie teoretyczne).
Aby uzyskać więcej informacji na temat SSL, zapoznaj się z tą i następującymi odpowiedziami.