Segmentacja atlasu na obrazach DWI przy użyciu głębokiego uczenia

Nov 30 2022

Napisane przez Asminę Barkhandinovą, Cerebra.ai Ltd.

Spis treści: Jednym z zadań, które można rozwiązać za pomocą głębokiego uczenia, jest segmentacja atlasu, aby pomóc lekarzom wykryć anomalie w określonym obszarze mózgu i zredukować czynnik ludzki. Ponieważ istnieją różne rodzaje skanowania (takie jak MRI, CTA, CT itp.

Spis treści:

Wstęp
Dane
Przetwarzanie wstępne
Trening
Budynek usługowy
Wyniki

Jednym z zadań, które można rozwiązać za pomocą głębokiego uczenia się, jest segmentacja atlasu, aby pomóc lekarzom wykryć anomalie w określonym obszarze mózgu i zredukować czynnik ludzki. Ponieważ istnieją różne rodzaje skanowania (takie jak MRI, CTA, CT itp.), będzie również wiele typów modeli do rozwiązania zadania dla każdego typu skanowania. W tym artykule omówimy proces budowania usługi Atlas DWI.

Zanim zagłębimy się w ten proces, opiszmy kilka definicji:

Atlas ASPEKTÓW — regionów mózgu. Atlas składa się z 10 regionów: m1, m2, m3, m4, m5, m6, i, l, c, ic.

Źródło: radipopedia.org

ASPEKTY — pomiar atlasów zmarłych. Im wyższa liczba, tym więcej stref ASPEKTÓW pozostało nietkniętych. Np. ASPEKT = 7 oznacza, że 7 z 10 atlasów pozostało normalnych, nietkniętych uderzeniem.

DWI — rodzaj skanowania MRI. W zwykłym rezonansie magnetycznym są dwa magnesy, które zmieniają spin atomów wodoru i odbierają odbitą energię, aby zbudować obraz mózgu. Oprócz tego DWI wykrywa również przepływ płynu (wody) w mózgu i odzwierciedla go na obrazie.

Artykuł składa się z 2 głównych części:

Szkolenie modelu segmentacji Atlasu na obrazach i znacznikach DWI.
Zbudowanie usługi, która zaakceptuje plik nifti i zwróci kontury aspektów (predykcja modelu).

W zbiorze danych wykorzystaliśmy obrazy DWI b0. Każdy plik miał format [512, 512, 20], czyli 20 wycinków trójwymiarowego modelu mózgu. Pokroiliśmy go na 20 obrazów 2D mózgu ze znacznikami dla każdego wycinka oznaczonymi przez lekarzy. Ogółem mieliśmy 170 zdjęć pokrojonych nifti i 170 znaczników. Obrazy DWI były danymi wejściowymi, a znaczniki były celami.

Wycinek obrazu DWI i znaczniki obecnego wycinka.

Przetwarzanie wstępne

Każdy „cel” został wstępnie przetworzony przez One-Hot Encoding i zapisany jako [11, 512, 512] 3D ndarray, gdzie każda z 11 warstw reprezentowała określoną klasę (tło i atlasy). Do powiększenia obrazu zastosowaliśmy normalizację obrazu ImageNet i przekonwertowaliśmy go na tensory.

def make_onehot_markup(im: Image) -> np.ndarray:

  '''Returns ndarray of (11, 512, 512) in one-hot encoding format
  
  Args:
      im (Image): Image object
  Returns:
      one_hot (np.ndarray): 3D one-hot encoding tensor
  
  '''
  red = process_mask_red(im)
  brown = process_mask_brown(im)
  blue = process_mask_blue(im)
  yellow = process_mask_yellow(im)
  cyan = process_mask_cyan(im)
  mag = process_mask_magenta(im)
  dblue = process_mask_dblue(im)
  green = process_mask_green(im)
  orange = process_mask_orange(im)
  purple = process_mask_purple(im)
  
  background = np.logical_not(np.sum(matrix, axis=0))

  matrix = np.stack([background, red, brown, blue, yellow, cyan,
                    mag, dblue, green, orange, purple])
  
  return matrix

Przeszkoliliśmy model segmentacji Unet z 11 klasami (10 atlasów i 1 klasa dla tła). Do strojenia hiperparametrów użyliśmy Optuny, która zasugerowała optymalizator i harmonogram i próbowała zmaksymalizować wynik beatu walidacji. Wywołania zwrotne uratowały 3 najlepsze modele w każdej zakładce.