Phân đoạn bản đồ trên hình ảnh DWI bằng Deep Learning

Nov 30 2022

Viết bởi Asmina Barkhandinova, Cerebra.ai Ltd.

Mục lục: Một trong những nhiệm vụ có thể giải quyết bằng Deep Learning là phân đoạn bản đồ, nhằm hỗ trợ các bác sĩ phát hiện những bất thường ở một khu vực nhất định của não bộ và giảm thiểu yếu tố con người. Vì có nhiều loại quét khác nhau (chẳng hạn như MRI, CTA, CT, v.v.)

Mục lục:

Giới thiệu
Dữ liệu
Sơ chế
Tập huấn
tòa nhà dịch vụ
Kết quả

Một trong những nhiệm vụ có thể giải quyết bằng Deep Learning là phân đoạn bản đồ, nhằm hỗ trợ các bác sĩ phát hiện những bất thường ở một khu vực nhất định của não bộ và giảm thiểu yếu tố con người. Vì có nhiều loại quét khác nhau (chẳng hạn như MRI, CTA, CT, v.v.), nên cũng sẽ có nhiều loại mô hình để giải quyết nhiệm vụ cho từng loại quét. Trong bài viết này, chúng tôi sẽ đề cập đến quá trình xây dựng DWI Atlas Service.

Trước khi đi sâu vào quy trình, hãy mô tả một số định nghĩa:

Atlas of ASPECTS — các vùng của não bộ. Atlas gồm 10 vùng: m1, m2, m3, m4, m5, m6, i, l, c, ic.

Nguồn: radipopedia.org

NHIỆM VỤ - phép đo các tập bản đồ đã chết. Con số càng cao, càng nhiều vùng ASPECTS không hề hấn gì. Ví dụ: ASPECTS = 7 có nghĩa là 7 trong số 10 tập bản đồ vẫn bình thường, không bị đột quỵ.

DWI — một loại quét MRI. Trong MRI thông thường, có hai nam châm làm thay đổi spin của các nguyên tử hydro và nhận năng lượng phản xạ để tạo ra hình ảnh của não. Ngoài ra, DWI còn phát hiện dòng chảy của chất lỏng (nước) trong não và phản ánh nó trên hình ảnh.

Bài viết gồm 2 phần chính:

Đào tạo mô hình Atlas Segmentation trên hình ảnh và đánh dấu DWI.
Xây dựng một dịch vụ sẽ chấp nhận tệp nifti và trả về các đường nét của các khía cạnh (dự đoán mô hình).

Trong tập dữ liệu, chúng tôi đã sử dụng hình ảnh DWI b0. Mỗi tệp có định dạng [512, 512, 20], tức là 20 lát mô hình 3D của bộ não. Chúng tôi đã cắt nó thành 20 hình ảnh 2D của bộ não với đánh dấu cho mỗi lát do các bác sĩ dán nhãn. Nhìn chung, chúng tôi có 170 hình ảnh của niftis cắt lát và 170 đánh dấu. Hình ảnh DWI là đầu vào và phần đánh dấu là mục tiêu.

Lát ảnh DWI và phần đánh dấu của lát cắt hiện tại.

Sơ chế

Mỗi 'mục tiêu' được xử lý trước bằng Mã hóa một lần nóng và được lưu trữ dưới dạng [11, 512, 512] ndarray 3D, trong đó mỗi lớp trong số 11 lớp đại diện cho một lớp nhất định (nền và tập bản đồ). Để tăng cường hình ảnh, chúng tôi đã áp dụng chuẩn hóa hình ảnh ImageNet và chuyển đổi nó thành Tensors.

def make_onehot_markup(im: Image) -> np.ndarray:

  '''Returns ndarray of (11, 512, 512) in one-hot encoding format
  
  Args:
      im (Image): Image object
  Returns:
      one_hot (np.ndarray): 3D one-hot encoding tensor
  
  '''
  red = process_mask_red(im)
  brown = process_mask_brown(im)
  blue = process_mask_blue(im)
  yellow = process_mask_yellow(im)
  cyan = process_mask_cyan(im)
  mag = process_mask_magenta(im)
  dblue = process_mask_dblue(im)
  green = process_mask_green(im)
  orange = process_mask_orange(im)
  purple = process_mask_purple(im)
  
  background = np.logical_not(np.sum(matrix, axis=0))

  matrix = np.stack([background, red, brown, blue, yellow, cyan,
                    mag, dblue, green, orange, purple])
  
  return matrix

Chúng tôi huấn luyện mô hình phân đoạn Unet gồm 11 lớp (10 tập bản đồ và 1 lớp nền). Để điều chỉnh siêu tham số, chúng tôi đã sử dụng Optuna đề xuất trình tối ưu hóa và trình lập lịch trình, đồng thời cố gắng tối đa hóa điểm nhịp xác thực. Các cuộc gọi lại đã lưu 3 mô hình tốt nhất trong mỗi lần.