JavaDIP-畳み込みを理解する

畳み込みは、2つの関数fとgに対する数学演算です。この場合の関数fとgは画像です。これは、画像も2次元関数であるためです。

畳み込みの実行

画像に対して畳み込みを実行するために、次の手順が実行されます-

  • マスクを(水平および垂直に)1回だけ裏返します。
  • マスクを画像上にスライドさせます。
  • 対応する要素を乗算してから追加します。
  • 画像のすべての値が計算されるまで、この手順を繰り返します。

を使用しております OpenCV 関数 filter2D画像に畳み込みを適用します。それは下にありますImgprocパッケージ。その構文を以下に示します-

filter2D(src, dst, depth , kernel, anchor, delta, BORDER_DEFAULT );

関数の引数を以下に説明します-

シニア番号 引数と説明
1

src

ソース画像です。

2

dst

行き先画像です。

3

depth

dstの深さです。負の値(-1など)は、深さがソースと同じであることを示します。

4

kernel

画像をスキャンするのはカーネルです。

5

anchor

これは、カーネルに対するアンカーの位置です。位置ポイント(-1、-1)は、デフォルトで中心を示します。

6

delta

畳み込み中に各ピクセルに追加される値です。デフォルトでは0です。

7

BORDER_DEFAULT

デフォルトではこの値を使用します。

次の例は、Imgprocクラスを使用してグレースケールの画像で畳み込みを実行する方法を示しています。

import org.opencv.core.Core;
import org.opencv.core.CvType;
import org.opencv.core.Mat;

import org.opencv.highgui.Highgui;
import org.opencv.imgproc.Imgproc;

public class convolution {
   public static void main( String[] args ) {
   
      try {
         int kernelSize = 3;
         System.loadLibrary( Core.NATIVE_LIBRARY_NAME );
         
         Mat source = Highgui.imread("grayscale.jpg",  Highgui.CV_LOAD_IMAGE_GRAYSCALE);
         Mat destination = new Mat(source.rows(),source.cols(),source.type());
         
         Mat kernel = new Mat(kernelSize,kernelSize, CvType.CV_32F) {
            {
               put(0,0,0);
               put(0,1,0);
               put(0,2,0);

               put(1,0,0);
               put(1,1,1);
               put(1,2,0);

               put(2,0,0);
               put(2,1,0);
               put(2,2,0);
            }
         };
         
         Imgproc.filter2D(source, destination, -1, kernel);
         Highgui.imwrite("original.jpg", destination);
         
      } catch (Exception e) {
          System.out.println("Error:" + e.getMessage());
      }
   }
}

出力

この例では、次のフィルター(カーネル)を使用して画像を畳み込みます。このフィルターにより、元の画像がそのまま生成されます。

0 0 0
0 1 0
0 0 0

元の画像

畳み込み画像