Java Virtual Machine - Panduan Cepat
JVM adalah spesifikasi, dan dapat memiliki implementasi yang berbeda, selama mematuhi spesifikasi tersebut. Spesifikasi dapat ditemukan di tautan di bawah ini -https://docs.oracle.com
Oracle memiliki implementasi JVM sendiri (disebut HotSpot JVM), IBM memiliki implementasi JVM sendiri (J9 JVM, misalnya).
Operasi yang ditentukan di dalam spesifikasi diberikan di bawah ini (sumber - Spesifikasi JVM Oracle, lihat tautan di atas) -
- Format file 'kelas'
- Tipe data
- Jenis dan nilai primitif
- Jenis dan nilai referensi
- Area data run-time
- Frames
- Representasi objek
- Aritmatika floating-point
- Metode khusus
- Exceptions
- Ringkasan set instruksi
- Perpustakaan kelas
- Desain publik, implementasi pribadi
JVM adalah mesin virtual, komputer abstrak yang memiliki ISA sendiri, memori sendiri, tumpukan, heap, dll. Ia berjalan pada OS host dan menempatkan permintaan akan sumber daya padanya.
Arsitektur HotSpot JVM 3 ditunjukkan di bawah ini -
Mesin eksekusi terdiri dari pengumpul sampah dan kompiler JIT. JVM hadir dalam dua rasa -client and server. Keduanya berbagi kode runtime yang sama tetapi berbeda dalam penggunaan JIT. Kita akan belajar lebih banyak tentang ini nanti. Pengguna bisa mengontrol ragam apa yang akan digunakan dengan menentukan flag JVM -client atau -server . Server JVM telah dirancang untuk aplikasi Java yang berjalan lama di server.
JVM hadir dalam versi 32b dan 64b. Pengguna dapat menentukan versi apa yang akan digunakan dengan menggunakan -d32 atau -d64 dalam argumen VM. Versi 32b hanya dapat menangani memori hingga 4G. Dengan aplikasi kritis yang mempertahankan set data besar dalam memori, versi 64b memenuhi kebutuhan itu.
JVM mengelola proses pemuatan, penautan, dan inisialisasi kelas dan antarmuka secara dinamis. Selama proses pemuatan, fileJVM finds the binary representation of a class and creates it.
Selama proses penautan, file loaded classes are combined into the run-time state of the JVM so that they can be executed during the initialization phase. JVM pada dasarnya menggunakan tabel simbol yang disimpan di kumpulan konstan run-time untuk proses penautan. Inisialisasi sebenarnya terdiri dariexecuting the linked classes.
Jenis Loader
Itu BootStrapclass loader berada di atas hierarki class loader. Ini memuat kelas JDK standar di direktori lib JRE .
Itu Extension class loader berada di tengah-tengah hierarki class loader dan merupakan turunan langsung dari class loader bootstrap dan memuat class tersebut dalam direktori lib \ ext JRE.
Itu Applicationclass loader berada di bagian bawah hierarki class loader dan merupakan turunan langsung dari class loader aplikasi. Ini memuat toples dan kelas yang ditentukan olehCLASSPATH ENV variabel.
Menghubungkan
Proses penautan terdiri dari tiga langkah berikut -
Verification- Ini dilakukan oleh verifikator Bytecode untuk memastikan bahwa file .class yang dihasilkan (Bytecode) adalah valid. Jika tidak, kesalahan dilemparkan dan proses penautan terhenti.
Preparation - Memori dialokasikan ke semua variabel statis kelas dan mereka diinisialisasi dengan nilai default.
Resolution- Semua referensi memori simbolik diganti dengan referensi asli. Untuk mencapai ini, tabel simbol dalam memori konstan run-time dari area metode kelas digunakan.
Inisialisasi
Ini adalah fase terakhir dari proses pemuatan kelas. Variabel statis diberi nilai asli dan blok statis dijalankan.
Spesifikasi JVM mendefinisikan area data run-time tertentu yang diperlukan selama eksekusi program. Beberapa di antaranya dibuat saat JVM dijalankan. Lainnya bersifat lokal untuk utas dan dibuat hanya ketika utas dibuat (dan dihancurkan ketika utas dihancurkan). Ini tercantum di bawah -
PC (Penghitung Program) Daftar
Ini bersifat lokal untuk setiap utas dan berisi alamat instruksi JVM yang sedang dijalankan utas.
Tumpukan
Ini bersifat lokal untuk setiap utas dan menyimpan parameter, variabel lokal, dan alamat pengembalian selama panggilan metode. Kesalahan StackOverflow dapat terjadi jika utas menuntut lebih banyak ruang tumpukan daripada yang diizinkan. Jika tumpukan dapat diperluas secara dinamis, itu masih dapat memunculkan OutOfMemoryError.
Tumpukan
Itu dibagikan di antara semua utas dan berisi objek, metadata kelas, array, dll., Yang dibuat selama waktu proses. Itu dibuat saat JVM dimulai dan dihancurkan saat JVM dimatikan. Anda dapat mengontrol jumlah tumpukan yang diminta JVM Anda dari OS menggunakan tanda tertentu (lebih lanjut tentang ini nanti). Perhatian harus diberikan untuk tidak menuntut terlalu sedikit atau terlalu banyak memori, karena memiliki implikasi kinerja yang penting. Selanjutnya, GC mengelola ruang ini dan terus menerus membuang benda mati untuk membebaskan ruang.
Metode Area
Area run-time ini umum untuk semua utas dan dibuat saat JVM dijalankan. Ini menyimpan struktur per kelas seperti kumpulan konstan (lebih lanjut tentang ini nanti), kode untuk konstruktor dan metode, data metode, dll. JLS tidak menentukan apakah area ini perlu dikumpulkan sampah, dan karenanya, implementasi dari JVM dapat memilih untuk mengabaikan GC. Selanjutnya, ini mungkin atau mungkin tidak berkembang sesuai kebutuhan aplikasi. JLS tidak mengamanatkan apa pun terkait hal ini.
Pangkalan Konstan Waktu
JVM mempertahankan struktur data per kelas / per jenis yang bertindak sebagai tabel simbol (salah satu dari banyak perannya) saat menghubungkan kelas yang dimuat.
Tumpukan Metode Asli
Saat utas memanggil metode asli, utas memasuki dunia baru di mana struktur dan batasan keamanan mesin virtual Java tidak lagi menghalangi kebebasannya. Metode native kemungkinan dapat mengakses area data runtime dari mesin virtual (bergantung pada antarmuka metode native), tetapi juga dapat melakukan hal lain yang diinginkan.
Pengumpulan Sampah
JVM mengelola seluruh siklus hidup objek di Java. Setelah sebuah objek dibuat, pengembang tidak perlu mengkhawatirkannya lagi. Jika objek mati (yaitu, tidak ada referensi lagi), objek dikeluarkan dari heap oleh GC menggunakan salah satu dari banyak algoritme - GC serial, CMS, G1, dll.
Selama proses GC, objek dipindahkan ke memori. Oleh karena itu, objek tersebut tidak dapat digunakan selama proses berlangsung. Seluruh aplikasi harus dihentikan selama proses berlangsung. Jeda seperti itu disebut jeda 'stop-the-world' dan merupakan beban yang sangat besar. Algoritme GC bertujuan untuk mengurangi waktu ini. Kami akan membahas hal ini dengan sangat rinci di bab-bab berikut.
Berkat GC, kebocoran memori sangat jarang terjadi di Java, tetapi bisa terjadi. Kita akan melihat di bab selanjutnya bagaimana membuat kebocoran memori di Java.
Dalam bab ini, kita akan belajar tentang kompilator JIT, dan perbedaan antara bahasa yang dikompilasi dan ditafsirkan.
Bahasa yang Dikompilasi vs.
Bahasa seperti C, C ++ dan FORTRAN adalah bahasa yang dikompilasi. Kode mereka dikirimkan sebagai kode biner yang ditargetkan ke mesin yang mendasarinya. Ini berarti bahwa kode tingkat tinggi dikompilasi menjadi kode biner sekaligus oleh kompilator statis yang ditulis khusus untuk arsitektur yang mendasarinya. Biner yang dihasilkan tidak akan berjalan di arsitektur lain.
Di sisi lain, bahasa yang diinterpretasikan seperti Python dan Perl dapat berjalan di mesin apa pun, selama mereka memiliki interpreter yang valid. Ini melewati baris demi baris di atas kode tingkat tinggi, mengubahnya menjadi kode biner.
Kode yang ditafsirkan biasanya lebih lambat dari kode yang dikompilasi. Misalnya, pertimbangkan satu putaran. Sebuah interpreted akan mengubah kode yang sesuai untuk setiap iterasi loop. Di sisi lain, kode yang dikompilasi hanya akan membuat terjemahan menjadi satu. Lebih lanjut, karena interpreter hanya melihat satu baris pada satu waktu, mereka tidak dapat melakukan kode penting seperti, mengubah urutan eksekusi pernyataan seperti compiler.
Kami akan melihat contoh pengoptimalan seperti itu di bawah -
Adding two numbers stored in memory. Karena mengakses memori dapat menghabiskan banyak siklus CPU, kompilator yang baik akan mengeluarkan instruksi untuk mengambil data dari memori dan mengeksekusi penambahan hanya jika data tersedia. Itu tidak akan menunggu dan sementara itu, jalankan instruksi lain. Di sisi lain, pengoptimalan seperti itu tidak mungkin dilakukan selama interpretasi karena penerjemah tidak mengetahui seluruh kode pada waktu tertentu.
Tapi kemudian, bahasa yang diinterpretasikan dapat berjalan di mesin apa pun yang memiliki interpreter yang valid untuk bahasa tersebut.
Apakah Java Dikompilasi atau Ditafsirkan?
Java mencoba mencari jalan tengah. Karena JVM berada di antara kompilator javac dan perangkat keras yang mendasarinya, kompilator javac (atau kompilator lainnya) mengkompilasi kode Java dalam Bytecode, yang dipahami oleh JVM khusus platform. JVM kemudian mengkompilasi Bytecode dalam biner menggunakan kompilasi JIT (Just-in-time), saat kode dijalankan.
HotSpots
Dalam program biasa, hanya ada sebagian kecil kode yang sering dieksekusi, dan seringkali, kode inilah yang memengaruhi kinerja keseluruhan aplikasi secara signifikan. Bagian kode seperti itu disebutHotSpots.
Jika beberapa bagian kode dijalankan hanya sekali, maka kompilasi itu akan membuang-buang tenaga, dan akan lebih cepat untuk menafsirkan Bytecode sebagai gantinya. Tetapi jika bagian tersebut adalah bagian yang panas dan dijalankan beberapa kali, JVM akan mengkompilasinya. Misalnya, jika sebuah metode dipanggil beberapa kali, siklus tambahan yang diperlukan untuk mengompilasi kode akan diimbangi dengan biner yang lebih cepat yang dihasilkan.
Lebih lanjut, semakin JVM menjalankan metode atau loop tertentu, semakin banyak informasi yang dikumpulkannya untuk membuat berbagai pengoptimalan sehingga biner yang lebih cepat dihasilkan.
Mari kita perhatikan kode berikut -
for(int i = 0 ; I <= 100; i++) {
System.out.println(obj1.equals(obj2)); //two objects
}
Jika kode ini diinterpretasikan, interpreter akan menyimpulkan untuk setiap iterasi bahwa kelas obj1. Ini karena setiap kelas di Java memiliki metode .equals (), yang diperluas dari kelas Object dan bisa diganti. Jadi, meskipun obj1 adalah string untuk setiap iterasi, deduksi akan tetap dilakukan.
Di sisi lain, apa yang sebenarnya akan terjadi adalah bahwa JVM akan memperhatikan bahwa untuk setiap iterasi, obj1 adalah kelas String dan karenanya, itu akan menghasilkan kode yang sesuai dengan metode .equals () dari kelas String secara langsung. Jadi, tidak diperlukan pencarian, dan kode yang dikompilasi akan dieksekusi lebih cepat.
Jenis perilaku ini hanya mungkin jika JVM mengetahui bagaimana kode berperilaku. Jadi, ia menunggu sebelum menyusun bagian tertentu dari kode.
Di bawah ini adalah contoh lain -
int sum = 7;
for(int i = 0 ; i <= 100; i++) {
sum += i;
}
Seorang interpreter, untuk setiap loop, mengambil nilai 'sum' dari memori, menambahkan 'I' padanya, dan menyimpannya kembali ke dalam memori. Akses memori adalah operasi yang mahal dan biasanya membutuhkan banyak siklus CPU. Karena kode ini berjalan beberapa kali, ini adalah HotSpot. JIT akan mengkompilasi kode ini dan melakukan pengoptimalan berikut.
Salinan lokal 'jumlah' akan disimpan dalam register, khusus untuk utas tertentu. Semua operasi akan dilakukan ke nilai di register dan ketika loop selesai, nilainya akan ditulis kembali ke memori.
Bagaimana jika utas lain mengakses variabel juga? Karena pembaruan sedang dilakukan pada salinan lokal variabel oleh beberapa utas lain, mereka akan melihat nilai usang. Sinkronisasi benang diperlukan dalam kasus seperti itu. Primitif sinkronisasi yang paling dasar adalah dengan menyatakan 'sum' sebagai volatile. Sekarang, sebelum mengakses variabel, sebuah thread akan membersihkan register lokalnya dan mengambil nilainya dari memori. Setelah mengaksesnya, nilainya segera ditulis ke memori.
Di bawah ini adalah beberapa pengoptimalan umum yang dilakukan oleh penyusun JIT -
- Metode inlining
- Penghapusan kode mati
- Heuristik untuk mengoptimalkan situs panggilan
- Lipat konstan
JVM mendukung lima tingkat kompilasi -
- Interpreter
- C1 dengan pengoptimalan penuh (tanpa profil)
- C1 dengan permintaan dan penghitung tepi belakang (profil ringan)
- C1 dengan profil lengkap
- C2 (menggunakan data profil dari langkah sebelumnya)
Gunakan -Xint jika Anda ingin menonaktifkan semua kompiler JIT dan hanya menggunakan interpreter.
Klien vs. Server JIT
Gunakan -client dan -server untuk mengaktifkan mode masing-masing.
Kompilator klien (C1) mulai mengkompilasi kode lebih cepat daripada kompilator server (C2). Jadi, pada saat C2 memulai kompilasi, C1 pasti sudah menyusun bagian-bagian kode.
Tapi sementara menunggu, C2 membuat profil kode untuk mengetahuinya lebih dari C1. Karenanya, waktu tunggu jika diimbangi dengan pengoptimalan dapat digunakan untuk menghasilkan biner yang jauh lebih cepat. Dari perspektif pengguna, trade-off adalah antara waktu startup program dan waktu yang dibutuhkan untuk menjalankan program. Jika waktu startup adalah premium, maka C1 harus digunakan. Jika aplikasi diharapkan berjalan untuk waktu yang lama (tipikal aplikasi yang ditempatkan pada server), lebih baik menggunakan C2 karena ia menghasilkan kode yang jauh lebih cepat yang sangat mengimbangi waktu startup tambahan.
Untuk program seperti IDE (NetBeans, Eclipse) dan program GUI lainnya, waktu startup sangat penting. NetBeans mungkin membutuhkan waktu satu menit atau lebih untuk memulai. Ratusan kelas dikompilasi saat program seperti NetBeans dimulai. Dalam kasus seperti itu, compiler C1 adalah pilihan terbaik.
Perhatikan bahwa ada dua versi C1 - 32b and 64b. C2 hanya masuk64b.
Kompilasi Bertingkat
Dalam versi yang lebih lama di Java, pengguna dapat memilih salah satu dari opsi berikut -
- Penerjemah (-Xint)
- C1 (-klien)
- C2 (-server)
Itu datang di Java 7. Ia menggunakan compiler C1 untuk startup, dan ketika kode semakin panas, beralih ke C2. Ini dapat diaktifkan dengan opsi JVM berikut: -XX: + TieredCompilation. Nilai defaultnya adalahset to false in Java 7, and to true in Java 8.
Dari lima tingkatan kompilasi, menggunakan kompilasi berjenjang 1 -> 4 -> 5.
Pada mesin 32b, hanya JVM versi 32b yang dapat diinstal. Pada mesin 64b, pengguna memiliki pilihan antara versi 32b dan 64b. Tetapi ada nuansa tertentu yang dapat memengaruhi kinerja aplikasi Java kami.
Jika aplikasi Java menggunakan memori kurang dari 4G, kita harus menggunakan JVM 32b bahkan pada mesin 64b. Ini karena referensi memori dalam kasus ini hanya akan menjadi 32b dan memanipulasinya akan lebih murah daripada memanipulasi alamat 64b. Dalam kasus ini, JVM 64b akan bekerja lebih buruk bahkan jika kita menggunakan OOPS (penunjuk objek biasa). Menggunakan OOPS, JVM dapat menggunakan alamat 32b di JVM 64b. Namun, memanipulasi mereka akan lebih lambat daripada referensi 32b yang sebenarnya karena referensi asli yang mendasarinya masih 64b.
Jika aplikasi kita akan menggunakan lebih dari memori 4G, kita harus menggunakan versi 64b karena referensi 32b tidak dapat menangani lebih dari memori 4G. Kami dapat menginstal kedua versi pada mesin yang sama dan dapat beralih di antara keduanya menggunakan variabel PATH.
Dalam bab ini, kita akan belajar tentang JIT Optimisations.
Metode Inlining
Dalam teknik pengoptimalan ini, kompilator memutuskan untuk mengganti panggilan fungsi Anda dengan badan fungsi. Di bawah ini adalah contoh yang sama -
int sum3;
static int add(int a, int b) {
return a + b;
}
public static void main(String…args) {
sum3 = add(5,7) + add(4,2);
}
//after method inlining
public static void main(String…args) {
sum3 = 5+ 7 + 4 + 2;
}
Dengan menggunakan teknik ini, kompilator menyelamatkan mesin dari overhead pembuatan panggilan fungsi apa pun (ini membutuhkan parameter pendorong dan popping ke tumpukan). Dengan demikian, kode yang dihasilkan berjalan lebih cepat.
Metode penyebarisan hanya dapat dilakukan untuk fungsi non-virtual (fungsi yang tidak diganti). Pertimbangkan apa yang akan terjadi jika metode 'tambah' ditimpa dalam sub kelas dan jenis objek yang berisi metode tersebut tidak diketahui hingga runtime. Dalam kasus ini, kompilator tidak akan tahu metode apa yang harus disebariskan. Tetapi jika metode tersebut ditandai sebagai 'final', maka compiler akan dengan mudah mengetahui bahwa metode tersebut dapat sebaris karena tidak dapat ditimpa oleh sub-kelas mana pun. Perhatikan bahwa sama sekali tidak ada jaminan bahwa metode akhir akan selalu sejalan.
Penghapusan Kode Mati dan Tidak Dapat Dihubungi
Kode tidak dapat dijangkau adalah kode yang tidak dapat dijangkau oleh aliran eksekusi yang memungkinkan. Kami akan mempertimbangkan contoh berikut -
void foo() {
if (a) return;
else return;
foobar(a,b); //unreachable code, compile time error
}
Kode mati juga merupakan kode yang tidak dapat dijangkau, tetapi kompiler mengeluarkan kesalahan dalam kasus ini. Sebaliknya, kami hanya mendapat peringatan. Setiap blok kode seperti konstruktor, fungsi, coba, tangkap, if, while, dll., Memiliki aturannya sendiri untuk kode yang tidak dapat dijangkau yang ditentukan dalam JLS (Spesifikasi Bahasa Java).
Lipat Konstan
Untuk memahami konsep pelipatan konstan, lihat contoh di bawah ini.
final int num = 5;
int b = num * 6; //compile-time constant, num never changes
//compiler would assign b a value of 30.
Siklus hidup objek Java dikelola oleh JVM. Setelah objek dibuat oleh pemrogram, kita tidak perlu khawatir tentang sisa siklus hidupnya. JVM secara otomatis akan menemukan objek yang tidak digunakan lagi dan mengambil kembali memorinya dari heap.
Pengumpulan sampah adalah operasi besar yang dilakukan JVM dan menyesuaikannya dengan kebutuhan kita dapat memberikan peningkatan kinerja yang besar pada aplikasi kita. Ada berbagai algoritme pengumpulan sampah yang disediakan oleh JVM modern. Kita perlu menyadari kebutuhan aplikasi kita untuk memutuskan algoritma mana yang akan digunakan.
Anda tidak dapat membatalkan alokasi objek secara terprogram di Java, seperti yang dapat Anda lakukan dalam bahasa non-GC seperti C dan C ++. Oleh karena itu, Anda tidak dapat memiliki referensi yang menjuntai di Jawa. Namun, Anda mungkin memiliki referensi null (referensi yang merujuk ke area memori di mana JVM tidak akan pernah menyimpan objek). Setiap kali referensi null digunakan, JVM akan menampilkan NullPointerException.
Perhatikan bahwa meskipun jarang menemukan kebocoran memori di program Java berkat GC, kebocoran itu bisa terjadi. Kami akan membuat kebocoran memori di akhir bab ini.
GC berikut digunakan dalam JVM modern
- Kolektor serial
- Pengumpul hasil
- Kolektor CMS
- Kolektor G1
Masing-masing algoritme di atas melakukan tugas yang sama - menemukan objek yang tidak lagi digunakan dan mendapatkan kembali memori yang ditempati di heap. Salah satu pendekatan naif untuk ini adalah menghitung jumlah referensi yang dimiliki setiap objek dan membebaskannya segera setelah jumlah referensi berubah 0 (ini juga dikenal sebagai penghitungan referensi). Mengapa ini naif? Pertimbangkan daftar tertaut melingkar. Setiap node akan memiliki referensi ke sana, tetapi seluruh objek tidak direferensikan dari mana pun, dan idealnya harus dibebaskan.
JVM tidak hanya membebaskan memori, tetapi juga menggabungkan potongan memori kecil menjadi lebih besar. Ini dilakukan untuk mencegah fragmentasi memori.
Singkatnya, algoritme GC biasa melakukan aktivitas berikut -
- Menemukan benda yang tidak digunakan
- Membebaskan memori yang mereka tempati di heap
- Menggabungkan fragmen
GC harus menghentikan thread aplikasi saat sedang berjalan. Ini karena ia memindahkan objek saat dijalankan, dan oleh karena itu, objek tersebut tidak dapat digunakan. Pemberhentian semacam itu disebut 'jeda stop-the-world dan meminimalkan frekuensi dan durasi jeda ini adalah tujuan kami saat menyetel GC kami.
Penggabungan Memori
Demonstrasi sederhana penggabungan memori ditunjukkan di bawah ini
Bagian yang diarsir adalah objek yang perlu dibebaskan. Bahkan setelah semua ruang diambil kembali, kita hanya dapat mengalokasikan objek dengan ukuran maksimum = 75Kb. Ini bahkan setelah kami memiliki 200 KB ruang kosong seperti yang ditunjukkan di bawah ini
Sebagian besar JVM membagi heap menjadi tiga generasi - the young generation (YG), the old generation (OG) and permanent generation (also called tenured generation). Apa alasan dibalik pemikiran seperti itu?
Studi empiris telah menunjukkan bahwa sebagian besar objek yang dibuat memiliki umur yang sangat pendek -
Sumber
https://www.oracle.com
Seperti yang Anda lihat bahwa semakin banyak objek yang dialokasikan dengan waktu, jumlah byte yang bertahan menjadi lebih sedikit (secara umum). Objek Jawa memiliki angka kematian yang tinggi.
Kami akan melihat contoh sederhana. Kelas String di Java tidak dapat diubah. Ini berarti bahwa setiap kali Anda perlu mengubah konten objek String, Anda harus membuat objek baru sama sekali. Misalkan Anda membuat perubahan pada string 1000 kali dalam satu lingkaran seperti yang ditunjukkan pada kode di bawah ini -
String str = “G11 GC”;
for(int i = 0 ; i < 1000; i++) {
str = str + String.valueOf(i);
}
Di setiap loop, kami membuat objek string baru, dan string yang dibuat selama iterasi sebelumnya menjadi tidak berguna (artinya, tidak direferensikan oleh referensi apa pun). Umur T objek itu hanya satu iterasi - mereka akan dikumpulkan oleh GC dalam waktu singkat. Objek berumur pendek tersebut disimpan di area generasi muda di heap. Proses mengumpulkan benda-benda dari generasi muda disebut pengumpulan sampah minor, dan selalu menyebabkan jeda 'stop the world'.
Saat generasi muda terisi, GC melakukan pengumpulan sampah kecil-kecilan. Benda mati dibuang, dan benda hidup dipindahkan ke generasi lama. Utas aplikasi berhenti selama proses ini.
Di sini, kita bisa melihat kelebihan yang ditawarkan oleh desain generasi seperti itu. Generasi muda hanyalah sebagian kecil dari tumpukan dan cepat terisi. Namun pemrosesannya membutuhkan waktu yang jauh lebih sedikit daripada waktu yang dibutuhkan untuk memproses seluruh heap. Jadi, jeda 'stop-dunia' dalam kasus ini jauh lebih singkat, meski lebih sering. Kita harus selalu bertujuan untuk jeda yang lebih pendek daripada yang lebih lama, meskipun itu mungkin lebih sering. Kami akan membahas ini secara rinci di bagian selanjutnya dari tutorial ini.
Generasi muda terbagi dalam dua ruang - eden and survivor space. Objek yang selamat selama pengumpulan eden dipindahkan ke ruang penyintas, dan mereka yang selamat dari ruang penyintas dipindahkan ke generasi lama. Generasi muda dipadatkan saat dikoleksi.
Saat objek dipindahkan ke generasi lama, pada akhirnya akan terisi, dan harus dikumpulkan dan dipadatkan. Algoritme yang berbeda mengambil pendekatan yang berbeda untuk ini. Beberapa dari mereka menghentikan utas aplikasi (yang menyebabkan jeda 'stop-the-world' yang lama karena generasi lama cukup besar dibandingkan dengan generasi muda), sementara beberapa dari mereka melakukannya secara bersamaan sementara utas aplikasi tetap berjalan. Proses ini disebut GC penuh. Dua kolektor seperti ituCMS and G1.
Mari kita sekarang menganalisis algoritma ini secara rinci.
Serial GC
ini adalah GC default pada mesin kelas klien (mesin prosesor tunggal atau 32b JVM, Windows). Biasanya, GC memiliki banyak multithread, tetapi GC serial tidak. Ini memiliki satu utas untuk memproses heap, dan itu akan menghentikan utas aplikasi setiap kali melakukan GC minor atau GC mayor. Kita dapat memerintahkan JVM untuk menggunakan GC ini dengan menentukan flag:-XX:+UseSerialGC. Jika kita ingin menggunakan beberapa algoritma yang berbeda, tentukan nama algoritma. Perhatikan bahwa generasi lama sepenuhnya dipadatkan selama GC utama.
GC Throughput
GC ini adalah default pada 64b JVM dan mesin multi-CPU. Berbeda dengan GC serial, ia menggunakan banyak utas untuk memproses generasi muda dan tua. Karenanya, GC juga disebutparallel collector. Kita dapat memerintahkan JVM kita untuk menggunakan kolektor ini dengan menggunakan bendera:-XX:+UseParallelOldGC atau -XX:+UseParallelGC(untuk JDK 8 dan seterusnya). Utas aplikasi dihentikan saat ia melakukan pengumpulan sampah besar atau kecil. Seperti kolektor serial, itu sepenuhnya memadatkan generasi muda selama GC utama.
Throughput GC mengumpulkan YG dan OG. Ketika eden telah terisi, kolektor mengeluarkan benda-benda hidup darinya ke dalam OG atau salah satu ruang yang selamat (SS0 dan SS1 pada diagram di bawah). Benda mati dibuang untuk membebaskan ruang yang mereka tempati.
Sebelum GC YG
Setelah GC dari YG
Selama GC penuh, pengumpul throughput mengosongkan seluruh YG, SS0, dan SS1. Setelah operasi, OG hanya berisi objek hidup. Kita harus mencatat bahwa kedua kolektor di atas menghentikan thread aplikasi saat memproses heap. Ini berarti jeda 'stopthe- world' yang lama selama GC utama. Dua algoritme berikutnya bertujuan untuk menghilangkannya, dengan mengorbankan lebih banyak sumber daya perangkat keras -
Kolektor CMS
Itu singkatan dari 'concurrent mark-sweep'. Fungsinya adalah menggunakan beberapa utas latar belakang untuk memindai melalui generasi lama secara berkala dan menyingkirkan objek mati. Namun selama GC minor, thread aplikasi dihentikan. Namun, jeda cukup kecil. Ini membuat CMS menjadi kolektor jeda rendah.
Kolektor ini membutuhkan waktu CPU tambahan untuk memindai melalui heap saat menjalankan thread aplikasi. Lebih lanjut, thread latar belakang hanya mengumpulkan heap dan tidak melakukan pemadatan apa pun. Mereka dapat menyebabkan heap menjadi terfragmentasi. Karena ini terus berlanjut, setelah titik waktu tertentu, CMS akan menghentikan semua thread aplikasi dan memadatkan heap menggunakan satu thread. Gunakan argumen JVM berikut untuk memberi tahu JVM agar menggunakan kolektor CMS -
“XX:+UseConcMarkSweepGC -XX:+UseParNewGC” sebagai argumen JVM untuk memerintahkannya menggunakan kolektor CMS.
Sebelum GC
Setelah GC
Perhatikan bahwa pengumpulan dilakukan secara bersamaan.
G1 GC
Algoritme ini bekerja dengan membagi heap menjadi beberapa wilayah. Seperti kolektor CMS, ini menghentikan thread aplikasi saat melakukan GC minor dan menggunakan thread latar belakang untuk memproses generasi lama sambil tetap menjalankan thread aplikasi. Karena generasi lama terbagi menjadi beberapa daerah, ia terus memadatkan mereka saat memindahkan objek dari satu daerah ke daerah lain. Oleh karena itu, fragmentasi minimal. Anda dapat menggunakan bendera:XX:+UseG1GCuntuk memberi tahu JVM Anda agar menggunakan algoritme ini. Seperti CMS, ini juga membutuhkan lebih banyak waktu CPU untuk memproses heap dan menjalankan thread aplikasi secara bersamaan.
Algoritme ini telah dirancang untuk memproses tumpukan yang lebih besar (> 4G), yang dibagi menjadi beberapa wilayah berbeda. Sebagian dari daerah itu terdiri dari generasi muda, dan sisanya adalah generasi tua. YG dihapus secara tradisional - semua utas aplikasi dihentikan dan semua objek yang masih hidup hingga generasi lama atau ruang penyintas.
Perhatikan bahwa semua algoritme GC membagi heap menjadi YG dan OG, dan menggunakan STWP untuk menghapus YG. Proses ini biasanya sangat cepat.
Pada bab terakhir, kita belajar tentang berbagai Gcs Generasi. Dalam bab ini, kita akan membahas tentang cara menyetel GC.
Ukuran Heap
Ukuran heap merupakan faktor penting dalam performa aplikasi Java kami. Jika terlalu kecil, maka akan sering diisi dan akibatnya harus sering dikumpulkan oleh GC. Di sisi lain, jika kita hanya menambah ukuran heap, meskipun perlu dikumpulkan lebih jarang, panjang jeda akan bertambah.
Lebih lanjut, meningkatkan ukuran heap memiliki hukuman berat pada OS yang mendasarinya. Menggunakan paging, OS membuat program aplikasi kita melihat lebih banyak memori daripada yang sebenarnya tersedia. OS mengatur ini dengan menggunakan beberapa ruang swap pada disk, menyalin bagian program yang tidak aktif ke dalamnya. Ketika bagian-bagian itu diperlukan, OS menyalinnya kembali dari disk ke memori.
Misalkan sebuah mesin memiliki memori 8G, dan JVM melihat memori virtual 16G, JVM tidak akan tahu bahwa sebenarnya hanya ada 8G yang tersedia pada sistem. Itu hanya akan meminta 16G dari OS, dan setelah mendapat memori itu, itu akan terus menggunakannya. OS harus menukar banyak data masuk dan keluar, dan ini adalah hukuman kinerja yang sangat besar pada sistem.
Dan kemudian muncul jeda yang akan terjadi selama GC penuh dari memori virtual tersebut. Karena GC akan bertindak di seluruh heap untuk pengumpulan dan pemadatan, GC harus menunggu lama hingga memori virtual ditukar keluar dari disk. Dalam kasus kolektor serentak, utas latar belakang harus menunggu lama untuk data disalin dari ruang swap ke memori.
Jadi di sini muncul pertanyaan tentang bagaimana kita harus memutuskan ukuran heap yang optimal. Aturan pertama adalah jangan pernah meminta OS lebih banyak memori daripada yang sebenarnya ada. Ini benar-benar akan mencegah masalah untuk sering bertukar. Jika mesin memiliki beberapa JVM yang terpasang dan berjalan, maka total permintaan memori oleh semuanya digabungkan kurang dari RAM sebenarnya yang ada dalam sistem.
Anda dapat mengontrol ukuran permintaan memori oleh JVM menggunakan dua flag -
-XmsN - Mengontrol memori awal yang diminta.
-XmxN - Mengontrol memori maksimum yang dapat diminta.
Nilai default dari kedua flag ini bergantung pada OS yang mendasarinya. Misalnya, untuk 64b JVM yang berjalan di MacOS, -XmsN = 64M dan -XmxN = minimal 1G atau 1/4 dari total memori fisik.
Perhatikan bahwa JVM dapat menyesuaikan di antara dua nilai secara otomatis. Misalnya, jika diketahui bahwa terlalu banyak GC yang terjadi, itu akan terus meningkatkan ukuran memori selama di bawah -XmxN dan sasaran kinerja yang diinginkan terpenuhi.
Jika Anda tahu persis berapa banyak memori yang dibutuhkan aplikasi Anda, maka Anda dapat mengatur -XmsN = -XmxN. Dalam hal ini, JVM tidak perlu mencari nilai "optimal" dari heap, dan karenanya, proses GC menjadi sedikit lebih efisien.
Ukuran Generasi
Anda dapat memutuskan berapa banyak heap yang ingin Anda alokasikan ke YG, dan berapa banyak yang ingin Anda alokasikan ke OG. Kedua nilai ini memengaruhi kinerja aplikasi kami dengan cara berikut.
Jika ukuran YG sangat besar, maka akan lebih jarang dikumpulkan. Ini akan menghasilkan lebih sedikit jumlah objek yang dipromosikan ke OG. Di sisi lain, jika Anda memperbesar ukuran OG terlalu banyak, maka pengumpulan dan pemadatan akan memakan banyak waktu dan ini akan menyebabkan jeda STW yang lama. Jadi, pengguna harus menemukan keseimbangan antara dua nilai ini.
Di bawah ini adalah flag yang dapat Anda gunakan untuk menyetel nilai-nilai ini -
-XX:NewRatio=N: Rasio YG terhadap OG (nilai default = 2)
-XX:NewSize=N: Ukuran awal YG
-XX:MaxNewSize=N: Ukuran maksimal YG
-XmnN: Setel NewSize dan MaxNewSize ke nilai yang sama menggunakan tanda ini
Ukuran awal YG ditentukan oleh nilai Rasio Baru dengan rumus yang diberikan -
(total heap size) / (newRatio + 1)
Karena nilai awal newRatio adalah 2, rumus di atas memberikan nilai awal YG menjadi 1/3 dari total ukuran heap. Anda selalu dapat mengganti nilai ini dengan secara eksplisit menentukan ukuran YG menggunakan flag NewSize. Bendera ini tidak memiliki nilai default, dan jika tidak disetel secara eksplisit, ukuran YG akan terus dihitung menggunakan rumus di atas.
Permagen dan Metaspace
Permagen dan metaspace adalah area heap tempat JVM menyimpan metadata kelas. Ruang ini disebut 'permagen' di Java 7, dan di Jawa 8 disebut 'metaspace'. Informasi ini digunakan oleh kompilator dan runtime.
Anda dapat mengontrol ukuran permagen menggunakan tanda berikut: -XX: PermSize=N dan -XX:MaxPermSize=N. Ukuran Metaspace dapat dikontrol menggunakan:-XX:Metaspace- Size=N dan -XX:MaxMetaspaceSize=N.
Ada beberapa perbedaan bagaimana permagen dan metaspace dikelola saat nilai bendera tidak disetel. Secara default, keduanya memiliki ukuran awal default. Namun sementara metaspace dapat menempati heap sebanyak yang dibutuhkan, permagen tidak dapat menempati lebih dari nilai awal default. Misalnya, 64b JVM memiliki ruang heap 82M sebagai ukuran permagen maksimum.
Perhatikan bahwa karena metaspace dapat menempati jumlah memori yang tidak terbatas kecuali ditentukan untuk tidak, dapat terjadi kesalahan kehabisan memori. GC penuh terjadi setiap kali region ini diubah ukurannya. Karenanya, selama startup, jika ada banyak class yang dimuat, metaspace dapat terus mengubah ukuran sehingga menghasilkan GC penuh setiap saat. Oleh karena itu, dibutuhkan banyak waktu untuk aplikasi besar untuk memulai jika ukuran metaspace awal terlalu rendah. Merupakan ide bagus untuk menambah ukuran awal karena mengurangi waktu startup.
Meskipun permagen dan metaspace menyimpan metadata kelas, itu tidak permanen, dan ruang tersebut diambil kembali oleh GC, seperti dalam kasus objek. Ini biasanya terjadi pada aplikasi server. Setiap kali Anda membuat penerapan baru ke server, metadata lama harus dibersihkan karena pemuat kelas baru sekarang membutuhkan ruang. Ruang ini dibebaskan oleh GC.
Kita akan membahas tentang konsep kebocoran memori di Jawa pada bab ini.
Kode berikut membuat kebocoran memori di Java -
void queryDB() {
try{
Connection conn = ConnectionFactory.getConnection();
PreparedStatement ps = conn.preparedStatement("query"); // executes a
SQL
ResultSet rs = ps.executeQuery();
while(rs.hasNext()) {
//process the record
}
} catch(SQLException sqlEx) {
//print stack trace
}
}
Dalam kode di atas, ketika metode keluar, kita belum menutup objek koneksi. Dengan demikian, koneksi fisik tetap terbuka sebelum GC dipicu dan melihat objek koneksi tidak terjangkau. Sekarang, ini akan memanggil metode terakhir pada objek koneksi, namun itu mungkin tidak diimplementasikan. Karenanya, objek tidak akan dikumpulkan sampah dalam siklus ini.
Hal yang sama akan terjadi selanjutnya sampai server jarak jauh melihat bahwa koneksi telah terbuka untuk waktu yang lama dan secara paksa memutuskannya. Dengan demikian, objek tanpa referensi akan tetap berada di memori dalam waktu lama yang menyebabkan kebocoran.