TensorFlow - Komputasi Terdistribusi

Bab ini akan berfokus pada cara memulai TensorFlow terdistribusi. Tujuannya adalah untuk membantu pengembang memahami konsep TF terdistribusi dasar yang berulang, seperti server TF. Kami akan menggunakan Notebook Jupyter untuk mengevaluasi TensorFlow terdistribusi. Implementasi komputasi terdistribusi dengan TensorFlow disebutkan di bawah -

Step 1 - Impor modul yang diperlukan wajib untuk komputasi terdistribusi -

import tensorflow as tf

Step 2- Buat cluster TensorFlow dengan satu node. Biarkan node ini bertanggung jawab atas pekerjaan yang memiliki nama "pekerja" dan yang akan mengoperasikan satu pengambilan di localhost: 2222.

cluster_spec = tf.train.ClusterSpec({'worker' : ['localhost:2222']})
server = tf.train.Server(cluster_spec)
server.target

Skrip di atas menghasilkan output berikut -

'grpc://localhost:2222'
The server is currently running.

Step 3 - Konfigurasi server dengan sesi masing-masing dapat dihitung dengan menjalankan perintah berikut -

server.server_def

Perintah di atas menghasilkan output berikut -

cluster {
   job {
      name: "worker"
      tasks {
         value: "localhost:2222"
      }
   }
}
job_name: "worker"
protocol: "grpc"

Step 4- Luncurkan sesi TensorFlow dengan mesin eksekusinya sebagai server. Gunakan TensorFlow untuk membuat dan menggunakan server lokallsof untuk mengetahui lokasi server.

sess = tf.Session(target = server.target)
server = tf.train.Server.create_local_server()

Step 5 - Lihat perangkat yang tersedia di sesi ini dan tutup sesi terkait.

devices = sess.list_devices()
for d in devices:
   print(d.name)
sess.close()

Perintah di atas menghasilkan output berikut -

/job:worker/replica:0/task:0/device:CPU:0