TensorFlow-분산 컴퓨팅

이 장에서는 분산 형 TensorFlow를 시작하는 방법에 중점을 둡니다. 목표는 개발자가 TF 서버와 같이 반복되는 기본 분산 TF 개념을 이해하도록 돕는 것입니다. 분산 형 TensorFlow를 평가하기 위해 Jupyter 노트북을 사용합니다. TensorFlow를 사용한 분산 컴퓨팅 구현은 다음과 같습니다.

Step 1 − 분산 컴퓨팅에 필요한 필수 모듈 가져 오기 −

import tensorflow as tf

Step 2− 하나의 노드로 TensorFlow 클러스터를 생성합니다. 이 노드가 이름이 "worker"이고 localhost : 2222에서 하나의 작업을 수행하는 작업을 담당하도록합니다.

cluster_spec = tf.train.ClusterSpec({'worker' : ['localhost:2222']})
server = tf.train.Server(cluster_spec)
server.target

위의 스크립트는 다음과 같은 출력을 생성합니다.

'grpc://localhost:2222'
The server is currently running.

Step 3 − 각 세션 별 서버 구성은 다음 명령을 실행하여 계산할 수 있습니다. −

server.server_def

위의 명령은 다음 출력을 생성합니다-

cluster {
   job {
      name: "worker"
      tasks {
         value: "localhost:2222"
      }
   }
}
job_name: "worker"
protocol: "grpc"

Step 4− 실행 엔진이 서버 인 TensorFlow 세션을 시작합니다. TensorFlow를 사용하여 로컬 서버를 만들고lsof 서버의 위치를 ​​찾으십시오.

sess = tf.Session(target = server.target)
server = tf.train.Server.create_local_server()

Step 5 −이 세션에서 사용 가능한 장치를보고 각 세션을 닫습니다.

devices = sess.list_devices()
for d in devices:
   print(d.name)
sess.close()

위의 명령은 다음 출력을 생성합니다-

/job:worker/replica:0/task:0/device:CPU:0