TensorFlow - Perceptron ชั้นเดียว

เพื่อให้เข้าใจ Perceptron ชั้นเดียวสิ่งสำคัญคือต้องเข้าใจ Artificial Neural Networks (ANN) โครงข่ายประสาทเทียมเป็นระบบประมวลผลข้อมูลซึ่งเป็นกลไกที่ได้รับแรงบันดาลใจจากการทำงานของวงจรประสาทชีวภาพ โครงข่ายประสาทเทียมมีหน่วยประมวลผลจำนวนมากที่เชื่อมต่อกัน ต่อไปนี้คือการแสดงแผนผังของโครงข่ายประสาทเทียม -

แผนภาพแสดงให้เห็นว่าหน่วยที่ซ่อนอยู่สื่อสารกับเลเยอร์ภายนอก ในขณะที่หน่วยอินพุตและเอาต์พุตสื่อสารผ่านชั้นที่ซ่อนอยู่ของเครือข่ายเท่านั้น

รูปแบบของการเชื่อมต่อกับโหนดจำนวนชั้นทั้งหมดและระดับของโหนดระหว่างอินพุตและเอาต์พุตโดยมีจำนวนเซลล์ประสาทต่อชั้นเป็นตัวกำหนดสถาปัตยกรรมของเครือข่ายประสาท

สถาปัตยกรรมมีสองประเภท ประเภทเหล่านี้มุ่งเน้นไปที่การทำงานของโครงข่ายประสาทเทียมดังต่อไปนี้ -

Perceptron ชั้นเดียว
Perceptron หลายชั้น

Perceptron ชั้นเดียว

เพอร์เซปตรอนชั้นเดียวเป็นแบบจำลองระบบประสาทที่เสนอครั้งแรกที่สร้างขึ้น เนื้อหาของหน่วยความจำในท้องถิ่นของเซลล์ประสาทประกอบด้วยเวกเตอร์ของน้ำหนัก การคำนวณของเพอร์เซปตรอนชั้นเดียวจะดำเนินการกับการคำนวณผลรวมของเวกเตอร์อินพุตแต่ละค่าคูณด้วยองค์ประกอบที่สอดคล้องกันของเวกเตอร์ของน้ำหนัก ค่าที่แสดงในเอาต์พุตจะเป็นอินพุตของฟังก์ชันการเปิดใช้งาน

ให้เรามุ่งเน้นไปที่การนำ Perceptron ชั้นเดียวไปใช้กับปัญหาการจำแนกภาพโดยใช้ TensorFlow ตัวอย่างที่ดีที่สุดในการแสดง Perceptron ชั้นเดียวคือการแสดง "Logistic Regression"

ตอนนี้ให้เราพิจารณาขั้นตอนพื้นฐานต่อไปนี้ของการฝึกการถดถอยโลจิสติกส์ -

น้ำหนักเริ่มต้นด้วยค่าสุ่มเมื่อเริ่มต้นการฝึก
สำหรับแต่ละองค์ประกอบของชุดการฝึกข้อผิดพลาดจะถูกคำนวณโดยมีความแตกต่างระหว่างเอาต์พุตที่ต้องการและเอาต์พุตจริง ข้อผิดพลาดที่คำนวณจะใช้เพื่อปรับน้ำหนัก
กระบวนการนี้จะทำซ้ำจนกว่าข้อผิดพลาดที่เกิดขึ้นในชุดการฝึกอบรมทั้งหมดจะไม่น้อยกว่าเกณฑ์ที่ระบุจนกว่าจะถึงจำนวนการทำซ้ำสูงสุด

รหัสที่สมบูรณ์สำหรับการประเมินการถดถอยโลจิสติกมีการระบุไว้ด้านล่าง -

# Import MINST data 
from tensorflow.examples.tutorials.mnist import input_data 
mnist = input_data.read_data_sets("/tmp/data/", one_hot = True) 

import tensorflow as tf 
import matplotlib.pyplot as plt 

# Parameters 
learning_rate = 0.01 
training_epochs = 25 
batch_size = 100 
display_step = 1 

# tf Graph Input 
x = tf.placeholder("float", [None, 784]) # mnist data image of shape 28*28 = 784 
y = tf.placeholder("float", [None, 10]) # 0-9 digits recognition => 10 classes 

# Create model 
# Set model weights 
W = tf.Variable(tf.zeros([784, 10])) 
b = tf.Variable(tf.zeros([10])) 

# Construct model 
activation = tf.nn.softmax(tf.matmul(x, W) + b) # Softmax 

# Minimize error using cross entropy 
cross_entropy = y*tf.log(activation) 
cost = tf.reduce_mean\ (-tf.reduce_sum\ (cross_entropy,reduction_indices = 1)) 

optimizer = tf.train.\ GradientDescentOptimizer(learning_rate).minimize(cost) 

#Plot settings 
avg_set = [] 
epoch_set = [] 

# Initializing the variables init = tf.initialize_all_variables()
# Launch the graph 
with tf.Session() as sess:
   sess.run(init)
   
   # Training cycle
   for epoch in range(training_epochs):
      avg_cost = 0.
      total_batch = int(mnist.train.num_examples/batch_size)
      
      # Loop over all batches
      for i in range(total_batch):
         batch_xs, batch_ys = \ mnist.train.next_batch(batch_size)
         # Fit training using batch data sess.run(optimizer, \ feed_dict = {
            x: batch_xs, y: batch_ys}) 
         # Compute average loss avg_cost += sess.run(cost, \ feed_dict = {
            x: batch_xs, \ y: batch_ys})/total_batch
      # Display logs per epoch step
      if epoch % display_step == 0:
         print ("Epoch:", '%04d' % (epoch+1), "cost=", "{:.9f}".format(avg_cost))
            avg_set.append(avg_cost) epoch_set.append(epoch+1)
   print ("Training phase finished")
    
   plt.plot(epoch_set,avg_set, 'o', label = 'Logistic Regression Training phase') 
   plt.ylabel('cost') 
   plt.xlabel('epoch') 
   plt.legend() 
   plt.show() 
    
   # Test model 
   correct_prediction = tf.equal(tf.argmax(activation, 1), tf.argmax(y, 1)) 
   
   # Calculate accuracy 
   accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float")) print 
      ("Model accuracy:", accuracy.eval({x: mnist.test.images, y: mnist.test.labels}))

เอาต์พุต

รหัสด้านบนสร้างผลลัพธ์ต่อไปนี้ -

การถดถอยโลจิสติกถือเป็นการวิเคราะห์เชิงคาดการณ์ การถดถอยโลจิสติกใช้เพื่ออธิบายข้อมูลและเพื่ออธิบายความสัมพันธ์ระหว่างตัวแปรไบนารีที่ขึ้นกับหนึ่งตัวแปรกับตัวแปรเล็กน้อยหรือตัวแปรอิสระ