Benchmarking และ Profiling

ในบทนี้เราจะเรียนรู้ว่าการเปรียบเทียบและการทำโปรไฟล์ช่วยในการแก้ไขปัญหาด้านประสิทธิภาพได้อย่างไร

สมมติว่าเราเขียนโค้ดและมันก็ให้ผลลัพธ์ที่ต้องการเช่นกัน แต่ถ้าเราต้องการรันโค้ดนี้ให้เร็วขึ้นหน่อยเพราะความต้องการเปลี่ยนไป ในกรณีนี้เราต้องค้นหาว่าส่วนใดของโค้ดของเราที่ทำให้โปรแกรมทั้งหมดทำงานช้าลง ในกรณีนี้การเปรียบเทียบและการสร้างโปรไฟล์จะมีประโยชน์

Benchmarking คืออะไร?

การเปรียบเทียบมีจุดมุ่งหมายเพื่อประเมินบางสิ่งโดยเปรียบเทียบกับมาตรฐาน อย่างไรก็ตามคำถามที่เกิดขึ้นที่นี่ก็คือการเปรียบเทียบคืออะไรและทำไมเราถึงต้องใช้ในกรณีของการเขียนโปรแกรมซอฟต์แวร์ การเปรียบเทียบโค้ดหมายความว่าโค้ดทำงานเร็วเพียงใดและคอขวดอยู่ที่ใด เหตุผลหลักประการหนึ่งในการเปรียบเทียบคือการเพิ่มประสิทธิภาพโค้ด

การเปรียบเทียบทำงานอย่างไร

หากเราพูดถึงการทำงานของการเปรียบเทียบเราต้องเริ่มต้นด้วยการเปรียบเทียบโปรแกรมทั้งหมดเป็นสถานะปัจจุบันหนึ่งจากนั้นเราสามารถรวมการวัดประสิทธิภาพขนาดเล็กแล้วแยกโปรแกรมออกเป็นโปรแกรมขนาดเล็ก เพื่อค้นหาคอขวดภายในโปรแกรมของเราและปรับให้เหมาะสม กล่าวอีกนัยหนึ่งเราสามารถเข้าใจได้ว่าเป็นการแบ่งปัญหาที่ใหญ่และยากออกเป็นชุดของปัญหาที่เล็กกว่าและง่ายกว่าเล็กน้อยสำหรับการเพิ่มประสิทธิภาพ

โมดูล Python สำหรับการเปรียบเทียบ

ใน Python เรามีโมดูลเริ่มต้นสำหรับการเปรียบเทียบซึ่งเรียกว่า timeit. ด้วยความช่วยเหลือของtimeit โมดูลเราสามารถวัดประสิทธิภาพของโค้ด Python ขนาดเล็กภายในโปรแกรมหลักของเราได้

ตัวอย่าง

ในสคริปต์ Python ต่อไปนี้เรากำลังนำเข้าไฟล์ timeit โมดูลซึ่งจะวัดเวลาที่ใช้ในการเรียกใช้ฟังก์ชันสองฟังก์ชันเพิ่มเติม - functionA และ functionB -

import timeit
import time
def functionA():
   print("Function A starts the execution:")
   print("Function A completes the execution:")
def functionB():
   print("Function B starts the execution")
   print("Function B completes the execution")
start_time = timeit.default_timer()
functionA()
print(timeit.default_timer() - start_time)
start_time = timeit.default_timer()
functionB()
print(timeit.default_timer() - start_time)

หลังจากเรียกใช้สคริปต์ข้างต้นเราจะได้รับเวลาดำเนินการของทั้งสองฟังก์ชันดังที่แสดงด้านล่าง

เอาต์พุต

Function A starts the execution:
Function A completes the execution:
0.0014599495514175942
Function B starts the execution
Function B completes the execution
0.0017024724827479076

การเขียนตัวจับเวลาของเราเองโดยใช้ฟังก์ชันมัณฑนากร

ใน Python เราสามารถสร้างตัวจับเวลาของเราเองได้ซึ่งจะทำหน้าที่เหมือนกับไฟล์ timeitโมดูล. สามารถทำได้ด้วยความช่วยเหลือของไฟล์decoratorฟังก์ชัน ต่อไปนี้เป็นตัวอย่างของตัวจับเวลาที่กำหนดเอง -

import random
import time

def timer_func(func):

   def function_timer(*args, **kwargs):
   start = time.time()
   value = func(*args, **kwargs)
   end = time.time()
   runtime = end - start
   msg = "{func} took {time} seconds to complete its execution."
      print(msg.format(func = func.__name__,time = runtime))
   return value
   return function_timer

@timer_func
def Myfunction():
   for x in range(5):
   sleep_time = random.choice(range(1,3))
   time.sleep(sleep_time)

if __name__ == '__main__':
   Myfunction()

สคริปต์ python ข้างต้นช่วยในการนำเข้าโมดูลเวลาแบบสุ่ม เราได้สร้างฟังก์ชันมัณฑนากร timer_func () ซึ่งมีฟังก์ชัน function_timer () อยู่ภายใน ตอนนี้ฟังก์ชันที่ซ้อนกันจะคว้าเวลาก่อนที่จะเรียกฟังก์ชันส่งผ่าน จากนั้นจะรอให้ฟังก์ชันกลับมาและคว้าเวลาสิ้นสุด ด้วยวิธีนี้ในที่สุดเราก็สามารถทำให้สคริปต์ python พิมพ์เวลาดำเนินการได้ สคริปต์จะสร้างผลลัพธ์ดังที่แสดงด้านล่าง

เอาต์พุต

Myfunction took 8.000457763671875 seconds to complete its execution.

การทำโปรไฟล์คืออะไร?

บางครั้งโปรแกรมเมอร์ต้องการวัดคุณลักษณะบางอย่างเช่นการใช้หน่วยความจำความซับซ้อนของเวลาหรือการใช้คำสั่งเฉพาะเกี่ยวกับโปรแกรมเพื่อวัดความสามารถที่แท้จริงของโปรแกรมนั้น การวัดผลเกี่ยวกับโปรแกรมแบบนี้เรียกว่าการทำโปรไฟล์ การทำโปรไฟล์ใช้การวิเคราะห์โปรแกรมแบบไดนามิกเพื่อทำการวัดดังกล่าว

ในส่วนต่อไปเราจะเรียนรู้เกี่ยวกับโมดูล Python สำหรับการทำโปรไฟล์

cProfile - โมดูล inbuilt

cProfileเป็นโมดูลในตัว Python สำหรับการทำโปรไฟล์ โมดูลนี้เป็นส่วนขยาย C ที่มีค่าโสหุ้ยที่เหมาะสมซึ่งเหมาะสำหรับการทำโปรไฟล์โปรแกรมที่ทำงานเป็นเวลานาน หลังจากรันมันจะบันทึกฟังก์ชันและเวลาดำเนินการทั้งหมด มันมีพลังมาก แต่บางครั้งก็ยากที่จะตีความและดำเนินการ ในตัวอย่างต่อไปนี้เรากำลังใช้ cProfile กับโค้ดด้านล่าง -

ตัวอย่าง

def increment_global():

   global x
   x += 1

def taskofThread(lock):

   for _ in range(50000):
   lock.acquire()
   increment_global()
   lock.release()

def main():
   global x
   x = 0

   lock = threading.Lock()

   t1 = threading.Thread(target=taskofThread, args=(lock,))
   t2 = threading.Thread(target= taskofThread, args=(lock,))

   t1.start()
   t2.start()

   t1.join()
   t2.join()

if __name__ == "__main__":
   for i in range(5):
      main()
   print("x = {1} after Iteration {0}".format(i,x))

รหัสด้านบนจะถูกบันทึกไว้ในไฟล์ thread_increment.pyไฟล์. ตอนนี้รันโค้ดด้วย cProfile บนบรรทัดคำสั่งดังนี้ -

(base) D:\ProgramData>python -m cProfile thread_increment.py
x = 100000 after Iteration 0
x = 100000 after Iteration 1
x = 100000 after Iteration 2
x = 100000 after Iteration 3
x = 100000 after Iteration 4
      3577 function calls (3522 primitive calls) in 1.688 seconds

   Ordered by: standard name

   ncalls tottime percall cumtime percall filename:lineno(function)

   5 0.000 0.000 0.000 0.000 <frozen importlib._bootstrap>:103(release)
   5 0.000 0.000 0.000 0.000 <frozen importlib._bootstrap>:143(__init__)
   5 0.000 0.000 0.000 0.000 <frozen importlib._bootstrap>:147(__enter__)
   … … … …

จากผลลัพธ์ข้างต้นเป็นที่ชัดเจนว่า cProfile พิมพ์ฟังก์ชัน 3577 ทั้งหมดที่เรียกว่าโดยใช้เวลาที่ใช้ในแต่ละครั้งและจำนวนครั้งที่เรียก ต่อไปนี้เป็นคอลัมน์ที่เราได้รับในผลลัพธ์ -

  • ncalls - เป็นจำนวนการโทร

  • tottime - เป็นเวลาทั้งหมดที่ใช้ในฟังก์ชันที่กำหนด

  • percall - หมายถึงผลหารของ tottime หารด้วย ncalls

  • cumtime- เป็นเวลาสะสมที่ใช้ในฟังก์ชันนี้และฟังก์ชันย่อยทั้งหมด มีความแม่นยำแม้กระทั่งสำหรับฟังก์ชันเรียกซ้ำ

  • percall - มันคือผลหารของ cumtime หารด้วยการเรียกแบบดั้งเดิม

  • filename:lineno(function) - โดยทั่วไปจะให้ข้อมูลตามลำดับของแต่ละฟังก์ชัน