Benchmarking และ Profiling
ในบทนี้เราจะเรียนรู้ว่าการเปรียบเทียบและการทำโปรไฟล์ช่วยในการแก้ไขปัญหาด้านประสิทธิภาพได้อย่างไร
สมมติว่าเราเขียนโค้ดและมันก็ให้ผลลัพธ์ที่ต้องการเช่นกัน แต่ถ้าเราต้องการรันโค้ดนี้ให้เร็วขึ้นหน่อยเพราะความต้องการเปลี่ยนไป ในกรณีนี้เราต้องค้นหาว่าส่วนใดของโค้ดของเราที่ทำให้โปรแกรมทั้งหมดทำงานช้าลง ในกรณีนี้การเปรียบเทียบและการสร้างโปรไฟล์จะมีประโยชน์
Benchmarking คืออะไร?
การเปรียบเทียบมีจุดมุ่งหมายเพื่อประเมินบางสิ่งโดยเปรียบเทียบกับมาตรฐาน อย่างไรก็ตามคำถามที่เกิดขึ้นที่นี่ก็คือการเปรียบเทียบคืออะไรและทำไมเราถึงต้องใช้ในกรณีของการเขียนโปรแกรมซอฟต์แวร์ การเปรียบเทียบโค้ดหมายความว่าโค้ดทำงานเร็วเพียงใดและคอขวดอยู่ที่ใด เหตุผลหลักประการหนึ่งในการเปรียบเทียบคือการเพิ่มประสิทธิภาพโค้ด
การเปรียบเทียบทำงานอย่างไร
หากเราพูดถึงการทำงานของการเปรียบเทียบเราต้องเริ่มต้นด้วยการเปรียบเทียบโปรแกรมทั้งหมดเป็นสถานะปัจจุบันหนึ่งจากนั้นเราสามารถรวมการวัดประสิทธิภาพขนาดเล็กแล้วแยกโปรแกรมออกเป็นโปรแกรมขนาดเล็ก เพื่อค้นหาคอขวดภายในโปรแกรมของเราและปรับให้เหมาะสม กล่าวอีกนัยหนึ่งเราสามารถเข้าใจได้ว่าเป็นการแบ่งปัญหาที่ใหญ่และยากออกเป็นชุดของปัญหาที่เล็กกว่าและง่ายกว่าเล็กน้อยสำหรับการเพิ่มประสิทธิภาพ
โมดูล Python สำหรับการเปรียบเทียบ
ใน Python เรามีโมดูลเริ่มต้นสำหรับการเปรียบเทียบซึ่งเรียกว่า timeit. ด้วยความช่วยเหลือของtimeit โมดูลเราสามารถวัดประสิทธิภาพของโค้ด Python ขนาดเล็กภายในโปรแกรมหลักของเราได้
ตัวอย่าง
ในสคริปต์ Python ต่อไปนี้เรากำลังนำเข้าไฟล์ timeit โมดูลซึ่งจะวัดเวลาที่ใช้ในการเรียกใช้ฟังก์ชันสองฟังก์ชันเพิ่มเติม - functionA และ functionB -
import timeit
import time
def functionA():
print("Function A starts the execution:")
print("Function A completes the execution:")
def functionB():
print("Function B starts the execution")
print("Function B completes the execution")
start_time = timeit.default_timer()
functionA()
print(timeit.default_timer() - start_time)
start_time = timeit.default_timer()
functionB()
print(timeit.default_timer() - start_time)
หลังจากเรียกใช้สคริปต์ข้างต้นเราจะได้รับเวลาดำเนินการของทั้งสองฟังก์ชันดังที่แสดงด้านล่าง
เอาต์พุต
Function A starts the execution:
Function A completes the execution:
0.0014599495514175942
Function B starts the execution
Function B completes the execution
0.0017024724827479076
การเขียนตัวจับเวลาของเราเองโดยใช้ฟังก์ชันมัณฑนากร
ใน Python เราสามารถสร้างตัวจับเวลาของเราเองได้ซึ่งจะทำหน้าที่เหมือนกับไฟล์ timeitโมดูล. สามารถทำได้ด้วยความช่วยเหลือของไฟล์decoratorฟังก์ชัน ต่อไปนี้เป็นตัวอย่างของตัวจับเวลาที่กำหนดเอง -
import random
import time
def timer_func(func):
def function_timer(*args, **kwargs):
start = time.time()
value = func(*args, **kwargs)
end = time.time()
runtime = end - start
msg = "{func} took {time} seconds to complete its execution."
print(msg.format(func = func.__name__,time = runtime))
return value
return function_timer
@timer_func
def Myfunction():
for x in range(5):
sleep_time = random.choice(range(1,3))
time.sleep(sleep_time)
if __name__ == '__main__':
Myfunction()
สคริปต์ python ข้างต้นช่วยในการนำเข้าโมดูลเวลาแบบสุ่ม เราได้สร้างฟังก์ชันมัณฑนากร timer_func () ซึ่งมีฟังก์ชัน function_timer () อยู่ภายใน ตอนนี้ฟังก์ชันที่ซ้อนกันจะคว้าเวลาก่อนที่จะเรียกฟังก์ชันส่งผ่าน จากนั้นจะรอให้ฟังก์ชันกลับมาและคว้าเวลาสิ้นสุด ด้วยวิธีนี้ในที่สุดเราก็สามารถทำให้สคริปต์ python พิมพ์เวลาดำเนินการได้ สคริปต์จะสร้างผลลัพธ์ดังที่แสดงด้านล่าง
เอาต์พุต
Myfunction took 8.000457763671875 seconds to complete its execution.
การทำโปรไฟล์คืออะไร?
บางครั้งโปรแกรมเมอร์ต้องการวัดคุณลักษณะบางอย่างเช่นการใช้หน่วยความจำความซับซ้อนของเวลาหรือการใช้คำสั่งเฉพาะเกี่ยวกับโปรแกรมเพื่อวัดความสามารถที่แท้จริงของโปรแกรมนั้น การวัดผลเกี่ยวกับโปรแกรมแบบนี้เรียกว่าการทำโปรไฟล์ การทำโปรไฟล์ใช้การวิเคราะห์โปรแกรมแบบไดนามิกเพื่อทำการวัดดังกล่าว
ในส่วนต่อไปเราจะเรียนรู้เกี่ยวกับโมดูล Python สำหรับการทำโปรไฟล์
cProfile - โมดูล inbuilt
cProfileเป็นโมดูลในตัว Python สำหรับการทำโปรไฟล์ โมดูลนี้เป็นส่วนขยาย C ที่มีค่าโสหุ้ยที่เหมาะสมซึ่งเหมาะสำหรับการทำโปรไฟล์โปรแกรมที่ทำงานเป็นเวลานาน หลังจากรันมันจะบันทึกฟังก์ชันและเวลาดำเนินการทั้งหมด มันมีพลังมาก แต่บางครั้งก็ยากที่จะตีความและดำเนินการ ในตัวอย่างต่อไปนี้เรากำลังใช้ cProfile กับโค้ดด้านล่าง -
ตัวอย่าง
def increment_global():
global x
x += 1
def taskofThread(lock):
for _ in range(50000):
lock.acquire()
increment_global()
lock.release()
def main():
global x
x = 0
lock = threading.Lock()
t1 = threading.Thread(target=taskofThread, args=(lock,))
t2 = threading.Thread(target= taskofThread, args=(lock,))
t1.start()
t2.start()
t1.join()
t2.join()
if __name__ == "__main__":
for i in range(5):
main()
print("x = {1} after Iteration {0}".format(i,x))
รหัสด้านบนจะถูกบันทึกไว้ในไฟล์ thread_increment.pyไฟล์. ตอนนี้รันโค้ดด้วย cProfile บนบรรทัดคำสั่งดังนี้ -
(base) D:\ProgramData>python -m cProfile thread_increment.py
x = 100000 after Iteration 0
x = 100000 after Iteration 1
x = 100000 after Iteration 2
x = 100000 after Iteration 3
x = 100000 after Iteration 4
3577 function calls (3522 primitive calls) in 1.688 seconds
Ordered by: standard name
ncalls tottime percall cumtime percall filename:lineno(function)
5 0.000 0.000 0.000 0.000 <frozen importlib._bootstrap>:103(release)
5 0.000 0.000 0.000 0.000 <frozen importlib._bootstrap>:143(__init__)
5 0.000 0.000 0.000 0.000 <frozen importlib._bootstrap>:147(__enter__)
… … … …
จากผลลัพธ์ข้างต้นเป็นที่ชัดเจนว่า cProfile พิมพ์ฟังก์ชัน 3577 ทั้งหมดที่เรียกว่าโดยใช้เวลาที่ใช้ในแต่ละครั้งและจำนวนครั้งที่เรียก ต่อไปนี้เป็นคอลัมน์ที่เราได้รับในผลลัพธ์ -
ncalls - เป็นจำนวนการโทร
tottime - เป็นเวลาทั้งหมดที่ใช้ในฟังก์ชันที่กำหนด
percall - หมายถึงผลหารของ tottime หารด้วย ncalls
cumtime- เป็นเวลาสะสมที่ใช้ในฟังก์ชันนี้และฟังก์ชันย่อยทั้งหมด มีความแม่นยำแม้กระทั่งสำหรับฟังก์ชันเรียกซ้ำ
percall - มันคือผลหารของ cumtime หารด้วยการเรียกแบบดั้งเดิม
filename:lineno(function) - โดยทั่วไปจะให้ข้อมูลตามลำดับของแต่ละฟังก์ชัน