ศิลปะแห่งการออกแบบพรอมต์: ขอบเขตที่รวดเร็วและการรักษาโทเค็น
สิ่งนี้ (เขียนร่วมกับMarco Tulio Ribeiro ) เป็นตอนที่ 2 ของซีรีส์เกี่ยวกับศิลปะของการออกแบบพร้อมท์ (ตอนที่ 1 ที่นี่ ) ที่เราพูดถึงการควบคุมโมเดลภาษาขนาดใหญ่ (LLM) ด้วยguidance
.
ในโพสต์นี้ เราจะพูดถึงวิธีที่วิธีการสร้างโทเค็นแบบละโมบที่ใช้โดยโมเดลภาษาสามารถแนะนำอคติที่ละเอียดอ่อนและทรงพลังให้กับข้อความแจ้งของคุณ ซึ่งนำไปสู่รุ่นต่อรุ่นที่น่าฉงนสนเท่ห์
แบบจำลองภาษาไม่ได้รับการฝึกอบรมเกี่ยวกับข้อความดิบ แต่ใช้กับโทเค็น ซึ่งเป็นกลุ่มข้อความที่มักเกิดขึ้นพร้อมกัน คล้ายกับคำ สิ่งนี้ส่งผลต่อวิธีที่โมเดลภาษา 'เห็น' ข้อความ รวมถึงข้อความแจ้ง (เนื่องจากข้อความแจ้งเป็นเพียงชุดของโทเค็น) โมเดลสไตล์ GPT ใช้วิธีการทำโทเค็น เช่นByte Pair Encoding (BPE) ซึ่งแมปไบต์อินพุตทั้งหมดกับรหัสโทเค็นในลักษณะที่ละโมบ สิ่งนี้ใช้ได้สำหรับการฝึกอบรม แต่อาจนำไปสู่ปัญหาเล็กน้อยในระหว่างการอนุมาน ดังที่แสดงในตัวอย่างด้านล่าง
ตัวอย่างของปัญหาขอบเขตทันที
พิจารณาตัวอย่างต่อไปนี้ ซึ่งเรากำลังพยายามสร้างสตริง HTTP URL:
import guidance
# we use StableLM as an example, but these issues impact all models to varying degrees
guidance.llm = guidance.llms.Transformers("stabilityai/stablelm-base-alpha-3b", device=0)
# we turn token healing off so that guidance acts like a normal prompting library
program = guidance('The link is <a href="http:{{gen max_tokens=10 token_healing=False}}')
program()
Notebook output.
guidance('The link is <a href="http{{gen max_tokens=10 token_healing=False}}')()
print_tokens(guidance.llm.encode('The link is <a href="http:'))
print_tokens(guidance.llm.encode('The link is <a href="http://www.google.com/search?q'))
แม้ว่า URL ในการฝึกอบรมจะถูกเข้ารหัสด้วยโทเค็น 1358 ( ) ข้อความ://
แจ้งของเราทำให้ LLM เห็นโทเค็น27
( :
) แทน ซึ่งทำให้การเสร็จสิ้นเสร็จสิ้นโดยการแยก://
ในความเป็นจริง โมเดลสามารถค่อนข้างแน่ใจว่าการเห็นโทเค็น27
( :
) หมายความว่าสิ่งที่ตามมาไม่น่าจะเป็นอะไรที่สามารถเข้ารหัสร่วมกับโคลอนโดยใช้ "โทเค็นที่ยาวกว่า" เช่น://
เนื่องจากในข้อมูลการฝึกอบรมของโมเดล อักขระเหล่านั้นจะ ได้รับการเข้ารหัสพร้อมกับเครื่องหมายทวิภาค (ข้อยกเว้นที่เราจะกล่าวถึงในภายหลังคือการทำให้เป็นมาตรฐานของคำย่อยในระหว่างการฝึกอบรม) ความจริงที่ว่าการเห็นโทเค็นหมายความว่าทั้งการเห็นการฝังโทเค็นนั้นและสิ่งที่ตามมาไม่ได้ถูกบีบอัดโดยโทเค็นที่ละโมบนั้นง่ายต่อการลืม แต่มันมีความสำคัญในขอบเขตที่ทันท่วงที
ลองค้นหาสตริงที่เป็นตัวแทนของโทเค็นทั้งหมดในคำศัพท์ของโมเดล เพื่อดูว่าโทเค็นใดขึ้นต้นด้วยโคลอน:
print_tokens(guidance.llm.prefix_matches(":"))
print_tokens(guidance.llm.prefix_matches("http"))
# Accidentally adding a space, will lead to weird generation
guidance('I read a book about {{gen max_tokens=5 token_healing=False temperature=0}}')()
# No space, works as expected
guidance('I read a book about{{gen max_tokens=5 token_healing=False temperature=0}}')()
guidance('An example ["like this"] and another example [{{gen max_tokens=10 token_healing=False}}')()
print_tokens(guidance.llm.prefix_matches(" ["))
แก้ไขอคติที่ไม่ได้ตั้งใจด้วย “โทเค็นฮีลลิ่ง”
เราจะทำอย่างไรเพื่อหลีกเลี่ยงอคติที่ไม่ได้ตั้งใจเหล่านี้ ทางเลือกหนึ่งคือการจบข้อความแจ้งของเราด้วยโทเค็นที่ไม่สามารถขยายเป็นโทเค็นที่ยาวกว่าได้ (เช่น แท็กบทบาทสำหรับโมเดลที่ใช้การแชท) แต่นี่เป็นข้อจำกัดที่รุนแรง
กลับguidance
มีคุณลักษณะที่เรียกว่า “การรักษาโทเค็น” ซึ่งจะสำรองกระบวนการสร้างโดยอัตโนมัติโดยหนึ่งโทเค็นก่อนสิ้นสุดพรอมต์ จากนั้นจำกัดโทเค็นแรกที่สร้างขึ้นให้มีคำนำหน้าที่ตรงกับโทเค็นสุดท้ายในพรอมต์ ในตัวอย่าง URL ของเรา นี่หมายถึงการลบ:
, และบังคับให้การสร้างโทเค็นแรกมี:
คำนำหน้า การรักษาโทเค็นช่วยให้ผู้ใช้สามารถแสดงข้อความแจ้งได้ตามต้องการ โดยไม่ต้องกังวลเกี่ยวกับขอบเขตของโทเค็น
ตัวอย่างเช่น ลองเรียกใช้ตัวอย่าง URL ด้านบนอีกครั้งโดยเปิดการรักษาโทเค็น (เปิดตามค่าเริ่มต้นสำหรับรุ่น Transformer เราจึงลบtoken_healing=False
):
# With token healing we generate valid URLs,
# even when the prompt ends with a colon:
guidance('The link is <a href="http:{{gen max_tokens=10}}')()
# With token healing, we will sometimes generate https URLs,
# even when the prompt ends with "http":
program = guidance('''The link is <a href="http{{gen 'completions' max_tokens=10 n=10 temperature=1}}''')
program()["completions"]
# Accidentally adding a space will not impact generation
program = guidance('''I read a book about {{gen max_tokens=5 temperature=0}}''')
program()
# This will generate the same text as above
program = guidance('''I read a book about{{gen max_tokens=6 temperature=0}}''')
program()
guidance('An example ["like this"] and another example [{{gen max_tokens=10}}')()
หากคุณคุ้นเคยกับวิธีฝึกโมเดลภาษา คุณอาจสงสัยว่าการปรับคำย่อยให้เป็นระเบียบนั้นเข้ากับเรื่องทั้งหมดนี้ ได้อย่างไร การทำให้เป็นมาตรฐานของคำย่อยเป็นเทคนิคที่ในระหว่างการฝึกฝนโทเค็นที่เหมาะสมที่สุดจะถูกสุ่มนำมาใช้เพื่อเพิ่มความทนทานของโมเดล ซึ่งหมายความว่าโมเดลไม่เห็นโทเค็นโลภที่ดีที่สุดเสมอไป การทำให้เป็นมาตรฐานของคำย่อยนั้นยอดเยี่ยมในการช่วยให้โมเดลมีขอบเขตของโทเค็นที่แข็งแกร่งขึ้น แต่ก็ไม่ได้ลบอคติที่โมเดลมีต่อโทเค็นมาตรฐานโลภไปโดยสิ้นเชิง ซึ่งหมายความว่าในขณะที่ขึ้นอยู่กับจำนวนของการทำให้เป็นมาตรฐานของคำย่อยในระหว่างโมเดลการฝึกอบรมอาจแสดงอคติขอบเขตของโทเค็นมากหรือน้อย แต่โมเดลทั้งหมดยังคงมีอคตินี้ และดังที่แสดงไว้ข้างต้น ยังสามารถส่งผลกระทบที่ทรงพลังและคาดไม่ถึงต่อเอาต์พุตของโมเดล
บทสรุป
เมื่อคุณเขียนพรอมต์ โปรดจำไว้ว่าการใช้โทเค็นแบบละโมบอาจมีผลกระทบอย่างมากต่อวิธีที่โมเดลภาษาตีความข้อความแจ้งของคุณ โดยเฉพาะอย่างยิ่งเมื่อพรอมต์ลงท้ายด้วยโทเค็นที่สามารถขยายเป็นโทเค็นที่ยาวขึ้นได้ แหล่งที่มาของความลำเอียงที่พลาดได้ง่ายนี้อาจส่งผลต่อผลลัพธ์ของคุณในรูปแบบที่น่าแปลกใจและไม่ได้ตั้งใจ
ในการแก้ไขปัญหานี้ ให้จบพรอมต์ของคุณด้วยโทเค็นที่ขยายไม่ได้ หรือใช้guidance
คุณสมบัติบางอย่าง เช่น ฟีเจอร์ "การรักษาโทเค็น" เพื่อให้คุณสามารถแสดงพรอมต์ของคุณตามที่คุณต้องการ โดยไม่ต้องกังวลเกี่ยวกับขอบเขตของโทเค็น
หากต้องการสร้างผลลัพธ์ซ้ำในบทความนี้ โปรดดูเวอร์ชันโน้ตบุ๊ก