ศิลปะแห่งการออกแบบพรอมต์: ขอบเขตที่รวดเร็วและการรักษาโทเค็น

May 09 2023
สิ่งนี้ (เขียนร่วมกับ Marco Tulio Ribeiro) เป็นตอนที่ 2 ของซีรีส์เกี่ยวกับศิลปะของการออกแบบพร้อมท์ (ตอนที่ 1 ที่นี่) ซึ่งเราจะพูดถึงการควบคุมโมเดลภาษาขนาดใหญ่ (LLM) พร้อมคำแนะนำ ในโพสต์นี้ เราจะพูดถึงวิธีที่วิธีการสร้างโทเค็นแบบละโมบที่ใช้โดยโมเดลภาษาสามารถแนะนำอคติที่ละเอียดอ่อนและทรงพลังให้กับข้อความแจ้งของคุณ ซึ่งนำไปสู่รุ่นต่อรุ่นที่น่าฉงนสนเท่ห์
ภาพทั้งหมดเป็นการสร้างสรรค์ดั้งเดิม

สิ่งนี้ (เขียนร่วมกับMarco Tulio Ribeiro ) เป็นตอนที่ 2 ของซีรีส์เกี่ยวกับศิลปะของการออกแบบพร้อมท์ (ตอนที่ 1 ที่นี่ ) ที่เราพูดถึงการควบคุมโมเดลภาษาขนาดใหญ่ (LLM) ด้วยguidance.

ในโพสต์นี้ เราจะพูดถึงวิธีที่วิธีการสร้างโทเค็นแบบละโมบที่ใช้โดยโมเดลภาษาสามารถแนะนำอคติที่ละเอียดอ่อนและทรงพลังให้กับข้อความแจ้งของคุณ ซึ่งนำไปสู่รุ่นต่อรุ่นที่น่าฉงนสนเท่ห์

แบบจำลองภาษาไม่ได้รับการฝึกอบรมเกี่ยวกับข้อความดิบ แต่ใช้กับโทเค็น ซึ่งเป็นกลุ่มข้อความที่มักเกิดขึ้นพร้อมกัน คล้ายกับคำ สิ่งนี้ส่งผลต่อวิธีที่โมเดลภาษา 'เห็น' ข้อความ รวมถึงข้อความแจ้ง (เนื่องจากข้อความแจ้งเป็นเพียงชุดของโทเค็น) โมเดลสไตล์ GPT ใช้วิธีการทำโทเค็น เช่นByte Pair Encoding (BPE) ซึ่งแมปไบต์อินพุตทั้งหมดกับรหัสโทเค็นในลักษณะที่ละโมบ สิ่งนี้ใช้ได้สำหรับการฝึกอบรม แต่อาจนำไปสู่ปัญหาเล็กน้อยในระหว่างการอนุมาน ดังที่แสดงในตัวอย่างด้านล่าง

ตัวอย่างของปัญหาขอบเขตทันที

พิจารณาตัวอย่างต่อไปนี้ ซึ่งเรากำลังพยายามสร้างสตริง HTTP URL:

import guidance

# we use StableLM as an example, but these issues impact all models to varying degrees
guidance.llm = guidance.llms.Transformers("stabilityai/stablelm-base-alpha-3b", device=0)

# we turn token healing off so that guidance acts like a normal prompting library
program = guidance('The link is <a href="http:{{gen max_tokens=10 token_healing=False}}')
program()

      
                
Notebook output.

guidance('The link is <a href="http{{gen max_tokens=10 token_healing=False}}')()

      
                

print_tokens(guidance.llm.encode('The link is <a href="http:'))

      
                

print_tokens(guidance.llm.encode('The link is <a href="http://www.google.com/search?q'))

      
                

แม้ว่า URL ในการฝึกอบรมจะถูกเข้ารหัสด้วยโทเค็น 1358 ( ) ข้อความ://แจ้งของเราทำให้ LLM เห็นโทเค็น27( :) แทน ซึ่งทำให้การเสร็จสิ้นเสร็จสิ้นโดยการแยก://

ในความเป็นจริง โมเดลสามารถค่อนข้างแน่ใจว่าการเห็นโทเค็น27( :) หมายความว่าสิ่งที่ตามมาไม่น่าจะเป็นอะไรที่สามารถเข้ารหัสร่วมกับโคลอนโดยใช้ "โทเค็นที่ยาวกว่า" เช่น://เนื่องจากในข้อมูลการฝึกอบรมของโมเดล อักขระเหล่านั้นจะ ได้รับการเข้ารหัสพร้อมกับเครื่องหมายทวิภาค (ข้อยกเว้นที่เราจะกล่าวถึงในภายหลังคือการทำให้เป็นมาตรฐานของคำย่อยในระหว่างการฝึกอบรม) ความจริงที่ว่าการเห็นโทเค็นหมายความว่าทั้งการเห็นการฝังโทเค็นนั้นและสิ่งที่ตามมาไม่ได้ถูกบีบอัดโดยโทเค็นที่ละโมบนั้นง่ายต่อการลืม แต่มันมีความสำคัญในขอบเขตที่ทันท่วงที

ลองค้นหาสตริงที่เป็นตัวแทนของโทเค็นทั้งหมดในคำศัพท์ของโมเดล เพื่อดูว่าโทเค็นใดขึ้นต้นด้วยโคลอน:

print_tokens(guidance.llm.prefix_matches(":"))

      
                

print_tokens(guidance.llm.prefix_matches("http"))

      
                

# Accidentally adding a space, will lead to weird generation
guidance('I read a book about {{gen max_tokens=5 token_healing=False temperature=0}}')()

      
                
# No space, works as expected guidance('I read a book about{{gen max_tokens=5 token_healing=False temperature=0}}')()

guidance('An example ["like this"] and another example [{{gen max_tokens=10 token_healing=False}}')()

      
                

print_tokens(guidance.llm.prefix_matches(" ["))

      
                

แก้ไขอคติที่ไม่ได้ตั้งใจด้วย “โทเค็นฮีลลิ่ง”

เราจะทำอย่างไรเพื่อหลีกเลี่ยงอคติที่ไม่ได้ตั้งใจเหล่านี้ ทางเลือกหนึ่งคือการจบข้อความแจ้งของเราด้วยโทเค็นที่ไม่สามารถขยายเป็นโทเค็นที่ยาวกว่าได้ (เช่น แท็กบทบาทสำหรับโมเดลที่ใช้การแชท) แต่นี่เป็นข้อจำกัดที่รุนแรง

กลับguidanceมีคุณลักษณะที่เรียกว่า “การรักษาโทเค็น” ซึ่งจะสำรองกระบวนการสร้างโดยอัตโนมัติโดยหนึ่งโทเค็นก่อนสิ้นสุดพรอมต์ จากนั้นจำกัดโทเค็นแรกที่สร้างขึ้นให้มีคำนำหน้าที่ตรงกับโทเค็นสุดท้ายในพรอมต์ ในตัวอย่าง URL ของเรา นี่หมายถึงการลบ:, และบังคับให้การสร้างโทเค็นแรกมี:คำนำหน้า การรักษาโทเค็นช่วยให้ผู้ใช้สามารถแสดงข้อความแจ้งได้ตามต้องการ โดยไม่ต้องกังวลเกี่ยวกับขอบเขตของโทเค็น

ตัวอย่างเช่น ลองเรียกใช้ตัวอย่าง URL ด้านบนอีกครั้งโดยเปิดการรักษาโทเค็น (เปิดตามค่าเริ่มต้นสำหรับรุ่น Transformer เราจึงลบtoken_healing=False):

# With token healing we generate valid URLs,
# even when the prompt ends with a colon:
guidance('The link is <a href="http:{{gen max_tokens=10}}')()

      
                
# With token healing, we will sometimes generate https URLs, # even when the prompt ends with "http": program = guidance('''The link is <a href="http{{gen 'completions' max_tokens=10 n=10 temperature=1}}''') program()["completions"]

# Accidentally adding a space will not impact generation
program = guidance('''I read a book about {{gen max_tokens=5 temperature=0}}''')
program()

      
                
# This will generate the same text as above program = guidance('''I read a book about{{gen max_tokens=6 temperature=0}}''') program()

guidance('An example ["like this"] and another example [{{gen max_tokens=10}}')()

      
                

หากคุณคุ้นเคยกับวิธีฝึกโมเดลภาษา คุณอาจสงสัยว่าการปรับคำย่อยให้เป็นระเบียบนั้นเข้ากับเรื่องทั้งหมดนี้ ได้อย่างไร การทำให้เป็นมาตรฐานของคำย่อยเป็นเทคนิคที่ในระหว่างการฝึกฝนโทเค็นที่เหมาะสมที่สุดจะถูกสุ่มนำมาใช้เพื่อเพิ่มความทนทานของโมเดล ซึ่งหมายความว่าโมเดลไม่เห็นโทเค็นโลภที่ดีที่สุดเสมอไป การทำให้เป็นมาตรฐานของคำย่อยนั้นยอดเยี่ยมในการช่วยให้โมเดลมีขอบเขตของโทเค็นที่แข็งแกร่งขึ้น แต่ก็ไม่ได้ลบอคติที่โมเดลมีต่อโทเค็นมาตรฐานโลภไปโดยสิ้นเชิง ซึ่งหมายความว่าในขณะที่ขึ้นอยู่กับจำนวนของการทำให้เป็นมาตรฐานของคำย่อยในระหว่างโมเดลการฝึกอบรมอาจแสดงอคติขอบเขตของโทเค็นมากหรือน้อย แต่โมเดลทั้งหมดยังคงมีอคตินี้ และดังที่แสดงไว้ข้างต้น ยังสามารถส่งผลกระทบที่ทรงพลังและคาดไม่ถึงต่อเอาต์พุตของโมเดล

บทสรุป

เมื่อคุณเขียนพรอมต์ โปรดจำไว้ว่าการใช้โทเค็นแบบละโมบอาจมีผลกระทบอย่างมากต่อวิธีที่โมเดลภาษาตีความข้อความแจ้งของคุณ โดยเฉพาะอย่างยิ่งเมื่อพรอมต์ลงท้ายด้วยโทเค็นที่สามารถขยายเป็นโทเค็นที่ยาวขึ้นได้ แหล่งที่มาของความลำเอียงที่พลาดได้ง่ายนี้อาจส่งผลต่อผลลัพธ์ของคุณในรูปแบบที่น่าแปลกใจและไม่ได้ตั้งใจ

ในการแก้ไขปัญหานี้ ให้จบพรอมต์ของคุณด้วยโทเค็นที่ขยายไม่ได้ หรือใช้guidanceคุณสมบัติบางอย่าง เช่น ฟีเจอร์ "การรักษาโทเค็น" เพื่อให้คุณสามารถแสดงพรอมต์ของคุณตามที่คุณต้องการ โดยไม่ต้องกังวลเกี่ยวกับขอบเขตของโทเค็น

หากต้องการสร้างผลลัพธ์ซ้ำในบทความนี้ โปรดดูเวอร์ชันโน้ตบุ๊ก