การเพิ่มการแจกแจงเลขชี้กำลังและฟังก์ชันที่เป็นไปได้มากที่สุด
ร้านรถประมาณ $\alpha$นาทีสำหรับการเปลี่ยนน้ำมันของรถยนต์ เวลาที่จำเป็นจริง$X$ แตกต่างกันไปใน $X\geq \alpha$และมีความแตกต่างกันระหว่างลูกค้าแต่ละราย เราสามารถสันนิษฐานได้ว่าเวลานี้สามารถอธิบายได้ด้วยตัวแปรสุ่มแบบเอ็กซ์โพเนนเชียล ดังนั้นตัวแปรสุ่ม X จึงมี PDF ต่อไปนี้
$$f_X(x):=\begin{cases}e^{\alpha -x} &x\geq \alpha \\ 0 & \text{else}\end{cases}$$
กล่าวคือ $X=\alpha + Z$ ในขณะที่ $Z\sim exp(1)$.
เพื่อประมาณ $\alpha$เราวัดเวลาที่จำเป็นสำหรับการเปลี่ยนถ่ายน้ำมันเครื่องของลูกค้า 10 ราย:
$$4.2 \quad 3.1 \quad 3.6 \quad 4.5 \quad 5.1 \quad 7.6 \quad 4.4 \quad 3.5 \quad 3.8 \quad 4.3$$
ซึ่งเราได้ค่าเฉลี่ยเชิงประจักษ์ $\bar{x}_{10}=4.41$.
คำนวณ Maximum-Likelihood-Estimator โปรดทราบว่าคุณไม่สามารถได้รับ Likelihood-Function)
วิธีแก้ปัญหาความเป็นไปได้ถูกกำหนดโดย
$$\begin{align} L(\alpha;x_1,\dots,x_n)&=\prod_{i=1}^nf_\alpha(x_i)=\prod_{i=1}^ne^{\alpha -x_i}1_{[\alpha, \infty)}(x_i)\\ &=exp\bigg(n\alpha-\sum_{i=1}^nx_i\bigg)\cdot \prod_{i=1}^n 1_{[\alpha,\infty)}(x_i)\\ &=exp\bigg(n\alpha-\sum_{i=1}^nx_i\bigg)\cdot \bigg(\min_{1\leq i \leq n} x_i\bigg)\\ &=\begin{cases}\exp(n\alpha-\sum_{i=1}^n x_i) & \alpha \leq \min_{1\leq i \leq n} x_i \\ 0 & \text{else}\end{cases} \end{align}$$
ในขณะที่
$$1_A(x)=\begin{cases}1 & x\in A \\ 0 & \text{else}\end{cases}$$
ในการเพิ่ม Likelihood-Function เราจำเป็นต้องเลือก $\alpha$ ใหญ่ที่สุด แต่ไม่สามารถใหญ่กว่า $\min_{1\leq i \leq n} x_i$. ดังนั้นเราจึงได้ค่า Maximum-Likelihood-Estimator ดังต่อไปนี้
$$\hat{\alpha}=\min_{1\leq i \leq n} x_i \quad \text{ or as a random variable} \quad \hat{\alpha}=\min_{1\leq i \leq n} X_i$$
คำถาม:ตอนนี้ฉันได้รับการคำนวณสิ่งที่ฉันสับสนคือ PDF ถ้าฉันบอกคุณว่าเรามีตัวแปรสุ่ม$X=\alpha + Z$ ด้วย $Z\sim exp(1)$คุณจะรับ PDF ข้างต้นได้อย่างไร
เพราะฉันสับสนเล็กน้อยเกี่ยวกับ PDF ฉันไม่เข้าใจจริงๆว่าทำไมเราถึงมองหาเครื่องมือประมาณค่า $\alpha$ คือฉันมองไม่เห็น $\alpha$ แสดงถึงพารามิเตอร์ในการแจกแจงของเรา
คำตอบ
จำได้ว่า $$Z \sim \operatorname{Exponential}(1)$$ หมายถึง $$f_Z(z) = e^{-z} \mathbb 1(z \ge 0).$$ ตอนนี้ให้ $X = g(Z) = \alpha + Z$ สำหรับพารามิเตอร์บางตัว $\alpha$. แล้ว$Z = g^{-1}(X) = X - \alpha$และ $dg^{-1}/dx = 1$. ด้วยประการฉะนี้$$f_X(x) = f_Z(g^{-1}(x)) \left|\frac{dg^{-1}}{dx}\right| = e^{-(x-\alpha)} \mathbb 1 (x-\alpha \ge 0) = e^{\alpha-x} \mathbb 1(x \ge \alpha),$$ตามที่อ้าง แต่นี่เป็นทางการมากเกินไป หากคุณเข้าใจว่าการสนับสนุนของ$Z$ เปิดอยู่ $[0, \infty)$แล้ว $\alpha + Z$ เพียงแค่เปลี่ยนการสนับสนุนเป็น $[\alpha, \infty)$และไม่ได้ทำอะไรกับความหนาแน่น ดังนั้นสิ่งที่คุณทำคือการแปลงตำแหน่งสำหรับการแจกแจงเลขชี้กำลังเมื่อคุณเพิ่มพารามิเตอร์คงที่$\alpha$.
สำหรับคำถามอื่น ๆ ของคุณ $\alpha$ในความเป็นจริงเป็นพารามิเตอร์เนื่องจากเป็นปริมาณคงที่ในแบบจำลองของเราซึ่งแสดงถึงระยะเวลาขั้นต่ำในการซ่อมบำรุงยานพาหนะ แต่เรายังไม่ทราบแน่ชัด จากการสังเกตตัวอย่างเรากำลังพยายามอนุมานเกี่ยวกับมูลค่าที่แท้จริงซึ่งเป็นที่สนใจของเรา ไม่มีพารามิเตอร์อื่น ๆ ในแบบจำลองให้เราประมาณได้ คุณอาจคิดว่าเราต้องการประมาณเวลาให้บริการโดยเฉลี่ย แต่เราได้แจ้งไปแล้ว$\operatorname{E}[Z] = 1$ดังนั้น $$\operatorname{E}[X] = \operatorname{E}[\alpha + Z] = \alpha + 1.$$ดังนั้นความรู้เกี่ยวกับเวลาบริการเฉลี่ยจึงเป็นข้อมูลเกี่ยวกับเวลาให้บริการขั้นต่ำ นี่เป็นเพราะโมเดลที่เราใช้ระบุไว้แล้ว$\operatorname{E}[Z] = 1$และไม่เพิ่มพารามิเตอร์เพิ่มเติม แต่แน่นอนว่าเราสามารถพิจารณาสถานการณ์ทั่วไปได้มากขึ้นพูด$$\operatorname{E}[Z] = \theta, \\ f_Z(z) = \frac{1}{\theta} e^{-z/\theta} \mathbb 1(z \ge 0),$$ ซึ่งเป็นการแจกแจงแบบเอ็กซ์โพเนนเชียลพร้อมพารามิเตอร์ค่าเฉลี่ย $\theta$ (หรือเทียบเท่าอัตรา $1/\theta$). หากเราสนใจเพียงการอนุมานเกี่ยวกับ$\alpha$แล้ว $\theta$จะถือว่าเป็นพารามิเตอร์ที่ก่อให้เกิดความรำคาญและค่าเฉลี่ยตัวอย่างเป็นตัวประมาณค่าสำหรับ$\alpha$ จะ "ปนเปื้อน" โดย $\theta$. เราจะสร้างตัวประมาณค่าที่เหมาะสมสำหรับ$\alpha$ เมื่อไหร่ $\theta$ ยังไม่ทราบ?