Apa sebutan integral dari CDF?

Dec 10 2020

Ini benar-benar pertanyaan nomenklatur. Saya tidak memiliki masalah khusus menemukan integral ganda dari tipe tersebut$\int\int\text{pdf}(y) \, d y \,d x$, dan menurut saya cukup berguna. Padahal kita punya nama yang bagus untuk$\int\text{pdf}(x) \, dx=\text{CDF}(\textit{x})$, di mana CDF adalah fungsi distribusi kumulatif (kredit: @NickCox, AKA, kepadatan), yang tidak saya miliki adalah nama yang baik untuk integral dari CDF.

Saya kira orang bisa menyebutnya sebagai akumulasi distribusi kumulatif (ACD), DID (integral ganda dari kepadatan) atau CDF2, tetapi saya belum melihat hal semacam itu. Misalnya, seseorang akan ragu untuk menggunakan "ccdf" atau "CCDF", karena itu telah diambil sebagai singkatan dari fungsi distribusi kumulatif komplementer , yang beberapa lebih suka mengatakan "fungsi kelangsungan hidup", S$(t)$, karena yang terakhir itu, secara tegas, untuk RV, sedangkan CCDF bukan dari RV; ini adalah fungsi yang sama dengan 1-CDF, yang mungkin berhubungan dengan probabilitas, tetapi tidak harus. Misalnya, PDF sering kali mengacu pada situasi di mana tidak ada kemungkinan, dan istilah yang lebih umum untuk PDF adalah "fungsi kepadatan". Namun,$df$sudah diambil sebagai "derajat kebebasan", jadi seluruh literatur terjebak dengan "PDF". Jadi bagaimana dengan DIPDF, "integral ganda dari PFD, agak panjang, yaitu. DIDF? ICDF untuk integral dari fungsi distribusi kumulatif (kerapatan)? Bagaimana dengan ICD, integral dari distribusi kumulatif? Saya suka yang itu, pendek dan bertuliskan semuanya.

@whuber memberikan beberapa contoh bagaimana ini digunakan dalam komentarnya di bawah dan saya mengutip "Benar. Saya membuat rumus umum untuk integral tertentu dari CDF di stats.stackexchange.com/a/446404/919. Yang juga terkait erat adalah statistik .stackexchange.com / question / 413331, stats.stackexchange.com/questions/105509, stats.stackexchange.com/questions/222478, dan stats.stackexchange.com/questions/18438 - dan saya tahu masih ada lagi. "

Berkat kontribusi @ whuber, teks pertanyaan ini sekarang lebih jelas daripada versi sebelumnya. Menyesal @SextusEmpericus, kami berdua telah menghabiskan terlalu banyak waktu untuk ini.

Dan jawaban yang diterima adalah distribusi "super-kumulatif" , karena nama itu menarik dan pernah digunakan sebelumnya, meskipun terus terang, tanpa diberitahu, saya tidak akan tahu itu, karena itulah saya bertanya. Sekarang, untuk pertama kalinya, kami mendefinisikan SCD sebagai akronimnya. Saya ingin akronim karena tidak seperti di tempat lain, di mana$S(x)$ digunakan untuk SCD$(x)$(tidak menyebutkan nama), saya menginginkan sesuatu yang cukup unik agar tidak menimbulkan kebingungan. Sekarang diberikan, saya mungkin menggunakan SCD di luar konteks statistik murni dalam pekerjaan saya sendiri, tetapi karena semua orang menggunakan PDF, bahkan ketika tidak ada p untuk dibicarakan, itu paling banyak adalah dosa ringan.

Edit: Setelah pertimbangan lebih lanjut, saya akan menyebut pdf sebagai$f$ apapun, misalnya, $f(x)$, CDF sebagai $F(x)$ dan integral ganda sebagai $\mathcal{F}(x)$ hanya untuk membuat segalanya lebih sederhana.

Jawaban

2 Dayne Dec 19 2020 at 09:35

Di sini saya menyebutkan satu istilah integral dari CDF yang digunakan oleh Prof. Avinash Dixit dalam catatan kuliahnya tentang Stochastic Dominance (yang kebetulan baru saja saya temukan). Jelas, ini bukan istilah yang diterima secara umum jika tidak maka akan dibahas di utas ini.

Dia menyebutnya fungsi distribusi super-kumulatif dan digunakan dalam definisi ekuivalen dari Second Order Stochastic Dominance. Membiarkan$X$ dan $Y$ jadilah dua rv seperti itu $E(X) = E(Y)$dan memiliki dukungan terbatas yang sama. Selanjutnya, biarkan$S_x(.), S_y(.)$ menjadi fungsi distribusi super kumulatif masing-masing.

Kami mengatakan itu $X$ adalah stochastic urutan kedua yang dominan di atas $Y$ iff $S_x(w) < S_y(w)$ untuk semua nilai $w$ dalam mendukung $X, Y$.

Menarik juga untuk dicatat bahwa untuk First Order Stochastic Dominance, kondisi tersebut hanya akan digantikan oleh CDF sebagai pengganti super-cdf.

5 SextusEmpiricus Dec 16 2020 at 21:16

Penolakan

Apa yang seharusnya disebut integral dari CDF

Saya menyarankan nama berikut "integral dari CDF". Kecuali ada sesuatu yang intuitif tentang integral ini, saya tidak mengerti mengapa kita harus mencari nama yang berbeda. Jawaban berikut hanya akan menunjukkan bahwa status saat ini adalah bahwa tidak ada ide intuitif di balik integral ganda PDF atau integral CDF (dan bahwa contoh tersebut bukan contoh integral CDF). Ini bukan jawaban langsung atas pertanyaan (melainkan jawaban mengapa kita tidak bisa menjawab pertanyaan itu).

Ini bukanlah jawaban yang menyarankan sebuah nama. Ini adalah ringkasan dari beberapa komentar yang mungkin berguna untuk mendapatkan jawaban.

Saat ini, bagi saya, tidak terlalu jelas apa arti integral ganda dari fungsi kepadatan probabilitas. Kedua contoh memiliki beberapa masalah: 1 Contoh Anda adalah fisika dan bukan probabilitas. Apakah ada gunanya integral ganda dari kepadatan probabilitas? 2 Selain itu, contoh tersebut bukanlah contoh integrasi ganda.

Dalam jawaban ini saya akan memperdebatkan mengapa integral ganda dari pdf bermasalah * **, dan mungkin ini dapat mengarah pada klarifikasi contoh, dan akhirnya inspirasi untuk nama integral ini.

* Ada beberapa pengertian tentang integral $1-CDF$ seperti di pertanyaan:

  • Nilai yang diharapkan dari variabel acak dengan mengintegrasikan $1-CDF$ ketika batas bawah $a\neq 0$? dimana integralnya$$\int_a^\infty 1-CDF(x) dx$$

  • Apa sebenarnya nama fungsi nilai parsial yang diharapkan? dimana integralnya$$\int_{-\infty}^a 1-CDF(x) dx$$

tapi saya tidak tahu apa pun yang mengintegrasikan file $CDF$

** Yang saya maksud dengan bermasalah adalah bahwa ini merupakan bagian integral dari properti yang luas tetapi tidak dengan cara aditif dengan set terputus-putus. Atau, integrand$dx$ ukuran ruang adalah jumlah yang kita tambahkan dan ditimbang dengan 1-CDF (x), jadi kita harus melihatnya secara intuitif sebagai penjumlahan $dx$.

Integral berakhir $1-F(x)$ dapat diubah menjadi penjumlahan di atas fungsi kuantil $\int_0^b (1-F(x)) dx = \int_{F(0)}^{F(b)} Q(p) dp$dan ini terkait dengan integral dari fungsi invers yang membuat integral tersebut berakhir$1-F(x)$setara dengan integral di atas fungsi kuantil. Untuk integral selesai$F(x)$Anda tidak memiliki persamaan yang sama. Tanpa persamaan ini, saya tidak melihat adanya intuisi untuk penggunaan integral seperti itu dan menjadi sulit untuk menemukan nama.


Kepadatan

Arti kepadatan telah menjadi subjek dalam pertanyaan ini: Apa yang sebenarnya kami maksud dengan "kepadatan" dalam fungsi Probabilitas Densitas (PDF)?

Dalam jawaban saya atas pertanyaan itu, saya menghubungkan kepadatan dengan turunan Radon-Nikodym

  • Massa jenis sebagai perbandingan dua ukuran pada ruang yang sama. $$\rho = \frac{d \nu}{d \mu}$$
  • Kedua besaran / ukuran ini adalah sifat ekstensif . Rasionya merupakan properti intensif
  • Dengan integrasi kepadatan ini, Anda mendapatkan properti yang luas .$$\nu(S) = \int_S \rho d \mu$$

Jadi integral dari kepadatan probabilitas (atau kepadatan yang dinormalisasi seperti yang digunakan dalam contoh Anda) akan memberikan 'probabilitas' sebagai hasil. Namun integral dari properti luas 'probabilitas' memberikan nilai tanpa penggunaan yang jelas.


Contoh 2

Dalam contoh kedua Anda, peluruhan sejumlah material radiaktif, integral ganda Anda tidak dihasilkan dari integral ganda propery intensif.

Jumlah material $M(t)$ mengikuti persamaan diferensial (dengan $\dot{}$ mengacu pada diferensiasi waktu):

$$\dot{M}(t)= -\frac{ln(2)}{\tau} \cdot M(t) = -\lambda \cdot M(t)$$

dimana $\tau$ adalah waktu paruh, dan $\lambda$adalah tingkat kerusakan. Solusinya adalah:

$$\begin{array}{rlcrcl} \text{amount of mass} &[mass] &:& & M(t) &=& 1-e^{-\lambda t} \\ \text{loss rate} &[mass/time]&:& & \dot{M}(t) &=& \lambda e^{-\lambda t} \\ \end{array}$$

Karena persamaan diferensial itu kita dapat menuliskannya $\dot{M}(t)$ atau $M(t)$ sebagai bagian integral dari itselve dengan menggunakan $M(t) - M(r) = - \int_t^r \dot{M}(s) ds$ dan jika $M(\infty) = 0$ kemudian

$$M(t) = M(t) - M(\infty) = - \int_t^\infty \dot{M}(s) ds = \lambda \int_t^\infty {M}(s) ds $$

Dalam contoh Anda, Anda menghitung kerugian total $Q(a,b)$ (dan terkait dengan kerugian rata-rata $Q(a,b)/(b-a)$) dalam jangka waktu tertentu dari $a$ untuk $b$sebagai fungsi massa. Dengan cara itulah Anda mendapatkan integral ganda

$$\begin{array}{rrcl} \text{total loss between $Sebuah$ and $b$} :& Q(a,b) &=& \int_a^b \dot M(t) dt = M(b) - M(a)\\ &&=& \int_a^b -\lambda M(t) dt \\ &&=& \int_{a}^b - \lambda \left(\lambda \int_t^\infty {M}(s) ds \right) dt \\ && =& - \lambda^2 \int_{a}^b \int_t^\infty {M}(s) ds dt \end{array}$$

BTW. Dalam contoh ini integral$\int_t^\infty {M}(s) ds$ sebenarnya tidak terkait dengan integral dari CDF melainkan merupakan integral dari fungsi survival.

Jadi, dalam contoh ini integral ganda muncul dari hubungan tersebut $\dot{M}(t) \propto M(t)$dan ini bukan merupakan integral ganda dari 'kepadatan' properti intensif. Ada faktornya$\lambda$ dengan unit $[1/time]$ yang mengubah 'jumlah massa' properti yang luas menjadi 'tingkat kerugian' properti yang intensif.

Integrasi dengan jelas dua kali pdf tidak memiliki arti, dan itu hanya mendapat makna melalui persamaan diferensial.

Hal ini menunjukkan bahwa untuk contoh-contoh di mana integral ganda ini terjadi, kita dapat menggunakan arti fisik integral untuk 'memberi nama' pada integral ganda.

BTW, dalam contoh Anda paparan radiasi rata-rata (sebagai pecahan) adalah

$$\dfrac{\text{CDF}(t_2) - \text{CDF}(t_1)}{t_2-t_1} \quad \text{with units} \frac{1}{[time]}$$

dari pada

$$\dfrac{\int_{0}^{t_2}\text{CDF}(t)\,d t-\int_{0}^{t_1}\text{CDF}(t)\,d t}{t_2-t_1} \quad \text{with units} \frac{[time]}{[time]}$$

Anda dapat melihat ini berdasarkan unitnya. Fraksi total paparan radiasi kurang dari satu unit. Fraksi rata-rata paparan radiasi harus memiliki satuan$[1/time]$. Koefisien$\lambda$ tidak ada untuk memberikan ekspresi dimensi yang tepat.

Contoh 1

Anda dapat menggeser ke atas dan ke bawah satu integral karena kuantitasnya merupakan integral dari dirinya sendiri. Ini juga jelas dari artikel yang Anda tautkan dari komentar 'Perbandingan konvolusi gamma-Pareto dengan metode konvensional untuk mengkarakterisasi farmakokinetik metformin dalam Journal of Pharmacokinetics and Pharmacodynamics volume 47, halaman19–45 (2020) .

Di artikel itu ada tertulis

massa rata-rata selama interval dosis, yang ditulis dari fungsi kelangsungan hidup sama $\Delta S(t)/\tau$, yaitu, $S \tau(i) = \frac{1}{\tau} \lbrace S[\tau(i-1)] - S(\tau i) \rbrace$, untuk $i=1,2,3, \dots$.

Dalam pertanyaan yang Anda tulis

Kemudian untuk mencari massa obat rata-rata selama interval pemberian dosis, kita memerlukan rata-rata integral dari CCDF yang dijumlahkan selama interval tersebut

yang berhubungan dengan integral $\dfrac{\int_{0}^{t_2}\text{CDF}(t)\,d t-\int_{0}^{t_1}\text{CDF}(t)\,d t}{t_2-t_1}$

Jika Anda mencari nama integral ini, mengapa tidak menggunakan nama yang setara $\Delta S(t)/\tau$?