
142. óra: A Markov- és a Csebisev-egyenlõtlenség
(\(Y\ge0\) azt jelenti, hogy \(Y\) esményterének minden eleme nemnegatív.)
Állítás:
\[
P\left(Y\ge c\right)\le\frac{M(Y)}{c}
\]
Megjegyzés: Az a kitétel, hogy "létezik a várható érték" a matematika tipikus óvatossága. Elõfordulhat az, hogy egy diszkrét valószínûségi változó várható értéke olyan végtelen összeget - sort - produkál, amely nem konvergens. Ilyen esetekben a tétel nem áll.
Bizonyítás: Jelölje \(y_i \) az \(Y\) eseményterének
elemeit, \(P(Y=y_i)\) azok valószínûségét!
\begin{equation}
\begin{split}
M(Y) &= \sum_{i}y_i\cdot P(Y=y_i) \ge \sum_{y_i\ge c}y_i\cdot
P(Y=y_i) \ge \sum_{y_i\ge c}c\cdot P(Y=y_i) = c\sum_{y_i\ge c}P(Y=y_i) =
c\cdot P(Y\ge c)\\\\
\text{Kaptuk tehát:}\\\\
c\cdot P(Y\ge c) &\le M(Y)\text{ }\big/\text{ }:c\text{ (Ne
feledjük, hogy }c>0\text{)}\\\\
P(Y\ge c) &\le\frac{M(Y)}{c}
\end{split}
\end{equation}És ez volt az állítás.
Állítás:
\[
P\left(\text{ }\big|\text{ }X-M(X)\text{ }\big|\ge\varepsilon\right) \le \frac{\sigma^2(X)}{\varepsilon^2}
\]
Bizonyítás: Alkalmazzuk a Markov-egyenlõtlenséget az
\(Y:=\left(X-M(X)\right)^2\) nemnegatív valószínûségi változóra, és a
\(c:=\varepsilon^2\) számra.
\begin{equation}
\begin{split}
P\left(Y\ge c\right) &\le \frac{\color{blue}{M(Y)}}{c}\\\\
P\underbrace{\left(\left[X-M(X)\vphantom{{1_1}^1}\right]^2\ge
\varepsilon^2\right)}_{\text{Itt majd gyököt vonunk}} &\le
\frac{\color{blue}{\sigma^2(X)}}{\varepsilon^2}\\\\
P\left(\text{ }\big|\text{ }X-M(X)\text{ }\big|\ge\varepsilon\right)
&\le \frac{\sigma^2(X)}{\varepsilon^2}
\end{split}
\end{equation}Ezzel állításunkat igazoltuk.
Talán egy dolgot érdemes még elemezni - a levezetés közben felhasznált
\(\color{blue}{M(Y)=\sigma^2(X)}\) összefügggést. Ez azonban az \(X\) és
a szórásnégyzetének definíciójából könnyen látható:
\[
M(Y) = \sum_i{P(y_i)\cdot y_i} =
\sum_i{P(x_i)\cdot\left(x_i-M(X)\right)^2} = \sigma^2(X)
\]
Egy példa a Csebisev-egyenlõtlenség alkalmazására
- Kedves kolléga úr! Ha egy szabályos pénzérmét többször feldobok, akkor a fej relatív gykoriságának várható értéke 0,5 lesz ugye?
- Várj csak! - mondanánk. Téged a relatív gyakoriság érdekel? Akkor vezessünk be egy valószínûségi változót! Nezezzük mondjuk \(R_n\)-nek. (\(n\) jelöli, hogy hányszor dobsz.)
Ha \(n\)-szer dobsz, akkor a fej \(k\)-szor történõ
bekövetkezésének valószínûsége, vagyis a \(\frac{k}n\) relatív
gyakoriság bekövetkezésének valószínûsége:
\[
R_n\left(\frac{k}n\right) =
\binom{n}kp^k(1-p)^{n-k}\hphantom{00000}k=0;1;2;\ldots;n
\]\(R_n\) eseménytere az
\(E=\lbrace0;\frac1n;\frac2n;\ldots;\frac{k}n;\ldots;1\rbrace\) halmaz,
de az egyes elemek valószínûsége azonos a Binomiális eloszlás megfelelõ
valószínûségeivel.
Ennek megfelelõen \(R_n\) várható értéke:
\begin{equation}
\begin{split}
M(R_n) &= \sum_{k=0}^n\frac{k}n\cdot\binom{n}kp^k(1-p)^{n-k} =
\frac1n\underbrace{\sum_{k=0}^n
k\cdot\binom{n}kp^k(1-p)^{n-k}}_{B_n^p\text{ várható értéke:
}np}=\frac1n\cdot np = p\\\\\\
\end{split}
\end{equation}
- Igen, igazad van! A fej relatív gyakoriságának várható értéke 0,5 (a valószínûség).
- Na és milyen sokszor kéne dobnom, ha azt akarom, hogy a relatív gyakoriság 0,49 és 0,51 közé essen? - faggatózik tovább.
- Hát... akárhányszor dobsz, akkor se lesz biztos, hogy ez teljesül. Végülis az sem kizárt, hogy folyamatosan csak írás sikerül.
- Na jó, de ez nem túl valószínû! - kiált a barátunk.
- Nem tényleg nem - válaszolnánk.
- Jó, akkor módosítok a kérdésen. Hányszor kell dobjak ahhoz, hogy 98%-os valószínûséggel 0,49 és 0,51 közé essen a relatív gyakoriság?
- Erre megpróbálhatjuk a választ.
Az \(R_n\) valószínûségi változó szórásnégyzete (várható értéke \(p\)
volt):
\begin{equation}
\begin{split}
\sigma^2(R_n) &= \sum_{k=0}^n
\left(\color{darkgreen}{\frac{k}n-p}\right)^2 \binom{n}kp^k(1-p)^{n-k} =
\sum_{k=0}^n\left(\color{darkgreen}{\frac{k-np}n}\right)^2
\binom{n}kp^k(1-p)^{n-k} =
\sum_{k=0}^n\frac{\left(\color{darkgreen}{k-np}\right)^2}{\color{darkgreen}{n}^2}
\binom{n}kp^k(1-p)^{n-k} = \\\\
&=
\frac1{\color{darkgreen}{n}^2}\underbrace{\sum_{k=0}^n\left(\color{darkgreen}{k-np}\right)^2
\binom{n}kp^k(1-p)^{n-k}}_{\text{Ez }B_n^p\text{ szórásnégyzete:
}np(1-p)} = \frac1{n^2}\cdot np(1-p) = \frac{p(1-p)}n
\end{split}
\end{equation}
Alkalmazzuk a Csebisev-egyenlõtlenséget \(R_n\)-re és a kérdezõ által
megadott \(\varepsilon=0,01\)-ra! (Ez jelentené azt, hogy NE 0,49
és 0,51 közé essen a relatív gyakoriság.)
\begin{equation}
\begin{split}
P\left(\text{ }\big|\text{ }R_n-M(R_n)\text{ }\big|\ge\varepsilon\right)
&\le \frac{\sigma^2(R_n)}{\varepsilon^2}\\\\
\text{Helyettesítsük be, amit tudunk:}\\\\
P\left(\text{ }\left|\text{ }\frac{k}n-p\text{ }\right|\ge0,01\right)
&\le \frac{\frac{p(1-p)}{n}}{0,0001}\\\\
P\left(\text{ }\left|\text{ }\frac{k}n-p\text{ }\right|\ge0,01\right)
&\le \frac{p(1-p)}{0,0001n}\\\\
\text{Beírva a }p=0,5\text{-et:}\\\\
P\left(\text{ }\left|\text{ }\frac{k}n-0,5\text{ }\right|\ge0,01\right)
&\le \frac{0,25}{0,0001n}\\\\
\end{split}
\end{equation}
A bal oldal azt fejezi ki, hogy a relatív gyakoriság NEM ESIK 0,49 és 0,51 közé. Azt szeretnénk megtudni, mennyi legyen \(n\) ahhoz, hogy ennek valószínûsége 2%-nál kisebb legyen.
Becslésünk szerint ez biztosan teljesül, ha a jobboldal nem nagyobb
0,02-nál:
\begin{equation}
\begin{split}
\frac{0,25}{0,0001n} &\le 0,02\\\\
\text{Oldjuk meg ezt }n\text{-re!}\\\\
0,25 &\le 0,02\cdot 0,0001n\\\\
0,25 &\le 0,000002n\\\\
\frac{0,25}{0,000002} &\le n\\\\
125\hphantom{.}000 &\le n
\end{split}
\end{equation}
Válasz: Legalább 125 000-szer kell dobnod ahhoz, hogy 98%-os valószínûséggel állíthassuk, hogy a FEJ relatív gyakorisága 0,49 és 0,51 közé esik.
(Ez meglepõen sok. Persze becsléssel dolgoztunk, így talán ez az eredmény nem pontos, de nagyságrendileg jó. Arra mindenképpen int ez a dolog minket, hogy a relatív gyakoriság elég lassan tart a valószínûséghez.)