
144. óra: Nagy számok törvénye (olvasmány)
A valószínûségszámítás tárgya a véletlen események vizsgálata.
Alapfogalmunk a valószínûség. A vszg. egy arányszám. Azt hivatott megmutatni, hogy ha a vizsgált kísérletet sokszor elvégezzük (pl. 1000-szer), akkor a kísérletek számának milyen arányában következik be a várt esemény.
Olyasmit gondolunk errõl a valószínûségrõl, hogy ha a kérdéses kísérletet n-szer elkövetjük, és k-szor bekövetkezik, akkor a \(\frac{k}{n}\) értéke valami fix arányszám (pl, 0,4) körül van.
De mi az, hogy 'akörül'? Annyi, vagy nem annyi?
Nem annyi, ez nyilvánvaló: ha 11-szer feldobunk egy szabályos pénzérmét biztos nem lesz a fele fej. De ha feldobnánk 100 000-szer, akkor sem érezzük biztosnak azt, hogy 50 000-szer lesz fej. És nem is biztos.
Akkor mirõl beszélünk itt egyáltalán?
Valami olyasmit is szoktunk mondani/gondolni, hogy ha 'nagyon' sokszor próbálkozunk, akkor a relatív gyakoriság valahogy 'közeledik' a valószínûséghez.
Akkor ez olyan mint a konvergencia?
Igen, olyasmi - de nem az.
A relatív gyakoriság konvergenciája a valószínûséghez azt jelentené, hogy ,,bármely \(\varepsilon>0\) számhoz található olyan \(N\) küszöbindex, amelyre \(\left|\frac{k}n-p\right|<\varepsilon\), ha \(n>N\).'' (Itt \(\frac{k}n\) a relatív gyakoriságot, \(p\) a valószínûséget jelöli.)
Hát ezt nem tudjuk megoldani. Hiszen akárhányszor próbálkoznuk is, pl. a pénzérme-feldobással, biztosat nem állíthatunk arról, hogy hányszor fog bekövetkezni a kedvezõ kimenetel.
Amit vállalhatunk: Tekintsünk egy \(p\) valószínûségû eseményt. A hozzá tartozó relatív gyakoriságot \(n\) független kísérlet után jelölje \(R_n\).
\[
P\left(\left|R_n-p\right|<\varepsilon\right)\longrightarrow 1
\]vagy ami ugyanaz
\[
\lim_{n\rightarrow\infty}P\left(\left|R_n-p\right|<\varepsilon\right) = 1
\]
Vagyis annak valószínûsége, hogy a relatív gyakoriság és a valószínûség közti eltérés \(\varepsilon\)-nál kisebb, 1-hez tart, ha \(n\) tart a végtelenbe.
Bizonyítás: Írjuk fel az \(R_n\)-re vonatkozó
Csebisev-egyenlõtlenséget!
\begin{equation}
\begin{split}
P\left(\left|R_n-p\right|\ge\varepsilon\right)
&\le\frac{\sigma^2(R_n)}{\varepsilon^2}
\end{split}
\end{equation}A bal oldalon térjünk át a komplementer eseményre:
\(P\left(\left|R_n-p\right|\ge\varepsilon\right) = 1 -
P\left(\left|R_n-p\right|<\varepsilon\right)\),
a jobb oldalon pedig emlékezzünk a relatív gyakoriság
\(\left(R_n\right)\) szórásnégyzetére.
\begin{equation}
\begin{split}
1 - P\left(\left|R_n-p\right|<\varepsilon\right) &\le
\frac{\frac{p(1-p)}n}{\varepsilon^2}\\\\
1 - P\left(\left|R_n-p\right|<\varepsilon\right) &\le
\frac{p(1-p)}{n\cdot\varepsilon^2}\\\\
1-\frac{p(1-p)}{n\cdot\varepsilon^2} &\le
P\left(\left|R_n-p\right|<\varepsilon\right)\\\\
\text{A jobb oldalon egy valószínûség áll,}\\
\text{ami 1-nél több nem lehet:}\\\\
1-\frac{p(1-p)}{n\cdot\varepsilon^2} &\le
P\left(\left|R_n-p\right|<\varepsilon\right) \le 1
\end{split}
\end{equation}A kérdésese sorozatot - a
\(P\left(\left|R_n-p\right|<\varepsilon\right)\)-et - két sorozat
fogja közre.
A minorásns az átviteli elv szerint 1-hez tart, mert a \(\frac{p(1-p)}{n\cdot\varepsilon^2}\) nullához tart (rögzített \(p\) és \(\varepsilon\) mellett).
A majoráns pedig maga az 1.
A rendõr-elv szerint tehát a közrefogott sorozat is 1-hez tart:
\[
\lim_{n\rightarrow\infty}P\left(\left|R_n-p\right|<\varepsilon\right)
= 1
\]
És ez volt az állítás.
Az elnevezésben a 'gyenge' nem a tétel minõségére, hanem a konvergencia típusára utal. Az ilyen konvergenciát nevezzük 'gyenge konvergenciá'-nak.
A tétel elég jól mutatja, hogy ez a konvergencia igen lassú, hiszen kb. \(\frac1n\) sebességû úgy, hogy a nevezõben még \(\varepsilon^2\) is lassítja... (Ne feledjük, \(\varepsilon\) jellemzõen kicsi szám!)
Maga a becslés - mint láttuk - alkalmas valamiféle küszöbindexek
megtalálására, amik jellemzõen igen nagy számok lesznek. Innen a tétel
neve: 'Nagy számok törvénye'.