[Citat] Întrebarea mai precis? ar fi:
Care este media num?rului de extrageri necesare pentru a "nimeri" toate numerele de la 1 la 49?
|
Romania are ceva traditie in teoria probabilitatilor. Pentru a da sanse traditiei sa traiasca un secol mai departe, incerc sa rezolv problema asemanatoare cea mai simpla, incat sa fie clar despre ce este vorba pentru un public mai larg...
Desigur, generalizarea sta pe limba:
Intr-o urna se afla toate numerele de la 1 la N, N natural >1.
Un experiment simplu consta in a extrage un numar, a-l tine minte si pune la loc.
Un experiment "derivat", consta in a repeta experimentul simplu de atatea ori pana ce toate numerele au fost extrase (cel putin o data).
Intrebare: Care este media num?rului de extrageri necesare pentru a "nimeri" toate numerele de la 1 la N?
Rezolvam cazul N=2.
Notam cu
multimea rezultatelor posibile in experimentul simplu. Distributia de probabilitate este cea ce repartizeaza 1/2 pentru fiecare din cele doua rezultate posibile.
Notam cu
multimea rezultatelor posibile in experimentul "derivat". Elementele acestui "spatiu de probabilitate" sunt tupletele:
(1,2)
(2,1)
(1,1,2)
(2,2,1)
(1,1,1,2)
(2,2,2,1)
.........
dar pentru a scrie mai putin ("white noise", cum numesc unii probabilisti acele semne de punctuatie ce atrag atentia de la esenta, deci paranteze, virgule, etc), vom scrie in loc "cuvinte" din "alfabetul" cu "literele" 1 si 2, anume:
12
21
112
211
1112
2111
....
Notam cu
functia ("aleatoatre") care asociaza unui "cuvant"
numarul de litere din el, deci K, deci numarul de repetari ale experimentului simplu in "acest mers al lumii" pana ce am data de toate numerele din urna.
Media ceruta este numarul urmator:
2 x (probabilitatea ca sa ne oprim dupa doi pasi)
+ 3 x (probabilitatea ca sa ne oprim dupa trei pasi)
+ 4 x (probabilitatea ca sa ne oprim dupa patru pasi)
+ 5 x (probabilitatea ca sa ne oprim dupa cinci pasi)
+ 6 x (probabilitatea ca sa ne oprim dupa sase pasi)
+ 7 x (probabilitatea ca sa ne oprim dupa sapte pasi)
+ ...
Sa vedem cum stau lucrurile...
Desigur ca avem nevoie de cel putin doua extrageri.
Dupa doua extrageri, lucrurile stau cam asa:
11 - probabilitate 1/4 - mai extragem
12 - probabilitate 1/4 - stop
21 - probabilitate 1/4 - stop
22 - probabilitate 1/4 - mai extragem
tinem minte lucrurile cu stop, iar in celelalte...
111 - probabilitate 1/8 - mai extragem
112 - probabilitate 1/8 - stop
221 - probabilitate 1/8 - stop
222 - probabilitate 1/8 - mai extragem
tinem minte lucrurile cu stop, iar in celelalte...
1111 - probabilitate 1/16 - mai extragem
1112 - probabilitate 1/16 - stop
2221 - probabilitate 1/16 - stop
2222 - probabilitate 1/16 - mai extragem
si asa mai departe.
Avem deci de calculat:
(Adica cum, nici macar pentru N=2 nu dam de o problema banala?! Hmm...)
Idee de calcul: Plecand de la formula
derivand dupa x, luand x=1/2 si trecand la limita dupa K
(eventual vazand din timp ca acel x la "putere mare" nu va mai juca la sfarsit nici un rol, deci plecand poate direct cu x^2 / (1-x) ) obtinem:
Surprindere?
Sa incercam un "Monte Carlo": Lasam computerul sa traga de 10.000 ori la sorti si sa ne dea media
(cod python, insotit de rezultate pentru doua simulari):
Ei bine, ruland acelasi cod "Monte Carlo" pentru N=3 si N=4 obtinem:
Cum se pot explica valorile de mai sus pentru N=3 si N=4?
(Pentru N=49 trebuie facute muuuult mai multe incercari, pentru a avea cat de cat o apropiere statistica de "adevar".)