miércoles, 3 de mayo de 2017

Adibideak


Blog honen helburua aurreko lanetan aurkeztutako adibideak R-n interpretazea da.


Lehenengo sarrerako adibidea:

Bi dado 24 aldiz botatzerakoan, gutxienez sei bikoitz bat ateratzeko probabilitatea kalkulatu dugu.

> local({
+   .Table <- data.frame(Probability=dbinom(0:2, size=2, prob=0.16666666667))
+   rownames(.Table) <- 0:2 
+   print(.Table)
+ })
  Probability
0  0.69444444
1  0.27777778
2  0.02777778

> pbinom(c(0), size=24, prob=0.027778, lower.tail=FALSE)
[1] 0.4914067

Lehenengo kalkulatu dugu binomialaren bitartez behin botata sei bikoitza lortzeko probabilitatea. Hau, 0.02777778 izango da. 

Gero, 24 aldiz botata gutxienez behin sei bikoitza lortzeko probabilitatea lortu dugu. Baina, R-k ">" aukera kalkulatzen duenez, eta gure aldagaia diskretua denez, ">0" kalkulatzea, ">=1" kalkulatzearen berdina da. Probabilitate hori 0.4914 atera zaigu.



Bigarren sarrerako adibidea:

Adibide honetan hiru probabilitate desberdin kalkulatu genituen, loteria-ontzitik ateratzen ez diren baina sarituak diren zenbakientzako:

G=Lehen 3 zifrak berdinak izatea eta gehienez 4 zifra berdin egotea.

H=Azkenengo 2 zifrak berdinak izatea.

X1=Lehen 3 zifretatik berdin kopurua =Bin(3, 0.1)
> local({
+   .Table <- data.frame(Probability=dbinom(0:3, size=3, prob=0.1))
+   rownames(.Table) <- 0:3 
+   print(.Table)
+ })
  Probability
0       0.729
1       0.243
2       0.027
3       0.001

X2=Azken 2 zifretatik berdin kopurua= Bin(2, 0.1)
> local({
+   .Table <- data.frame(Probability=dbinom(0:2, size=2, prob=0.1))
+   rownames(.Table) <- 0:2 
+   print(.Table)
+ })
  Probability
0        0.81
1        0.18
2        0.01


> pbinom(c(1), size=2, prob=0.1, lower.tail=TRUE)
[1] 0.99

> pbinom(c(2), size=3, prob=0.1, lower.tail=TRUE)
[1] 0.999


Beraz, lehenengo sariaren lehengo hiru zifra berdinak izateko probabilitatea 0.00099 izango da.  


Orduan, gure zenbakia lehen sariaren azken bi zifrak edukitzeagatik saritua izateko probabilitatea 0.0099 da.  

Azkenik, lehen sariaren azken zifraren berdina izateko probabilitatea kalkulatuko dugu. 
I=Azkenengo zifra berdina izatea eta gehienez 4 zifra berdin.

X3=Lehengo 4 zifretatik berdin kopurua= Bin(4, 0.1)
X4=Azkenengo zifra berdina izatea=Bin(1, 0.1)
> local({
+   .Table <- data.frame(Probability=dbinom(0:1, size=1, prob=0.1))
+   rownames(.Table) <- 0:1 
+   print(.Table)
+ })
  Probability
0         0.9
1         0.1

> pbinom(c(3), size=4, prob=0.1, lower.tail=TRUE)
[1] 0.9999




Hirugarren sarrerako adibidea:


Adibide honetan euro bateko bost txanpon hartu eta aldi berean 30 aldiz jaurti ditugu. 

R berak zoriz kalkulatu du. R-k kalkulatu du 5 txanponak 30 aldiz botatzerakoan, txanpon bakoitzak lortutako aurpegi kopurua eta batazbestekoa.



Oraingoan, jaurtiketa bakoitzean zenbat aurpegi atera diren kalkulatu du R-k zoriz.  


> numSummary(MuestrasBinomiales[,"obs"], statistics=c("mean"), quantiles=c(0,.25,.5,.75,1))
    mean 
2.433333



Bostak aurpegi edo gurutze izateko probabilitatea inolako daturik kontutan izan gabe 0,0625 da. Baina gure txanponak 30 aldiz jaurti ditugunez, banaketa binomiala erabiliz, gutxienez behin bost txanponak berdinak izateko probabilitatea 0,8558 da.

> local({
+   .Table <- data.frame(Probability=dbinom(0:5, size=5, prob=0.5))
+   rownames(.Table) <- 0:5 
+   print(.Table)
+ })
  Probability
0     0.03125
1     0.15625
2     0.31250
3     0.31250
4     0.15625
5     0.03125

> pbinom(c(0), size=30, prob=0.0625, lower.tail=FALSE)
[1] 0.8557425

Lehenengo adibideak kalkulatu dugun bezala ">0" kasua kalkualtu dugu. 

miércoles, 29 de marzo de 2017

Probabilitatea eta Estatistika Deskribatzailea erlazionatzen

          Lehenik probabilitatea eta estatistika definituko ditugu eta ondoren bien arteko erlazioa behatuko dugu.


Probabilitatea

          Era antolatua eta sistematikoan aurkeztutako zenbakizko datuen multzoa da. Datuak sailkatzeko, antolatzeko, laburtzeko eta patroiak aurkitzeko metodo eta prozesuetaz arduratzen da. Gainera, probabilitateak aurre esaten digu gertaera bat jasotzeko aukerak.



Estatistika deskribatzailea

          Estatistika fenomeno aldakor eta ziurgabeei buruzko datu-multzoak bildu, sailkatu, irudikatu, laburtu eta aztertu egiten dituen metodo eta prozeduren multzoa da. Horien baitan dauden erregulartasunak eta erlazioak bilatu, horietarako ereduak eratu, aurresanak egin, konklusio zehatzak eman eta erabaki egokiak hartzeko laguntza eskeintzen du. Labur, estatistikaren helburua jasotako datuetatik informazio baliagarria eskuratzeko teknikak garatu eta aplikatzea da.


Erlazioa

          Bien arteko erlazioaren gakoa biek ausazko gertaerak ikertzen dituztela da, hau da, biak zorizko gertaeren ikerketaz arduratzen dira ikuspegi matematiko batetik. Gainera, estatistikak bere helburua lortzeko probabilitate teoria oinarritzat hartzen du.

          Horretaz gain, beste erlazio bat guk orain arte ikasi dugun probabilitatearen kalkuluan dago. Bizitza errealeko problema bat aurkeztu zaigunean, bai test batek positibo eman eta gaizki egoteko probabilitatea kalkulatzea, edota suteen alarma bat gaizki aktibatzeko probabilitatea kalkulatzea eskatzen zaigunean, kasu guztietan, zorizko aldagai sistema bat deskribatu dugu lehenik, non gehienetan aldagai horien probabilitatea eman diguten. Hor dago erlazioa. Probabilitate horiek egiteko, lehenengo testak edota saiakerak egin behar izan dira, lagin zehatz batekin eta baldintza konkretu batzuetan. Saiakerak egin ondoren, datuak bildu, ondorio batzuetara iritsi da eta ondorio horietatik probabilitate batzuk atera dira. Zati hori guztia estatistika deskribatzaileari esker egiten da. Hortik aurrera, testak erabili gabe lortuko diren beste probabilitateak probabilitatearen kalkuluari esker izango dira.


Adibide bat:

          Estatistika deskribatzailearen eta probabilitatearen desberdintasunak hobeto ikusteko adibide bat jarriko dugu. Horretarako esperimentu bat egin dugu. Euro bateko bost txanpon hartu eta aldi berean 30 aldiz jaurti ditugu. Eta hau izan da emaitza:



          Estatistika deskribatzailearen ikuspegitik, txanpon bakoitza islatzen badugu, esan dezakegu lehen txanponaren kasuan aurpegia 13 aldiz atera dela, bigarren, hirugarren eta laugarren kasuetan 17 aldiz, eta azkenengoan 15 aldiz. Gure datuetan oinarrituz lehenengo txanponan aurpegiaren probabilitatea 0,4333 da, bigarrengo, hirugarrengo eta laugarrengo txanponetan 0,5667 eta azkenengoan 0,5. Beraz, guk datuak kontutan izan gabe kalkulatuko genukeen probabilitatea bostgarren txanponak bakarrik betetzen du.

          Bost txanponak batera aztertuz, bostak aurpegi edo gurutze izateko probabilitatea inolako daturik kontutan izan gabe 0,0625 da. Baina gure txanponak 30 aldiz jaurti ditugunez, banaketa binomiala erabiliz, gutxienez behin bost txanponak berdinak izateko probabilitatea 0,8558 da, baina guk aztertutako adibidean hori ez da behin ere gertatu.

          Beraz, ikus dugu probabilitatea eta estatistika erabat erlazionatuta daudela, izan ere estatistika probabilitatean oinarritzen da datuak antolatzeko baina emaitzak askotan probabilitateak kalkulatzen duen emaitza orokorretik urrundu egiten dira, hau da, probabilitateak nolabait emaitza ideala ematen digu eta estatistikak aldiz erreala (aztertzen hari garen datuetan oinarrituta).

miércoles, 15 de marzo de 2017

Gabonetako Loteria eta Probabilitatea

  • Historia
Gabonetako zozketa 1812ko martxoan ospatu zen lehenengo aldiz Cadizen. Berez 1811ko gabonetan izan behar zen, baina garaiko gatazkak zirela eta atzeratu egin zen. Zozketa Ciriaco González Carvajal ministoak bultzatu zuen, estatuak dirua lortzeko asmoz. Aurrerago zozketaren ospalekua
Madrilera mugitu zen.

Guda ugari eta ezbeharrek ez dute inoiz zozketa hau eten. Ospatu zen lehenengo urtetik gaur egun arte, sari hauek San Ildefonsoko ikasleek abestu izan dituzte. Aipatzekoa da 1938an bi gabonetako loteria ospatu zirela; izan ere, garaian bizi zen guda zibileko bi aldeek, alde frankistak eta alde errepublikarrak beraien loteriak antolatu zituzten. Urteak igaro ahala jolastu izan diren zenbakien kopurua handituz joan da, gaurko 100000 zenbakietara iritsi arte.




  • Gabonetako Loteria
00000 eta 99999 bitarteko zenbakiek parte hartzen dute gabonetako loteriaren zozketan.  Zenbaki bakoitzeko 165 serie daude eta serie bakoitza 10 dezimogatik osatuta dago. Beraz zenbaki bakoitzeko, 1650 dezimo daude.
Sariak, bi motatan sailkatu daitezke, sari handiak eta sari txikiak:
  1. Sari handiak: Sari nagusia, bigarren saria, hirugarren saria, laugarren saria,bostgarren saria eta Pedrea dira.
  2. Sari txikiak sari handien menpe daude. Adibidez, lehenbiziko hiru zifrak sari nagusiaren berdinak dituzten zenbakiei sari bat ematen zaie.
Zozketa egiteko, bi loteria-ontzi daude. Loteria-ontzi batean, 00000 eta 99999 bitarteko zenbakiak dauzkaten bolatxoak agertzen dira. Zenbaki bakoitza behin sartuko da loteria-ontzian. Beste loteria-ontzian, sari handiak sartuta daude. Banaka ateratzen dira bolatxoak loteria-ontzietatik, zenbakiak eta sariak elkartuz.


  •  Datuak aztertzen 
Orain 206 urteetan (1812-2017) zehar 207 loterien lehenengo saria aztertuko dugu gehien bat, hau baita esangarriena.

Amaierak eta errepikatutako kopurua, ''reintegro'' zenbakia:
110 aldiz bikoitia eta 97 aldiz bakoitia izan da. 

Bakarrik bi zenbaki errepikatu dira lehenengo sariaren zenbaki modura: 15.640, 1956 eta 1978 urteetan; eta 20.297, 1903 eta 2006 urteetan.


Aurreko grafikak 1811-tik 2016-ra egon diren lehenengo zenbakiak adierazten ditu eta ikus dezakegu erabat zorizkoa dela, ez da inolako patroirik edo zentzuzko jarrerarik ikusten. Nabaria da grafikan zenbakien kopurua igo egin dela urteak igaro ala.

  • Benetako Probabilitateak
Loteria-ontzi handian 100000 bola ditugu eta beste ontzi txikiagoan banatzen diren 1807 sariak ditugu.

A=Lehen saria lortzea

B=Bigarren saria lortzea
C=Hirugarren saria lortzea
D=Laugarren saria lortzea
E=Bostgarren saria lortzea
F=Pedrearen saria lortzea

P(A)=1/100000=0.00001


Bigarren eta hirugarren sariak lortzeko probabilitatea era berean kalkulatzen dira.

P(A)=P(B)=P(C)

Laugarrena lortzeko probabilitatea 2 rengatik biderkatu behar da, saria bi aldiz agertzen delako ontzian txkikian, bestalde kalkulua berbera da.


P(D)=2/100000=0.00002


Bostgarren saria lortzeko probabilitatea 8 rengatik biderkatu behar da, saria zortzi aldiz agertzen delako ontzian txikian, eta pedrearen kasuan 1794rengatik, arrazoi berberarengtik.


P(E)=8/100000=0.00008


P(F)=1794/100000=0.01794



Orain, loteria-ontzitik ateratzen ez diren baina sarituak izan daitezkeen zenbakien probabilitateak lortuko ditugu. Kasu hauek kalkulatzeko, kontutan edukiko dugu gure zenbakia lehenengo, bigarren edo hirugarren sariak ez izatea.


X1=Lehen 3 zifretatik berdin kopurua =Bin(3, 0.1)

X2=Azken 2 zifretatik berdin kopurua= Bin(2, 0.1)

G=Lehen 3 zifrak berdinak izatea eta gehienez 4 zifra berdin egotea.








Beraz, lehenengo sariaren lehengo hiru zifra berdinak izateko probabilitatea 0.00099 izango da. Berdin gertatuko da bigarren eta hirugarren sariarekin. 


H=Azkenengo 2 zifrak berdinak izatea.







Orduan, gure zenbakia lehen sariaren azken bi zifrak edukitzeagatik saritua izateko probabilitatea 0.0099 da. Eta berriro ere, berdina gertatzen da bigarren eta hirugarren sariarekin. 


Azkenik, lehen sariaren azken zifraren berdina izateko probabilitatea kalkulatuko dugu. Seguraski, probabilitatea hau interesgarriena izango da, gutxienez jolastu duzun dirua galtzen ez duzulako.


X3=Lehengo 4 zifretatik berdin kopurua= Bin(4, 0.1)

X4=Azkenengo zifra berdina izatea

I=Azkenengo zifra berdina izatea eta gehienez 4 zifra berdin.






 

Beraz, gure zenbakiarekin jolastutakoa ez galtzeko probabilitatea 0.0998 da.

Ondorio bezala esan dezakegu norberaren aukera dela loterian jolastea edo ez jolastea, baina emaitzetan oinarrituta nabarmena da irabazteko aukera ia nulua dela.




martes, 28 de febrero de 2017

Probabilitatearen historia


           Zoria edonon aurki dezakegu gizakiaren historia beatuz gero. Aurkitu izan dira K. a. VII. mendean Sumerioek eta Asirioek utzitako aztarnetan animalien hezurrez eginiko dadoak.  Egiptiarrek berriz dadoen emaitzak ohol batzuetan idazten zituzten, eta horietako zenbait heldu dira gaur egunera. Ziurrenik, ohola horiek erabiliz hurrengo jaurtiketen emaitzak asmatzeko ahaleginak egingo zituzten. Baina ez da  XVI-XVII mendeetara arte noiz probabilitatea zientzia modura eta era matematiko batera ikertzen hasten den arte.

Egiptiarren zorizko jokoa “Senet”

  • Probabilitatearen lehenengo aztarnak (XII. mendetik XVI. mendera)

           XII.mendean aurki dezakegu probabilitateari buruzko lehenbiziko problema, Richard

de Fournival-en De Vetula poeman. Poema honetan, hiru dado jaurtitzen badira 216 konbinazio posible daudela esaten da.

           Zorizko jokoei buruzko problema garrantzitsuena apustuen irabaziak bidezko modu batean banatzea zen. Hiru pertsona ezberdin saiatu ziren problema honi irtenbidea ematen; Luca Pacioli, Giromalo Cardano eta Niccolo Tartaglia. Hala ere, ez zuten lortu soluzio matematiko egoki bat ematea. Giromalo Cardanok zorizko jokoetako probabilitate kalkuluei buruzko lehenbiziko liburu garrantzitsua idatzi zuen 1565ean (Libros de los juegos de azar).

           Hiru izen hauetaz aparte, probabilitatearen aitzindari bezala Galileo Galilei azpimarratu behar da. Bere bizitzan zehar dadoei buruzko problema ezberdinak ebatzi zituen eta liburu bat idatzi zuen horri buruz (Sobre la puntuación en tiradas de dados). Hala ere, Galileoren ekarpen garrantzitsuena eta gaur egunean oraindik erabiltzen dena, erroreen analisia da. Erroreak bi motatan bereizi zituen: sistematikoak eta ausazkoak.



  • Probabilitate modernoaren  hasiera (XVII-XVIII. mendeak)
               
           Probabilitatearen hasiera XVII. mendean hasten da Fermat eta Pascal-en eskutik zorizko jokoekin erlazionatutako arazo batzuk ebazten saiatzen direnean.

           Dena hasi zen Pascal eta Fermat-ek De Méré izeneko zaldun batek  planteatutako joko zahar batengatik interesa agertu zutenean. Jokoa hurrengoa zen: bi dado 24 aldiz bota, eta gutxienez sei bikoitz bat irtetearen alde ala kontra  apostu egin behar zen.

           Garaiko jokalari batzuen kalkuluen arabera, gutxienez behin sei bikoitz bat aterako zen eta horren alde apostu egiten zuten. Baina kalkulu horiek okerrak ziren eta jokalariek dirua galtzen zutenez zergatia ulertzeko nahia eta beharra sortu zitzaien. Pascal eta Fermat-ek zalantza horri erantzuna aurkitzen saiatu ziren, probabilitatearen  teoria modernoari hasiera emanez.

           Baina ez Pascalek, ez Fermat-ek ez zituzten bere emaitzak idatziz adierazi. Beraien ordez Christian Huygens-ek argitaratu zuen 1657an probabilitatearen lehen liburua, ”De Ratiocinnis in ludo aleae”, Pascal eta Fermat-ek sortutako teorian oinarriturik. Gainera, Huygens-ek teoria hori are gehiago hedatu zuen hainbat arazo gehiago argituz.
       
           Probabilitatearen definizio klasikoa ematen lehena Jacob Bernoulli izan zen, bera hil ondoren argitaratu zen ‘’Ars conjectandi’’ izeneko liburuan. Liburu honetan Zenbaki Handien legea aurkitu dezakegu. Hau izan zen kasu partikularren atzean dauden kontzeptu orokorrak azaltzen lehenengoa.


           Probabilitate konposatuaren teorema ere  De Moivrek enuntziatu zuen lehen aldiz zehatz-mehatz, nahiz eta matematikarien artean oso ezaguna izan gai hartan, ‘’The doctrine of chances’’ deituriko liburuan. Bertan, aldagai independenteen eta dependenteen kontzeptuak definitu zituen. Bi definizio hauetatik abiatuz probabilitate konposatuaren teorema enuntziatzera iritsi zen.

           Beranduago, seguraski bere ikaslea izandako Thomas Bayesek probabilitate baldintzatua ebakiduren probabilitatearen funtziopean adierazi zuen. Baina teorema hau Pierre-Simon Laplacek hobetu zuen ‘’Théorie analytique des probabilités’’ liburuan. Horretaz gain, liburu horretan Laplacek zorizko jokoen teoria matematikoaren aurkezpena egiten du.



  • Gaur egungo probabilitatearen definizioa (XIX. mendea - gaur egun)

           XIX. mendearen erdialdean Tchebycheff errusiarrak probabilitatearen teoriari ekarpen handiak egin zizkion, Markov eta Kolmogorov errusiar matematikarien laguntzaz. Probabilitatearen problema garrantzitsuak ebatziz eta gaur egun erabiltzen den probabilitatearen definizioa ezarriz.