-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathpapoulis_probability_notes.tex
executable file
·14473 lines (13533 loc) · 865 KB
/
papoulis_probability_notes.tex
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
936
937
938
939
940
941
942
943
944
945
946
947
948
949
950
951
952
953
954
955
956
957
958
959
960
961
962
963
964
965
966
967
968
969
970
971
972
973
974
975
976
977
978
979
980
981
982
983
984
985
986
987
988
989
990
991
992
993
994
995
996
997
998
999
1000
\documentclass[a4paper]{report}
\usepackage[spanish]{babel}
\usepackage{graphicx}
\pagestyle{headings}
\titlepage
\usepackage[utf8]{inputenc} % para codificacion unicode (utf8)
\usepackage{enumerate}
\usepackage{hyperref} % para links a paginas web
\usepackage{subfig}
\usepackage{graphics}
\usepackage{amsmath}
\usepackage{amssymb}
\usepackage{amsthm}
\usepackage{placeins}
\usepackage{tabularx}
\usepackage{booktabs,siunitx}
\usepackage{calc}
\usepackage{bm}
\usepackage{fullpage}
\usepackage{mathdots}
\usepackage{multirow}
\usepackage[table,xcdraw]{xcolor}
\usepackage{stackengine}
\stackMath
\usepackage{csquotes}
\usepackage{appendix}
% plot a circle
\usepackage{tikz}
\newcommand\TikCircle[1][3]{\tikz[baseline=-#1]{\draw[thick](0,0.05)circle[radius=#1mm];}}
\decimalpoint
% That follow is for listings configuration
\usepackage{listings}
\usepackage{color}
\usepackage{textcomp}
\definecolor{listinggray}{gray}{0.9}
\definecolor{lbcolor}{rgb}{0.99,0.99,0.99}
\lstset{
backgroundcolor=\color{lbcolor},
tabsize=4,
rulecolor=,
language=python,
basicstyle=\scriptsize,
upquote=true,
aboveskip={1.5\baselineskip},
columns=fixed,
showstringspaces=false,
extendedchars=true,
breaklines=true,
prebreak = \raisebox{0ex}[0ex][0ex]{\ensuremath{\hookleftarrow}},
frame=single,
showtabs=false,
showspaces=false,
showstringspaces=false,
identifierstyle=\ttfamily,
keywordstyle=\color[rgb]{0,0,1},
commentstyle=\color[rgb]{0.133,0.545,0.133},
stringstyle=\color[rgb]{0.627,0.126,0.941},
literate=%
{á}{{\'{a}}}1
{é}{{\'{e}}}1
{í}{{\'{i}}}1
{ó}{{\'{o}}}1
{ú}{{\'{u}}}1
{ñ}{{\~n}}1
}
\newcommand{\X}{\mathbf{X}}
\newcommand{\Y}{\mathbf{Y}}
\newcommand{\W}{\mathbf{W}}
\newcommand{\Z}{\mathbf{Z}}
\newcommand{\Hbf}{\mathbf{H}}
\newcommand{\vbf}{\mathbf{v}}
\newcommand{\h}{\mathbf{h}}
\newcommand{\A}{\mathbf{A}}
\newcommand{\B}{\mathbf{B}}
\newcommand{\C}{\mathbf{C}}
\newcommand{\D}{\mathbf{D}}
\newcommand{\I}{\mathbf{I}}
\newcommand{\R}{\mathbf{R}}
\newcommand{\T}{\mathbf{T}}
\newcommand{\abf}{\mathbf{a}}
\newcommand{\bbf}{\mathbf{b}}
\newcommand{\x}{\mathbf{x}}
\newcommand{\y}{\mathbf{y}}
\newcommand{\w}{\mathbf{w}}
\newcommand{\z}{\mathbf{z}}
\newcommand{\p}{\mathbf{p}}
\newcommand{\s}{\mathbf{s}}
\newcommand{\Phibf}{\mathbf{\Phi}}
\newcommand{\Psibf}{\mathbf{\Psi}}
\newcommand{\Gammabf}{\mathbf{\Gamma}}
\newcommand{\thetabf}{\bm{\theta}}
\newcommand{\var}{\operatorname{var}}
\newcommand{\cov}{\operatorname{cov}}
\DeclareMathOperator*{\argmin}{arg\,min}
\DeclareMathOperator*{\argmax}{arg\,max}
\newtheorem*{theorem*}{Teorema}
\title{Estudiando el libro ``Probability, random variables, and stochastic processes'' de Athanasios Papoulis y S. Unnikrishna Pillai}
\author{Ernesto López}
\begin{document}
\maketitle
\pagenumbering{roman}
\tableofcontents
\chapter*{Prefacio}
Cuando se estudian tópicos de ingeniería como procesamiento estadístico de señales, reconocimiento de patrones, aprendizaje automático o cualquier disciplina que involucre el análisis cuantitativo de datos, es imprescindible el dominio de la teoría de la probabilidad.
El presente documento consiste en apuntes sobre el libro ``Probability, random variables, and stochastic processes'' \cite{papoulis2002probability}. Se seleccionó este texto debido a que desarrolla la teoría de forma profunda pero a su vez desde un enfoque práctico, evitando las formalidades matemáticas de la teoría de la probabilidad moderna basada en la teoría de la medida. El objetivo de este documento es explicar mas detalladamente algunos razonamientos que el autor omite posiblemente por asumir triviales.
\pagenumbering{arabic}
\part{Probabilidad y variables aleatorias}
\chapter{Conceptos básicos}
En este capítulo inicial, se incluyen algunas definiciones básicas de la teoría de la probabilidad. A diferencia del resto del documento, este capítulo está basado en el texto \cite{kupferman09lectures}, aunque también se empleó como soporte el libro \cite{resnick1999probability}, mas estricto matemáticamente. Se hará hincapié en las definiciones y teoremas vinculados a secuencias de eventos, con el objetivo de facilitar el estudio de los modos de convergencia de secuencias de variables aleatorias, que se explica en el capítulo 7 de \cite{papoulis2002probability} pero con poca profundidad.
\section{El espacio muestral}
Si bien la teoría de la probabilidad está basada en un conjunto de reglas formales abstractas, también posee un significado intuitivo que está relacionado siempre a la realización de un \emph{experimento}. Este experimento puede ser real o conceptual. En la teoría de la probabilidad se asignan probabilidades a todos los resultados posibles del experimento. En el modelo abstracto de un experimento, el conjunto de todos los resultados posibles del experimento se llama \emph{espacio muestral}. Debe tenerse en cuenta que este conjunto es una entidad matemática independientemente del significado intuitivo. El espacio muestral se denota como \(\Omega\) o \(S\) y sus elementos como \(\omega\) o \(\zeta\)\footnote{En este capítulo se usa la notación del texto de referencia (\cite{kupferman09lectures}). En el resto del documento se emplea la notación de \cite{papoulis2002probability}, en donde el espacio muestral se denota como \(S\) y sus elementos como \(\zeta\).}.
\section{Eventos}
Considérese el experimento de lanzar un dado. Los resultados posibles del experimento son los números naturales del 1 al 6, o en otras palabras, el espacio muestral es \(\Omega=\{1,\dots,\,6\}\). Sin embargo, podría interesar el resultado ``salió un número par''. Este resultado no es un elemento de \(\Omega\), si no el \emph{subconjunto} \(\{2,\,4,\,6\}\) de \(\Omega\). El resultado ``salió un número par'' no es un \emph{resultado elemental} del experimento. Cuando el resultado es un subconjunto del espacio muestral en lugar de un resultado elemental, se denomina \emph{evento}.
La realización de un experimento se llama \emph{ensayo}. En cada ensayo, ocurre un único resultado \(\zeta_i\). Se dice que el evento \(A\) ocurrió en el ensayo si contiene el elemento \(\zeta_i\), es decir, \(\zeta_i\in A\).
Los conceptos intuitivos de resultado y evento incorporan dentro un contexto matemático abstracto como un conjunto y sus subconjuntos. De esta forma, es posible aplicar las operaciones unión, intersección y complementación de conjuntos sobre eventos. Ocurre el evento \(A\cup B\) cuando ocurre el evento \(A\) o el evento \(B\). Ocurre el evento \(A\cap B\) cuando ocurre el evento \(A\) y el evento \(B\). Si los eventos \(A\) y \(B\) son mutuamente excluyentes, si ocurre \(A\) no ocurre \(B\) y viceversa. Si \(A\subset B\) y ocurre \(A\), entonces también ocurre \(B\). El complemento \(\overline{A}\) del evento \(A\) es el evento que cumple que \(A\cup\overline{A}=\Omega\). En cada ensayo, ocurre el evento \(A\) o el evento \(\overline{A}\).
En la bibliografía, los eventos se denotan típicamente con letras mayúsculas del comienzo del alfabeto latino: \(A,\,B,\) etcétera. Como se mencionó, un evento es un subconjunto de \(\Omega\).
\subsection{Secuencias de eventos}
Sea la secuencia de eventos \(\{A_n\}_{n=1}^{\infty}\subset\Omega\). Se define:
\begin{itemize}
\item \emph{Intersección de la secuencia}:
\[
\bigcap_{n=1}^{\infty}A_n\triangleq\{\omega\in\Omega:\omega\in A_n\textrm{ para todo }n\}.
\]
\item \emph{Unión de la secuencia}:
\[
\bigcup_{n=1}^{\infty}A_n\triangleq\{\omega\in\Omega:\omega\in A_n\textrm{ para al menos algún }n\}.
\]
\end{itemize}
\subsubsection{Límites de secuencias de eventos}\label{sec:events_sequences_limit}
Las definiciones de los distintos modos de convergencia de secuencias de variables aleatorias requiere el concepto de límite de secuencias de conjuntos. Sea \(\{A_n\}_{n=1}^{\infty}\subset\Omega\). Se define
\begin{itemize}
\item \emph{Ínfimo de una secuencia de eventos}:
\[
\inf_{k\geq n}A_k\triangleq \bigcap_{k=n}^{\infty}A_k=\{\omega\in\Omega:\omega\in A_k\textrm{ para todo }k\geq n\}
\]
\item \emph{Supremo de una secuencia de eventos}:
\[
\sup_{k\geq n}A_k\triangleq \bigcup_{k=n}^{\infty}A_k=\{\omega\in\Omega:\omega\in A_k\textrm{ para al menos un }k\geq n\}
\]
\end{itemize}
Notar que el ínfimo es una secuencia de conjuntos monótonamente creciente con \(n\) y el supremo es una secuencia monótonamente decreciente con \(n\) (ver sección \ref{sec:monotone_sequences} sobre secuencias monótonas).
\begin{itemize}
\item \emph{Límite inferior de una secuencia de eventos}:
\[
\liminf_{n\rightarrow \infty }A_n\triangleq\bigcup_{n=1}^{\infty }\bigcap_{k=n}^{\infty }A_k
\]
\item \emph{Límite superior de una secuencia de eventos}:
\[
\limsup_{n\rightarrow \infty }A_n\triangleq\bigcap_{n=1}^{\infty }\bigcup_{k=n}^{\infty }A_k
\]
Para interpretar estos conceptos, se requiere un análisis profundo de las definiciones, y es lo que se hará a continuación. Sea la secuencia de eventos \(\{A_n\}_{n=1}^{\infty}\subset\Omega\),
\begin{enumerate}[(a)]
\item la interpretación de \(\liminf\) es la siguiente:
\begin{align*}
\liminf_{n\rightarrow \infty }A_n\triangleq\bigcup_{n=1}^{\infty }\bigcap_{k=n}^{\infty }A_k&=\left\{\omega\in\Omega:\omega\in A_n\,\forall n\geq n_0(\omega)\textrm{ para algún }n_0(\omega)\in\mathbb{N}\right\}\\
&=\left\{\omega\in\Omega:\omega\in A_n \textrm{ para todo }n\textrm{ excepto para un número finito}\right\}\\
&=\left\{\omega\in\Omega:\omega\in A_n \textrm{ ``eventualmente siempre''}\right\}
\end{align*}
\item la interpretación de \(\limsup\) es la siguiente:
\begin{align*}
\limsup_{n\rightarrow \infty }A_n\triangleq\bigcap_{n=1}^{\infty }\bigcup_{k=n}^{\infty }A_k&=\left\{\omega\in\Omega:\omega\in A_k\textrm{ para al menos un }k\geq n,\,\forall n\right\}\\
&=\left\{\omega\in\Omega:\omega\in A_{n_k},\, k=1,\,2,\dots,\,\textrm{para alguna subsecuencia } n_k(\omega)\right\}\\
&=\left\{\omega\in\Omega:\omega\in A_n \textrm{ ``infinitamente a menudo''}\right\}
\end{align*}
\end{enumerate}
En la bibliografía, se emplea la siguiente notación:
\[
\liminf_{n\rightarrow \infty }A_n=\left\{\omega\in\Omega:\omega\in A_n\;e.a.\right\},\qquad\qquad
\limsup_{n\rightarrow \infty }A_n=\left\{\omega\in\Omega:\omega\in A_n\;i.o.\right\},
\]
donde la sigla \(e.a.\) proviene de la sigla de ``eventualmente siempre'' en inglés (\emph{eventually always}) y la sigla \(i.o.\) proviene de la sigla ``infinitamente a menudo'' en inglés (\emph{infinitely often}).
Dos conexiones entre los conceptos de \(\liminf\) y \(\limsup\) son las siguientes:
\begin{enumerate}
\item Se cumple la relación de inclusión
\[
\liminf_{n\rightarrow \infty }A_n\subseteq\limsup_{n\rightarrow \infty }A_n.
\]
Esta relación proviene de que
\[
\left\{\omega\in\Omega:\omega\in A_n\,\forall n\geq n_0(\omega)\right\}\subseteq\left\{\omega\in\Omega:\omega\in A_n \textrm{ ``infinitamente a menudo''}\right\}
\]
\item Además, se cumple que
\[
\left(\liminf_{n\rightarrow\infty}A_n\right)^c=\limsup_{n\rightarrow\infty}A_n^c.
\]
Esta identidad se obtiene aplicando las leyes de Morgan de la siguiente forma:
\begin{align*}
\left(\liminf_{n\rightarrow\infty}A_n\right)^c&=\left(\bigcup_{n=1}^{\infty }\bigcap_{k=n}^{\infty }A_k\right)^c=\bigcap_{n=1}^{\infty}\left(\bigcap_{k=n}^{\infty}A_k\right)^c=\bigcap_{n=1}^{\infty}\bigcup_{k=n}^{\infty}A_k^c=\limsup_{n\rightarrow\infty}A_n^c
\end{align*}
De forma análoga, puede probarse que
\[
\left(\limsup_{n\rightarrow\infty}A_n\right)^c=\liminf_{n\rightarrow\infty}A_n^c.
\]
\end{enumerate}
\item \emph{Límite de una secuencia de eventos}: si la secuencia de eventos \(\{A_n\}_{n=1}^{\infty}\) es tal que \(\liminf_{n\rightarrow\infty}A_n=\limsup_{n\rightarrow\infty}A_n\), se dice que la secuencia tiene límite, el cual se define como
\[
\lim_{n\rightarrow\infty}A_n=\liminf_{n\rightarrow\infty}A_n=\limsup_{n\rightarrow\infty}A_n.
\]
\end{itemize}
\paragraph{Ejemplos}
\begin{enumerate}[(a)]
\item Sea \(\Omega\) el conjunto \(\mathbb{N}\) de los números naturales y sea
\[
A_n=\{\textrm{todos los números naturales pares/impares si }n\textrm{ es par/impar}\}.
\]
Considerando que
\[
\bigcup_{k=n}^{\infty }A_k=\mathbb{N},\qquad \bigcap_{k=n}^{\infty }A_k=\emptyset,\qquad \forall n,
\]
se tiene que
\[
\limsup_{n\rightarrow \infty }A_n=\bigcap_{n=1}^{\infty }\bigcup_{k=n}^{\infty }A_k=\bigcap_{n=1}^{\infty }\mathbb{N}=\mathbb{N}=\Omega,
\]
y
\[
\liminf_{n\rightarrow \infty }A_n=\bigcup_{n=1}^{\infty }\bigcap_{k=n}^{\infty }A_k=\bigcup_{n=1}^{\infty }\emptyset=\emptyset.
\]
Se concluye la secuencia no tiene límite.
\item Sea \(A_n=\left[0,\,n/(n+1)\right)\). Como
\[
\bigcup_{k=n}^{\infty }A_k=\bigcup_{k=n}^{\infty }\left[0,\,\frac{k}{k+1}\right)=\left[0,\,\lim_{k\to\infty}\frac{k}{k+1}\right)=[0,\,1),\qquad\forall n,
\]
se tiene que
\[
\limsup_{n\rightarrow \infty }A_n=\bigcap_{n=1}^{\infty }\bigcup_{k=n}^{\infty }A_k=\bigcap_{n=1}^{\infty }[0,\,1)=[0,\,1).
\]
Por otro lado, se cumple que
\[
\bigcap_{k=n}^{\infty }A_k=\bigcap_{k=n}^{\infty }\left[0,\,\frac{k}{k+1}\right)=\left[0,\,\frac{n}{n+1}\right),
\]
donde en la última igualdad se empleó que \([0,\,n/(n+1))\subset[0,\,m/(m+1))\) si \(n<m\). Por lo tanto,
\[
\liminf_{n\rightarrow \infty }A_n=\bigcup_{n=1}^{\infty }\bigcap_{k=n}^{\infty }A_k=\bigcup_{n=1}^{\infty }\left[0,\,\frac{n}{n+1}\right)=[0,\,1).
\]
Se concluye que existe el límite de \(A_n\) y es \(\lim_{n\to\infty}A_n=[0,\,1)\).
\item Sea \(A_n = \{0,\,1/n,\,2/n,\,...,\,(n-1)/n,\,1\}\). De esta forma,
\[
A_1 = \{0,\,1\},\quad A_2 = \left\{0,\,\frac{1}{2},\,1\right\},\quad A_3 = \left\{0,\,\frac{1}{3},\,\frac{2}{3},\,1\right\},\quad A_4 = \left\{0,\,\frac{1}{4},\,\frac{1}{2},\,\frac{3}{4},\,1\right\},\quad\dots
\]
Notando que
\[
\bigcup_{k=n}^{\infty }A_k=\mathbb{Q}\cap[0,\,1] \qquad\forall n,
\]
esto es, todos los números racionales entre 0 y 1 inclusive, se tiene que
\[
\limsup_{n\rightarrow \infty }A_n=\bigcap_{n=1}^{\infty }\bigcup_{k=n}^{\infty }A_k=\bigcap_{n=1}^{\infty }\mathbb{Q}\cap[0,\,1]=\mathbb{Q}\cap[0,\,1].
\]
Por otro lado,
\[
\bigcap_{k=n}^{\infty }A_k=\{0,\,1\},
\]
así que
\[
\liminf_{n\rightarrow \infty }A_n=\bigcup_{n=1}^{\infty }\bigcap_{k=n}^{\infty }A_k=\bigcup_{n=1}^{\infty }\{0,\,1\}=\{0,\,1\}.
\]
En este caso, la secuencia \(A_n\) no tiene límite.
\end{enumerate}
\subsubsection{Secuencias monótonas}\label{sec:monotone_sequences}
Una secuencia de conjuntos \(\{A_n\}_{n=1}^{\infty}\) se dice \emph{monótona creciente} si \(A_1\subset A_2\subset A_3\subset\cdots\) y \emph{monótona decreciente} si \(A_1\supset A_2\supset A_3\supset\cdots\). Se emplea la notación \(A_n\nearrow\) o \(A_n\uparrow\) para indicar que una secuencia es creciente y \(A_n\searrow\) o \(A_n\downarrow\) para indicar que una secuencia es decreciente. El límite de secuencias monótonas de conjuntos siempre existe, como se demostrará a continuación.
\paragraph{Teorema} Si la secuencia de conjuntos \(\{A_n\}_{n=1}^{\infty}\) es creciente, el límite existe y está dado por
\begin{equation}\label{eq:increasing_sequence_limit}
\lim_{n\to\infty} A_n = \bigcup_{n=1}^{\infty}A_n.
\end{equation}
Para demostrarlo, se observa que por tratarse de una secuencia creciente se cumple que
\[
\bigcup_{k=n}^{\infty}A_k=\bigcup_{k=1}^{\infty}A_k,\qquad\bigcap_{k=n}^{\infty}A_k=A_n,
\]
ya que \(A_1\subset A_2\subset A_3\subset\cdots\). Por lo tanto, el límite superior es
\[
\limsup_{n\rightarrow \infty }A_n=\bigcap_{n=1}^{\infty }\bigcup_{k=n}^{\infty }A_k=\bigcap_{n=1}^{\infty }\bigcup_{k=1}^{\infty}A_k=\bigcup_{k=1}^{\infty}A_k,
\]
y el límite inferior es
\[
\liminf_{n\rightarrow \infty }A_n=\bigcup_{n=1}^{\infty }\bigcap_{k=n}^{\infty }A_k=\bigcup_{n=1}^{\infty }A_n.
\]
Se concluye que el límite existe y es
\[
\lim_{n\to\infty} A_n = \liminf_{n\rightarrow \infty }A_n = \limsup_{n\rightarrow \infty }A_n=\bigcup_{n=1}^{\infty }A_n.
\]
Observar que el resultado del límite inferior es intuitivo, ya que si \(\omega\in A_n\) para algún \(n\), debido a que la secuencia es creciente, se cumple que \(\omega\in A_{n+1},\,A_{n+2},\,\dots\). Esto significa que \(\omega\) ocurre eventualmente siempre para todo \(\omega\) en cualquier evento \(A_n\) de la secuencia, por lo que el ĺimite es \(\bigcup_{n=1}^{\infty}A_n\).
\paragraph{Teorema} Si la secuencia de conjuntos \(\{A_n\}_{n=1}^{\infty}\) es decreciente, el límite existe y está dado por
\begin{equation}\label{eq:decreasing_sequence_limit}
\lim_{n\to\infty} A_n = \bigcap_{n=1}^{\infty}A_n.
\end{equation}
Para demostrarlo, se parte de que por tratarse de una secuencia decreciente se cumple que
\[
\bigcup_{k=n}^{\infty}A_k=A_n,\qquad\bigcap_{k=n}^{\infty}A_k=\bigcap_{k=1}^{\infty}A_k,
\]
ya que \(A_1\supset A_2\supset A_3\supset\cdots\). Por lo tanto, el límite superior es
\[
\limsup_{n\rightarrow \infty }A_n=\bigcap_{n=1}^{\infty }\bigcup_{k=n}^{\infty }A_k=\bigcap_{n=1}^{\infty }A_n,
\]
y el límite inferior es
\[
\liminf_{n\rightarrow \infty }A_n=\bigcup_{n=1}^{\infty }\bigcap_{k=n}^{\infty }A_k=\bigcup_{n=1}^{\infty }\bigcap_{k=1}^{\infty }A_k=\bigcap_{k=1}^{\infty }A_k.
\]
Se concluye que el límite existe y es
\[
\lim_{n\to\infty} A_n = \liminf_{n\rightarrow \infty }A_n = \limsup_{n\rightarrow \infty }A_n=\bigcap_{n=1}^{\infty }A_n.
\]
\subsection{Álgebra de eventos}
Sea \(\Omega\) el espacio muestral de cierto experimento. La colección de todos los posibles eventos del experimento es el conjunto de todos los subconjuntos de \(\Omega\). Este conjunto se denomina \emph{conjunto potencia} y se denota como \(\mathcal{P}(\Omega)\) o \(2^{\Omega}\). Si un conjunto tiene \(n\) elementos, la cantidad total de subconjuntos es \(2^n\). Esto proviene de la identidad
\[
\sum _{k=0}^{n}{\binom {n}{k}}=2^{n},
\]
ya que la cantidad de subconjuntos distintos de \(k\) elementos que se pueden formar tomados de \(n\) elementos es \(\binom {n}{k}\), por lo que el total de subconjuntos es la suma de estos subconjuntos para \(k=0,\dots,\,n\). El lado derecho de la igualdad se deduce del teorema del binomio, dado por la ecuación \ref{eq:binomial_theorem}, con \(x=y=1\). Otra forma sencilla de deducir que el total de subconjuntos es \(2^n\) es considerar un número binario de \(n\) dígitos, donde un 0 o un 1 en la posición \(i\)-ésima indica la ausencia o presencia respectivamente del elemento \(i\)-ésimo en el subconjunto. El total de números binarios distintos de \(n\) dígitos es \(2^n\). Por ejemplo, en el experimento de arrojar un dado, el espacio muestral contiene \(n=6\) elementos y el total de subconjuntos es \(2^6=64\), como se muestra en la siguiente tabla
\bgroup
\def\arraystretch{1.2}
\begin{center}
\begin{tabular}{|>{\centering\arraybackslash}m{4.5cm}|>{\centering\arraybackslash}m{4.5cm}|}
\hline
\bf{Subconjunto} & \bf{Representación binaria} \\ \hline
\(\{\}=\emptyset\) & 000000 \\ \hline
\(\{1\}\) & 000001 \\ \hline
\(\{2\}\) & 000010 \\ \hline
\(\{1,\,2\}\) & 000011 \\ \hline
\(\vdots\) & \(\vdots\) \\ \hline
\(\{2,\,3,\,4,\,5,\,6\}\) & 111110 \\ \hline
\(\{1,\,2,\,3,\,4,\,5,\,6\}=\Omega\) & 111111 \\ \hline
\end{tabular}
\end{center}
\egroup
Los eventos de un experimento son subconjuntos del espacio muestral \(\Omega\) a los cuales se le asignan probabilidades, como se verá mas adelante. Sin embargo, no necesariamente se considerarán como eventos todos los subconjuntos de \(\Omega\). Un motivo de esto es la naturaleza del experimento. Por ejemplo, si en el experimento de arrojar un dado interesa si el resultado es par o impar, alcanza con considerar como eventos únicamente los cuatro conjuntos \(\emptyset\), \(\{\textrm{par}\}\), \(\{\textrm{impar}\}\) y \(\Omega\). Pero la razón principal de no considerar todos los subconjuntos de \(\Omega\) es de naturaleza matemática: en algunos casos en donde el espacio muestral contiene infinitos elementos, no es posible asignar probabilidades a todos sus subconjuntos satisfaciendo los axiomas de probabilidad, dados en la sección \ref{sec:probability_space}. Por lo tanto, la colección de eventos a considerar es en realidad un subconjunto de \(2^{\Omega}\). Este subconjunto debe cumplir los requerimientos de un \emph{álgebra de eventos}. En otras palabras, se considerarán como eventos los subconjuntos de \(2^{\Omega}\) que forman un álgebra de eventos.
Un conjunto de eventos se dice \textbf{álgebra de eventos} sobre \(\Omega\) si cumple las siguientes tres condiciones:
\begin{enumerate}[(I)]
\item \(\Omega\) es un evento.
\item Si \(A\subseteq\Omega\) es un evento, también lo es \(A^c\). Es decir, un álgebra de eventos es cerrado bajo la operación de complementación.
\item Si \(A,\,B\subseteq\Omega\) son eventos, también lo es \(A\cap B\). Es decir, un álgebra de eventos es cerrado bajo la intersección finita.
\end{enumerate}
Un sinónimo de álgebra es \emph{cuerpo}. También ocasionalmente se emplea el término \emph{campo} por la traducción de término usado en inglés (\emph{field}).
\paragraph{Teorema} Sea \(\Omega\) un espacio muestral y \(\mathcal{C}\) un álgebra de eventos sobre \(\Omega\). Entonces, se cumple que
\begin{enumerate}
\item \(\emptyset\in\mathcal{C}\).
Demostración: como \(\mathcal{C}\) es un álgebra de eventos, \(\Omega\in\mathcal{C}\) y además \(\Omega^c=\emptyset\in\mathcal{C}\).
\item Si \(A_1,\dots,\,A_n\in\mathcal{C}\), se cumple que \(\bigcup_{i=1}^nA_i\in\mathcal{C}\).
Demostración para \(n=2\): como \(\mathcal{C}\) es un álgebra de eventos y \(A_1,\,A_2\in\mathcal{C}\), se cumple que \(A_1^c,\,A_2^c\in\mathcal{C}\). Además, como \(\mathcal{C}\) es cerrado bajo intersecciones finitas, se cumple que \(A_1^c\cap A_2^c\in\mathcal{C}\) y además por ser cerrado a la complementación, también se cumple que
\[
\left(A_1^c\cap A_2^c\right)^c=A_1\cup A_2\in\mathcal{C},
\]
donde en la igualdad se emplearon las leyes de Morgan. La generalización para \(n\) arbitrario se puede demostrar por inducción.
\item Si \(A_1,\dots,\,A_n\in\mathcal{C}\), se cumple que \(\bigcap_{i=1}^nA_i\in\mathcal{C}\).
\end{enumerate}
\subsection{\texorpdfstring{\(\sigma\)}{}-álgebra de eventos}
Una familia de eventos \(\mathcal{F}\) de un espacio muestral \(\Omega\) es un \(\sigma\)-álgebra sobre \(\Omega\) si es un álgebra sobre \(\Omega\) y además cumple que
\begin{itemize}
\item[(III')] Si \(\{A_n\}_{n=1}^{\infty}\) es una sucesión infinita de eventos en \(\mathcal{F}\), se cumple que
\[
\bigcap_{n=1}^{\infty}A_n\in\mathcal{F}.
\]
\end{itemize}
Una familia de eventos que cumple esta propiedad se dice que es cerrada bajo intersecciones numerables. Es fácil ver que un conjunto de eventos que cumple esta propiedad también es cerrado bajo intersecciones finitas. Además, análogamente a un conjunto álgebra, las condiciones implican que un conjunto \(\sigma\)-álgebra es cerrado a uniones numerables, es decir, también se cumple que
\begin{itemize}
\item Si \(\{A_n\}_{n=1}^{\infty}\) es una sucesión infinita de eventos en \(\mathcal{F}\), se cumple que
\[
\bigcup_{n=1}^{\infty}A_n\in\mathcal{F}.
\]
\end{itemize}
En la teoría de la probabilidad, el espacio (conjunto) de eventos es un \(\sigma\)-álgebra. De esta forma, gracias a la clausura de las operaciones en el espacio, se logra la suficiente flexibilidad para construir eventos a partir de otros eventos, pero no se brinda flexibilidad completa para evitar problemas para asignar probabilidades a los elementos del espacio.
\subsubsection{Ejemplos de \(\sigma\)-álgebra}
A continuación se dan algunos ejemplos de conjuntos \(\sigma\)-álgebra sencillos.
\begin{enumerate}[(a)]
\item \emph{El conjunto potencia}: como el conjunto potencia \(\mathcal{F}=\mathcal{P}(\Omega)\) es el conjunto de todos los posibles subconjuntos de \(\Omega\), satisface todos los postulados de clausura de un \(\sigma\)-álgebra.
\item \emph{El \(\sigma\)-álgebra mínimo}: considérese el conjunto \(\mathcal{F}=\{\emptyset,\,\Omega\}\). Cumple los postulados de clausura, ya que,
\[
\emptyset^c=\Omega\in\mathcal{F},\qquad\Omega^c=\emptyset\in\mathcal{F},\qquad\emptyset\cap\Omega=\emptyset\in\mathcal{F}.
\]
\item Para cada evento \(A\subseteq\Omega\), el conjunto \(\mathcal{F}=\{\emptyset,\,A,\,A^c,\,\Omega\}\) es un \(\sigma\)-álgebra. Es fácil ver que este conjunto cumple con todos los postulados de un \(\sigma\)-álgebra, como por ejemplo
\[
(A^c)^c=A\in\mathcal{F},\qquad A\cap A^c=\emptyset\in\mathcal{F},\qquad A\cap \Omega=A\in\mathcal{F},\qquad A\cap A^c\cap\Omega=\emptyset\in\mathcal{F},
\]
y así sucesivamente.
\item \emph{El \(sigma\)-álgebra contable/co-contable}. Se entiende por conjunto \emph{contable} aquel de cardinalidad finita o cardinalidad infinita pero numerable. Un ejemplo es el conjunto \(\mathbb{N}\) de los números naturales. El conjunto \(\mathbb{Q}\) de los números racionales también es contable, aunque esta afirmación es menos intuitiva.
Sea \(\Omega\) un espacio muestral no contable, y se considera la familia
\[
\mathcal{F}=\{A\subseteq\Omega:\,A\textrm{ es contable}\}\cup\{A\subseteq\Omega:\,A^c\textrm{ es contable}\}.
\]
Por ejemplo, si \(\Omega=\mathbb{R}\), \(\mathcal{F}\) consiste en los subconjuntos de \(\mathbb{R}\) que son contables o tienen complemento contable. \(\mathcal{F}\) es un \(\sigma\)-álgebra, ya que
\begin{enumerate}[(I)]
\item \(\Omega\in\mathcal{F}\), ya que \(\Omega^c=\emptyset\) es contable por tener cero elementos.
\item \(A\in\mathcal{F}\) implica que \(A^c\in\mathcal{F}\). Efectivamente, si \(A\in\mathcal{F}\) significa que \(A\) o \(A^c\) es contable. Por lo tanto, \(A^c\in\mathcal{F}\) ya que \(A^c\) o \(\left(A^c\right)^c=A\) es contable.
\item Si \(\{A_n\}_{n=1}^{\infty}\in\mathcal{F}\), se cumple que \(\bigcap_{n=1}^{\infty}A_n\in\mathcal{F}\). Para verificar esto, hay que considerar dos casos
\begin{enumerate}[(a)]
\item si al menos un \(A_n\) es contable, \(\bigcap_{n=1}^{\infty}A_n\) es contable y por lo tanto está en \(\mathcal{F}\).
\item si ningún \(A_n\) es contable, \(A_n^c\) es contable para todo \(n\), y por lo tanto \(\bigcup_{n=1}^{\infty}A_n^c\) es contable. Como
\[
\left(\bigcap_{n=1}^{\infty}A_n\right)^c=\bigcup_{n=1}^{\infty}A_n^c\quad\textrm{es contable},
\]
se concluye que \(\bigcap_{n=1}^{\infty}A_n\in\mathcal{F}\), ya que su complemento es contable.
\end{enumerate}
\end{enumerate}
\end{enumerate}
\section{Espacios de probabilidad}
\subsection{Espacio medible}
Se llama \emph{espacio medible} al par \((\Omega,\,\mathcal{F})\) que consiste en un conjunto \(\Omega\) y en un \(\sigma\)-álgebra \(\mathcal{F}\) de subconjuntos (eventos) de \(\Omega\). El nombre proviene de que se trata de un espacio que está listo para asignarle una medida. Cuando a cada elemento de \(\mathcal{F}\) se le asigna una medida de probabilidad \(P\), se construye un \emph{espacio de probabilidad}.
\subsection{Espacio de probabilidad}\label{sec:probability_space}
Un espacio de probabilidad es el triplete \((\Omega,\,\mathcal{F},\,P)\), donde \(\Omega\) es el espacio muestral de cierto experimento, \(\mathcal{F}\) es un \(\sigma\)-álgebra de subconjuntos de \(\Omega\) y \(P\) es una medida de probabilidad con dominio \(\mathcal{F}\) y rango \([0,\,1]\), es decir,
\[
P\,:\,\mathcal{F}\to \mathbb{R},
\]
que cumple las siguientes propiedades:
\begin{enumerate}[(I)]
\item Para cada evento \(A\in\mathcal{F}\), \(P(A)>0\).
\item \(P\) es \emph{contable aditiva}: si \(\{A_n\}_{n=1}^{\infty}\) es una secuencia de eventos disjuntos en \(\mathcal{F}\), se cumple que
\begin{equation}\label{eq:probability_measure_countably_additive}
P\left(\bigcup_{n=1}^{\infty}A_n\right)=\sum_{n=1}^{\infty}P(A_n).
\end{equation}
Esta propiedad también se llama \(\sigma\)-aditiva.
\item \(P(\Omega)=1\).
\end{enumerate}
Algunas consecuencias de la definición de medida de probabilidad \(P\) son las siguientes:
\begin{enumerate}
\item Se cumple que
\begin{equation}\label{complement_probability}
P(A^c)=1-P(A),
\end{equation}
ya que,
\[
1\overset{\textrm{(III)}}{=}P(\Omega)=P(A\cup A^c)\overset{\textrm{(II)}}{=}P(A)+P(A^c).
\]
\item Se cumple que
\[
P(\emptyset)=0,
\]
ya que \(P(\emptyset)=P(\Omega^c)=1-P(\Omega)=1-1=0\).
\item Para dos eventos \(A,\,B\) cualesquiera, se cumple que\footnote{De aquí en mas, se empleará la notación \(AB\) para indicar \(A\cap B\).}
\begin{equation}\label{eq:events_union}
P(A\cup B) = P(A)+P(B)-P(AB).
\end{equation}
Para demostrarlo, se observa que
\begin{align*}
P(A\cup B)&\overset{(a)}{=}P(AB^c\cup BA^c\cup AB)\\
&\overset{(b)}{=}P(AB^c)+P(BA^c)+P(AB)\\
&\overset{(c)}{=}P(A)-P(AB)+P(B)-P(AB)+P(AB)\\
&=P(A)+P(B)-P(AB),
\end{align*}
donde la identidad \((a)\) se observa en el diagrama de Venn de la figura \ref{fig:sets_union_probability}, en \((b)\) se usó que \(AB^c\), \(BA^c\) y \(AB\) son disjuntos, como se aprecia también en la figura \ref{fig:sets_union_probability} y en \((c)\) se sustituyó \(P(AB^c)\) y \(P(BA^c)\) a partir de las siguientes identidades,
\begin{equation}\label{eq:events_union_tmp}
\begin{aligned}
P(A)&=P(AB^c)+P(AB)\\
P(B)&=P(BA^c)+P(AB),
\end{aligned}
\end{equation}
que provienen de notar por ejemplo que \(A=(AB^c)\cup(AB)\) y demás que los conjuntos \(AB^c\) y \(AB\) son disjuntos.
\begin{figure}[!htb]
\begin{minipage}[c]{0.37\textwidth}
\includegraphics[width=\textwidth]{figuras/sets_union_probability.pdf}
\end{minipage}\hfill
\begin{minipage}[c]{0.53\textwidth}
\caption{
Diagrama de Venn con los eventos \(A\) y \(B\). Se observa que se cumple que \(A\cup B=AB^c\cup BA^c\cup AB\), donde los eventos \(AB^c\), \(BA^c\) y \(AB\) son disjuntos.
} \label{fig:sets_union_probability}
\end{minipage}
\end{figure}
\item \emph{Principio de inclusión-exclusión}: si \(A_1,\,\dots,\,A_n\) son eventos, se cumple que
\begingroup
\addtolength{\jot}{1em}
\begin{equation}\label{eq:inclusion_exclusion_principle}
\begin{aligned}
P\left(\bigcup_{i=1}^nA_i\right)&=\sum_{i=1}^nP(A_i)-\sum_{1\leq i_1 < i_2\leq n}P(A_{i_1}A_{i_2})+\sum_{1\leq i_1 < i_2 < i_3\leq n}P(A_{i_1}A_{i_2}A_{i_3})+\cdots\\
&\qquad+(-1)^{n-1}\sum_{1\leq i_1 <\dots< i_{n-1}\leq n}P(A_{i_1}\cdots A_{i_{n-1}})+(-1)^nP(A_1\cdots A_n).
\end{aligned}
\end{equation}
\endgroup
El principio puede demostrarse por inducción. Ya se demostró que se cumple para \(n=2\), dado por la ecuación \ref{eq:events_union}. Asumiendo que se cumple para \(n\), como en la ecuación \ref{eq:inclusion_exclusion_principle}, hay que demostrar que se cumple para \(n+1\). Desarrollando el lado izquierdo para \(n+1\), se tiene que
\begin{align}\label{eq:inclusion_exclusion_principle_tmp}
P(A_1\cup\dots\cup A_n\cup A_{n+1})&\overset{(a)}{=}P[(A_1\cup\dots\cup A_n)\cup A_{n+1}]\nonumber\\
&\overset{(b)}{=}P(A_1\cup\dots\cup A_n)+P(A_{n+1})-P[(A_1\cup\dots\cup A_n)\cap A_{n+1}]\nonumber\\
&\overset{(c)}{=}P(A_1\cup\dots\cup A_n)+P(A_{n+1})-P[(A_1\cap A_{n+1})\cup\dots\cup(A_n\cap A_{n+1})],
\end{align}
donde en \((a)\) se empleó la propiedad asociativa de la operación de unión, en \((b)\) se empleó el principio de inclusión-exclusión para \(n=2\) y en \((c)\) la propiedad distributiva de la operación de intersección. El primer y tercer sumando consisten en probabilidades de \(n\) uniones, y por hipótesis se cumple el principio de inclusión-exclusión, que para el primer sumando está dado por la ecuación \ref{eq:inclusion_exclusion_principle} y para el tercer sumando es
\begingroup
\addtolength{\jot}{1em}
\begin{equation*}
\begin{aligned}
P\left(\bigcup_{i=1}^{n}A_{i}A_{n+1}\right)&=\sum_{i=1}^nP(A_iA_{n+1})-\sum_{1\leq i_1 < i_2\leq n}P(A_{i_1}A_{i_2}A_{n+1})+\cdots\\
&\qquad+(-1)^{n-1}\sum_{1\leq i_1 <\dots< i_{n-1}\leq n}P(A_{i_1}\cdots A_{i_{n-1}}A_{n+1})+(-1)^nP(A_1\cdots A_nA_{n+1}).
\end{aligned}
\end{equation*}
\endgroup
Sustituyendo esos resultados en la ecuación \ref{eq:inclusion_exclusion_principle_tmp}, se obtiene que
\begingroup
\addtolength{\jot}{1em}
\begin{equation*}
\begin{aligned}
P\left(\bigcup_{i=1}^{n+1}A_{i}\right)&=\Bigg[\sum_{i=1}^nP(A_i)-\sum_{1\leq i_1 < i_2\leq n}P(A_{i_1}A_{i_2})+\sum_{1\leq i_1 < i_2 < i_3\leq n}P(A_{i_1}A_{i_2}A_{i_3})+\cdots\\
&\qquad+(-1)^nP(A_1\cdots A_n)\Bigg]\\
&\qquad+ P(A_{n+1})\\
&\qquad-\Bigg[\sum_{i=1}^nP(A_iA_{n+1})-\sum_{1\leq i_1 < i_2\leq n}P(A_{i_1}A_{i_2}A_{n+1})+\cdots\\
&\qquad+(-1)^{n-1}\sum_{1\leq i_1 <\dots< i_{n-1}\leq n}P(A_{i_1}\cdots A_{i_{n-1}}A_{n+1})+(-1)^nP(A_1\cdots A_nA_{n+1})\Bigg].
\end{aligned}
\end{equation*}
\endgroup
y reordenando los sumandos, la expresión puede escribirse como
\begingroup
\addtolength{\jot}{1em}
\begin{equation}\label{eq:inclusion_exclusion_principle_tmp1}
\begin{aligned}
P\left(\bigcup_{i=1}^{n+1}A_{i}\right)&=\left[\sum_{i=1}^nP(A_i)+ P(A_{n+1})\right]
-\left[\sum_{1\leq i_1 < i_2\leq n}P(A_{i_1}A_{i_2})+\sum_{i=1}^nP(A_iA_{n+1})\right]\\
&\qquad+\left[\sum_{1\leq i_1 < i_2 < i_3\leq n}P(A_{i_1}A_{i_2}A_{i_3})+\sum_{1\leq i_1 < i_2\leq n}P(A_{i_1}A_{i_2}A_{n+1})\right]+\cdots\\
&\qquad+(-1)^n\left[P(A_1\cdots A_n)+\sum_{1\leq i_1 <\dots< i_{n-1}\leq n}P(A_{i_1}\cdots A_{i_{n-1}}A_{n+1})\right]\\
&\qquad +(-1)^{n+1}P(A_1\cdots A_nA_{n+1}).
\end{aligned}
\end{equation}
\endgroup
El paso siguiente, es notar que cada sumando entre paréntesis rectos puede agruparse en una sola sumatoria. Por ejemplo, los sumandos de la sumatoria en la penúltima expresión entre paréntesis rectos son las \(\binom{n}{n-1}=n\) probabilidades de los productos de los siguientes \(n\) factores
\[\arraycolsep=2pt\def\arraystretch{1.2}
\begin{array}{cccccccc}
A_1&A_2&A_3&\cdots&A_{n-2}&A_{n-1}&\TikCircle&A_{n+1}\\
A_1&A_2&A_3&\cdots&A_{n-2}&\TikCircle&A_n&A_{n+1}\\
A_1&A_2&A_3&\cdots&\TikCircle&A_{n-1}&A_n&A_{n+1}\\
\vdots& \vdots &\vdots & \iddots &\vdots& \vdots &\vdots &\vdots \\
A_1& A_2 &\TikCircle&\cdots& A_{n-2}&A_{n-1}&A_n&A_{n+1}\\
A_1&\TikCircle&A_3&\cdots&A_{n-2}&A_{n-1}&A_n&A_{n+1}\\
\TikCircle & A_2 &A_3&\cdots&A_{n-2}&A_{n-1}&A_n&A_{n+1},
\end{array}
\]
y al sumar el término \(P(A_1\cdots A_n)\), se obtiene la suma de las \(n+1\) probabilidades de los productos de \(n\) factores
\[\arraycolsep=2pt\def\arraystretch{1.2}
\begin{array}{cccccccc}
A_1&A_2&A_3&\cdots&A_{n-2}&A_{n-1}&A_n&\TikCircle\\
A_1&A_2&A_3&\cdots&A_{n-2}&A_{n-1}&\TikCircle&A_{n+1}\\
A_1&A_2&A_3&\cdots&A_{n-2}&\TikCircle&A_n&A_{n+1}\\
A_1&A_2&A_3&\cdots&\TikCircle&A_{n-1}&A_n&A_{n+1}\\
\vdots& \vdots &\vdots & \iddots &\vdots& \vdots &\vdots &\vdots \\
A_1& A_2 &\TikCircle&\cdots& A_{n-2}&A_{n-1}&A_n&A_{n+1}\\
A_1&\TikCircle&A_3&\cdots&A_{n-2}&A_{n-1}&A_n&A_{n+1}\\
\TikCircle & A_2 &A_3&\cdots&A_{n-2}&A_{n-1}&A_n&A_{n+1},
\end{array}
\]
expresión que se puede escribir como
\[
\sum_{1\leq i_1 <\dots< i_{n}\leq n+1}P(A_{i_1}\cdots A_{i_{n}}).
\]
Generalizando este razonamiento para todos los sumandos entre paréntesis rectos de la ecuación \ref{eq:inclusion_exclusion_principle_tmp1}, se obtiene que
\begingroup
\addtolength{\jot}{1em}
\begin{equation*}
\begin{aligned}
P\left(\bigcup_{i=1}^{n+1}A_{i}\right)&=\sum_{i=1}^{n+1}P(A_i)
-\sum_{1\leq i_1 < i_2\leq n+1}P(A_{i_1}A_{i_2})
+\sum_{1\leq i_1 < i_2 < i_3\leq n+1}P(A_{i_1}A_{i_2}A_{i_3})+\cdots\\
&\qquad+(-1)^n\sum_{1\leq i_1 <\dots< i_{n}\leq n+1}P(A_{i_1}\cdots A_{i_{n}})\\
&\qquad+(-1)^{n+1}P(A_1\cdots A_{n+1}),
\end{aligned}
\end{equation*}
\endgroup
con lo que queda demostrado el paso inductivo.
\item \emph{Propiedad de monotonía}. La medida de probabilidad \(P\) es no decreciente: dados dos eventos \(A\) y \(B\), se cumple que
\begin{equation}\label{eq:probability_monotony_property}
\textrm{si } A\subset B\qquad \Rightarrow\qquad P(A)\leq P(B).
\end{equation}
Efectivamente, como \(B=A\cup(B\setminus A)\) y los conjuntos \(A\) y \(B\setminus A\) son disjuntos, se cumple que
\[
P(B)=P(A)+P(B\setminus A)\geq P(A).
\]
\item \emph{Desigualdad de Boole}. La medida de probabilidad \(P\) es contable sub-aditiva: para eventos cualesquiera \(A_n\), \(n\geq 1\), se cumple que
\begin{equation}\label{eq:boole_inequality}
P\left(\bigcup_{n=1}^{\infty}A_n\right)\leq\sum_{n=1}^{\infty}P(A_n).
\end{equation}
Para demostrarlo, considérese la secuencia de eventos
\[
B_1=A_1,\quad B_2=A_2\setminus A_1,\quad B_3=A_3\setminus(A_1\cup A_2),\dots,\quad B_n=A_n\setminus\left(\bigcup_{k=1}^{n-1}A_k\right),\dots
\]
Los eventos \(B_n\) son disjuntos, su unión es igual a la unión de los eventos \(A_n\) y además \(B_n\subseteq A_n\). Por lo tanto, se cumple que
\[
P\left(\bigcup_{n=1}^{\infty}A_n\right)=P\left(\bigcup_{n=1}^{\infty}B_n\right)=\sum_{n=1}^{\infty}P(B_n)\leq \sum_{n=1}^{\infty}P(A_n).
\]
\end{enumerate}
\subsubsection{Espacios contables}
Si el espacio muestral \(\Omega\) tiene un número finito \(N\) de resultados posibles, la probabilidad de todos los eventos puede ser expresada en términos de las probabilidades
\[
P\{\zeta_i\}=p_i
\]
de los resultados elementales \(\{\zeta_i\}\). Debido a las propiedades de la medida de probabilidad, los valores \(p_i\) deben ser no-negativos y su suma debe valer 1,
\[
p_i\geq 0,\qquad p_1+\dots+p_N=1.
\]
Considérese el caso en que el evento \(A\) consiste en \(r\) resultados elementales \(\zeta_{k_i}\), \(i=1,\dots,\,r\). Como \(A\) puede expresarse como la unión de los resultados elementales \(\{\zeta_{k_i}\}\), se cumple que
\[
P(A)=P\{\zeta_{k_1}\}+\dots+P\{\zeta_{k_r}\}=p_{k_1}+\dots+p_{k_r}.
\]
Por la propiedad contable aditiva de la medida de probabilidad (ecuación \ref{eq:probability_measure_countably_additive}), esto también es cierto en el caso en que \(\Omega\) consiste en una cantidad infinita pero contable de resultados elementales.
\paragraph{Ejemplo} El siguiente ejemplo (ejemplo 2.8 de \cite{papoulis2002probability}) muestra como es posible determinar las probabilidades de eventos complejos expresándolos como la unión de eventos mas simples mutuamente excluyentes.
Una urna contiene \(m\) bolas blancas y \(n\) bolas negras. Se extrae aleatoriamente una bola por vez sin reposición. Se quiere calcular la probabilidad de extraer alguna bola blanca antes de la \(k\)-ésima extracción (inclusive).
Denótese como \(W_k\) al evento
\[
W_k=\{\textrm{una bola blaca es extraída antes de la }k\textrm{-ésima extracción}\}.
\]
Notar que el complemento del evento \(W_k\) es la extracción de \(k\) bolas negras en las \(k\) extracciones. El evento \(W_k\) puede ocurrir de las siguientes formas mutuamente excluyentes: se extre una bola blanca en la primera extracción, o se extrae una bola negra seguida de una bola blanca, o se extraen dos bolas negras seguidas de una bola blanca, y así sucesivamente hasta la extracción de \(k-1\) bolas negras seguida de una bola blanca. Sea el evento
\[
X_i=\{\textrm{se extraen }i\textrm{ bolas negras seguidas de una bola blanca}\},\qquad i=0,\,1,\dots,\,n.
\]
De esta forma,
\[
W_k = X_0\cup X_1\cup.\dots\cup X_{k-1},
\]
y como los eventos \(X_i\) son mutuamente excluyentes, se cumple que
\[
P(W_k)=\sum_{i=0}^{k-1}P(X_i).
\]
Observando que
\begin{align*}
P(X_0)&=\frac{m}{m+n}\\
P(X_1)&=\frac{n}{m+n}\cdot\frac{m}{m+n-1}\\
P(X_2)&=\frac{n}{m+n}\cdot\frac{n-1}{m+n-1}\cdot\frac{m}{m+n-2}\\
%P(X_3)&=\frac{n}{m+n}\cdot\frac{n-1}{m+n-1}\cdot\frac{n-2}{m+n-2}\cdot\frac{m}{m+n-3}\\
\vdots \quad& \\
P(X_i)&=\frac{n}{m+n}\cdot\frac{n-1}{m+n-1}\cdots\frac{n-(i-1)}{m+n-(i-1)}\cdot\frac{m}{m+n-i}\\
\vdots \quad& \\
P(X_{k-1})&=\frac{n}{m+n}\cdot\frac{n-1}{m+n-1}\cdots\frac{n-(k-2)}{m+n-(k-2)}\cdot\frac{m}{m+n-(k-1)},
\end{align*}
y sumando se obtiene que
\begin{equation}\label{eq:example_2-8_result}
\begin{aligned}
P(W_k) = \frac{m}{m+n}\bigg\{1&+\frac{n}{m+n-1}+\frac{n[n-1]}{[m+n-1][m+n-2]}+\cdots\\
&+\frac{n[n-1]\cdots[n-(k-2)]}{[m+n-1][m+n-2]\cdots[m+n-(k-1)]}\bigg\},
\end{aligned}
\end{equation}
que es el resultado que se buscaba.
Es interesante notar que en la extracción \(n+1\), se debe haber extraído al menos una bola blanca, por lo que
\[
P(W_{n+1})=1.
\]
Sustituyendo este resultado en la ecuación \ref{eq:example_2-8_result}, es decir, evaluando en \(k=n+1\) e igualando a 1, se obtiene la siguiente interesante identidad:
\[
1+\frac{n}{m+n-1}+\frac{n(n-1)}{(m+n-1)(m+n-2)}+\cdots+\frac{n(n-1)\cdots2\cdot1}{(m+n-1)(m+n-2)\cdots(m+1)m}=\frac{m+n}{m}.
\]
También vale la pena observar que, como se mencionó previamente, el evento
\[
Y_k=\{\textrm{se extraen }k\textrm{ bolas negras en }k\textrm{ extracciones}\}
\]
es el complemento del evento \(W_k\), y por lo tanto,
\[
P(W_k)=1-P(Y_k).
\]
Como \(Y_k\) ocurre cuando se extrae una bola negra en la primer extracción, y se extrae una bola negra en la segunda extracción y así sucesivamente hasta la \(k\)-ésima extracción, se tiene que
\[
P(Y_k)=\frac{n}{m+n}\cdot\frac{n-1}{m+n-1}\cdots\frac{n-(k-1)}{m+n-(k-1)},
\]
y por lo tanto,
\[
P(W_k)=1-\frac{n(n-1)\cdots(n-k+1)}{(n+m)(n+m-1)\cdots(n+m-k+1)}.
\]
Esta expresión es equivalente a la de la ecuación \ref{eq:example_2-8_result}.
\subsubsection{Espacios no contables. El eje real.}
Si el espacio muestral \(\Omega\) consiste en una cantidad infinita no contable de elementos, la probabilidad de los eventos no puede expresarse en función de la probabilidad de los resultados elementales.
Considérese que \(\Omega\) es el conjunto de todos los números reales. Sus subconjuntos son conjuntos arbitrarios de puntos en el eje real. Puede demostrarse que no es posible asignar probabilidades a todos los subconjuntos de \(\Omega\) de forma de satisfacer las propiedades de una medida de probabilidad.
Para construir una medida de probabilidad sobre el eje real, se considerarán como eventos todos los intervalos \(x_1\leq x\leq x_2\), y sus uniones e intersecciones contables. Puede demostrarse que estos eventos forman un \(\sigma\)-álgebra de eventos. Este \(\sigma\)-álgebra incluye todas las semirrectas \(x\leq x_i\), donde \(x_i\) es cualquier número real. También contiene todos los intervalos abiertos y cerrados, todos los puntos individuales del eje real, y en general, todos los conjuntos de puntos de interés práctico en las aplicaciones. Sin embargo, es posible demostrar que existen conjuntos de puntos en el eje real que no son uniones e intersecciones contables de intervalos, y por lo tanto, el \(\sigma\)-álgebra generado por intervalos no contiene todos los subconjuntos de \(\Omega\).
Para obtener una especificación completa de un espacio de probabilidad sobre el eje real, alcanza con asignar probabilidades a los eventos \(\{x\leq x_i\}\). El resto de las probabilidades surgen de las propiedades de la medida de probabilidad. Supóngase que \(\alpha(x)\) es una función que cumple que
\[
\int_{-\infty}^{\infty}\alpha(x)dx=1,\qquad \alpha(x)\geq 0.
\]
Se define la probabilidad del evento \(\{x\leq x_i\}\) como
\[
P\{x\leq x_i\}=\int_{-\infty}^{x_i}\alpha(x)dx.
\]
De esta forma, quedan especificadas todas las probabilidades del espacio de probabilidad. Por ejemplo, para obtener la probabilidad del evento \(\{x_1<x\leq x_2\}\), se observa que
\[
\{x\leq x_1\}\cup\{x_1<x\leq x_2\}=\{x\leq x_2\},
\]
donde los eventos \(\{x\leq x_1\}\) y \(\{x_1<x\leq x_2\}\) son mutuamente excluyentes. Por lo tanto, se cumple que
\[
P\{x\leq x_1\}+P\{x_1<x\leq x_2\}=P\{x\leq x_2\}.
\]
De esta forma,
\begin{align*}
P\{x_1<x\leq x_2\}&=P\{x\leq x_2\}-P\{x\leq x_1\}\\
&=\int_{-\infty}^{x_2}\alpha(x)dx-\int_{-\infty}^{x_1}\alpha(x)dx\\
&=\int_{x_1}^{x_2}\alpha(x)dx,
\end{align*}
quedando definida la probabilidad del evento \(\{x_1<x\leq x_2\}\) como
\begin{equation}\label{eq:interval_probability_real_line_space}
P\{x_1<x\leq x_2\}=\int_{x_1}^{x_2}\alpha(x)dx.
\end{equation}
Se observa además que si la función \(\alpha(x)\) es acotada, la integral \ref{eq:interval_probability_real_line_space} tiende a 0 cuando \(x_1\to x_2\). Esto conduce a la conclusión de que la probabilidad del resultado elemental \(\{x_2\}\) es nula para todo \(x_2\) en el eje real. La probabilidad de cada resultado elemental de \(\Omega\) es 0, a pesar de que la probabilidad de su unión es 1. Esto no entra en conflicto con la propiedad contable aditiva de la medida de probabilidad dada por la ecuación \ref{eq:probability_measure_countably_additive}, ya que la cantidad de elementos de \(\Omega\) no es contable.
\subsection{Continuidad de la medida de probabilidad}\label{sec:probability_measure_continuity}
Se presentan a continuación los teoremas vinculados a la \emph{continuidad} de la función de probabilidad. La medida de probabilidad es una función continua en el sentido de que si una secuencia de eventos \(\{A_n\}_{n=1}^{\infty}\) tiene límite, se cumple que \(P(\lim A_n)=\lim P(A_n)\). Se comenzará demostrando una versión mas liviana de este teorema para el caso particular de secuencias crecientes y decrecientes.
\paragraph{Teorema} \emph{Continuidad para secuencias crecientes}: sea \(\{A_n\}_{n=1}^{\infty}\) una secuencia creciente de eventos, entonces se cumple que
\[
P\left(\lim_n A_n\right)=\lim_n P\left(A_n\right).
\]
Además, como \(P(A_n)\) es una función creciente, se cumple que
\[
P(A_n)\nearrow\lim_n P(A_n).
\]
\paragraph{Demostración} Como se vio en la sección \ref{sec:monotone_sequences}, el limite de una secuencia creciente existe y está dado por
\[
\lim_n A_n=\bigcup_{k=1}^{\infty}A_k.
\]
Notar que por ser una secuencia creciente, para cualquier \(n\) se cumple que
\[
\bigcup_{k=1}^{n}A_k=A_n\qquad\Rightarrow\qquad P\left(\bigcup_{k=1}^{n}A_k\right)=P(A_n).
\]
Para demostrar el teorema, se define la secuencia de eventos disjuntos
\[
B_1=A_1,\quad B_2=A_2\setminus A_1,\dots,\quad B_n=A_n\setminus A_{n-1},\dots
\]
Notar que se cumple que
\[
\bigcup_{k=1}^{n}B_k=\bigcup_{k=1}^{n}A_k=A_n,
\]
y por lo tanto,
\[
\bigcup_{k=1}^{\infty}B_k=\bigcup_{k=1}^{\infty}A_k.
\]
De esta forma,
\begin{align*}
P\left(\lim_n A_n\right)&=P\left(\bigcup_{k=1}^{\infty}A_k\right)\\
&=P\left(\bigcup_{k=1}^{\infty}B_k\right)\\
&\overset{(a)}{=}\sum_{k=1}^{\infty}P(B_k)\\
&=\lim_n\sum_{k=1}^{n}P(B_k)\\
&\overset{(b)}{=}\lim_n P\left(\bigcup_{k=1}^{n}B_k\right)\\
&=\lim_n P(A_n),
\end{align*}
donde en \((a)\) y \((b)\) se empleó la propiedad contable aditiva de \(P\) para eventos disjuntos.
\paragraph{Teorema} \emph{Continuidad para secuencias decrecientes}: sea \(\{A_n\}_{n=1}^{\infty}\) una secuencia decreciente de eventos, entonces se cumple que
\[
P\left(\lim_n A_n\right)=\lim_n P\left(A_n\right).
\]
Además, como \(P(A_n)\) es una función decreciente, se cumple que
\[
P(A_n)\searrow\lim_n P(A_n).
\]
\paragraph{Demostración} Como la sucesión \(\{A_n\}_{n=1}^{\infty}\) es decreciente, la sucesión \(\{A_n^c\}_{n=1}^{\infty}\) es creciente. Por lo tanto,
\begin{align*}
P\left(\lim_n A_n\right)&\overset{(a)}{=}P\left(\bigcap_{k=1}^{\infty}A_k\right)\\
&\overset{(b)}{=}1-P\left[\left(\bigcap_{k=1}^{\infty}A_k\right)^c\right]\\
&\overset{(c)}{=}1-P\left(\bigcup_{k=1}^{\infty}A_k^c\right)\\
&\overset{(d)}{=}1-P\left(\lim_n A_n^c\right)\\
&\overset{(e)}{=}1-\lim_n P\left(A_n^c\right)\\
&\overset{(f)}{=}1-\lim_n\left[1-P(A_n)\right]\\
&=\lim_n P(A_n),
\end{align*}
donde en \((a)\) se consideró que \(A_n\) es decreciente por lo que el límite existe y está dado por la ecuación \ref{eq:decreasing_sequence_limit}, en \((b)\) y en \((f)\) se empleó la propiedad \ref{complement_probability} de la medida de probabilidad, en \((c)\) se aplicaron leyes de Morgan, en \((d)\) se empleó que \(A_n^c\) es creciente y el límite está dado por la ecuación \ref{eq:increasing_sequence_limit}, y en \((e)\) se aplicó el resultado del teorema anterior de la continuidad de la función de probabilidad para secuencias crecientes.
\paragraph{Lema} \emph{Lema de Fatou}: sea \(\{A_n\}_{n=1}^{\infty}\) una secuencia arbitraria de eventos, entonces se cumple que
\begin{equation}\label{eq:fatou_lemma}
P\left(\liminf_n A_n\right)\leq\liminf_n P\left(A_n\right).
\end{equation}
\paragraph{Demostración} Recordar que
\[
\liminf_n A_n = \bigcup_{n=1}^{\infty }\bigcap_{k=n}^{\infty }A_k = \bigcup_{n=1}^{\infty}G_n,
\]
donde se definió la secuencia creciente \(G_n=\bigcap_{k=n}^{\infty }A_k\), es el conjunto de resultados que ocurren ``eventualmente siempre''. Por lo tanto,
\begin{align}\label{eq:fatou_lemma_tmp}
\lim_n P\left(G_n\right)&\overset{(a)}{=}P\left(\lim_n G_n\right)\nonumber\\
&\overset{(b)}{=}P\left(\bigcup_{n=1}^{\infty } G_n\right)\nonumber\\
&=P\left(\bigcup_{n=1}^{\infty } \bigcap_{k=n}^{\infty }A_k\right)\nonumber\\
&=P\left(\liminf_n A_n\right),
\end{align}
donde en \((a)\) se empleó la continuidad de la función de probabilidad para secuencias crecientes y en \((b)\) se empleó que el límite de secuencias crecientes existe y está dado por la ecuación \ref{eq:increasing_sequence_limit}. Por otro lado, se tiene que como \(G_n=\bigcap_{k=n}^{\infty }A_k\), se cumple que
\[
P(G_n)\leq \inf_{k\geq n} P(A_k),
\]
y tomando el límite cuando \(n\to\infty\), se tiene que
\[
\lim_n P(G_n)\leq \lim_n\left[\inf_{k\geq n} P(A_k)\right].
\]
Como se vio previamente en la ecuación \ref{eq:fatou_lemma_tmp}, el lado izquierdo de la desigualdad converge a \(P\left(\liminf_n A_n\right)\), y el lado derecho converge a \(\liminf_n P(A_n)\), resultando en \ref{eq:fatou_lemma}, que es lo que se quería demostrar.
\paragraph{Lema} \emph{Lema de Fatou Reverso}: sea \(\{A_n\}_{n=1}^{\infty}\) una secuencia arbitraria de eventos, entonces se cumple que
\begin{equation}\label{eq:reverse_fatou_lemma}
\limsup_n P\left(A_n\right)\leq P\left(\limsup_n A_n\right)
\end{equation}
\paragraph{Demostración} La demostración en análoga a la del lema de Fatou. Recordar que
\[
\limsup_n A_n = \bigcap_{n=1}^{\infty }\bigcup_{k=n}^{\infty }A_k = \bigcap_{n=1}^{\infty}G_n,
\]
donde se definió la secuencia decreciente \(G_n=\bigcup_{k=n}^{\infty }A_k\), es el conjunto de resultados que ocurren ``infinitamente a menudo''. Por un lado, se tiene que
\begin{align}\label{eq:reverse_fatou_lemma_tmp}
\lim_n P\left(G_n\right)&\overset{(a)}{=}P\left(\lim_n G_n\right)\nonumber\\
&\overset{(b)}{=}P\left(\bigcap_{n=1}^{\infty } G_n\right)\nonumber\\
&=P\left(\bigcap_{n=1}^{\infty } \bigcup_{k=n}^{\infty }A_k\right)\nonumber\\
&=P\left(\limsup_n A_n\right),
\end{align}
donde en \((a)\) se empleó la continuidad de la función de probabilidad para secuencias decrecientes y en \((b)\) se empleó que el límite de secuencias decrecientes existe y está dado por la ecuación \ref{eq:decreasing_sequence_limit}. Por otro lado, se tiene que como \(G_n=\bigcup_{k=n}^{\infty }A_k\), se cumple que
\[
P(G_n)\geq \sup_{k\geq n} P(A_k),
\]
y tomando el límite cuando \(n\to\infty\), se tiene que
\[
\lim_n P(G_n)\geq \lim_n\left[\sup_{k\geq n} P(A_k)\right].
\]
Como se vio previamente en la ecuación \ref{eq:reverse_fatou_lemma_tmp}, el lado izquierdo de la desigualdad converge a \(P\left(\limsup_n A_n\right)\), y el lado derecho converge a \(\limsup_n P(A_n)\), resultando en \ref{eq:reverse_fatou_lemma}, que es lo que se quería demostrar.
Es necesario realizar una consideración sobre los lemas de Fatou. En la ecuación \ref{eq:fatou_lemma} por ejemplo, el \(\liminf_n\) del lado izquierdo de la desigualdad se aplica sobre la secuencia de eventos \(A_n\), mientras que el \(\liminf_n\) del lado derecho se aplica sobre la sucesión de números \(P(A_n)\). Tanto el límite inferior \(\liminf_n\) como el límite superior \(\limsup_n\) aplicados a secuencias de eventos, fueron definidos en la sección \ref{sec:events_sequences_limit}. La definición del límite inferior y el límite superior aplicados a la sucesión de números \(x_n\) son las siguientes:
\[
\liminf_{n\to\infty}x_n=\lim_{n\to\infty}\left(\inf_{k\geq n} x_k\right),\qquad
\limsup_{n\to\infty}x_n=\lim_{n\to\infty}\left(\sup_{k\geq n} x_k\right),
\]
como ya se sugirió en la demostración de los lemas de Fatou. La interpretación de el límite inferior y el límite superior aplicado a sucesiones numéricas, se ilustra en la figura \ref{fig:liminf_limsup}\footnote{Fuente: \url{https://en.wikipedia.org/wiki/Limit_superior_and_limit_inferior}}.
\begin{figure}[!htb]
\begin{center}
\includegraphics[width=0.8\columnwidth]{figuras/liminf_limsup.pdf}
\caption{\label{fig:liminf_limsup} Ilustración del límite inferior y el límite superior aplicado a la secuencia de números \(x_n\). La secuencia \(x_n\) se grafica en negro. La secuencia \(\sup_{k\geq n} x_k\) es una secuencia en \(n\), donde el valor que toma en \(n\) se obtiene como el máximo valor que toma \(x_k\) en \(k\geq n\). El límite superior \(\limsup_n x_n\) es el límite de la secuencia \(\sup_{k\geq n} x_k\) cuando \(n\to\infty\). Análogamente, \(\inf_{k\geq n} x_k\) es la secuencia que consiste en el mínimo de \(x_k\) para \(k\geq n\) para cada valor de \(n\), y el límite inferior \(\liminf_n x_n\) es el límite de dicha secuencia cuando \(n\to\infty\). El límite inferior y el límite superior coinciden si y solo si la secuencia converge.}
\end{center}
\end{figure}
Combinando el lema de Fatou y el lema de Fatou reverso, se obtienen las siguientes desigualdades:
\begin{equation}\label{eq:fatou_inequalities}
P\left(\liminf_n A_n\right)\leq\liminf_n P\left(A_n\right)\leq\limsup_n P\left(A_n\right)\leq P\left(\limsup_n A_n\right),
\end{equation}
donde la primera y ultima desigualdad son el lema de Fatou y el lema de Fatou reverso respectivamente, y la desigualdad del centro proviene de que para cualquier secuencia numérica \(x_n\), se cumple que
\[
\inf_{k\geq n}x_k\leq\sup_{k\geq n}x_k,\qquad\textrm{para todo }n.
\]
\paragraph{Ejemplo} Sea \(\Omega=\{0,\,1\}\), con medida de probabilidad \(P(\{0\})=1/3\) y \(P(\{1\})=2/3\). El \(\sigma\)-álgebra de eventos es en este caso \(\mathcal{F}=\{\emptyset,\,\{0\},\,\{1\},\,\Omega\}\) con probabilidades 0, 1/3, 2/3 y 1 respectivamente. Sea la secuencia de eventos
\[
A_n=
\left\{\begin{array}{ll}
\{0\}, & \textrm{si }n\textrm{ es par} \\
\{1\}, & \textrm{si }n\textrm{ es impar}
\end{array} \right..
\]
Se calculará \(P(\liminf_n A_n)\), \(P(\limsup_n A_n)\), \(\liminf_n P(A_n)\) y \(\limsup_n P(A_n)\). Considerando que
\[
\bigcup_{k=n}^{\infty }A_k=\{0,\,1\},\qquad \bigcap_{k=n}^{\infty}A_k=\emptyset,\qquad \forall n,
\]
se tiene que
\[
\limsup_n A_n=\bigcap_{n=1}^{\infty}\bigcup_{k=n}^{\infty}A_k=\bigcap_{n=1}^{\infty}\{0,\,1\}=\{0,\,1\}=\Omega,
\]
y
\[
\liminf_n A_n=\bigcup_{n=1}^{\infty}\bigcap_{k=n}^{\infty}A_k=\bigcup_{n=1}^{\infty}\emptyset=\emptyset.
\]
Por lo tanto,
\[
P\left(\limsup_{n\rightarrow \infty }A_n\right)=1,\qquad P\left(\liminf_{n\rightarrow \infty }A_n\right)=0.
\]
Además, como
\[
\sup_{k\geq n}P(A_k)=\frac{2}{3},\qquad \inf_{k\geq n}P(A_k)=\frac{1}{3},\qquad\forall n
\]
se tiene que
\[
\limsup_n P(A_n)=\frac{2}{3},\qquad \liminf_n P(A_n)=\frac{1}{3}.
\]
Notar que se cumplen las desigualdades de los lemas de Fatou dadas por la ecuación \ref{eq:fatou_inequalities}.
\paragraph{Teorema} \emph{Continuidad de la medida de probabilidad}: si una secuencia de eventos \(\{A_n\}_{n=1}^{\infty}\) tiene límite, entonces se cumple que
\begin{equation}\label{eq:probability_continuity}
P\left(\lim_n A_n\right) = \lim_n P\left(A_n\right).
\end{equation}
\paragraph{Demostración} Como la secuencia tiene límite, se cumple que (ver sección \ref{sec:events_sequences_limit})
\[
\lim_n A_n=\limsup_n A_n=\liminf_n A_n
\]
y por lo tanto,
\[
P\left(\lim_n A_n\right)=P\left(\limsup_n A_n\right)=P\left(\liminf_n A_n\right).
\]
Esto indica que las desigualdades de los lemas de Fatou de la ecuación \ref{eq:fatou_inequalities} deben ser igualdades, y por lo tanto
\[
\limsup_n P(A_n)=\liminf_n P(A_n)=\lim_n P(A_n),
\]
concluyendo la prueba.
Se presenta a continuación el lema de Borel-Cantelli, que es la herramienta básica para demostrar convergencia casi segura.
\paragraph{Lema} \emph{Lema de Borel-Cantelli}: sea \(\{A_n\}_{n=1}^{\infty}\) una secuencia de eventos tal que
\[
\sum_n P(A_n)<\infty.
\]
Entonces, se cumple que
\[
P\left(\limsup_n A_n\right) = P(\{A_n\,i.o.\})=0.
\]
Esto significa que el conjunto de elementos \(\omega\) del espacio muestral \(\Omega\) que pertenecen a una cantidad infinita de eventos \(A_1,\,A_2,\dots\) tiene probabilidad 0 en \(\Omega\).
\paragraph{Demostración} Se define la secuencia decreciente
\[
G_n=\bigcup_{k=n}^\infty A_k.
\]
Se cumple que
\[
P(G_n)\searrow P\left(\limsup_n A_n\right),
\]
ya que
\[
\lim_n P(G_n)\overset{(a)}{=}P\left(\lim_n G_n\right)
\overset{(b)}{=}P\left(\bigcap_{n=1}^\infty G_n\right)
=P\left(\bigcap_{n=1}^\infty \bigcup_{k=n}^\infty A_k\right)
=P\left(\limsup_n A_n\right),
\]
donde en \((a)\) se empleó la continuidad de la medida de probabilidad para secuencias decrecientes y en \((b)\) que el límite de una secuencia decreciente existe y está dado por la ecuación \ref{eq:decreasing_sequence_limit}. Por lo tanto, para todo \(m\) se cumple que
\[
P\left(\limsup_n A_n\right)\leq P(G_m)=P\left(\bigcup_{k=m}^\infty A_k\right)\leq\sum_{k=m}^\infty P(A_k)
\]
donde la última desigualdad proviene de la propiedad de sub-aditividad de la medida de probabilidad dada por la ecuación \ref{eq:boole_inequality}. Tomando \(m\to\infty\) y considerando que el lado derecho es la cola de una serie convergente y por lo tanto
\[
\lim_{m\to\infty}\sum_{k=m}^\infty P(A_k)=0,
\]
se concluye la prueba.
\paragraph{Ejemplo} \emph{Paradoja de Ross–Littlewood} \cite{ross2009first9th}: supongase que se dispone de una urna infinitamente grande y una colección de infinitas bolillas etiquetadas con los números 1, 2, 3, etcétera. Considérese que se realiza el siguiente experimento: al minuto 1 antes del mediodía, las bolillas numeradas del 1 al 10 se introducen en la urna, y la bolilla de número 10 se extrae (asúmase que la extracción consume tiempo 0). Luego, a 1/2 minuto antes del mediodía, se introducen las bolillas numeradas del 11 al 20 y se extrae la bolilla 20. A 1/4 de minuto antes del mediodía, se introducen las bolillas numeradas del 21 al 30 y se extrae la bolilla 30, y así sucesivamente.
Los tiempos en donde se ejecuta cada paso son así definidos para asegurar que una cantidad contable infinita de pasos se ejecutaron al mediodía. Una secuencia contable infinita de operaciones que se realizan en un tiempo finito se denomina \emph{supertarea}.
La pregunta de interés es cuantas bolillas hay en la urna al mediodía.
La respuesta a la pregunta claramente es que hay infinitas bolillas en la urna al mediodía, ya que toda bolilla cuyo número no sea de la forma \(10n\), para todo \(n\geq 1\), permanece en la urna.
Supóngase que ahora se modifica el experimento de la siguiente forma: al minuto 1 antes del mediodía, las bolillas numeradas del 1 al 10 se introducen en la urna, y la bolilla de número 1 se extrae. Luego, a 1/2 minuto antes del mediodía, se introducen las bolillas numeradas del 11 al 20 y se extrae la bolilla 2. A 1/4 de minuto antes del mediodía, se introducen las bolillas numeradas del 21 al 30 y se extrae la bolilla 3, y así sucesivamente. En este nuevo experimento, ¿cuantas bolillas hay en la urna al mediodía?
Tal vez sorprendentemente, la respuesta ahora es que la urna está vacía al mediodía. Efectivamente, considérese cualquier bolilla, la \(n\)-ésima por ejemplo. En algún momento previo al mediodía, esta bolilla será extraída. Concretamente, la bolilla \(n\) será extraída \((1/2)^{n-1}\) minutos antes del mediodía. Se concluye que para cada \(n\), la bolilla \(n\) no estará en la urna al mediodía, y por lo tanto, la urna estará vacía a esa hora.
Como se ve, la diferencia de los resultados de los experimentos proviene de la forma en que se extraen las bolillas. Se considera a continuación el caso en que cuando se extrae una bolilla, se hace de forma aleatoria entre las bolillas presentes en la urna. Es decir, 1 minuto antes del mediodía, se introducen las bolillas numeradas del 1 al 10 y se extrae una bolilla al azar, y así sucesivamente. En este caso, ¿cuantas bolillas hay en la urna al mediodía?
Considérese la bolilla etiquetada con el número 1, y defínase \(E_n\) al evento que consiste en que la bolilla 1 está aún en la urna luego de \(n\) extracciones. Se comenzará calculando \(P(E_n)\). Para esto, se define \(A_n\) como el evento que consiste que no se extrae la bolilla 1 en el paso \(n\). De esta forma,
\[
E_n=A_1\cap A_2\cap\dots\cap A_n,
\]
y como los eventos \(A_k\) son independientes (este concepto se verá mas adelante en el capítulo \ref{ch:repeated_trials}), se cumple que
\[
P(E_n)=P(A_1)\times P(A_2)\times\dots\times P(A_n)=\prod_{k=1}^nP(A_k).
\]
Para calcular \(P(A_k)\), se observa que en el paso \(k\)-ésimo luego de insertar las 10 bolillas y previo a la extracción hay \(10k-(k-1)=9k+1\) bolillas en la urna, ya que se insertaron 10 bolillas en cada paso hasta el paso \(k\)-ésimo y se sacó una en los \(k-1\) pasos previos. De esas \(9k+1\) bolillas, \(9k\) no son la bolilla 1. Por lo tanto, la probabilidad de no extraer la bolilla en el paso \(k\) es
\[
P(A_k)=\frac{9k}{9k+1},
\]
y por lo tanto,
\[
P(E_n)=\prod_{k=1}^n\frac{9k}{9k+1}.
\]
Si bien los conceptos para llegar a este resultado no se han desarrollado aún en estos apuntes, el mismo puede deducirse con técnicas simple de conteo y la noción frecuentista de la probabilidad.
Ahora, la probabilidad de que la bolilla 1 está aún en la urna al mediodía es
\[
P\{\textrm{bolilla 1 está en la urna al mediodía}\}=P\left(\lim_{n\to\infty} E_n\right).
\]
Para continuar con el razonamiento es necesario notar que la secuencia de eventos \(E_n\) es decreciente. Efectivamente, que la bolilla 1 esté en la urna en el paso \(n+1\) implica que esté en la urna en el paso \(n\), y por lo tanto,
\[