1.3. Аксіоматична побудова теорії ймовірностей
«Алгебра — інтелектуальний інструмент, який створений, щоб додати ясність кількісному аспекту Всесвіту.»
— А. Уайтхед
Одним із методів, які застосовуються при побудові математичної теорії, є аксіоматичний метод. Він передбачає, що основу математичної теорії утворюють деякі положення, що приймаються без доведення (аксіоми), а всі інші виводяться з цих аксіом шляхом доведення з використанням чисто логічних побудов. Першим застосував такий підхід старогрецький математик Евклід (близько 300 р. до н. е.). У подальшому реалізацією цього підходу стала евклідова (або елементарна) геометрія, хоча «Начала» Евкліда і не були достатньо послідовними з точки зору втілення аксіоматичного методу. Роль аксіоматичного підходу в науці була означена у книзі німецького математика Давида Гільберта (1862 – 1943) «Підстави геометрії». Саме Гільберт запропонував те поняття аксіоматичного методу, яке застосовується в науці і зараз, також побудував першу послідовну і повну систему аксіом для елементарної геометрії. Гільберт вважав, що аксіоматичний підхід можна поширити не тільки на елементарну геометрію, але і на арифметику, аналіз, теорію множин тощо.
Аксіоматичний підхід до побудови теорії ймовірностей було реалізовано одним з найвидатніших математиків ХХ сторіччя, радянським вченим Андрієм Миколайовичем Колмогоровим (1903 – 1987).
Додаткова інформація
Поняття ймовірності було відомо ще античним філософам, які розглядали прояв законів природи через безліч випадкових подій. Однак інтерес до неї як до прикладної дисципліни сформувався у cередні віки. Це пов’язано зі складанням таблиць смертності і питаннями страхування. Так, у Лондоні вже з 1592 року велися точні записи про смертність, а розвиток мореплавства призвів до необхідності оцінювати ризики, з якими стикаються купці при торгівлі з далекими країнами. На основі цих записів англійський учений, родоначальник науки демографії Джон Граунт (1620 — 1674) склав таблиці ймовірності смерті як функції віку. Одночасно в Голландії питаннями теорії ймовірностей і її застосування до демографічної статистики зайнялися Йоганн Худде і Ян де Вітт. Вони виконали аналогічні розрахунки і використовували їх для обчислення довічної ренти.
Формування теорії ймовірностей як науки відносять до середньовіччя. Чималий внесок у цей процес вніс італійський мислитель епохи Відродження, фізик і астроном, один із засновників сучасного експериментально-теоретичного природознавства Галілео Галілей (1564 – 1623). Найважливішою новацією Галілея в науці було його прагнення математизувати фізику, описувати навколишній світ не мовою якостей, як це було прийнято у фізиці Аристотеля, а мовою математики. Галілей писав: «Ніколи я не стану від зовнішніх тіл вимагати чогось іншого, ніж величина, фігура, кількість і більш-менш швидкі рухи для того, щоб пояснити виникнення відчуттів смаку, запаху і звуку. Я думаю, що якби ми усунули вуха, язики, носи, то залишилися б тільки фігури, числа, рухи, але не запахи, смаки і звуки, які, на мою думку, поза живою істотою є нічим іншим, як тільки порожньою думкою». Поява інтересу Галілея до поняття «ймовірність» була викликана таким спостереженням: під час гри трьома кістками десятка випадає частіше, ніж дев’ятка. Проаналізувавши ймовірність випадкових подій, Галілей прийшов до висновку, що три гральні кістки містять 27 різних сполучень чисел, що дають в сумі 10 очок, а кількість подібних сполучень для дев’яти — усього лише 25. При тому, що загальна кількість числових комбінацій для трьох кісток дорівнює 216. Відчуйте різницю: ймовірність отримати 10 становить \(\frac{27}{216}\), а отримати 9 становить \(\frac{25}{216}\). Який же треба було мати експериментальний досвід, щоб звернути увагу на цей факт.
Подальше застосування математичного аналізу до визначення ймовірностей випадкових подій пов’язане з ім’ям ще одного провідного математика і філософа Блеза Паскаля (1623 – 1662). До нього звернувся придворний французького короля Антуан Гомбо, відомий як Шевальє де Мере (1607 – 1648), який був азартним гравцем, з проханням визначити, скільки разів треба кинути дві гральні кістки, щоб випадків появи відразу двох шісток було більше половини від загальної кількості спроб. З цього приводу Паскаль звернувся до математика П’єра Ферма (1601 – 1665), і вони удвох встановили деякі вихідні положення теорії ймовірностей, зокрема прийшли до поняття математичного сподівання і формулювання теорем додавання і множення ймовірностей.
Саме азартні ігри подарували теорії ймовірностей такі прості і зрозумілі моделі, як гральні кості зокрема і азартні ігри взагалі. До речі, азартна гра (фр. jeu de hasard) перекладається буквально як «гра випадку». Цій темі присвячені такі роботи видатних вчених, як «Про розрахунки в азартних іграх» Крістіана Гюйгенса (1629 – 1695), «Мистецтво припущень» Якоба Бернуллі (1654 – 1705), «Досвід аналізу азартних ігор» П’єра де Монморта (1678 – 1719), «Про вимір випадковості, або про можливості результатів у азартних іграх» Абрахама де Муавра (1667 – 1754). Застосування навчальних моделей, побудованих на азартних іграх, дозволяють здійснювати випробування подумки, без проведення фізичного експерименту. Такі випробування називають уявними експериментами, і саме завдяки можливості здійснювати уявні експерименти і перевіряти їх результати на практиці сформувався математичний інструментарій теорії ймовірностей.На думку академіка А. М. Колмогорова теорію ймовірностей можна й необхідно було аксіоматизувати так, як це було зроблено стосовно геометрії. Це означає, що після того, як були введені основні означення і співвідношення між об’єктами, що досліджуються, а також сформульовані аксіоми, яким ці співвідношення повинні підпорядковуватись, усі подальші викладення базуються лише на цих аксіомах.
Слід зазначити, що аксіоматизацію теорії ймовірностей можна здійснювати різними способами відносно як вибору аксіом, так і вибору основних означень та основних відносин. Основним критерієм при виборі способу аксіоматизації є простота самої системи аксіом і простота подальшої побудови теорії. За цим критерієм застосування аксіоматики Колмогорова до побудови теорії ймовірностей на цей час є найбільш вдалим. За цією аксіоматикою Колмогоров у якості основних означень запропонував прийняти випадкову подію та її ймовірність. Спираючись на ці означення, Колмогоров запропонував наступну систему аксіом.
- Аксіома І (алгебра подій)
- Нехай \(\Omega\) – множина елементів \(\omega_{i}\), які є елементарними подіями, а \(F\) – множина підмножин з \(\Omega\). Елементами множини \(F\) є випадкові події. Тоді \(F\) є алгеброю множин, що означає, що якщо \(\Omega \in F\), то поєднання, перетин чи різниця двох множин системи знов належить до цієї системи.
Протилежна подія \(\overline{S}\) також називається доповненням події \(S\) до повної групи несумісних випадкових подій.
- Алгебра подій
- Іншими словами, множина \(F\), елементами якої є підмножини множини \(\Omega\) (не обов’язково всі), називається \(\mathbf{\sigma}\)-алгеброю, або \(\sigma\)-алгеброю подій, якщо виконуються такі умови:
- \(\Omega \in F\), тобто \(\sigma\)-алгебра подій містить вірогідну подію;
- разом з будь-якою подією \(\sigma\)-алгебра також містить протилежну їй подію, тобто якщо \(A \in F\), то \(\overline{A} \in F\);
- разом з будь-яким зліченним набором подій \(\sigma\)-алгебра містить їх об’єднання, тобто якщо \(A_{1},\ \ A_{2},\ \ ... A_{n} \in F\), то \(A_{1} \cup A_{2} \cup \ \ ... \cup\ A_{n} \in F\).
- Аксіома ІІ (існування ймовірності подій)
- Кожній події \(S\) із множини \(F\) поставлено у відповідність невід’ємне дійсне число \(P(S)\), де \(P(S) \geq 0\). Число називається ймовірністю випадкової події \(S\).
- Аксіома ІІІ (нормування ймовірності)
- Імовірність вірогідної події дорівнює одиниці: \[\begin{equation} P(\Omega) = 1. \tag{1.5} \end{equation}\]
- Аксіома IV (адитивність ймовірностей)
- Якщо випадкові події \(S_{1}\) і \(S_{2}\) є несумісними, то ймовірність суми подій дорівнює сумі їх імовірностей:
\[\begin{equation} P\left( S_{1} + S_{2} \right) = P\left( S_{1} \right) + P\left( S_{2} \right),\ якщо\ S_{1} \cap S_{2} = \ Ø. \tag{1.6} \end{equation}\]
Аксіома IV поширюється на будь-яку скінченну кількість попарно несумісних випадкових подій \(S_{1},\ \ S_{2},\ \ ...,\ \ S_{n}\). Отже, якщо \(S_{i} \cap S_{j} = \ Ø\), де \(i \neq j\), то формула набуває вигляду (1.7):
\[\begin{equation} P\left( S_{1} + S_{2} + ... + S_{n} \right) = P\left( S_{1} \right) + P\left(S_{2} \right) + ... + P\left( S_{n} \right). \tag{1.7} \end{equation}\]
- Поле ймовірностей
- Сукупність об’єктів \(\Omega\), \(F\) і \(P\), яка задовольняє аксіомам І – IV, називається полем ймовірностей.
Згідно з аксіоматикою Колмогорова можна визначити властивості ймовірності.
- Імовірність неможливої події дорівнює нулю
Доведення. За аксіомою ІІІ маємо, що ймовірність вірогідної події \(\Omega\) дорівнює 1. Оскільки множини \(\Omega\) і \(\ Ø\) не мають спільних елементів, тобто є несумісними, то відносно них справедлива аксіома IV:
\[P\left( \Omega + \ Ø \right) = P\left( \Omega \right) + P\left( \ Ø \right).\]
Звідси отримуємо:
\[P(\ Ø) = P\left( \Omega + \ Ø \right) - P\left( \Omega\right) .\]
Оскільки неможливій події відповідає пуста множина, то її додавання не змінює ту подію, до якої вона додається. Отже, справедливою є наступна рівність: \(\Omega + \ Ø = \Omega\).
Звідси отримуємо, що \(P(\ Ø) = P\left( \Omega + \ Ø \right) - P\left( \Omega \right) = P\left( \Omega \right) - P\left( \Omega \right)\).
За третьою аксіомою \(P(\Omega) = 1\). Відповідно ймовірність неможливої події дорівнює нулю:
\[P(\ Ø) = P\left( \Omega \right) - P\left( \Omega \right) = 1 - 1 = 0 .\]
Ураховуючи аксіому ІІ, у загальному випадку маємо, що відповідно до ймовірності будь-якої події виконується умова:
\[P(S) \in \lbrack 0;\ \ 1\rbrack.\]
Якщо виключити неможливу і вірогідну події, то матимемо, що ймовірність випадкової події належить проміжку:
\[0 < P(S) < 1\].
- Імовірність події \(\overline{A}\), яка є протилежною до події \(A\), визначається за формулою (1.8):
Доведення. Події \(A\) та \(\overline{A}\) є несумісними і утворюють повну групу випадкових подій. Подія \(A + \overline{A}\) є вірогідною. Тому на підставі аксіоми ІІІ маємо \(Р(A + \overline{A}) = 1\). Оскільки події \(A\) та \(\overline{A}\) є несумісними, то на підставі аксіоми IV отримуємо:
\[Р(A + \overline{A}) = Р(A) + Р(\overline{A}).\]
Отже, \(Р(A) + Р(\overline{A}) = 1\).
Звідки \(P(\overline{A}) = 1 - P(A)\).
Приклад 1.3
Кидають три монети. Визначити ймовірність того, що хоча б на одній монеті випаде герб.
Розв’язок
Побудуємо простір елементарних подій. Для цього будемо розглядати результати випробування для кожної монети окремо. Вони надані у табл. 1.1, де «+» означає, що на даній монеті випав герб, а «–» означає, що випав номінал.
Табл. 1.1
Результати випробувань з трьома монетами
Елементарна подія | \(ω_1\) | \(ω_2\) | \(ω_3\) | \(ω_4\) | \(ω_5\) | \(ω_6\) | \(ω_7\) | \(ω_8\) |
---|---|---|---|---|---|---|---|---|
1-а монета | + | - | + | + | - | - | + | - |
2-а монета | + | + | - | + | - | + | - | - |
3-я монета | + | + | + | - | + | - | - | - |
Отже, для даного випробування простір елементарних подій складається з восьми подій, з яких події \(\omega_{1},\ \ \omega_{2},\ \ ...,\ \ \omega_{7}\) є сприятливими для випадкової події \(A\), яка полягає у тому, що хоча б на одній монеті випаде герб. За класичним означенням ймовірності (1.3) маємо: \[P(A) = \frac{7}{8}.\]
Протилежною є подія \(\overline{A}\), яка полягає у тому, що герб не з’явиться на жодній з монет. Для цієї випадкової події сприятливою є лише елементарна подія \(\omega_{8}\). За класичним означенням ймовірності (1.3) ймовірність цієї події становить:
\[P(\overline{A}) = \frac{1}{8}.\]
Спираючись на властивості ймовірностей, можемо визначити ймовірність події \(A\) за формулою (1.7):
\[P(A) = 1 - P(\overline{A}) = 1 - \frac{1}{8} = \frac{7}{8}.\]
Отже, ми отримали той самий результат, що і при безпосередньому обчисленні ймовірності події \(A\).
Відповідь: \(\frac{7}{8}.\)
Слід зауважити, що при аналізі результатів уявного випробування виходять із принципу ігнорування малоймовірних подій. Наприклад, коли кидають монету, то вважають, що вона впаде або номіналом, або гербом, і не приймають до уваги можливість, що вона впаде на ребро і залишиться в цьому положенні.- Малоймовірна подія
- У загальному випадку вважають, що випадкова подія, ймовірність появи якої менша за 0,1, є малоймовірною.
Отже, якщо ймовірність появи події дуже мала, то можна практично бути впевненим, що при однократному випробуванні ця подія не матиме місця.
Однак величина ймовірності, починаючи з якої подія вважається малоймовірною, залежить від важливості наслідків, до яких призводить ігнорування такої події.
Рівень ймовірності, яким можна знехтувати, називається рівнем значущості. Ми говорили про рівень значущості 0,1. Але можливі й інші рівні значущості. Так, в економіці та соціології малоймовірними вважаються події, ймовірність яких не перевищує 0,05 або 0,01, у медицині та оборонній промисловості ці значення є ще меншими.