Основные теории вероятности. Статистическое определение вероятности

Некоторые программисты после работы в области разработки обычных коммерческих приложений задумываются о том, чтобы освоить машинное обучение и стать аналитиком данных. Часто они не понимают, почему те или иные методы работают, и большинство методов машинного обучения кажутся магией. На самом деле, машинное обучение базируется на математической статистике, а та, в свою очередь, основана на теории вероятностей. Поэтому в этой статье мы уделим внимание базовым понятиям теории вероятностей: затронем определения вероятности, распределения и разберем несколько простых примеров.

Возможно, вам известно, что теория вероятностей условно делится на 2 части. Дискретная теория вероятностей изучает явления, которые можно описать распределением с конечным (или счетным) количеством возможных вариантов поведения (бросания игральных костей, монеток). Непрерывная теория вероятностей изучает явления, распределенные на каком-то плотном множестве, например на отрезке или в круге.

Можно рассмотреть предмет теории вероятностей на простом примере. Представьте себя разработчиком шутера. Неотъемлемой частью разработки игр этого жанра является механика стрельбы. Ясно, что шутер в котором всё оружие стреляет абсолютно точно, будет малоинтересен игрокам. Поэтому, обязательно нужно добавлять оружию разброс. Но простая рандомизация точек попадания оружия не позволит сделать его тонкую настройку, поэтому, корректировка игрового баланса будет сложна. В то же время, используя случайные величины и их распределения можно проанализировать то, как будет работать оружие с заданным разбросом, и поможет внести необходимые корректировки.

Пространство элементарных исходов

Допустим, из некоторого случайного эксперимента, который мы можем многократно повторять (например, бросание монеты), мы можем извлечь некоторую формализуемую информацию (выпал орел или решка). Эта информация называется элементарным исходом, при этом целесообразно рассматривать множество всех элементарных исходов, часто обозначаемое буквой Ω (Омега).

Структура этого пространства целиком зависит от природы эксперимента. Например, если рассматривать стрельбу по достаточно большой круговой мишени, - пространством элементарных исходов будет круг, для удобства размещенный с центром в нуле, а исходом - точка в этом круге.

Кроме того, рассматривают множества элементарных исходов - события (например, попадание в «десятку» - это концентрический круг маленького радиуса с мишенью). В дискретном случае всё достаточно просто: мы можем получить любое событие, включая или исключая элементарные исходы за конечное время. В непрерывном же случае всё гораздо сложнее: нам понадобится некоторое достаточно хорошее семейство множеств для рассмотрения, называемое алгеброй по аналогии с простыми вещественными числами, которые можно складывать, вычитать, делить и умножать. Множества в алгебре можно пересекать и объединять, при этом результат операции будет находиться в алгебре. Это очень важное свойство для математики, которая лежит за всеми этими понятиями. Минимальное семейство состоит всего из двух множеств - из пустого множества и пространства элементарных исходов.

Мера и вероятность

Вероятность - это способ делать выводы о поведении очень сложных объектов, не вникая в принцип их работы. Таким образом, вероятность определяется как функция от события (из того самого хорошего семейства множеств), которая возвращает число - некоторую характеристику того, насколько часто может происходить такое событие в реальности. Для определённости математики условились, что это число должно лежать между нулем и единицей. Кроме того, к этой функции предъявляются требования: вероятность невозможного события нулевая, вероятность всего множества исходов единичная, и вероятность объединения двух независимых событий (непересекающихся множеств) равна сумме вероятностей. Другое название вероятности - вероятностная мера. Чаще всего используется Лебегова мера , обобщающая понятия длина, площадь, объём на любые размерности (n -мерный объем), и таким образом она применима для широкого класса множеств.

Вместе совокупность множества элементарных исходов, семейства множеств и вероятностной меры называется вероятностным пространством . Рассмотрим, каким образом можно построить вероятностное пространство для примера со стрельбой в мишень.

Рассмотрим стрельбу в большую круглую мишень радиуса R , в которую невозможно промахнуться. Множеством элементарных событий положим круг с центром в начале координат радиуса R . Поскольку мы собираемся использовать площадь (меру Лебега для двумерных множеств) для описания вероятности события, то будем использовать семейство измеримых (для которых эта мера существует) множеств.

Примечание На самом деле, это технический момент и в простых задачах процесс определения меры и семейства множеств не играет особой роли. Но понимать, что эти два объекта существуют, необходимо, ведь во многих книгах по теории вероятности теоремы начинаются со слов: «Пусть (Ω,Σ,P) - вероятностное пространство … ».

Как уже сказано выше, вероятность всего пространства элементарных исходов должна равняться единице. Площадь (двумерная мера Лебега, которую мы обозначим λ 2 (A) , где А — событие) круга по хорошо известной со школы формуле равна π *R 2 . Тогда мы можем ввести вероятность P(A) = λ 2 (A) / (π *R 2) , и эта величина уже будет лежать между 0 и 1 для любого события А.

Если предположить, что попадание в любую точку мишени равновероятно, поиск вероятности попадания стрелком в какую-то то область мишени сводится к поиску площади этого множества (отсюда можно сделать вывод, что вероятность попадания в конкретную точку нулевая, ведь площадь точки равна нулю).

Например, мы хотим узнать, какова вероятность того, что стрелок попадёт в «десятку» (событие A — стрелок попал в нужное множество). В нашей модели, «десятка» представляется кругом с центром в нуле и радиусом r. Тогда вероятность попадания в этот круг P(A) = λ 2 /(A)π *R 2 = π * r 2 /(π R 2)= (r/R) 2 .

Это одна из самых простых разновидностей задач на «геометрическую вероятность», - большинство таких задач требуют поиска площади.

Случайные величины

Случайная величина — функция, переводящая элементарные исходы в вещественные числа. К примеру, в рассмотренной задаче мы можем ввести случайную величину ρ(ω) — расстояние от точки попадания до центра мишени. Простота нашей модели позволяет явно задать пространство элементарных исходов: Ω = {ω = (x,y) такие числа, что x 2 +y 2 ≤ R 2 } . Тогда случайная величина ρ(ω) = ρ(x,y) = x 2 +y 2 .

Средства абстракции от вероятностного пространства. Функция распределения и плотность

Хорошо, когда структура пространства хорошо известна, но на самом деле так бывает далеко не всегда. Даже если структура пространства известна, она может быть сложна. Для описания случайных величин, если их выражение неизвестно, существует понятие функции распределения, которую обозначают F ξ (x) = P(ξ < x) (нижний индекс ξ здесь означает случайную величину). Т.е. это вероятность множества всех таких элементарных исходов, для которых значение случайной величины ξ на этом событии меньше, чем заданный параметр x .

Функция распределения обладает несколькими свойствами:

  1. Во-первых, она находится между 0 и 1 .
  2. Во-вторых, она не убывает, когда ее аргумент x растёт.
  3. В третьих, когда число -x очень велико, функция распределения близка к 0 , а когда само х большое, функция распределения близка к 1 .

Вероятно, смысл этой конструкции при первом чтении не слишком понятен. Одно из полезных свойств — функция распределения позволяет искать вероятность того, что величина принимает значение из интервала. Итак, P (случайная величина ξ принимает значения из интервала ) = F ξ (b)-F ξ (a) . Исходя из этого равенства, можем исследовать, как изменяется эта величина, если границы a и b интервала близки.

Пусть d = b-a , тогда b = a+d . А следовательно, F ξ (b)-F ξ (a) = F ξ (a+d) - F ξ (a) . При малых значениях d , указанная выше разность так же мала (если распределение непрерывное). Имеет смысл рассматривать отношение p ξ (a,d)= (F ξ (a+d) - F ξ (a))/d . Если при достаточно малых значениях d это отношение мало отличается от некоторой константы p ξ (a) , не зависящей от d, то в этой точке случайная величина имеет плотность, равную p ξ (a) .

Примечание Читатели, которые ранее сталкивались понятием производной, могут заметить что p ξ (a) — производная функции F ξ (x) в точке a . Во всяком случае, можно изучить понятие производной в посвященной этой теме статье на сайте Mathprofi.

Теперь смысл функции распределения можно определить так: её производная (плотность p ξ , которую мы определили выше) в точке а описывает, насколько часто случайная величина будет попадать в небольшой интервал с центром в точке а (окрестность точки а) по сравнению с окрестностями других точек. Другими словами, чем быстрее растёт функция распределения, тем более вероятно появление такого значения при случайном эксперименте.

Вернемся к примеру. Мы можем вычислить функцию распределения для случайной величины, ρ(ω) = ρ(x,y) = x 2 +y 2 , которая обозначает расстояние от центра до точки случайного попадания в мишень. По определению F ρ (t) = P(ρ(x,y) < t) . т.е. множество {ρ(x,y) < t)} — состоит из таких точек (x,y) , расстояние от которых до нуля меньше, чем t . Мы уже считали вероятность такого события, когда вычисляли вероятность попадания в «десятку» - она равна t 2 /R 2 . Таким образом, Fρ(t) = P(ρ(x,y) < t) = t 2 /R 2 , для 0

Мы можем найти плотность p ρ этой случайной величины. Сразу заметим, что вне интервала она нулевая, т.к. функция распределения на этом промежутке неизменна. На концах этого интервала плотность не определена. Внутри интервала её можно найти, используя таблицу производных (например из на сайте Mathprofi) и элементарные правила дифференцирования. Производная от t 2 /R 2 равна 2t/R 2 . Значит, плотность мы нашли на всей оси вещественных чисел.

Ещё одно полезное свойство плотности — вероятность того, что функция принимает значение из промежутка, вычисляется при помощи интеграла от плотности по этому промежутку (ознакомиться с тем, что это такое, можно в статьях о собственном , несобственном , неопределенном интегралах на сайте Mathprofi).

При первом чтении, интеграл по промежутку от функции f(x) можно представлять себе как площадь криволинейной трапеции. Ее сторонами являются фрагмент оси Ох, промежуток (горизонтальной оси координат), вертикальные отрезки, соединяющие точки (a,f(a)), (b,f(b)) на кривой с точками (a,0), (b,0) на оси Ох. Последней стороной является фрагмент графика функции f от (a,f(a)) до (b,f(b)) . Можно говорить об интеграле по промежутку (-∞; b] , когда для достаточно больших отрицательных значений, a значение интеграла по промежутку будет меняться пренебрежимо мало по сравнению с изменением числа a. Аналогичным образом определяется и интеграл по промежуткам Тематики информационные технологии в целом EN probability theorytheory of chancesprobability calculation … Справочник технического переводчика

Теория вероятностей - есть часть математики, изучающая зависимости между вероятностями (см. Вероятность и Статистика) различных событий. Перечислим важнейшие теоремы, относящиеся к этой науке. Вероятность появления одного из нескольких несовместных событий равняется… … Энциклопедический словарь Ф.А. Брокгауза и И.А. Ефрона

ТЕОРИЯ ВЕРОЯТНОСТЕЙ - математич. наука позволяющая по вероятностям одних событий случайных (см.) находить вероятности случайных событий, связанных к. л. образом с первыми. Современная Т.в. основана на аксиоматике (см. Метод аксиоматический) А. Н. Колмогорова. На… … Российская социологическая энциклопедия

Теория вероятностей - раздел математики, в котором по данным вероятностям одних случайных событий находят вероятности других событий, связанных некоторым образом с первыми. Теория вероятностей изучает также случайные величины и случайные процессы. Одна из основных… … Концепции современного естествознания. Словарь основных терминов

теория вероятностей - tikimybių teorija statusas T sritis fizika atitikmenys: angl. probability theory vok. Wahrscheinlichkeitstheorie, f rus. теория вероятностей, f pranc. théorie des probabilités, f … Fizikos terminų žodynas

Теория Вероятностей - … Википедия

Теория вероятностей - математическая дисциплина, изучающая закономерности случайных явлений … Начала современного естествознания

ТЕОРИЯ ВЕРОЯТНОСТЕЙ - (probability theory) см. Вероятность … Большой толковый социологический словарь

Теория вероятностей и её применения - («Теория вероятностей и её применения»,) научный журнал Отделения математики АН СССР. Публикует оригинальные статьи и краткие сообщения по теории вероятностей, общим вопросам математической статистики и их применениям в естествознании и… … Большая советская энциклопедия

Книги

  • Теория вероятностей. , Вентцель Е.С.. Книга представляет собой учебник, предназначенный для лиц, знакомых с математикой в объёме обычного втузовского курса и интересующихся техническими приложениямитеории вероятностей, в… Купить за 1993 грн (только Украина)
  • Теория вероятностей. , Вентцель Е.С.. Эта книга будет изготовлена в соответствии с Вашим заказом по технологии Print-on-Demand. Книга представляет собой учебник, предназначенный для лиц, знакомых с математикой в объёме обычного…

Многие, столкнувшись с понятием «теория вероятности», пугаются, думая, что это нечто непосильное, очень сложное. Но все на самом деле не так трагично. Сегодня мы рассмотрим основное понятие теории вероятности, научимся решать задачи на конкретных примерах.

Наука

Что же изучает такой раздел математики, как «теория вероятности»? Она отмечает закономерности и величин. Впервые данным вопросом заинтересовались ученые еще в восемнадцатом веке, когда изучали азартные игры. Основное понятие теории вероятности - событие. Это любой факт, который констатируется опытом или наблюдением. Но что же такое опыт? Еще одно основное понятие теории вероятности. Оно означает, что этот состав обстоятельств создан не случайно, а с определенной целью. Что касается наблюдения, то здесь исследователь сам не участвует в опыте, а просто является свидетелем данных событий, он никак не влияет на происходящее.

События

Мы узнали, что основное понятие теории вероятности - это событие, но не рассмотрели классификацию. Все они делятся на следующие категории:

  • Достоверные.
  • Невозможные.
  • Случайные.

Независимо от того, какие это события, за которыми наблюдают или создают в ходе опыта, все они подвержены данной классификации. Предлагаем с каждым из видов познакомиться отдельно.

Достоверное событие

Это такое обстоятельство, перед которым сделан необходимый комплекс мероприятий. Для того чтобы лучше вникнуть в суть, лучше привести несколько примеров. Этому закону подчинены и физика, и химия, и экономика, и высшая математика. Теория вероятности включает такое важное понятие, как достоверное событие. Приведем примеры:

  • Мы работаем и получаем вознаграждение в виде заработной платы.
  • Сдали хорошо экзамены, прошли конкурс, за это получаем вознаграждение в виде поступления в учебное заведение.
  • Мы вложили деньги в банк, при необходимости получим их назад.

Такие события являются достоверными. Если мы выполнили все необходимые условия, то обязательно получим ожидаемый результат.

Невозможные события

Сейчас мы рассматриваем элементы теории вероятности. Предлагаем перейти к пояснению следующего вида события, а именно - невозможного. Для начала оговорим самое важное правило - вероятность невозможного события равна нулю.

От данной формулировки нельзя отступать при решении задач. Для пояснения приведем примеры таких событий:

  • Вода замерзла при температуре плюс десять (это невозможно).
  • Отсутствие электроэнергии никак не влияет на производство (так же невозможно, как и в предыдущем примере).

Более примеров приводить не стоит, так как описанные выше очень ярко отражают суть данной категории. Невозможное событие никогда не произойдет во время опыта ни при каких обстоятельствах.

Случайные события

Изучая элементы теории вероятности, особое внимание стоит уделить именно данному виду события. Именно их и изучает данная наука. В результате опыта может что-то произойти или нет. Кроме этого, испытание может проводиться неограниченное количество раз. Яркими примерами могут служить:

  • Бросок монеты - это опыт, или испытание, выпадение орла - это событие.
  • Вытягивание мячика из мешка вслепую - испытание, попался красный шар - это событие и так далее.

Таких примеров может быть неограниченное количество, но, в общем, суть должна быть понятна. Для обобщения и систематизирования полученных знаний о событиях приведена таблица. Теория вероятности изучает только последний вид из всех представленных.

название

определение

Достоверные

События, происходящие со стопроцентной гарантией при соблюдении некоторых условий.

Поступление в учебное заведение при хорошей сдаче вступительного экзамена.

Невозможные

События, которые никогда не произойдут ни при каких условиях.

Идет снег при температуре воздуха плюс тридцать градусов по Цельсию.

Случайные

Событие, которое может произойти или нет в ходе проведения опыта/испытания.

Попадание или промах при бросании баскетбольного мяча в кольцо.

Законы

Теория вероятности - это наука, изучающая возможность выпадения какого-либо события. Как и другие, она имеет некоторые правила. Существуют следующие законы теории вероятности:

  • Сходимость последовательностей случайных величин.
  • Закон больших чисел.

При расчете возможности сложного можно использовать комплекс простых событий для достижения результата более легким и быстрым путем. Отметим, что законы легко доказываются с помощью некоторых теорем. Предлагаем для начала познакомиться с первым законом.

Сходимость последовательностей случайных величин

Отметим, что видов сходимости несколько:

  • Последовательность случайных величин сходима по вероятности.
  • Почти невозможное.
  • Среднеквадратическая сходимость.
  • Сходимость по распределению.

Так, с лету, очень тяжело вникнуть в суть. Приведем определения, которые помогут разобраться в данной теме. Для начала первый вид. Последовательность называют сходимой по вероятности , если соблюдено следующее условие: n стремится к бесконечности, число, к которому стремится последовательность, больше нуля и приближена к единице.

Переходим к следующему виду, почти наверное . Говорят, что последовательность сходится почти наверное к случайной величине при n, стремящейся к бесконечности, и Р, стремящейся к величине, приближенной к единице.

Следующий тип - это сходимость среднеквадратическая . При использовании СК-сходимости изучение векторных случайных процессов сводится к изучению их координатных случайных процессов.

Остался последний тип, давайте разберем кратко и его, чтобы переходить непосредственно к решению задач. Сходимость по распределению имеет и еще одно название - «слабое», далее поясним, почему. Слабая сходимость — это сходимость функций распределения во всех точках непрерывности предельной функции распределения.

Обязательно выполним обещание: слабая сходимость отличается от всех вышеперечисленных тем, что случайная величина не определена на вероятностном пространстве. Это возможно потому, что условие формируется исключительно с использованием функций распределения.

Закон больших чисел

Отличными помощниками при доказательстве данного закона станут теоремы теории вероятности, такие как:

  • Неравенство Чебышева.
  • Теорема Чебышева.
  • Обобщенная теорема Чебышева.
  • Теорема Маркова.

Если будем рассматривать все эти теоремы, то данный вопрос может затянуться на несколько десятков листов. У нас же основная задача - это применение теории вероятности на практике. Предлагаем вам прямо сейчас этим и заняться. Но перед этим рассмотрим аксиомы теории вероятностей, они будут основными помощниками при решении задач.

Аксиомы

С первой мы уже познакомились, когда говорили о невозможном событии. Давайте вспоминать: вероятность невозможного события равна нулю. Пример мы приводили очень яркий и запоминающийся: выпал снег при температуре воздуха тридцать градусов по Цельсию.

Вторая звучит следующим образом: достоверное событие происходит с вероятностью, равной единице. Теперь покажем, как это записать с помощью математического языка: Р(В)=1.

Третья: Случайное событие может произойти или нет, но возможность всегда варьируется в пределах от нуля до единицы. Чем ближе значение к единице, тем шансов больше; если значение приближается к нулю, вероятность очень мала. Запишем это математическим языком: 0<Р(С)<1.

Рассмотрим последнюю, четвертую аксиому, которая звучит так: вероятность суммы двух событий равняется сумме их вероятностей. Записываем математическим языком: Р(А+В)=Р(А)+Р(В).

Аксиомы теории вероятностей - это простейшие правила, которые не составит труда запомнить. Попробуем решить некоторые задачи, опираясь на уже полученные знания.

Лотерейный билет

Для начала рассмотрим простейший пример - лотерея. Представьте, что вы купили один лотерейный билет на удачу. Какова вероятность, что вы выиграете не менее двадцати рублей? Всего в тираже участвует тысяча билетов, один из которых имеет приз в пятьсот рублей, десять по сто рублей, пятьдесят по двадцать рублей, а сто - по пять. Задачи по теории вероятности основаны на том, чтобы найти возможность удачи. Сейчас вместе разберем решение выше представленного задания.

Если мы буквой А обозначим выигрыш в пятьсот рублей, то вероятность выпадения А будет равняться 0,001. Как мы это получили? Просто необходимо количество "счастливых" билетов разделить на общее их число (в данном случае: 1/1000).

В - это выигрыш в сто рублей, вероятность будет равняться 0,01. Сейчас мы действовали по тому же принципу, что и в прошлом действии (10/1000)

С - выигрыш равен двадцати рублям. Находим вероятность, она равняется 0,05.

Остальные билеты нас не интересуют, так как их призовой фонд меньше заданного в условии. Применим четвертую аксиому: Вероятность выиграть не менее двадцати рублей составляет Р(А)+Р(В)+Р(С). Буквой Р обозначается вероятность происхождения данного события, мы в предыдущих действиях уже их нашли. Осталось только сложить необходимые данные, в ответе мы получаем 0,061. Это число и будет являться ответом на вопрос задания.

Карточная колода

Задачи по теории вероятности бывают и более сложными, для примера возьмем следующее задание. Перед вами колода из тридцати шести карт. Ваша задача - вытянуть две карты подряд, не перемешивая стопку, первая и вторая карты должны быть тузами, масть значения не имеет.

Для начала найдем вероятность того, что первая карта будет тузом, для этого четыре делим на тридцать шесть. Отложили его в сторону. Достаем вторую карту, это будет туз с вероятностью три тридцать пятых. Вероятность второго события зависит от того, какую карту мы вытянули первой, нам интересно, был это туз или нет. Из этого следует, что событие В зависит от события А.

Следующим действием находим вероятность одновременного осуществления, то есть перемножаем А и В. Их произведение находится следующим образом: вероятность одного события умножаем на условную вероятность другого, которую мы вычисляем, предполагая, что первое событие произошло, то есть первой картой мы вытянули туз.

Для того чтобы стало все понятно, дадим обозначение такому элементу, как события. Вычисляется она, предполагая, что событие А произошло. Рассчитывается следующим образом: Р(В/А).

Продолжим решение нашей задачи: Р(А * В)=Р(А) * Р(В/А) или Р(А * В)=Р(В) * Р(А/В). Вероятность равняется (4/36) * ((3/35)/(4/36). Вычисляем, округляя до сотых. Мы имеем: 0,11 * (0,09/0,11)=0,11 * 0,82=0,09. Вероятность того, что мы вытянем два туза подряд, равна девяти сотым. Значение очень мало, из этого следует, что и вероятность происхождения события крайне мала.

Забытый номер

Предлагаем разобрать еще несколько вариантов заданий, которые изучает теория вероятности. Примеры решения некоторых из них вы уже видели в данной статье, попробуем решить следующую задачу: мальчик забыл последнюю цифру номера телефона своего друга, но так как звонок был очень важен, то начал набирать все по очереди. Нам необходимо вычислить вероятность того, что он позвонит не более трех раз. Решение задачи простейшее, если известны правила, законы и аксиомы теории вероятности.

Перед тем как смотреть решение, попробуйте решить самостоятельно. Нам известно, что последняя цифра может быть от нуля до девяти, то есть всего десять значений. Вероятность набрать нужную составляет 1/10.

Далее нам нужно рассматривать варианты происхождения события, предположим, что мальчик угадал и сразу набрал нужную, вероятность такого события равняется 1/10. Второй вариант: первый звонок промах, а второй в цель. Рассчитаем вероятность такого события: 9/10 умножаем на 1/9, в итоге получаем также 1/10. Третий вариант: первый и второй звонок оказались не по адресу, только с третьего мальчик попал туда, куда хотел. Вычисляем вероятность такого события: 9/10 умножаем на 8/9 и на 1/8, получаем в итоге 1/10. Другие варианты по условию задачи нас не интересуют, по этому нам осталось сложить полученные результаты, в итоге мы имеем 3/10. Ответ: вероятность того, что мальчик позвонит не более трех раз, равняется 0,3.

Карточки с числами

Перед вами девять карточек, на каждой из которых написано число от одного до девяти, цифры не повторяются. Их положили в коробку и тщательно перемешали. Вам необходимо рассчитать вероятность того, что

  • выпадет четное число;
  • двухзначное.

Перед тем как переходить к решению, оговорим, что m - это число удачных случаев, а n - это общее количество вариантов. Найдем вероятность того, что число будет четным. Не составит труда посчитать, что четных чисел четыре, это и будет наша m, всего возможно девять вариантов, то есть m=9. Тогда вероятность равняется 0,44 или 4/9.

Рассматриваем второй случай: количество вариантов девять, а удачных исходов быть вообще не может, то есть m равняется нулю. Вероятность того, что вытянутая карточка будет содержать двухзначное число, так же равняется нулю.