Сайт про гаджеты, ПК, ОС. Понятные инструкции для всех
  • Главная
  • Планшеты
  • Дискретные случайные величины. Математическое ожидание дискретной случайной величины

Дискретные случайные величины. Математическое ожидание дискретной случайной величины

Понятие математического ожидания можно рассмотреть на примере с бросанием игрального кубика. При каждом броске фиксируются выпавшие очки. Для их выражения используются натуральные значения в диапазоне 1 – 6.

После определенного количества бросков при помощи не сложных расчетов можно найти среднее арифметическое значение выпавших очков.

Также, как и выпадение любого из значений диапазона, эта величина будет случайной.

А если увеличить количество бросков в несколько раз? При больших количествах бросков среднее арифметическое значение очков будет приближаться к конкретному числу, получившему в теории вероятностей название математического ожидания.

Итак, под математическим ожиданием понимается среднее значение случайной величины. Данный показатель может представляться и в качестве взвешенной суммы значений вероятной величины.

Это понятие имеет несколько синонимов:

  • среднее значение;
  • средняя величина;
  • показатель центральной тенденции;
  • первый момент.

Иными словами, оно является ничем иным как числом вокруг которого распределяются значения случайной величины.

В различных сферах человеческой деятельности подходы к пониманию математического ожидания будут несколько отличаться.

Оно может рассматриваться как:

  • средняя выгода, полученная от принятия какого-то решения, в том случае, когда такое решение рассматривается с точки зрения теории больших чисел;
  • возможная сумма выигрыша либо проигрыша (теория азартных игр), рассчитанная в среднем для каждой из ставок. На сленге они звучат как «преимущество игрока» (позитивно для игрока) либо «преимущество казино» (негативно для игрока);
  • процент прибыли, полученной от выигрыша.

Матожидание не является обязательным для абсолютно всех случайных величин. Оно отсутствует для тех у которых наблюдается расхождение соответствующей суммы или интеграла.

Свойства математического ожидания

Как и любому статистическому параметру, математическому ожиданию присущи свойства:


Основные формулы для математического ожидания

Вычисление математического ожидания может выполняться как для случайных величин, характеризующихся как непрерывностью (формула А), так и дискретностью (формула Б):

  1. M(X)=∑i=1nxi⋅pi, где xi – значения случайной величины, pi – вероятности:
  2. M(X)=∫+∞−∞f(x)⋅xdx, где f(x) – заданная плотность вероятностей.

Примеры вычисления математического ожидания

Пример А.

Можно ли узнать средний рост гномов в сказке о Белоснежке. Известно, что каждый из 7 гномов имел определенный рост: 1,25; 0,98; 1,05; 0,71; 0,56; 0,95 и 0,81 м.

Алгоритм вычислений достаточно прост:

  • находим сумму всех значений показателя роста (случайная величина):
    1,25+0,98+1,05+0,71+0,56+0,95+ 0,81 = 6,31;
  • полученную сумму делим на количество гномов:
    6,31:7=0,90.

Таким образом, средний рост гномов в сказке равен 90 см. Иными словами таково математическое ожидание роста гномов.

Рабочая формула — М(х)=4 0,2+6 0,3+10 0,5=6

Практическая реализация математического ожидания

К вычислению статистического показателя математического ожидания прибегают в различных сферах практической деятельности. В первую очередь речь идет о коммерческой сфере. Ведь введение Гюйгенсом этого показателя связано с определением шансов, которые могут быть благоприятными, либо напротив неблагоприятными, для какого-то события.

Этот параметр широко применяется для оценки рисков, особенно если речь идет о финансовых вложениях.
Так, в предпринимательстве расчет математического ожидания выступает в качестве метода для оценивания риска при расчете цен.

Также данный показатель может использоваться при расчете эффективности проведения тех или иных мероприятий, например, по охране труда. Благодаря ему можно вычислить вероятность наступления события.

Еще одна сфера применения данного параметра – менеджмент. Также он может рассчитываться при контроле качества продукции. Например, при помощи мат. ожидания можно рассчитать возможное количество изготовления бракованных деталей.

Незаменимым мат.ожидание оказывается и при проведении статистической обработки полученных в ходе научных исследований результатов. Он позволяет рассчитать и вероятность проявления желательного либо нежелательного исхода эксперимента или исследования в зависимости от уровня достижения поставленной цели. Ведь ее достижение может ассоциироваться с выигрышем и выгодой, а ее не достижение – в качестве проигрыша либо убытка.

Использование математического ожидания на Форекс

Практическое применение данного статистического параметра возможно при проведении операций на валютном рынке. С его помощью можно осуществлять анализ успешности торговых сделок. При чем увеличение значения ожидания свидетельствует об увеличении их успешности.

Также важно помнить, что математическое ожидание не должно рассматриваться в качестве единственного статистического параметра используемого для анализа работы трейдера. Использование нескольких статистических параметров наряду со средним значением повышает точность проводимого анализа в разы.

Данный параметр хорошо зарекомендовал себя при мониторинговых наблюдениях за торговыми счетами. Благодаря ему выполняется быстрая оценка работ, осуществляемых на депозитном счете. В тех случаях, когда деятельность трейдера удачна и он избегает убытков, пользоваться исключительно расчетом математического ожидания не рекомендуется. В этих случаях не учитываются риски, что снижает эффективность анализа.

Проведенные исследования тактик трейдеров свидетельствуют о том, что:

  • наиболее эффективными оказываются тактики, базирующиеся на случайном входе;
  • наименее эффективны – тактики, базирующиеся на структурированных входах.

В достижении позитивных результатов не менее важны:

  • тактика управления капиталом;
  • стратегии выходов.

Используя такой показатель как математическое ожидание можно предположить каким будет прибыль либо убыток при вложении 1 доллара. Известно, что этот показатель, рассчитанный для всех игр, практикуемых в казино, в пользу заведения. Именно это позволяет зарабатывать деньги. В случае длинной серии игр вероятность потери денег клиентом существенно возрастает.

Игры профессиональных игроков ограничены небольшими временными промежутками, что увеличивает вероятность выигрыша и снижает риск проигрыша. Такая же закономерность наблюдается и при выполнении инвестиционных операций.

Инвестор может заработать значительную сумму при положительном ожидании и совершении большого количества сделок за небольшой временной промежуток.

Ожидание может рассматриваться как разница между произведением процента прибыли (PW) на среднюю прибыль (AW) и вероятность убытка (PL) на средний убыток (AL).

В качестве примера можно рассмотреть следующий: позиция – 12,5 тыс. долларов, портфель — 100 тыс. долларов, риск на депозит – 1%. Прибыльность сделок составляет 40% случаев при средней прибыли 20%. В случае убытка средние потери составляют 5%. Расчет математического ожидания для сделки дает значение в 625 долларов.

Следующим по важности свойством случайной величины вслед за математическим ожиданием является ее дисперсия, определяемая как средний квадрат отклонения от среднего:

Если обозначить через то дисперсия VX будет ожидаемым значением Это характеристика „разброса" распределения X.

В качестве простого примера вычисления дисперсии предположим, что нам только что сделали предложение, от которого мы не в силах отказаться: некто подарил нам два сертификата для участия в одной лотерее. Устроители лотереи продают каждую неделю по 100 билетов, участвующих в отдельном тираже. В тираже выбирается один их этих билетов посредством равномерного случайного процесса - каждый билет имеет равные шансы быть выбранным - и обладатель этого счастливого билета получает сто миллионов долларов. Остальные 99 владельцев лотерейных билетов не выигрывают ничего.

Мы можем использовать подарок двумя способами: купить или два билета в одной лотерее, или по одному для участия в двух разных лотереях. Какая стратегия лучше? Попытаемся провести анализ. Для этого обозначим через случайные величины, представляющие размер нашего выигрыша по первому и второму билету. Ожидаемое значение в миллионах, равно

и то же самое справедливо для Ожидаемые значения аддитивны, поэтому наш средний суммарный выигрыш составит

независимо от принятой стратегии.

Тем не менее, две стратегии выглядят различными. Выйдем за рамки ожидаемых значений и изучим полностью распределение вероятностей

Если мы купим два билета в одной лотерее, то наши шансы не выиграть ничего составят 98% и 2% - шансы на выигрыш 100 миллионов. Если же мы купим билеты на разные тиражи, то цифры будут такими: 98.01% - шанс не выиграть ничего, что несколько больше, чем ранее; 0.01% - шанс выиграть 200 миллионов, также чуть больше, чем было ранее; и шанс выиграть 100 миллионов теперь составляет 1.98%. Таким образом, во втором случае распределение величины несколько более разбросано; среднее значение, 100 миллионов долларов, несколько менее вероятно, тогда как крайние значения более вероятны.

Именно это понятие разброса случайной величины призвана отразить дисперсия. Мы измеряем разброс через квадрат отклонения случайной величины от ее математического ожидания. Таким образом, в случае 1 дисперсия составит

в случае 2 дисперсия равна

Как мы и ожидали, последняя величина несколько больше, поскольку распределение в случае 2 несколько более разбросано.

Когда мы работаем с дисперсиями, то все возводится в квадрат, так что в результате могут получиться весьма большие числа. (Множитель есть один триллион, это должно впечатлить

даже привычных к крупным ставкам игроков.) Для преобразования величин в более осмысленную исходную шкалу часто извлекают квадратный корень из дисперсии. Полученное число называется стандартным отклонением и обычно обозначается греческой буквой а:

Стандартные отклонения величины для наших двух лотерейных стратегий составят . В некотором смысле второй вариант примерно на 71247 долларов рискованнее.

Каким образом дисперсия помогает в выборе стратегии? Это не ясно. Стратегия с большей дисперсией рискованнее; но что лучше для нашего кошелька - риск или безопасная игра? Пусть у нас есть возможность купить не два билета, а все сто. Тогда мы могли бы гарантировать выигрыш в одной лотерее (и дисперсия была бы нулевой); или же можно было сыграть в сотне разных тиражей, ничего не получая с вероятностью зато имея ненулевой шанс на выигрыш вплоть до долларов. Выбор одной из этих альтернатив лежит за рамками этой книги; все, что мы можем сделать здесь,- это объяснить, как произвести подсчеты.

В действительности имеется более простой способ вычисления дисперсии, чем прямое использование определения (8.13). (Есть все основания подозревать здесь какую-то скрытую от глаз математику; иначе с чего бы дисперсия в лотерейных примерах оказалась целым кратным Имеем

поскольку - константа; следовательно,

„Дисперсия есть среднее значение квадрата минус квадрат среднего значения"

Например, в задаче про лотерею средним значением оказывается или Вычитание (квадрата среднего) дает результаты, которые мы уже получили ранее более трудным путем.

Есть, однако, еще более простая формула, применимая, когда мы вычисляем для независимых X и Y. Имеем

поскольку, как мы знаем, для независимых случайных величин Следовательно,

„Дисперсия суммы независимых случайных величин равняется сумме их дисперсий" Так, например, дисперсия суммы, которую можно выиграть на один лотерейный билет, равняется

Следовательно, дисперсия суммарного выигрыша по двум лотерейным билетам в двух различных (независимых) лотереях составит Соответствующее значение дисперсии для независимых лотерейных билетов будет

Дисперсия суммы очков, выпавших на двух кубиках, может быть получена по той же формуле, поскольку есть сумма двух независимых случайных величин. Имеем

для правильного кубика; следовательно, случае смещенного центра масс

следовательно, если у обоих кубиков центр масс смещен. Заметьте, что в последнем случае дисперсия больше, хотя принимает среднее значение 7 чаще, чем в случае правильных кубиков. Если наша цель - выбросить побольше приносящих удачу семерок, то дисперсия - не лучший показатель успеха.

Ну хорошо, мы установили, как вычислить дисперсию. Но мы пока не дали ответа на вопрос, почему надо вычислять именно дисперсию. Все так делают, но почему? Основная причина заключается в неравенстве Чебышева которое устанавливает важное свойство дисперсии:

(Это неравенство отличается от неравенств Чебышёва для сумм, встретившихся нам в гл. 2.) На качественном уровне (8.17) утверждает, что случайная величина X редко принимает значения, далекие от своего среднего если ее дисперсия VX мала. Доказательство

тельство необычайно просто. Действительно,

деление на завершает доказательство.

Если мы обозначим математическое ожидание через а стандартное отклонение - через а и заменим в (8.17) на то условие превратится в следовательно, мы получим из (8.17)

Таким образом, X будет лежать в пределах -кратного стандартного отклонения от своего среднего значения за исключением случаев, вероятность которых не превышает Случайная величина будет лежать в пределах 2а от по крайней мере для 75% испытаний; в пределах от до - по крайней мере для 99%. Это случаи неравенства Чебышёва.

Если бросить пару кубиков раз, то общая сумма очков во всех бросаниях почти всегда, при больших будет близка к Причина этого следующая: дисперсия независимых бросаний составит Дисперсия в означает стандартное отклонение всего

Поэтому из неравенства Чебышёва получаем, что сумма очков будет лежать между

по крайней мере для 99% всех бросаний правильных кубиков. Например, итог миллиона бросаний с вероятностью более 99% будет заключен между 6.976 млн и 7.024 млн.

В общем случае, пусть X - любая случайная величина на вероятностном пространстве П, имеющая конечное математическое ожидание и конечное стандартное отклонение а. Тогда можно ввести в рассмотрение вероятностное пространство Пп, элементарными событиями которого являются -последовательности где каждое , а вероятность определяется как

Если теперь определить случайные величины формулой

то величина

будет суммой независимых случайных величин, которая соответствует процессу суммирования независимых реализаций величины X на П. Математическое ожидание будет равно а стандартное отклонение - ; следовательно, среднее значение реализаций,

будет лежать в пределах от до по крайней мере в 99% временного периода. Иными словами, если выбрать достаточно большое то среднее арифметическое независимых испытаний будет почти всегда очень близко к ожидаемому значению (В учебниках теории вероятностей доказывается еще более сильная теорема, называемая усиленным законом больших чисел; но нам достаточно и простого следствия неравенства Чебышёва, которое мы только что вывели.)

Иногда нам не известны характеристики вероятностного пространства, но требуется оценить математическое ожидание случайной величины X при помощи повторных наблюдений ее значения. (Например, нам могла бы понадобиться средняя полуденная температура января в Сан-Франциско; или же мы хотим узнать ожидаемую продолжительность жизни, на которой должны основывать свои расчеты страховые агенты.) Если в нашем распоряжении имеются независимые эмпирические наблюдения то мы можем предположить, что истинное математическое ожидание приблизительно равно

Можно оценить и дисперсию, используя формулу

Глядя на эту формулу, можно подумать, что в ней - типографская ошибка; казалось бы, там должно стоять как в (8.19), поскольку истинное значение дисперсии определяется в (8.15) через ожидаемые значения. Однако замена здесь на позволяет получить лучшую оценку, поскольку из определения (8.20) вытекает, что

Вот доказательство:

(В этой выкладке мы опираемся на независимость наблюдений, когда заменяем на )

На практике для оценки результатов эксперимента со случайной величиной X обычно вычисляют эмпирическое среднее и эмпирическое стандартное отклонение после чего записывают ответ в виде Вот, например, результаты бросаний пары кубиков, предположительно правильных.

Математическое ожидание и дисперсия - чаще всего применяемые числовые характеристики случайной величины. Они характеризуют самые важные черты распределения: его положение и степень разбросанности. Во многих задачах практики полная, исчерпывающая характеристика случайной величины - закон распределения - или вообще не может быть получена, или вообще не нужна. В этих случаях ограничиваются приблизительным описанием случайной величины с помощью числовых характеристик.

Математическое ожидание часто называют просто средним значением случайной величины. Дисперсия случайной величины - характеристика рассеивания, разбросанности случайной величины около её математического ожидания.

Математическое ожидание дискретной случайной величины

Подойдём к понятию математического ожидания, сначала исходя из механической интерпретации распределения дискретной случайной величины. Пусть единичная масса распределена между точками оси абсцисс x 1 , x 2 , ..., x n , причём каждая материальная точка имеет соответствующую ей массу из p 1 , p 2 , ..., p n . Требуется выбрать одну точку на оси абсцисс, характеризующую положение всей системы материальных точек, с учётом их масс. Естественно в качестве такой точки взять центр массы системы материальных точек. Это есть среднее взвешенное значение случайной величины X , в которое абсцисса каждой точки x i входит с "весом", равным соответствующей вероятности. Полученное таким образом среднее значение случайной величины X называется её математическим ожиданием.

Математическим ожиданием дискретной случайной величины называется сумма произведений всех возможных её значений на вероятности этих значений:

Пример 1. Организована беспроигрышная лотерея. Имеется 1000 выигрышей, из них 400 по 10 руб. 300 - по 20 руб. 200 - по 100 руб. и 100 - по 200 руб. Каков средний размер выигрыша для купившего один билет?

Решение. Средний выигрыш мы найдём, если общую сумму выигрышей, которая равна 10*400 + 20*300 + 100*200 + 200*100 = 50000 руб, разделим на 1000 (общая сумма выигрышей). Тогда получим 50000/1000 = 50 руб. Но выражение для подсчёта среднего выигрыша можно представить и в следующем виде:

С другой стороны, в данных условиях размер выигрыша является случайной величиной, которая может принимать значения 10, 20, 100 и 200 руб. с вероятностями, равными соответственно 0,4; 0,3; 0,2; 0,1. Следовательно, ожидаемый средний выигрыш равен сумме произведений размеров выигрышей на вероятности их получения.

Пример 2. Издатель решил издать новую книгу. Продавать книгу он собирается за 280 руб., из которых 200 получит он сам, 50 - книжный магазин и 30 - автор. В таблице дана информация о затратах на издание книги и вероятности продажи определённого числа экземпляров книги.

Найти ожидаемую прибыль издателя.

Решение. Случайная величина "прибыль" равна разности доходов от продажи и стоимости затрат. Например, если будет продано 500 экземпляров книги, то доходы от продажи равны 200*500=100000, а затраты на издание 225000 руб. Таким образом, издателю грозит убыток размером в 125000 руб. В следующей таблице обобщены ожидаемые значения случайной величины - прибыли:

Число Прибыль x i Вероятность p i x i p i
500 -125000 0,20 -25000
1000 -50000 0,40 -20000
2000 100000 0,25 25000
3000 250000 0,10 25000
4000 400000 0,05 20000
Всего: 1,00 25000

Таким образом, получаем математическое ожидание прибыли издателя:

.

Пример 3. Вероятность попадания при одном выстреле p = 0,2 . Определить расход снарядов, обеспечивающих математическое ожидание числа попаданий, равное 5.

Решение. Из всё той же формулы математического ожидания, которую мы использовали до сих пор, выражаем x - расход снарядов:

.

Пример 4. Определить математическое ожидание случайной величины x числа попаданий при трёх выстрелах, если вероятность попадания при каждом выстреле p = 0,4 .

Подсказка: вероятность значений случайной величины найти по формуле Бернулли .

Свойства математического ожидания

Рассмотрим свойства математического ожидания.

Свойство 1. Математическое ожидание постоянной величины равно этой постоянной:

Свойство 2. Постоянный множитель можно выносить за знак математического ожидания:

Свойство 3. Математическое ожидание суммы (разности) случайных величин равно сумме (разности) их математических ожиданий:

Свойство 4. Математическое ожидание произведения случайных величин равно произведению их математических ожиданий:

Свойство 5. Если все значения случайной величины X уменьшить (увеличить) на одно и то же число С , то её математическое ожидание уменьшится (увеличится) на то же число:

Когда нельзя ограничиваться только математическим ожиданием

В большинстве случаев только математическое ожидание не может в достаточной степени характеризовать случайную величину.

Пусть случайные величины X и Y заданы следующими законами распределения:

Значение X Вероятность
-0,1 0,1
-0,01 0,2
0 0,4
0,01 0,2
0,1 0,1
Значение Y Вероятность
-20 0,3
-10 0,1
0 0,2
10 0,1
20 0,3

Математические ожидания этих величин одинаковы - равны нулю:

Однако характер распределения их различный. Случайная величина X может принимать только значения, мало отличающиеся от математического ожидания, а случайная величина Y может принимать значения, значительно отклоняющиеся от математического ожидания. Аналогичный пример: средняя заработная плата не даёт возможности судить об удельном весе высоко- и низкооплачиваемых рабочих. Иными словами, по математическому ожиданию нельзя судить о том, какие отклонения от него, хотя бы в среднем, возможны. Для этого нужно найти дисперсию случайной величины.

Дисперсия дискретной случайной величины

Дисперсией дискретной случайной величины X называется математическое ожидание квадрата отклонения её от математического ожидания:

Средним квадратическим отклонением случайной величины X называется арифметическое значение квадратного корня её дисперсии:

.

Пример 5. Вычислить дисперсии и средние квадратические отклонения случайных величин X и Y , законы распределения которых приведены в таблицах выше.

Решение. Математические ожидания случайных величин X и Y , как было найдено выше, равны нулю. Согласно формуле дисперсии при Е (х )=Е (y )=0 получаем:

Тогда средние квадратические отклонения случайных величин X и Y составляют

.

Таким образом, при одинаковых математических ожиданиях дисперсия случайной величины X очень мала, а случайной величины Y - значительная. Это следствие различия в их распределении.

Пример 6. У инвестора есть 4 альтернативных проекта инвестиций. В таблице обобщены данные об ожидаемой прибыли в этих проектах с соответствующей вероятностью.

Проект 1 Проект 2 Проект 3 Проект 4
500, P =1 1000, P =0,5 500, P =0,5 500, P =0,5
0, P =0,5 1000, P =0,25 10500, P =0,25
0, P =0,25 9500, P =0,25

Найти для каждой альтернативы математическое ожидание, дисперсию и среднее квадратическое отклонение.

Решение. Покажем, как вычисляются эти величины для 3-й альтернативы:

В таблице обобщены найденные величины для всех альтернатив.

У всех альтернатив одинаковы математические ожидания. Это означает, что в долгосрочном периоде у всех - одинаковые доходы. Стандартное отклонение можно интерпретировать как единицу измерения риска - чем оно больше, тем больше риск инвестиций. Инвестор, который не желает большого риска, выберет проект 1, так как у него наименьшее стандартное отклонение (0). Если же инвестор отдаёт предпочтение риску и большим доходам в короткий период, то он выберет проект наибольшим стандартным отклонением - проект 4.

Свойства дисперсии

Приведём свойства дисперсии.

Свойство 1. Дисперсия постоянной величины равна нулю:

Свойство 2. Постоянный множитель можно выносить за знак дисперсии, возводя его при этом в квадрат:

.

Свойство 3. Дисперсия случайной величины равна математическому ожиданию квадрата этой величины, из которого вычтен квадрат математического ожидания самой величины:

,

где .

Свойство 4. Дисперсия суммы (разности) случайных величин равна сумме (разности) их дисперсий:

Пример 7. Известно, что дискретная случайная величина X принимает лишь два значения: −3 и 7. Кроме того, известно математическое ожидание: E (X ) = 4 . Найти дисперсию дискретной случайной величины.

Решение. Обозначим через p вероятность, с которой случайная величина принимает значение x 1 = −3 . Тогда вероятностью значения x 2 = 7 будет 1 − p . Выведем уравнение для математического ожидания:

E (X ) = x 1 p + x 2 (1 − p ) = −3p + 7(1 − p ) = 4 ,

откуда получаем вероятности: p = 0,3 и 1 − p = 0,7 .

Закон распределения случайной величины:

X −3 7
p 0,3 0,7

Дисперсию данной случайной величины вычислим по формуле из свойства 3 дисперсии:

D (X ) = 2,7 + 34,3 − 16 = 21 .

Найти математическое ожидание случайной величины самостоятельно, а затем посмотреть решение

Пример 8. Дискретная случайная величина X принимает лишь два значения. Большее из значений 3 она принимает с вероятностью 0,4. Кроме того, известна дисперсия случайной величины D (X ) = 6 . Найти математическое ожидание случайной величины.

Пример 9. В урне 6 белых и 4 чёрных шара. Из урны вынимают 3 шара. Число белых шаров среди вынутых шаров является дискретной случайной величиной X . Найти математическое ожидание и дисперсию этой случайной величины.

Решение. Случайная величина X может принимать значения 0, 1, 2, 3. Соответствующие им вероятности можно вычислить по правилу умножения вероятностей . Закон распределения случайной величины:

X 0 1 2 3
p 1/30 3/10 1/2 1/6

Отсюда математическое ожидание данной случайной величины:

M (X ) = 3/10 + 1 + 1/2 = 1,8 .

Дисперсия данной случайной величины:

D (X ) = 0,3 + 2 + 1,5 − 3,24 = 0,56 .

Математическое ожидание и дисперсия непрерывной случайной величины

Для непрерывной случайной величины механическая интерпретация математического ожидания сохранит тот же смысл: центр массы для единичной массы, распределённой непрерывно на оси абсцисс с плотностью f (x ). В отличие от дискретной случайной величиной, у которой аргумент функции x i изменяется скачкообразно, у непрерывной случайной величины аргумент меняется непрерывно. Но математическое ожидание непрерывной случайной величины также связано с её средним значением.

Чтобы находить математическое ожидание и дисперсию непрерывной случайной величины, нужно находить определённые интегралы . Если дана функция плотности непрерывной случайной величины, то она непосредственно входит в подынтегральное выражение. Если дана функция распределения вероятностей, то, дифференцируя её, нужно найти функцию плотности.

Арифметическое среднее всех возможных значений непрерывной случайной величины называется её математическим ожиданием , обозначаемым или .

Математическим ожиданием случайной величины X называется среднее значение .

1. M(C) = C

2. M(CX) = CM(X) , где C = const

3. M(X ± Y) = M(X) ± M(Y)

4. Если случайные величины X и Y независимы, то M(XY) = M(X)·M(Y)

Дисперсия

Дисперсией случайной величины X называется

D(X) = S(x – M(X)) 2 p = M(X 2 ) – M 2 (X) .

Дисперсия представляет собой мерой отклонения значений случайной величины от своего среднего значения.

1. D(C) = 0

2. D(X + C) = D(X)

3. D(СX) = C 2 D(X) , где C = const

4. Для независимых случайных величин

D(X ± Y) = D(X) + D(Y)

5. D(X ± Y) = D(X) + D(Y) ± 2Cov(x, y)

Квадратный корень из дисперсии случайной величины X называется средним квадратичным отклонением .

@ Задача 3 : Пусть случайная величина X принимает всего два значения (0 или 1) с вероятностями q, p , где p + q = 1 . Найти математическое ожидание и дисперсию.

Решение:

M(X) = 1·p + 0·q = p; D(X) = (1 – p) 2 p + (0 – p) 2 q = pq.

@ Задача 4 : Математическое ожидание и дисперсия случайной величины X равны 8. Найти математическое ожидание и дисперсия случайных величин: а) X – 4 ; б) 3X – 4 .

Решение: M(X – 4) = M(X) – 4 = 8 – 4 = 4; D(X – 4) = D(X) = 8; M(3X – 4) = 3M(X) – 4 = 20; D(3X – 4) = 9D(X) = 72.

@ Задача 5 : Совокупность семей имеет следующее распределение по числу детей:

x i x 1 x 2
p i 0,1 p 2 0,4 0,35

Определить x 1 , x 2 и p 2 , если известно, что M(X) = 2; D(X) = 0,9 .

Решение: Вероятность p 2 равна p 2 = 1 – 0,1 – 0,4 – 0,35 = 0,15. Неизвестные x находятся из уравнений: M(X) = x 1 ·0,1 + x 2 ·0,15 + 2·0,4 + 3·0,35 = 2; D(X) = ·0,1 + ·0,15 + 4·0,4 + 9·0,35 – 4 = 0,9. x 1 = 0; x 2 = 1.

Генеральная совокупность и выборка. Оценки параметров

Выборочное наблюдение

Статистическое наблюдение можно организовать сплошное и не сплошное. Сплошное наблюдение предусматривает обследование всех единиц изучаемой совокупности (генеральной совокупности). Генеральная совокупность это множество физических или юридических лиц, которую исследователь изучает согласно своей задачи. Это часто экономически невыгодно, а иногда и невозможно. В связи с этим изучается только часть генеральной совокупности – выборочная совокупность .

Результаты, полученные на основе выборочной совокупности, можно распространить на генеральную совокупность, если следовать следующим принципам:



1. Выборочная совокупность должна определяться случайным образом.

2. Число единиц выборочной совокупности должно быть достаточным.

3. Должна обеспечиваться репрезентативность ( представительность) выборки. Репрезентативная выборка представляет собой меньшую по размеру, но точную модель той генеральной совокупности, которую она должна отражать.

Типы выборок

В практике применяются следующие типы выборок:

а) собственно-случайная, б) механическая, в) типическая, г) серийная, д) комбинированная.

Собственно-случайная выборка

При собственно-случайной выборке отбор единиц выборочной совокупности производится случайным образом, например, посредством жеребьевки или генератора случайных чисел.

Выборки бывают повторные и бесповторные. При повторной выборке единица, попавшая в выборку, возвращается и сохраняет равную возможность снова попасть в выборку. При бесповторной выборке единица совокупности, попавшая в выборку, в дальнейшем в выборке не участвует.

Ошибкиприсущие выборочному наблюдению, возникающие в силу того, что выборочная совокупность не полностью воспроизводит генеральную совокупность, называются стандартными ошибками . Они представляют собой среднее квадратичное расхождение между значениями показателей, полученных по выборке, и соответствующими значениями показателей генеральной совокупности.

Расчетные формулы стандартной ошибки при случайном повторном отборе следующая: , а при случайном бесповторном отборе следующая: , где S 2 – дисперсия выборочной совокупности, n/N – доля выборки, n, N - количества единиц в выборочной и генеральной совокупности. При n = N стандартная ошибка m = 0.

Механическая выборка

При механической выборке генеральная совокупность разбивается на равные интервалы и из каждого интервала случайным образом отбирается по одной единице.

Например, при 2%-ной доли выборки из списка генеральной совокупности отбирается каждая 50-я единица.

Стандартная ошибка механической выборки определяется как ошибка собственно-случайной бесповторной выборки.

Типическая выборка

При типической выборке генеральная совокупность разбивается на однородные типические группы, затем из каждой группы случайным образом производится отбор единиц.

Типической выборкой пользуются в случае неоднородной генеральной совокупности. Типическая выборка дает более точные результаты, потому что обеспечивается репрезентативность.

Например, учителя, как генеральная совокупность, разбиваются на группы по следующим признакам: пол, стаж, квалификация, образование, городские и сельские школы и т.д.

Стандартные ошибки типической выборки определяются как ошибки собственно-случайной выборки, с той лишь разницей, что S 2 заменяется средней величиной от внутригрупповых дисперсий.

Серийная выборка

При серийной выборке генеральная совокупность разбивается на отдельные группы (серии), затем случайным образом выбранные группы подвергаются сплошному наблюдению.

Стандартные ошибки серийной выборки определяются как ошибки собственно-случайной выборки, с той лишь разницей, что S 2 заменяется средней величиной от межгрупповых дисперсий.

Комбинированная выборка

Комбинированная выборка является комбинацией двух или более типов выборок.

Точечная оценка

Конечной целью выборочного наблюдения является нахождение характеристик генеральной совокупности. Так как этого невозможно сделать непосредственно, то на генеральную совокупность распространяют характеристики выборочной совокупности.

Принципиальная возможность определения средней арифметической генеральной совокупности по данным средней выборки доказывается теоремой Чебышева . При неограниченном увеличении n вероятность того, что отличие выборочной средней от генеральной средней будет сколь угодно мало, стремится к 1.

Это означает, что характеристика генеральной совокупности с точностью . Такая оценка называется точечной .

Интервальная оценка

Базисом интервальной оценки является центральная предельная теорема .

Интервальная оценка позволяет ответить на вопрос: внутри какого интервала и с какой вероятностью находится неизвестное, искомое значение параметра генеральной совокупности?

Обычно говорят о доверительной вероятности p = 1 a, с которой будет находиться в интервале D < < + D, где D = t кр m > 0 предельная ошибка выборки, a - уровень значимости (вероятность того, что неравенство будет неверным), t кр - критическое значение, которое зависит от значений n и a. При малой выборке n < 30 t кр задается с помощью критического значения t-распределения Стъюдента для двустороннего критиерия с n – 1 степенями свободы с уровнем значимости a (t кр (n – 1, a) находится из таблицы «Критические значения t–распределения Стъюдента», приложение 2). При n > 30, t кр - это квантиль нормального закона распределения (t кр находится из таблицы значений функции Лапласа F(t) = (1 a)/2 как аргумент). При p = 0,954 критическое значение t кр = 2 при p = 0,997 критическое значение t кр = 3. Это означает, что предельная ошибка обычно больше стандартной ошибки в 2-3 раза.

Таким образом, суть метода выборки заключается в том, что на основании статистических данных некоторой малой части генеральной совокупности удается найти интервал, в котором с доверительной вероятностью p находится искомая характеристика генеральной совокупности (средняя численность рабочих, средний балл, средняя урожайность, среднее квадратичное отклонение и т.д.).

@ Задача 1. Для определения скорости расчетов с кредиторами предприятий корпорации в коммерческом банке была проведена случайная выборка 100 платежных документов, по которым средний срок перечисления и получения денег оказался равным 22 дням ( = 22) со стандартным отклонением 6 дней (S = 6). С вероятностью p = 0,954 определить предельнуюошибку выборочной средней и доверительный интервал средней продолжительности расчетов предприятий данной корпорации.

Решение: Предельнаяошибка выборочной средней согласно (1) равна D = 2· 0,6 = 1,2, а доверительный интервал определяется как (22 – 1,2; 22 + 1,2), т.е. (20,8; 23,2).

§6.5 Корреляция и регрессия

Математическим ожиданием (средним значением) случайной величины X , заданной на дискретном вероятностном пространстве, называется число m =M[X]=∑x i p i , если ряд сходится абсолютно.

Назначение сервиса . С помощью сервиса в онлайн режиме вычисляются математическое ожидание, дисперсия и среднеквадратическое отклонение (см. пример). Кроме этого строится график функции распределения F(X) .

Свойства математического ожидания случайной величины

  1. Математическое ожидание постоянной величины равно ей самой: M[C]=C , C – постоянная;
  2. M=C M[X]
  3. Математическое ожидание суммы случайных величин равно сумме их математических ожиданий: M=M[X]+M[Y]
  4. Математическое ожидание произведения независимых случайных величин равно произведению их математических ожиданий: M=M[X] M[Y] , если X и Y независимы.

Свойства дисперсии

  1. Дисперсия постоянной величины равна нулю: D(c)=0.
  2. Постоянный множитель можно вынести из-под знака дисперсии, возведя его в квадрат: D(k*X)= k 2 D(X).
  3. Если случайные величины X и Y независимы, то дисперсия суммы равна сумме дисперсий: D(X+Y)=D(X)+D(Y).
  4. Если случайные величины X и Y зависимы: D(X+Y)=DX+DY+2(X-M[X])(Y-M[Y])
  5. Для дисперсии справедлива вычислительная формула:
    D(X)=M(X 2)-(M(X)) 2

Пример . Известны математические ожидания и дисперсии двух независимых случайных величин X и Y: M(x)=8 , M(Y)=7 , D(X)=9 , D(Y)=6 . Найти математическое ожидание и дисперсию случайное величины Z=9X-8Y+7 .
Решение. Исходя из свойств математического ожидания: M(Z) = M(9X-8Y+7) = 9*M(X) - 8*M(Y) + M(7) = 9*8 - 8*7 + 7 = 23.
Исходя из свойств дисперсии: D(Z) = D(9X-8Y+7) = D(9X) - D(8Y) + D(7) = 9^2D(X) - 8^2D(Y) + 0 = 81*9 - 64*6 = 345

Алгоритм вычисления математического ожидания

Свойства дискретных случайных величин: все их значения можно перенумеровать натуральными числами; каждому значению сопоставить отличную от нуля вероятность.
  1. Поочередно умножаем пары: x i на p i .
  2. Складываем произведение каждой пары x i p i .
    Например, для n = 4: m = ∑x i p i = x 1 p 1 + x 2 p 2 + x 3 p 3 + x 4 p 4
Функция распределения дискретной случайной величины ступенчатая, она возрастает скачком в тех точках, вероятности которых положительны.

Пример №1 .

x i 1 3 4 7 9
p i 0.1 0.2 0.1 0.3 0.3

Математическое ожидание находим по формуле m = ∑x i p i .
Математическое ожидание M[X] .
M[x] = 1*0.1 + 3*0.2 + 4*0.1 + 7*0.3 + 9*0.3 = 5.9
Дисперсию находим по формуле d = ∑x 2 i p i - M[x] 2 .
Дисперсия D[X] .
D[X] = 1 2 *0.1 + 3 2 *0.2 + 4 2 *0.1 + 7 2 *0.3 + 9 2 *0.3 - 5.9 2 = 7.69
Среднее квадратическое отклонение σ(x) .
σ = sqrt(D[X]) = sqrt(7.69) = 2.78

Пример №2 . Дискретная случайная величина имеет следующий ряд распределения:

Х -10 -5 0 5 10
р а 0,32 2a 0,41 0,03
Найти величину a , математическое ожидание и среднее квадратическое отклонение этой случайной величины.

Решение. Величину a находим из соотношения: Σp i = 1
Σp i = a + 0,32 + 2 a + 0,41 + 0,03 = 0,76 + 3 a = 1
0.76 + 3 a = 1 или 0.24=3 a , откуда a = 0.08

Пример №3 . Определить закон распределения дискретной случайной величины, если известна её дисперсия, причем х 1 x 1 =6; x 2 =9; x 3 =x; x 4 =15
p 1 =0,3; p 2 =0,3; p 3 =0,1; p 4 =0,3
d(x)=12,96

Решение.
Здесь надо составить формулу нахождения дисперсии d(x) :
d(x) = x 1 2 p 1 +x 2 2 p 2 +x 3 2 p 3 +x 4 2 p 4 -m(x) 2
где матожидание m(x)=x 1 p 1 +x 2 p 2 +x 3 p 3 +x 4 p 4
Для наших данных
m(x)=6*0,3+9*0,3+x 3 *0,1+15*0,3=9+0.1x 3
12,96 = 6 2 0,3+9 2 0,3+x 3 2 0,1+15 2 0,3-(9+0.1x 3) 2
или -9/100 (x 2 -20x+96)=0
Соответственно надо найти корни уравнения, причем их будет два.
x 3 =8, x 3 =12
Выбираем тот, который удовлетворяет условию х 1 x 3 =12

Закон распределения дискретной случайной величины
x 1 =6; x 2 =9; x 3 =12; x 4 =15
p 1 =0,3; p 2 =0,3; p 3 =0,1; p 4 =0,3

Лучшие статьи по теме