Как построить распределение гаусса в excel

Практические примеры решений систем и анализ вероятностей методом Гаусса. Как использовать функцию ГАУСС для вычислений.

Нормальное распределение в статистике

История закона насчитывает 300 лет. Первым открывателем стал Абрахам де Муавр, который придумал аппроксимацию биномиального распределения еще 1733 году. Через много лет Карл Фридрих Гаусс (1809 г.) и Пьер-Симон Лаплас (1812 г.) вывели математические функции.

Лаплас также обнаружил замечательную закономерность и сформулировал центральную предельную теорему (ЦПТ), согласно которой сумма большого количества малых и независимых величин имеет нормальное распределение.

Нормальный закон не является фиксированным уравнением зависимости одной переменной от другой. Фиксируется только характер этой зависимости. Конкретная форма распределения задается специальными параметрами. Например, у = аx + b – это уравнение прямой. Однако где конкретно она проходит и под каким наклоном, определяется параметрами а и b. Также и с нормальным распределением. Ясно, что это функция, которая описывает тенденцию высокой концентрации значений около центра, но ее точная форма задается специальными параметрами.

Кривая нормального распределения Гаусса имеет следующий вид.

График плотности нормального распределения

График нормального распределения напоминает колокол, поэтому можно встретить название колоколообразная кривая. У графика имеется «горб» в середине и резкое снижение плотности по краям. В этом заключается суть нормального распределения. Вероятность того, что случайная величина окажется около центра гораздо выше, чем то, что она сильно отклонится от середины.

Различные вероятности у нормально распределенных данных

На рисунке выше изображены два участка под кривой Гаусса: синий и зеленый. Основания, т.е. интервалы, у обоих участков равны. Но заметно отличаются высоты. Синий участок удален от центра, и имеет существенно меньшую высоту, чем зеленый, который находится в самом центре распределения. Следовательно, отличаются и площади, то бишь вероятности попадания в обозначенные интервалы.

Формула нормального распределения (плотности) следующая.

Функция Гаусса

Формула состоит из двух математических констант:

π – число пи 3,142;

е – основание натурального логарифма 2,718;

двух изменяемых параметров, которые задают форму конкретной кривой:

m – математическое ожидание (в различных источниках могут использоваться другие обозначения, например, µ или a);

σ2 – дисперсия;

ну и сама переменная x, для которой высчитывается плотность вероятности.

Конкретная форма нормального распределения зависит от 2-х параметров: математического ожидания (m) и дисперсии (σ2). Кратко обозначается N(m, σ2) или N(m, σ). Параметр m (матожидание) определяет центр распределения, которому соответствует максимальная высота графика. Дисперсия σ2 характеризует размах вариации, то есть «размазанность» данных.

Параметр математического ожидания смещает центр распределения вправо или влево, не влияя на саму форму кривой плотности.

Влияние матожидания на нормальное распределение

А вот дисперсия определяет остроконечность кривой. Когда данные имеют малый разброс, то вся их масса концентрируется у центра. Если же у данных большой разброс, то они «размазываются» по широкому диапазону.

Влияние сигмы на нормальное распределение

Плотность распределения не имеет прямого практического применения. Для расчета вероятностей нужно проинтегрировать функцию плотности.

Вероятность того, что случайная величина окажется меньше некоторого значения x, определяется функцией нормального распределения:

Функция нормального распределения
Используя математические свойства любого непрерывного распределения, несложно рассчитать и любые другие вероятности, так как

P(a ≤ X < b) = Ф(b) – Ф(a)

Примеры использования функции ГАУСС в Excel

Синтаксис рассматриваемой функции не представляет из себя ничего сложного, ведь функции ГАУСС присущ всего один обязательный аргумент – Z – возвращающий число.

Важно отметить, что существует определенная связь между функцией ГАУСС и такой статистической функцией, как стандартное нормальное распределение, иначе говоря – НОРМ.СТ.РАСП.

Итак, всегда функция НОРМ.СТ.РАСП (0; Истина) делает возврат 0,5, тогда как ГАУСС (z) имеет в результате значение меньше на 0,5, чем результат функции НОРМ.СТ.РАСП. На рисунке, расположенном ниже, приведен пример использования данных статистических функций для возвращения числа 1,5.

НОРМ.СТ.РАСП.

Для наглядности продемонстрируем зависимость между значениями функций графическим способом. Для этого – сформируем таблицу с выборкой чисел, например на интервале от -5 до 5 с шагом 0,5, а затем по имеющимся данным построим график:

пропорциональная корреляция.

На графике четко прослеживается пропорциональная корреляция результатов вычислений функций ГАУСС и НОРМ.СТ.РАСП.

Легко создать нормальную диаграмму распределения (кривую колокола) в Excel

В Excel диаграмма колоколообразной кривой, также известная как диаграмма нормального распределения, используется для анализа вероятности каждого события. Обычно вы можете рассчитать среднее значение, стандартное отклонение и нормальное распределение с помощью формул, а затем создать диаграмму колоколообразной кривой на основе вычисленных данных. Здесь с Kutools for Excel, вы можете щелкнуть, чтобы создать стандартную диаграмму нормального распределения в три этапа с применением Нормальное распределение / кривая колокола утилита.

Создайте диаграмму нормального распределения или колоколообразной кривой в несколько кликов

Создайте диаграмму нормального распределения или колоколообразной кривой в несколько кликов

Чтобы быстро создать нормальное распределение или диаграмму колоколообразной кривой в Excel, примените эту функцию, выполнив следующие действия:

1. Нажмите Kutools > Графики > Распределение данныхНормальное распределение / кривая колокола. Смотрите скриншот:

диаграмма кривой колокола 01

2. В выскочившем Быстро создать диаграмму нормального распределения В диалоговом окне выберите тип диаграммы, которую вы хотите создать, а затем выберите диапазон данных, на основе которого вы хотите создать диаграмму, затем максимальное значение, минимальное значение, среднее значение и стандартное отклонение были вычислены и перечислены в диалоговом окне. Смотрите скриншот:

3, Затем нажмите OK кнопка, график нормального распределения или колоколообразной кривой был создан сразу, см. снимок экрана:

Советы:

Если вы отметите График гистограммы частот в Быстро создать диаграмму нормального распределения диалоговом окне, он создаст диаграмму гистограммы, как показано ниже.

В Быстро создать диаграмму нормального распределения диалог, если вы отметите оба График нормального распределения и График гистограммы частот флажки, будет создана комбинированная диаграмма, как показано ниже:

Ноты:

1. Если вы хотите вывести рассчитанные данные, вы можете проверить Выходные данные флажок, то все рассчитанные данные будут выведены в новую книгу.

2. Вы можете нажать на Пример в Быстро создать диаграмму нормального распределения диалоговое окно при первом использовании, и оно создаст новую книгу для отображения образца данных и диаграммы для вас.

Рекомендуемые инструменты для повышения производительности

Следующие ниже инструменты могут значительно сэкономить ваше время и деньги. Какой из них вам подходит?

Office Tab

:

Использование удобных вкладок в вашем офисе

, как и в случае Chrome, Firefox и New Internet Explorer.

Kutools for Excel

:

Более 300 дополнительных функций для Excel

2019, 2016, 2013, 2010, 2007 и Office 365.

Classic Menu for Office

:

Верните знакомые меню в Office

2007, 2010, 2013, 2016, 2019 и 365, как если бы это были Office 2000 и 2003.

Kutools for Excel

Описанная выше функциональность – лишь одна из 300 мощных функций Kutools for Excel.

Разработано для Excel (Office) 2019, 2016, 2013, 2010, 2007 и Office 365. Бесплатная загрузка и использование в течение 60 дней.

Снимок экрана Kutools for Excel

btn подробнее      btn скачать     покупка btn

Общие сведения

Если величина является суммой многих случайных слабо взаимозависимых величин, каждая из которых вносит малый вклад относительно общей суммы, то центрированное и нормированное распределение такой величины при достаточно большом числе слагаемых стремится к нормальному распределению.

Это следует из центральной предельной теоремы теории вероятностей. В окружающем нас мире часто встречаются величины, значение которых определяется совокупностью многих независимых факторов. Этот факт, а также то, что распределение считалось типичным, обычным, привели к тому, что в конце XIX века стал использоваться термин «нормальное распределение». Нормальное распределение играет заметную роль во многих областях науки, например в математической статистике и статистической физике.

Случайная величина, имеющая нормальное распределение, называется нормальной, или гауссовской, случайной величиной.

Exceltip

Блог о программе Microsoft Excel: приемы, хитрости, секреты, трюки

Метод Гаусса для простых уравнений

Для простых уравнений, где три или меньше неизвестных, можно воспользоваться методом Гаусса. Вы можете решить одно уравнение или несколько одновременно. Будем решать по следующим данным:
2x+3y=12
3x−y=7.

  1. Вставим наши уравнения в ячейки (желательно их оформить у самого края электронной книги).

№ 1.png

  1. Чуть ниже на этой странице делаем две небольшие таблицы, куда будут вноситься коэффициенты и свободные члены. Для этого оформим несколько ячеек со значением А (для коэффициентов) и несколько с шапкой В (для свободных членов)

№ 2.png

Важно!

Будьте внимательны при внесении записей, все значения, которые расположены после знака равно, записываются в табличку В.

  1. Теперь занимаемся первым уравнением. Для этого скопируем первую матрицу вместе со значением после знака равно. Размещаем ее ниже наших табличек на одну строчку.

№ 3.png

  1. Далее в ячейку ниже вводим подготовленную формулу: =B8:E8-$B7:7:7:E7∗(B8/7*(B8/7(B8/B$7). Затем нажимаете комбинацию клавиш CTRL+SHIFT+ENTER. Во всей строке проставятся точные значения.

№ 4.png

  1. Далее вам нужно скопировать эту строку и продублировать ее на ячейку ниже. Теперь скопируем две первые строчки после пустующей строки. Для этого выделим их и нажмем комбинацию CTRL+C или при помощи встроенного инструмента «Копировать» на панели управления.

№ 5.png

  1. Отступаем одну строчку и на следующей делаем выделение пустой ячейки курсором мыши. Затем вызываем выпадающий список путем нажатия на правую кнопку мыши. Теперь выбираем пункт «Специальная вставка», появится дополнительный список, в котором необходимо отметить «Вставить значения».

№ 6.png

  1. Как видим, в нашем случае высвечивается ошибка о запрете деления на «0». В вашем случае, это будут другие значения.

№ 7.png

  1. В дальнейшем вам необходимо сделать обратную прогонку. Для этого отступим три пустые строки на странице, а в четвертую вставим формулу: =B17:E17/D17. Затем выделяем строчку и жмем все ту же комбинацию клавиш CTRL+SHIFT+ENTER.

№ 8.png

В результате, при проведении правильных расчетов вы должны получить ответы на буквенные символы. Однако, этот метод требует внимательности и точного ввода формул, с чем не каждый пользователь справляется, поэтому рассмотрим другой вариант для решения.

Полезно знать!

Аналогичным способом проводим вычисление неизвестных аргументов для второго и третьего уравнений, если они присутствуют, и представляют собой целую систему.

Задания для самостоятельной работы

1. Какова вероятность того, что восемь из десяти студентов,сдающих зачет, получат «незачет». (0,04)

Решение системы вероятности методом ГАУССА в Excel

Задача представляет собой вычисление вероятности возможных значений при бросании двух костей.

Пример с игрой в кости является наиболее наглядным, так как мы имеем ограниченный набор данных, которые соответствуют вероятностям. Так, вероятность имеет значение от нуля до единицы, к которому стремится наблюдаемая частота при бесконечно большой выборке или повторении эксперимента.

Существует 36 возможных комбинаций. При этом, вероятность того, что при бросании двух костей выпадет 2 очка равна 1/36, а 7 очков – 1/6. Отобразим перечень возможных значений бросания двух игральных костей в таблице, приведя при этом все вероятности к общему знаменателю.

36 возможных комбинаций.

Однако, такой ряд данных не дает возможности для выявления полного распределения, поэтому следует отобразить данные об отдельных вероятностях в рассчитанную по функции распределения. Так необходимо, все вероятности просуммировать последовательно (1+2+3+4+5+6+5+4+3+2+1).

просуммировать последовательно.

Теперь определяем коэффициент вероятности разделив по отдельности последовательную сумму вероятностей на максимально возможное количество комбинаций 36.

количество комбинаций 36.

В первом случае нами были рассмотрены отдельные вероятности, во втором – сумма вероятностей от первого возможного значения до заданного.

Необходимо преобразовать диапазон ячеек D2:D13 в числовой формат данных, иначе при обращении на них функции ГАУСС будет иметь место ошибка.

В созданный рядом с первоначальной таблицей столбец E введем формулу, которая в качестве аргумента делает обращение к ячейке D2.

Далее, протянем формулу вниз по столбцу, и получим ряд вероятностей с использованием функции ГАУСС.

ГАУСС.

Для более наглядной визуализации, построим график вероятности:

график вероятности.

Вероятность

Вероятность, что подброшенная монета упадёт орлом вверх 50%, что при броске шестигранного кубика выпадет 4 – 16,7%, что завтра на кого-нибудь упадёт метеорит – 0.00000000294%. Это простые примеры, достаточно разделить количество желаемых событий на общее количество случаев и мы получаем вероятность события, но когда результаты эксперимента могут быть не только орлом или решкой (что эквивалентно да/нет), а большим набором данных. Например, вес батона хлеба, если мы возьмём в магазине 1000 буханок хлеба и взвесим каждую, то мы узнаем, что на самом деле батон не весит 400 грамм, результаты будут варьироваться в диапазоне 384-416 грамм (допуск разброса веса предусмотрен ГОСТом).

3. Генерация случайных величин

Еще одним аспектомиспользования законов распределения вероятностей являет­ся генерация случайных величин. Бывают ситуации, когда необходимополучить пос­ледовательность случайных чисел. Это, в частности, требуется длямоделирования объектов, имеющих случайную природу, по известному распределениювероятно­стей.

Процедура генерациислучайных величин используется для заполнения диапазона ячеек случайными числами, извлеченными изодного или не­скольких распределений.

В MSExcel для генерации СВ используются функции из категории Математические:

СЛЧИС () – выводит на экран  равномернораспределенные случайные числа больше или равные 0 и меньшие 1;

СЛУЧМЕЖДУ (ниж_граница; верх_граница) – выводит на экранслучайное число, лежащее между про­извольными заданнымизначениями.

В случае использованияпроцедуры Генерация случайных чисел из пакета Анализа необходимозапол­нить следующие поля:

число переменныхвводится число столбцов значений, которые необходимо разместить в выходном диапазоне. Если это число не введено, то всестолбцы в выходном диапазоне будут заполнены;

число случайных чиселвводится число случайных значений, которое необ­ходимо вывести длякаждой переменной, если число случайных чисел не будет введе­но, то все строки выходного диапазона будут заполнены;

– в поле распределение необходимо выбрать тип распределения,которое следует использовать для генерации случайных переменных:

1.  равномерноехарактеризуетсяверxней и нижней границами. Переменные из­влекаются с одной итой же вероятностью для всех значений интервала.

2. нормальное— характеризуется средним значением и стандартным отклонени­ем. Обычно дляэтого распределения используют среднее значе­ние0 и стандартное отклонение 1.

3. биномиальное— характеризуется вероятностью успеха (величина р) для неко­торого числа попыток. Например, можно сгенерировать случайные двухальтернативные переменные по числу попыток, сумма которых будет биномиальной случайнойпеременной;

4. дискретное— характеризуется значением СВ и соответствующим ему интервалом вероятности, диапазон должен состоять из двух столбцов: левого,содержаще­го значения, и правого, содержащеговероятности, связанные со значением в дан­ной строке. Сумма вероятностей должна бытьравна 1;

5. распределения Бернулли, Пуассонаи Модельное.

– в поле случайное рассеиваниевводится произвольное значение, для которого необ­ходимогенерировать случайные числа. Впоследствии можно снова использовать этозначение для получения тех же самых случайных чисел.

выходной диапазонвводится ссылка на левую верхнюю ячейку выходного диапазона. Размер выходного диапазона будет определен автоматически, ина эк­ран будет выведено сообщение в случаевозможного наложения выходного диапа­зона на исходныеданные.

Рассмотрим пример.                                                                                  

Пример 3. Повар столовой может готовить 4 различных первых блюда (уха, щи, борщ, грибной суп). Необходимо составить меню на месяц, так чтобыпервые блюда чередовались в случайном порядке.

Решение

1.        Пронумеруем первыеблюда по порядку: 1 — уха, 2 — щи, 3 — борщ, 4 — грибной суп. Введем числа 1-4 в диапазон А2:А5 рабочей таблицы.

2.        Укажем желаемую вероятность появлениякаждого первого блюда. Пусть все блюда будутравновероятны (р=1/4). Вводим число 0,25 в диапазон В2:В5.

3.        В меню Сервисвыбираем пункт Анализ данных и далее указываем строку Генерацияслучайных чисел. В появившемся диалоговом окне указываем Числопеременных1, Число случайных чисел30 (количестводней в месяце). В поле Распределение указываем Дискретное (только натуральные числа). В поле Входнойинтервал значений и вероятностейвводим (мышью) диапазон, содержащий номера супов и ихвероятности. – А2:В5.

4.        Указываем выходнойдиапазон и нажимаем ОК. В столбце С появляются случайные числа: 1, 2, 3,4.

Как построить график с нормальным распределением в Excel

95-0-Normalnoe-raspredelenie-v-Excel-logo.png

Так как я часто имею дело с большим количеством данных, у меня время от времени возникает необходимость генерировать массивы значений для проверки моделей в Excel. К примеру, если я хочу увидеть распределение веса продукта с определенным стандартным отклонением, потребуются некоторые усилия, чтобы привести результат работы формулы СЛУЧМЕЖДУ() в нормальный вид. Дело в том, что формула СЛУЧМЕЖДУ() выдает числа с единым распределением, т.е. любое число с одинаковой долей вероятности может оказаться как у нижней, так и у верхней границы запрашиваемого диапазона. Такое положение дел не соответствует действительности, так как вероятность возникновения продукта уменьшается по мере отклонения от целевого значения. Т.е. если я произвожу продукт весом 100 грамм, вероятность, что я произведу 97-ми или 103-граммовый продукт меньше, чем 100 грамм. Вес большей части произведенной продукции будет сосредоточен рядом с целевым значением. Такое распределение называется нормальным. Если построить график, где по оси Y отложить вес продукта, а по оси X – количество произведенного продукта, график будет иметь колоколообразный вид, где наивысшая точка будет соответствовать целевому значению.

Таким образом, чтобы привести массив, выданный формулой СЛУЧМЕЖДУ(), в нормальный вид, мне приходилось ручками исправлять пограничные значения на близкие к целевым. Такое положение дел меня, естественно, не устраивало, поэтому, покопавшись в интернете, открыл интересный способ создания массива данных с нормальным распределением. В сегодняшней статье описан способ генерации массива и построения графика с нормальным распределением.

Рейтинг
( 1 оценка, среднее 5 из 5 )
Загрузка ...