Как в excel построить кривую нормального распределения - Учим Эксель

Построение кривой Лоренца в Microsoft Excel

Кривая Лоренца в Microsoft Excel

Для оценки уровня неравенства меж разными слоями населения общества нередко употребляют кривую Лоренца и производный от неё показатель – коэффициент Джинни. При помощи их можно найти, как велик соц разрыв в обществе меж самыми обеспеченными и более бедными слоями населения. При помощи инструментов приложения Excel можно существенно облегчить функцию построения кривой Лоренца. Давайте, разберемся, как в среде Эксель это можно выполнить на практике.

Внедрение кривой Лоренца

Кривая Лоренца представляет собой типичную функцию распределения, отображенную графически. По оси X данной функции размещается количество населения в процентном соотношении по нарастающей, а по оси Y — полное количество государственного дохода. Фактически, сама кривая Лоренца состоит из точек, любая из которых соответствует процентному соотношению уровня дохода определенной части общества. Чем больше изогнута линия Лоренца, тем больше в обществе уровень неравенства.

В безупречной ситуации, при которой отсутствует публичное неравенство, любая группа населения имеет уровень дохода прямо пропорциональный её численности. Линия, характеризующая такую ситуацию, именуется кривой равенства, хотя она и представляет собой прямую. Чем больше площадь фигуры, ограниченной кривой Лоренца и кривой равенства, тем выше уровень неравенства в обществе.

Кривая Лоренца может употребляться не только лишь для определения ситуации имущественного расслоения в мире, в определенной стране либо в обществе, да и для сопоставления в данном нюансе отдельных домохозяйств.

Вертикальная ровная, которая соединяет линию равенства и более удаленную от неё точку кривой Лоренца, именуется индексом Гувера либо Робин Гуда. Данный отрезок указывает, какую величину дохода необходимо перераспределить в обществе, чтоб достигнуть полного равенства.

Уровень неравенства в обществе определяется при помощи индекса Джинни, который может варьироваться от 0 до 1. Он ещё именуется коэффициентом концентрации доходов.

Построение полосы равенства

Сейчас давайте на определенном примере поглядим, как сделать линию равенства и кривую Лоренца в Экселе. Для этого используем таблицу количества населения разбитого на 5 равных групп (по 20%), которые суммируются в таблице по нарастающей. Во 2-ой колонке данной таблицы представлена величина государственного дохода в процентном соотношении, которая соответствует определенной группе населения.

Таблица доходов населения в Microsoft Excel

Для начала построим линию абсолютного равенства. Она будет состоять из 2-ух точек – нулевой и точки суммарного государственного дохода для 100% населения.

    Перебегаем во вкладку «Вставка». На полосы в блоке инструментов «Диаграммы» нажимаем на клавишу «Точечная». Конкретно данный тип диаграмм подойдет для нашей задачки. Дальше раскрывается перечень подвидов диаграмм. Избираем «Точечная с гладкими кривыми и маркерами».

Выбор вида диаграммы в Microsoft Excel

Переход к выбору данных в Microsoft Excel

Окно выбора источника данных в Microsoft Excel

В поле «Значения X» следует указать координаты точек диаграммы по оси X. Как мы помним, их будет всего две: 0 и 100. Записываем данные значения через точку с запятой в данном поле.

В поле «Значения Y» следует записать координаты точек по оси Y. Их тоже будет две: 0 и 35,9. Крайняя точка, как мы можем созидать по графику, соответствует совокупному национальному доходу 100% населения. Итак, записываем значения «0;35,9» без кавычек.

Изменения ряда для диаграммы Линия равенства в Microsoft Excel

Закрытие окна выбора источника данных в Microsoft Excel

Линия равенства построена в Microsoft Excel

Создание кривой Лоренца

Сейчас нам предстоит конкретно построить кривую Лоренца, делая упор на табличные данные.

    Кликаем правой клавишей мыши по области диаграммы, на которой уже размещена линия равенства. В запустившемся меню опять останавливаем выбор на пт «Избрать данные…».

Переход к выбору данных в программе Microsoft Excel

Переход к добавлению нового элемента в окне выбора источника в Microsoft Excel

В поле «Значения X» следует занести все данные столбца «% населения» нашей таблицы. Для этого устанавливаем курсор в область поля. Дальше зажимаем левую клавишу мыши и выделяем соответственный столбец на листе. Координаты здесь же будут отображены в окне конфигурации ряда.

В поле «Значения Y» заносим координаты ячеек столбца «Сумма государственного дохода». Делаем это по той же методике, по которой вносили данные в предшествующее поле.

Изменения ряда для кривой Лоренца в Microsoft Excel

Закрытие окна выбора источника данных в программе Microsoft Excel

Кривая Лоренца построена в Microsoft Excel

Построение кривой Лоренца и полосы равенства в Экселе делается на тех же принципах, что и построение хоть какого другого вида диаграмм в данной программке. Потому для юзеров, которые обуяли умением строить диаграммы и графики в Excel, данная задачка не обязана вызвать огромных заморочек.

Мы рады, что смогли посодействовать Для вас в решении трудности.

Кроме данной статьи, на веб-сайте еще 12327 инструкций.
Добавьте веб-сайт Lumpics.ru в закладки (CTRL+D) и мы буквально еще пригодимся для вас.

Отблагодарите создателя, поделитесь статьей в соц сетях.

Опишите, что у вас не вышло. Наши спецы постараются ответить очень стремительно.

Обычное распределение: осознание гистограмм и вероятностей

Данная статья является частью серии статей о статистике в электротехнике, которую мы начали с обсуждения статистического анализа и описательной статистики. Потом мы изучили три описательных статистических показателя исходя из убеждений внедрения в обработке сигналов.

В прошлой статье мы представили обычное распределение в электротехнике, заложив базу для нашего текущего обсуждения: осознание вероятностей в измеренных данных.

Интересно почитать:  Фильтр по строкам эксель

Осознание гистограмм

В предшествующей статье мы начали обсуждение нормального распределения, обратившись к форме данной гистограммы:

Рисунок 1 Гистограмма, иллюстрирующая нормальное распределение Набросок 1 – Гистограмма, иллюстрирующая обычное либо гауссово распределение

Я думаю, что большая часть людей, работающих в области науки либо техники, хотя бы смутно знакомы с гистограммами, но давайте создадим шаг вспять.

Что такое гистограмма?

Гистограммы – это зрительные представления 1) значений, присутствующих в наборе данных, и 2) частоты возникновения этих значений. Показанная выше гистограмма может представлять огромное количество разных типов инфы.

Представим, что она представляет собой распределение значений, приобретенных нами при измерении различия, округлой до наиблежайшего милливольта, меж номинальным и фактическим выходным напряжением линейного стабилизатора, который подвергался разным температурам и условиям эксплуатации. Так, к примеру, приблизительно 8000 измерений проявили разницу в 0 мВ меж номинальным и фактическим выходными напряжениями, а приблизительно 1000 измерений проявили разницу в 10 мВ.

Гистограммы – очень действенный метод обобщения огромных размеров данных. Взглянув на гистограмму выше, мы можем стремительно отыскать частоту отдельных значений в наборе данных и найти тенденции либо закономерности, которые посодействуют нам осознать связь меж измеренным значением и частотой.

Гистограммы с интервалами

Когда набор данных содержит настолько не мало различных значений, что мы не можем комфортно связать их с отдельными столбцами гистограммы, мы используем объединение в интервалы (биннинг). Другими словами мы определяем спектр значений как интервал, группируем результаты измерений в эти интервалы и создаем по одному столбцу для всякого интервала.

Последующая гистограмма, которая была сгенерирована из нормально распределенных данных со средним значением 0 и обычным отклонением 0,6, употребляет интервалы заместо отдельных значений:

Рисунок 2 Гистограмма с использованием интервалов вместо отдельных значений Набросок 2 – Гистограмма с внедрением интервалов заместо отдельных значений

Горизонтальная ось разбита на 10 интервалов схожей ширины, и любому интервалу назначен один столбец. Все результаты измерений, попадающие в числовой интервал, влияют на высоту соответственного столбца (метки на горизонтальной оси демонстрируют, что интервалы не схожей ширины, но это просто поэтому, что значения меток округлены).

Гистограммы и возможность

В неких ситуациях гистограмма не дает подходящей нам инфы. Мы можем поглядеть на гистограмму и просто найти частоту измеренного значения, но не можем просто найти возможность измеренного значения.

К примеру, если я посмотрю на первую гистограмму, я понимаю, что приблизительно 8000 измерений проявили разницу в 0 В меж номинальным и фактическим напряжениями стабилизатора, но я не понимаю, какова возможность того, что итог случаем избранного измерения либо новейшего измерения скажет о разнице в 0 В.

Это суровое ограничение, поэтому что возможность отвечает на очень всераспространенный вопросец: каковы шансы, что…?

Каковы шансы, что у моего линейного стабилизатора погрешность выходного напряжения будет наименее 2 мВ? Какова возможность того, что частота битовых ошибок моего канала передачи данных будет выше 10 -3 ? Какова возможность того, что из-за шума мой входной сигнал превзойдет порог срабатывания? И так дальше.

Причина этого ограничения заключается в том, что гистограмма просто верно не передает размер подборки, другими словами полное количество измерений (на теоретическом уровне полное количество измерений можно найти, сложив значения всех столбцов гистограммы, но это было бы мучительно и неточно).

Если мы знаем размер подборки, мы можем поделить количество возникновений на размер подборки и таковым образом найти возможность. Давайте разглядим пример.

Рисунок 3 Пример того, как гистограмма может помочь нам определить вероятность путем деления количества появлений на размер выборки Набросок 3 – Пример того, как гистограмма может посодействовать нам найти возможность методом деления количества возникновений на размер подборки

Красноватые пунктирные полосы заключают в себя столбцы, которые указывают на погрешности напряжения наименее 2 мВ, а числа, написанные снутри столбцов, указывают четкое количество возникновений этих 3-х значений погрешности напряжения. Сумма этих 3-х чисел составляет 23 548. Таковым образом, на базе этого примера по сбору данных возможность получения погрешности наименее 2 мВ составляет 23 548/100 000 ≈ 23,5%.

Функция массы вероятности

Если наша основная цель при разработке гистограммы – передать информацию о вероятности, мы можем поменять всю гистограмму, разделив все счетчики вхождений на размер подборки.

Приобретенный график является аппроксимацией функции массы вероятности. К примеру:

Рисунок 4 Гистограмма, изображающая приблизительную функцию массы вероятности, полученную путем деления количества всех вхождений на размер выборки Набросок 4 – Гистограмма, изображающая ориентировочную функцию массы вероятности, полученную методом деления количества всех вхождений на размер подборки

Всё, что мы по сути выполнили, это изменили числа на вертикальной оси. Тем не наименее, сейчас мы можем поглядеть на отдельное значение либо на группу значений и просто найти возможность возникновения.

Желаю прояснить последующую деталь: я произнес, что мы аппроксимируем функцию массы вероятности, когда берем гистограмму и делим значения на размер подборки. Настоящая функция массы вероятности представляет собой идеализированное распределение вероятностей, что значит, что для этого будет нужно нескончаемое количество измерений.

Интересно почитать:  Как построить график корреляции в excel

Таковым образом, когда мы работаем с близкими к реальности размерами подборки, гистограмма, сделанная на базе измеренных данных, дает нам лишь приближение функции массы вероятности.

Масса вероятности против плотности вероятности

Стоит выделить, что функция массы вероятности является дискретным эквивалентом функции плотности вероятности (о которой мы гласили в предшествующей статье).

В то время как функция плотности вероятности является непрерывной и предоставляет значения вероятности, когда мы интегрируем функцию в обозначенном спектре, функция массы вероятности дискретизируется и дает нам возможность, связанную с определенным значением либо интервалом.

Эти две функции передают одну и ту же общую статистическую информацию о переменной либо о сигнале, но делают это по-разному.

Направьте внимание на разницу меж 2-мя наименованиями: вертикальная ось функции массы вероятности показывает массу вероятности, как количественное значение. Вертикальная ось функции плотности вероятности показывает плотность вероятности относительно горизонтальной оси; чтоб найти количественное значение вероятности, мы должны интегрировать эту плотность по горизонтальной оси.

Заключение

Мы разглядели функции массы и плотности вероятности, и сейчас мы готовы изучить кумулятивную функцию распределения и изучить вероятности нормального распределения исходя из убеждений обычного отличия. О этом мы побеседуем в последующей статье.

Обычное распределение

Обычное распределение является более всераспространенным типом распределения, предполагаемым в техническом анализе фондового рынка и в остальных видах статистического анализа. Обычное обычное распределение имеет два параметра: среднее значение и обычное отклонение . Для нормального распределения 68% наблюдений находятся в границах +/- одно обычное отклонение от среднего значения, 95% находятся в границах +/- два обычных отличия, а 99,7% находятся в границах + — три обычных отличия.

Общим обычным распределением вероя тностей непрерывной случайной величины именуется распределение с плотностью Нормальное распределение

Обычное распределение задается 2-мя параметрами: и .

По определениям математического ожидания и дисперсии опосля выполнения соответственных интегрирований можно вывести, что для нормального распределения справедливы формулы:

По данной ссылке вы найдёте полный курс лекций по высшей арифметике:

Определение:

Обычное распределение с параметрами и именуется нормированным; его плотность Нормальное распределение

Так как функция является четной, неопределенный интеграл от нее — нечетная функция, и поэтому заместо функции распределения употребляется функция Лапласа Функции табулированы Графики плотности нормального распределения для различных значений показаны на рис. 2.6. Нормальное распределение

Пусть случайная величина X задана плотностью нормального распределения ; тогда возможность того, что воспримет значение на интервале согласно формулам равна: Нормальное распределениеПреобразование данной формулы методом введения новейшей переменной интегрирования приводит к комфортной вычислительной формуле Нормальное распределениегде — функция Лапласа, определенная по формуле.

Может быть для вас будут полезны данные странички:

Определенный интеграл примеры решений

Область определения функции примеры решения

Пределы функций примеры решения

Производная показательно степенной функции

Модель нормального распределения мотивирована центральной предельной аксиомой.

Теория утверждает, что средние значения, рассчитанные из независящих идентично распределенных случайных величин, имеют примерно обычные распределения, независимо от типа распределения, из которого выбираются переменные (при условии, что они имеют конечную дисперсию). Обычное распределение время от времени путают с симметричным распределением. Симметричное распределение — это то, где разделительная линия делает два зеркальных изображения, но фактические данные могут быть 2-мя горбами либо серией бугров в дополнение к кривой колокола, которая показывает на обычное распределение.

Нормальное распределение

Примеры с решением

Пример 1.

Случайная величина распределена по нормальному закону с математическим ожиданием и средним квадратическим отклонением, соответственно равными 10 и 5. Отыскать возможность того, что воспримет значение на интервале (20, 30).

Решение:

Воспользуемся формулой . По условию Как следует, Нормальное распределениеПо табл. 2 приложения находим надлежащие значения функции Лапласа и совсем получаем:

Пример 2.

Магазин реализует мужские костюмчики. По данным статистики, распределение по размерам является обычным с математическим ожиданием и средним квадратическим отклонением, соответственно равным 48 и 2. Найти процент спроса на костюмчики 50-го размера при условии разброса значений этого размера в интервале (49, 51).

Решение:

По условию задачки Используя формулу (2.66), получаем, что возможность спроса на костюмчики 50-го размера в данном интервале равна: Нормальное распределение

Как следует, спрос на костюмчики 50-го размера составит около 24%, и магазину необходимо предугадать это в общем объеме закупки.

Обычное распределение и его числовые свойства

ДСВ — дискретная случайная величина

НСВ — непрерывная случайная величина.

В этом подразделе мы сделаем функцию распределения для всякого типа НСВ и сделаем график, выясним числовые характеристики этого типа НСВ и узнаем тип НСВ в настоящих ситуациях из содержания задачки. вы будете обучаться. Более всераспространенным в природе, экономике, социологии и остальных науках является обычное распределение непрерывных случайных величин.

Используя обычное распределение, вы сможете обрисовать плотность вероятности НСВ, когда возникают отличия от среднего случайного значения из-за разных явлений, работающих независимо друг от друга, но в схожей степени.

Интересно почитать:  Как в excel добавить несколько строк

Чем больше случайных случайных величин добавлено, тем поточнее итог. Все эти явления не зависят друг от друга, но, воздействуя на процесс производства приблизительно с схожей силой, обусловливают то, что закон, по которому меняется НСВ (к примеру, размер определенной детали), описывается обычным распределением.

Самое четкое изготовка детали с данными размерами — «идеал» — будет соответствовать математическому ожиданию т, разброс фактических значений случайной величины размера детали — понятию дисперсии (поточнее — среднеквадратическому отклонению ). Случайная величина с обычным распределением существует в интервале и описывается законами: плотности вероятности именуемой «кривой Гаусса» (рис. 2.9, а) где и — характеристики нормального распределения, при этом функции распределения (рис. 2.9, б):

Нормальное распределение

Подстановкой интеграл приводится к виду Нормальное распределение

Потому для удобства вводится нечетная функция именуемая функцией Лапласа. Функцию Лапласа именуют также «интегралом вероятности», либо «функцией ошибок». Разумеется, что

Математическое ожидание случайной величины распределенной нормааьно, равно дисперсия равна потому параметр — среднеквадратическое отклонение.

Случайную величину распределенную нормально с параметрами и обозначают На практике для вычисления значений функции Лапласа употребляются таблицы, которые приводятся в справочной литературе (табл. П. 3). Возможность попадания в интервал НСВ, распределенной по нормальному закону, можно отыскать при помощи функции Лапласа по формуле

Величины характеристик нормального распределения СВ конкретно влияют на форму кривой при она воспринимает наибольшее значение, равное Потому с увесил личением (уменьшением) наибольшая ордината убывает (растет) и кривая становится наиболее пологой, приближаясь к оси

Величина математического ожидания влияет на размещение кривой относительно оси ординат: при возрастании (убывании) кривая сдвигается на право (на лево). Потому при помощи подстановки можно получить функцию плотности вероятности, график которой симметричен относительно оси Таковая кривая соответствует нормированному закону нормального распределения с параметрами и Величину именуют стандартно обычной. Ее функция распределения имеет вид

Логарифмически-нормальное распределение

Определение. Непрерывная случайная величина имеет логарифмически-нормальное (сокращенно логнормальное распределение), если ее логарифм подчинен нормальному закону. Потому что при неравенства равносильны, то функция распределения логнормального распределения совпадает с функцией нормального распределения для случайной величины т.е. в согласовании с Нормальное распределение

Дифференцируя по получим выражение плотности вероятности для логнормального распределения Нормальное распределение

Нормальное распределение

Можно обосновать, что числовые свойства случайной величины распределенной по логнормальному закону, имеют вид: математическое ожидание дисперсия мода медиана Разумеется, чем меньше тем поближе друг к другу значения моды, медианы и математического ожидания, а кривая распределения — поближе к симметрии.

Если в обычном законе параметр а выступает в качестве среднего значения случайной величины, то в логнормальном — в качестве медианы. Логнормальное распределение употребляется для описания распределения доходов, банковских вкладов, цен активов, месячной зарплаты, посевных площадей под различные культуры, долговечности изделий в режиме износа и старения и др.

Обычное распределение, также известное как распределение Гаусса, является распределением вероятностей , симметричным относительно среднего значения, показывающим, что данные около среднего значения встречаются почаще, чем данные, дальние от среднего значения.

Нормальное распределение

Пример 3.

Проведенное исследование показало, что вклады населения в данном банке могут быть описаны случайной величиной распределенной по логнормальному закону с параметрами Отыскать: а) средний размер вклада; б) долю вкладчиков, размер вклада которых составляет не наименее 1000 ден. ед.; в) моду и медиану случайной величины и объяснить их смысл.

Решение:

а) Найдем средний размер вклада, т.е. Нормальное распределение

б) Толика вкладчиков, размер вклада которых составляет не наименее 1000 ден. ед., есть Нормальное распределение

При определении воспользуемся тем, что функция логнормального распределения случайной величины совпадает с функцией нормального распределения случайной величины т.е. с учетом имеем:

Нормальное распределение

Сейчас Нормальное распределение

(рис. 4.15). Нормальное распределение

в) Вычислим моду случайной величины Нормальное распределениет.е. более нередко встречающийся банковский вклад равен 280 ден. ед. (поточнее, более нередко встречающийся простый интервал с центром 280 ден. ед., т.е. интервал ( Нормальное распределениеЕсли исходить из вероятностного смысла параметра логнормального распределения, то медиана т.е. половина вкладчиков имеют вклады до 530 ден. ед., а иная половина — сверх 530 ден. ед.

Нормальное распределение Нормальное распределение

Присылайте задания в хоть какое время денька и ночи в ➔

Официальный веб-сайт Брильёновой Натальи Валерьевны педагога кафедры информатики и электроники Екатеринбургского муниципального института.

Все права автора на размещённые материалы сохранены за правообладателями этих материалов. Хоть какое коммерческое и/либо другое внедрение не считая подготовительного ознакомления материалов веб-сайта natalibrilenova.ru запрещено. Публикация и распространение размещённых материалов не преследует за собой коммерческой и/либо хоть какой иной выгоды.

Веб-сайт предназначен для облегчения образовательного путешествия студентам очникам и заочникам по вопросцам обучения . Наталья Брильёнова не дает и не оказывает продукты и услуги.

Ссылка на основную публикацию
Adblock
detector