Гистограммы это: Гистограммы. Что это? Как построить? Как представить данные? Как провести анализ? | Бережливые шесть сигм | Статьи | База знаний

Содержание

Представляйте данные исследования с использованием блочных диаграмм и гистограмм

Гистограммы и блочные диаграммы часто используются для визуального представления данных исследований. Поэтому важно понимать разницу между ними. Использование блочной диаграммы или гистограммы зависит от характера данных и интерпретации, которую исследователь хотел бы предоставить.

Блочные диаграммы и как их читать

Блочная диаграмма используется для построения графика распределения данных. Блочные диаграммы также называются диаграммами размаха. Эти графики кодируют пять характеристик распределения данных, показывая читателю их положение и длину. Блок варьирует от Q1 (первый квартиль) распределения до Q3 (третий квартиль) распределения, а диапазон представлен IQR (межквартильный диапазон). Медиана обозначена линией поперек блока. Размахи на блочных диаграммах простираются от Q1 и Q3 до самых крайних точек данных.

В свою очередь, каждое из этих выпадающих значений отмечено знаком. Как альтернатива, максимальные и минимальные значения могут быть использованы в качестве конечных точек размаха.

Чтение блочных диаграмм не так сложно, как может показаться. Медиана, представленная линией, проходящей через блок, является серединой набора данных. Это означает, что 50% данных больше медианы. Верхний размах представляет значения выше среднего. Выпадающие значения – это точки над верхним размахом. Аналогичная интерпретация применяется к нижнему размаху и выпадающим значениям. Блочные диаграммы также могут представлять ассиметричные распределения в наборе данных. Положение медианы на блоке показывает, насколько много данных находится над или под ней.

Благодарим за представление изображения: Натан Яу из Flowing Data

Гистограммы и как их читать

Гистограммы предназначены для представления категориальных переменных и подходят для подсчета. Гистограммы отображают и сравнивают частоту, число или другие показатели (например, среднее) для разных категорий данных. Однако непрерывные данные лабораторных исследований, исследований на людях и исследований на животных часто представлены в виде гистограмм. Гистограммы – это часто используемые графики, потому что их легко интерпретировать и просто создавать. Они полезны для отображения номинальных или порядковых категорий. Порядковые категории – это данные, которые ранжируются (например, от очень хорошего до очень плохого), в то время как номинальные данные представляют качественные или описательные данные (например, страна рождения, предмет, изучаемый в университете). Существуют различные типы гистограмм, такие как горизонтальные гистограммы, сгруппированные гистограммы и гистограммы с накоплением. Исследователи должны создавать свои графики, соблюдая несколько правил, чтобы представить свои работы в четкой и эффективной форме.

Интерпретация гистограмм начинается с наблюдения высоты гистограммы относительно соответствующего значения на оси Y. Различия в высотах столбцов можно определить, обратившись к оси Y. Второй шаг – сравнить группировки столбцов. Некоторые гистограммы могут иметь столбцы, сгруппированные в кластеры. В этом случае сравните столбцы внутри кластеров, чтобы понять, как каждый набор данных в подкатегории сравнивается с другими наборами данных. Кроме того, вы также можете проверить диапазон, вычитая самое низкое значение (обозначенное самым коротким столбцом) из наибольшего значения (обозначенного самым длинным столбцом).

Какой из этих графиков следует использовать?

Какой тип данных вы будете представлять? Как вы хотите представить свои данные? Вам нужно ответить на такие вопросы, прежде чем выбирать между этими двумя типами.

Некоторые авторы утверждают, что гистограммы не должны использоваться, в то время как другие утверждают, что должны появиться новые форматы для представления данных. Сгруппированные гистограммы полезны, например, для отображения бюджетов для двух домохозяйств. Одно из распространенных применений гистограмм – показать соотношение одного значения к другому.

С другой стороны, блочные диаграммы полезны для построения различных наборов данных из независимых источников. Пример включает в себя сравнение результатов тестов между различными университетами, изменение данных (до и после) в результате процесса или данные с разных машин, производящих один и тот же продукт. Блочные диаграммы – это хороший способ представить распределение ваших данных, особенно если вы стремитесь показать другие значения помимо среднего.

Связывание данных ваших исследований

Это просто, если вы решите, какой тип графика лучше всего подходит для ваших данных. Например, если ваши данные ассиметричны, можно использовать блочную диаграмму. Ваш читатель сможет определить, смещены ли данные влево или вправо, в зависимости от блока полосы выше и ниже средней линии. Данные из ANOVA также могут быть показаны с помощью блочной диаграммы. Если ваши данные, в основном, носят описательный характер, и вы хотите показать пропорции, то гистограмма – ваш лучший выбор.

Какой бы путь вы ни выбрали, важно понимать полезность этих графиков. Ваш анализ данных исследования является основной частью отчета об исследовании – делайте это эффективно! Дайте нам знать, что вы думаете об использовании блочной диаграммы и гистограммы при представлении результатов!

Создание гистограммы — Access

Добавление гистограммы с группировкой в форму Access.

  • На ленте нажмите Создать> Конструктор форм.

  • Выберите Вставить диаграмму > Гистограмма> Гистограмма с группировкой

  • Щелкните то место на сетке конструктора форм, где должна находиться диаграмма.

  • В области Параметры диаграммы щелкните Запросы и выберите нужный запрос. 

    В этом примере выберите запрос «Продажи в Восточной Азии».

  • Чтобы настроить диаграмму, выберите параметры в следующих разделах. В данном примере:

    • для параметра Ось (категорий) задайте значение «Квартал»;

    • для параметра Значения (вертикальная ось) задайте значение «Продажи в Восточной Азии в 2017 г. (Sum)».

    • для параметра Значения (вертикальная ось) задайте значение «Продажи в Восточной Азии в 2018 г. (Sum)».

  • Чтобы обрезать текст на диаграмме, выберите вкладку Формат в области Параметры диаграммыи отредактируйте Отображаемое имя

    .

  • Чтобы удалить название диаграммы, щелкните на ленте Страница свойств и для параметра Имеет название задайте значение «Нет».

  • Примечание: На странице свойств можно выбирать различные диаграммы, не начиная весь процесс заново. Например, можно изменить значение свойства Тип диаграммы на «Гистограмма с накоплением», посмотреть на результат, а затем снова задать Гистограмма с группировкой

  • Чтобы просмотреть готовую диаграмму, щелкните правой кнопкой мыши вкладку Форма и выберите ФормаПредставление

  • Что такое гистограмма в фотографии

    Гистограмма – это график. Мы используем гистограмму в фотографии, чтобы увидеть, как много пикселей каждого значения присутствует в снимке. Каждый пиксель на фотографии имеет свое значение от 0 (черный) до 255 (белый). Левая сторона графика представляет темные тона шкалы, а правая сторона – светлые.

     

     

    В цветной фотографии каждый пиксель имеет свое значение (0-255) для каждого цвета. Гистограмма, изображенная на картинке, показывает распределение значений пикселей для каждого цвета (красного, синего и зеленого), где они перекрывают второстепенные цвета (пурпурный, голубой и желтый), и отображают, наконец, области, которые содержат все три цвета и показаны как серый.

    Изображение справа, цветная гистограмма, показывает распределение всех цветов на картинке отдельно. Хотя это может быть интересно только для продвинутых пользователей Photoshop, мы же, простые смертные, получаем всю необходимую информацию с гистограммы яркости, которая показана ниже.

    Гистограмма яркости, как следует из названия, показывает общее значение каждого пикселя в одном графике. Таким образом, мы можем сразу увидеть является ли фотография слишком темной, или слишком яркой.

    Проблема

    Вы, наверное, думаете, что лучший способ увидеть слишком темная ли фотография, или слишком светлая, это посмотреть, собственно, на фотографию. В конце концов, благодаря магии цифровой фотографии мы можем рассмотреть фотографию на экране.

    Проблема в том, что при просмотре на экране изображение будет меняться в соответствии с настройками монитора (они часто настраиваемые или даже самонастраиваемые) и в зависимости от яркости присутствующего света. Если вы просматриваете фото на экране камеры в яркий солнечный день, то они будут выглядеть совсем иначе, чем при просмотре в темноте.

    Лучший способ увидеть, правильно ли экспонирована фотография, это посмотреть на гистограмму. Большинство приличных DSLR- камер отображают гистограмму в режиме просмотра фотографий. Узнайте, как включить эту функцию и используйте данные гистограммы для наиболее важных снимков или хотя бы для первого в серии.

    Анализ гистограммы

    Все достаточно просто. Когда изображение хорошо экспонировано, гистограмма будет содержать большие столбики в середине, и совсем мало или же никакой информации по краям. Взгляните на эти три фотографии вместе с их гистограммами.

     

    Правильная экспозицияГистограмма

     

    Первая показывает нам правильно экспонированное изображение. Шкала не заходит в область крайних светлых тонов, говоря нам о том, что на снимке почти нет чисто белых пикселей. В части теней (слева) кривая спадает довольно круто и это означает, что несколько пикселей на фото чисто черные, но в основном мы получили всю необходимую информацию о снимке. Когда сцена содержит больше контраста, чем наша камера может охватить, невозможно отобразить это в одном снимке, поэтому мы вынуждены идти на компромисс. Лучше получить несколько абсолютно черных областей, чем сильный пересвет, который более очевиден.

     

     

    Недоэкспонированный кадрГистограмма

     

    Фотография ниже, как вы видите, сильно недоэкспонирована. Распределение пикселей происходит в теневой области и практически нет пикселей со значением выше, чем средний серый. Хотя мы можем осветлить этот снимок в Photoshop, проблема в том, что, когда у вас большое количество пикселей со значением 0, между ними нет никакой разницы. Все, что мы можем сделать, это повысить значения выше нуля, что сделает изображение очень контрастным. Лучше изначально получить всю информацию (т.е. разные значения пикселей) из вашей сцены.

    Переэкспонированный кадр — Гистограмма

     

    Наконец, в переэкспонированной версии мы можем видеть большое количество пикселей со значением 255 (белый). Не имеет значения, сколько затемнения вы добавите в Photoshop, вы не сможете отделить один белый пиксель от другого, так что детали в ярких тонах теряются навсегда.

    Получение максимально количества информации

    Надеюсь, вы увидели на этих трех примерах, что настройка правильной экспозиции, где лишь несколько пикселей чисто белые и насколько чисто черные, как на первом примере, записывает максимальное количество деталей сцены в вашу камеру.

    Если позже вы решите, из художественных соображений, свести на нет некоторые детали, это нормально. Но все же лучше, если изначально они у вас будут.

    Существует несколько техник, чтобы получить правильную экспозицию, такие, как брекетинг и компенсация экспозиции, но прежде всего важно уметь прочитать гистограмму.

     

    Источник: www.geofflawrence.com

    Перевод: Татьяна Сапрыкина

     

    гистограмма – Финансовая энциклопедия

    Что такое гистограмма?

    Гистограмма – это графическое представление, которое упорядочивает группу точек данных в определенные пользователем диапазоны. По внешнему виду он похож на гистограмму . Гистограмма уплотняет ряд данных в легко интерпретируемый визуальный элемент, беря множество точек данных и группируя их в логические диапазоны или интервалы.

    Ключевые моменты

    • Гистограмма – это представление данных в виде гистограммы, которое объединяет диапазон результатов в столбцы по оси x.
    • Ось Y представляет собой количество или процент вхождений в данные для каждого столбца и может использоваться для визуализации распределения данных.
    • В торговле гистограмма MACD используется техническими аналитиками для обозначения изменений импульса.

    Пример гистограммы

    Как работают гистограммы

    Гистограммы обычно используются в статистике, чтобы продемонстрировать, сколько переменных определенного типа встречается в определенном диапазоне. Например, перепись населения, ориентированная на демографию страны, может использовать гистограмму, чтобы показать, сколько людей находится в возрасте от 0 до 10, 11 и 20, 21 и 30, 31 и 40, 41 и 50 и т. Д. Эта гистограмма будет выглядеть аналогично приведенному выше примеру.

    Многие трейдеры знакомы с гистограммой расхождения конвергенции скользящих средних (MACD), которая является популярным техническим индикатором , показывающим разницу между линией MACD и сигнальной линией.

    Например, если разница между двумя линиями составляет 5 долларов, гистограмма MACD графически представляет эту разницу. Гистограмма MACD нанесена на график, чтобы трейдер мог легко определить импульс конкретной ценной бумаги.

    Полоса гистограммы является положительной, когда линия MACD находится выше сигнальной линии , и отрицательной, когда линия MACD находится ниже сигнальной линии. Возрастающая гистограмма MACD указывает на увеличение восходящего импульса, в то время как убывающая гистограмма используется для сигнала нисходящего импульса.

    Пример гистограммы MACD

    Торговля с гистограммой MACD

    Трейдеры часто упускают из виду гистограмму MACD при использовании этого индикатора для принятия торговых решений. Слабость использования индикатора MACD в его традиционном понимании, когда линия MACD пересекает сигнальную линию, заключается в том, что торговый сигнал отстает от цены. Поскольку две линии являются скользящими средними, они не пересекаются до тех пор, пока не произойдет движение цены. Это означает, что трейдеры отказываются от части этого начального движения.

    Гистограмма MACD помогает решить эту проблему, генерируя более ранние сигналы входа. Трейдеры могут отслеживать длину столбцов гистограммы по мере их удаления от нулевой линии. Индикатор генерирует торговый сигнал, когда столбец гистограммы короче предыдущего бара. Как только меньшая полоса гистограммы завершается, трейдеры открывают позицию в направлении снижения гистограммы. Другие технические индикаторы следует использовать вместе с гистограммой MACD, чтобы повысить надежность сигнала. Трейдеры должны разместить стоп-лосс, чтобы закрыть сделку, если цена ценной бумаги не изменится, как ожидалось.


    Гистограмма

    Наглядное представление о характере изменения частот вариационного ряда дают полигон и гистограмма.

    Гистограмма — это способ графического изображения интервальных распределений вариант при непрерывном варьировании признака. Гистограмма распределения применяется только для изображения интервального вариационного ряда.

    Гистограмма представляет собой столбчатый график, построенный по полученным за определенный период (например, за неделю или за месяц) данным, которые разбиваются на несколько интервалов; число данных, попадающих в каждый из интервалов (частота), выражается высотой столбика.

    Данные для построения гистограммы собирают в течение длительного периода — недели, месяца, года и т. д.

    Гистограмма – это серия столбиков одинаковой ширины, но разной высоты, показывающая рассеяние и распределение данных. Ширина столбика – это интервал в диапазоне наблюдений, высота – количество данных, приходящихся на тот или иной интервал, т.е. частость. По существу, гистограмма отображает распределение исследуемого показателя. Гистограмма позволяет оценить характер рассеивания показателя и разобраться в том, на чём следует сосредоточить усилия по улучшению.

    Гистограмму используют для изображения только интервальных рядов.

    Признак называется непрерывно варьирующим, если его значения отличаются друг от друга на сколь угодно малую величину, т.е. признак может принимать любые значения в некотором интервале. Непрерывный вариационный ряд такого признака называется интервальным (см. табл. 3 и 4).

    Таблица 3

    Общий вид интервального вариационного ряда частот

    Интервалы

    ai-ai+1


    a1-a2

    a2-a3

    an-an+1

    Частоты

    mi


    m1

    m2

    mn

    Таблица 4

    Общий вид интервального вариационного ряда частостей

    Интервалы

    ai-ai+1


    a1-a2

    a2-a3

    an-an+1

    Частости

    wi


    w1

    w2

    wn

    Просматривая результаты проведенных наблюдений, определяют, сколько значений вариантов попало в каждый конкретный интервал. Предполагается, что каждому интервалу принадлежит один из его концов: либо во всех случаях левые (чаще), либо во всех случаях правые, а частоты или частости показывают число вариантов, заключенных в указанных границах. Разности (ai-ai+1) называются частичными интервалами или интервальными разностями.

    Для того чтобы интервальный вариационный ряд не был громоздким и в то же время позволял выявить характерные черты изменения значений случайной величины, обычно число частичных интервалов выбирают от 7 до 10. Длина частичного интервала (интервальная разность) зависит от размаха варьирования и выбранного числа интервалов

    Если окажется, что h – дробное число, то за длину частичного интервала следует брать либо ближайшее целое число, либо ближайшую простую дробь.

    Для упрощения последующих расчетов интервальный вариационный ряд можно заменить условно дискретным. В этом случае серединное значение i-го интервала принимают за вариант xi, а соответствующую интервальную частоту mi– за частоту этого интервала.

    Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины h, а высоты равны отношению  (плотность частоты). Площадь частичного i-го прямоугольника равна — сумме частот вариант, попавших в i-ый интервал. Площадь гистограммы частот равна сумме всех частот, т.е. объему выборки n

    Если соединить середины верхних оснований прямоугольников отрезками прямой, то можно получить полигон того же распределения, который будет являться выборочным аналогом дифференциальной функции распределения f(x).

    Гистограммой относительных частотназывают ступенчатую фигуру, со­стоящую из прямоугольников, основаниями которых служат частичные интервалы длины h, а высоты равны отношению (плотность относительной частоты). Площадь частичного i-го прямоугольника равна — сумме относительных час­тот вариант, попавших в i — ый интервал. Площадь гистограммы относительных частот равна сумме всех относительных частот, т.е. единице.

    Характерные типы гистограмм показаны на рис. .

     

     

     

     

    Рис. Характерные типы гистограмм

    На рис.,а показан обычный тип гистограммы с двусторонней симметрией, что указывает на стабильность процесса.

    На рис.,б в распределении имеется два пика (двугорбая гистограмма). Такая гистограмма получается при объединении двух распределений, например, в случае двух видов сырья, изменения настройки процесса или объединения в одну партию изделий, обработанных на двух разных станках. Требуется расслоение продукции.

    На рис.,в показана гистограмма с обрывом. Такое распределение получается, когда невозможно получить значение ниже (или выше) некоторой величины. Подобное распределение имеет место также, когда из партии исключены все изделия с показателем ниже (и/или выше) нормы, т.е. изначально это была партия с большим количеством дефектных изделий. Такое же распределение получается, когда измерительные приборы были неисправны.

    На рис.,г показана гистограмма с островком. Получается при ошибках в измерениях, или когда некоторое количество дефектных изделий перемешано с доброкачественными.

    На рис.,д показана гистограмма с прогалами («гребёнка»). Получается, когда ширина интервала не кратна единице измерения или при ошибках оператора.

    На рис.,е показана гистограмма в форме плато. Получается, когда объединяются несколько распределений при небольшой разнице средних значений. В этом случае требуется расслоение.

    Гистограмма строится в следующем порядке. Систематизируют данные, собранные, например, за 10 дней или за месяц. Число данных должно быть не менее 30-50, оптимальное число — порядка 100. Если их оказывается более 300, затраты времени на их обработку оказываются слишком большими. Следующий шаг — определение наибольшего L и наименьшего S значений данных. При большом числе значений (порядка 100) определение L и S затруднительно, поэтому вначале определяют наибольшее и наименьшее значения в каждом десятке значений, а затем среди полученных значений определяют L и S. Интервал между наибольшим и наименьшим значениями делят на соответствующие участки. Число участков должно примерно соответствовать корню квадратному из числа данных. При числе данных З0-50 число участков должно быть равно 5-7, при числе данных 50-100-6-10; при числе данных 100-2008-15. Далее определяют ширину участка h. Разность между L и S делят на число участков и полученное число округляют. Например, для анализа результатов контроля толщины пластин при L=11,8 мм,S=7,1 мм и числе участков 10 получим h=(11,8-7,1):10=0,47 мм. Округляют это число до 0,5 мм и получают ширину участка h=0,5 мм.

    Значения границ участков определяют следующим образом. Вначале находят наименьшее граничное значение для первого участка из условия S — единица измерения/2.

    В приведенном примере S=7,1 мм; единица измерения составляет 0,1 мм . Таким образом, наименьшее граничное значение для первого участка оказывается равным

    7,1 мм — 0,1 мм/2 = 7,05 мм

    Прибавляя к полученному значению ширину участка h=0,5 мм, находим что первый участок занимает интервал на оси абсцисс от 7,05 мм до 7,55 мм . Аналогично, прибавляя 0,5 мм к 7,55 мм, получим интервал второго участка (7,55 мм- 8,05 мм ), и т. д.

    В интервал последнего участка (11,55-12,05) входит наибольшее значение L.

    Следующий шаг — определение центральных значений для участков. Центральное значение для участка определяют по формуле

    Сумма граничных значений участка/2=нижнее граничное значение участка+верхнее граничное значение участка/2

    В приведенном примере центральное значение для первого участка равно

    7,05+7,55/2=7,3 мм

    Центральные значения последующих участков находятся прибавлением ширины участка h=0,5 мм к значению для предыдущего участка.

    В размеченные описанным выше образом интервалы участков размещают данные измеренных значений толщины пластин в каждом интервале, которые составляют частоту f попадания этих данных в соответствующий интервал (табл. 9).

    Таблица 9

     

    Интервал участка, мм

    Центральное значение, мм  

    Частота

    7,05-7,55  

    7,3

    2

    7,55-8,05  

    7,8

    9

    8,05-8,55  

    8,3

    14

    8,55-9,05  

    8,8

    17

    9,05-9,55  

    9,3

    16

    9,55-10,05  

    9,8

    15

    10,05-10,55  

    10,3

    14

    10,55-11,05  

    10,8

    9

    11,05-11,55  

    11,3

    3

    11,55-12,05  

    11,8

    1

     

     Сумма (f)100

    Последним шагом является построение графика гистограммы. По оси абсцисс откладывают значения параметров качества, по оси ординат — частоту. Для каждого участка строят прямоугольник (столбик) с основанием, равным ширине интервала участка; высота его соответствует частоте попадания данных в этот интервал (см. рис. 20). Если на гистограмме от руки провести кривую распределения данных по частоте, а также верхнее и нижнее предельные значения нормы, то легко можно понять вид распределения гистограммы и соотношение значений контрольных нормативов. Анализ гистограммы позволяет сделать заключение о состоянии процесса, однако если неясны условия контроля процесса или временные изменения, необходимо в комбинации с гистограммой использовать также контрольные карты и график, представляемый ломаной линией. Полученная в результате анализа гистограммы информация может быть легко использована для построения и исследования причинно-следственной диаграммы, что повысит обоснованность мер, намеченных для улучшения процесса.

    Поскольку гистограмма выражает условия процесса за период, в течение которого были получены данные, важную информацию может дать форма распределения гистограммы в сравнении с контрольными нормативами.

    Режим «Гистограмма» Пакета Анализа Excel сслужит для вычисления частот попада­ния данных в указанные границы интервалов, а также для пост­роения гистограммы интервального вариационного ряда распре­деления.

     

    в начало


    Гистограмма и ее использование — Блог Про Фото

    Умение читать гистограмму важно на каждой стадии создания HDR-изображения. Гистограмма, создаваемая камерой, понадобится вам, чтобы определять диапазон EV, который нужно запечатлеть, оценивать отдельные кадры из серии, снятой брекетингом, изменять различные настройки при преобразовании HDR-изображений и оценивать изображения в ходе последующей цифровой обработки. Это важный инструмент, дающий ценнейшую информацию на каждом этапе процедуры создания HDR-фотографий.

    Мы уже видели, что диапазон EV реальных сюжетов заметно выше динамического диапазона матрицы камеры, в результате чего на фотографиях возникают пере- и недоэкспонированные места. Существует родственный термин «тональный диапазон»; он относится к распределению тонов между самыми светлыми и самыми темными областями изображения. Например, изображение с широким динамическим диапазоном будет содержать и темные, и светлые области (и диапазон тонов между ними), в то время как изображение с небольшим тональным диапазоном в основном будет состоять из средних тонов. Диапазон и распределение тонов отображаются графически посредством гистограммы — графика с двумя осями. Горизонтальная ось показывает распределение тонов от черноты (слева) до белизны (справа), а по вертикали показывается количество пикселей с тем или иным тональным значением, так что чем выше вершина гистограммы, тем больше пикселей изображения имеют яркость в данном отрезке диапазона.

     

    На этом примере можно видеть, что данные сосредоточены в районе середины гистограммы. Это указывает на два фактора.

    Во-первых, это показывает, что тональный диапазон достаточно узок -нет ни черноты,ни белизны, ни темных теней, ни ярких светов. Другими словами, бОльшая часть тонов имеют среднюю яркость. Во-вторых, это говорит нам,что динамический диапазон реального сюжета соответствовал динамическому диапазону матрицы камеры,так как вся информация, снятая с сюжета при съемке, умещается на горизонтальной оси.

     

    На этой фотографии диапазон EV реального сюжета запечатлен полностью, но форма гистограммы сильно отличается от первой. Мы видим большое скопление данных в правой части и лишь небольшой бугорок слева. Высокий столб справа соответствует областям снимка, на которых изображена белая стена,а маленькое скопление левее — более темным областям изображения (телефону и красной деревянной доске за ним).

     

     

    На этом примере гистограмма наползает на правый край. Это указывает, что какая-то часть изображения переэкспонирована, и если посмотреть на фотографию, то можно понять, почему так произошло. Я настроил экспозицию так, чтобы запечатлеть приличный диапазон тонов переднего плана, но поскольку диапазон EV реального сюжета был довольно большим, самые яркие области оказались «выбитыми» — то есть на фотографии отобразились в виде сплошной белизны.

    Изображение содержит очень много переэкспонированных участков, и детали в тенях на переднем плане потеряны. В данном случае на «провал» теней указывает левая оконечность гистограммы; видно, что часть пикселей -черные.Увеличение экспозиции сместило бы гистограмму вправо, и часть деталей восстановилась бы, но, вероятно, не все.

     

     

    В этом примере одновременно провалены тени и выбиты света — то есть здесь есть области сплошной черноты и сплошной белизны.

    Это значит, что диапазон EV реального сюжета намного превышал динамический диапазон матрицы фотоаппарата. Коррекция экспозиции для фиксации большего количества деталей светов сделала бы тени еще темнее, и наоборот.

     

    Все эти примеры демонстрируют, что гистограмма может снабжать вас исключительно ценной информацией, касающейся настроенной вами экспозиции и, в случае с гистограммой в камере, она служит средством моментальной и точной оценки как диапазона ЕV реального фотографируемого сюжета, так и тонального диапазона снимка в том виде, как его зафиксировала камера.

    Точно оценивая гистограмму, вы можете добиться того, чтобы готовая HDR-фотография содержала полный тональный диапазон.

    Как читать и понимать гистограммы изображений в фотошопе

    Одним из наиболее ценных инструментов, которые мы имеем при редактировании и исправлении изображений в Photoshop, является гистограмма . На самом деле, гистограммы настолько ценны, что не ограничиваются только Photoshop. Вы также найдете гистограммы во многих других программах для редактирования изображений, таких как Adobe Lightroom, Photoshop Elements и собственный плагин Camera Raw для Photoshop. Многие цифровые камеры сегодня также имеют удобную функцию гистограммы. В мире фотографии и редактирования фотографий гистограммы есть везде!

    Итак, что же такое гистограмма? Проще говоря, гистограмма — это график. Теперь, я знаю, как только я упомяну слово «график», некоторые люди захотят вздремнуть, но я обещаю вам, это легко. Это также очень важно, если вы серьезно относитесь к своим изображениям (и если вы читаете это, это безопасная ставка, что вы). Гистограмма — это график, который показывает нам текущий тональный диапазон изображения, чтобы мы могли оценить его и, при необходимости, исправить. Под тональным диапазоном я подразумеваю диапазон уровней яркости изображения. Гистограмма показывает нам, сколько изображения в настоящее время чисто черного цвета, сколько в настоящее время чисто белого цвета, и какая часть изображения находится где-то посередине.

    Здесь важно отметить, что хотя мы говорим об уровнях яркости, мы говорим не только о черно-белых (серых) изображениях. Гистограммы работают одинаково хорошо и одинаково важны с полноцветными фотографиями. Это потому, что, хотя мы не всегда думаем о цвете как о чем-то большем, чем цвет, каждый цвет в вашем изображении имеет свой собственный уровень яркости. Желтые, например, обычно очень светлые; блюз намного темнее. Эти различия в значениях яркости означают, что цвет может оказать огромное влияние на тональный диапазон вашего изображения.

    Как нам помогает возможность видеть тональный диапазон изображения? Ну, вы когда-нибудь смотрели на фотографию и думали, что она кажется немного «плоской»? Тема была интересной, композиция была хорошей, но в целом она просто не «высовывалась» у вас? Скорее всего, это потому, что изображение страдает от низкой контрастности; блики (самые светлые области изображения), скорее всего, были слишком темными, а тени (самые темные области) были не такими темными, как следовало бы.

    Теперь вы, возможно , смогли распознать это, просто взглянув на фотографию своими глазами, но когда дело доходит до редактирования изображения, печальная правда в том, что наши глаза не так надежны, как вы думаете. Они отлично умеют сравнивать два изображения рядом и распознавать, какое из них лучше, но когда дело доходит до оценки одногоНапример, их можно легко одурачить, увидев, что некоторые области светлее или темнее, чем они есть на самом деле. Дисплей (монитор) вашего компьютера также может добавить проблемы, если он не был должным образом откалиброван. Например, установка слишком высокой яркости экрана может сделать ваши изображения фантастическими на экране, но темными и разочаровывающими, когда вы начнете их печатать. Гистограмма преодолевает обе эти проблемы. Это не зависит от вашего зрения или ваших настроек дисплея. Вместо этого он получает информацию непосредственно от самого изображения, поэтому он всегда показывает вам точное и надежное представление о тональном диапазоне, облегчая обнаружение таких проблем, как плохой контраст, и, как мы увидим в наших руководствах по уровням и кривым, чинить!

    Другая распространенная проблема, с которой мы сталкиваемся при редактировании изображений, — это обрезка теней и бликов , где тени такие темные, они становятся не чем иным, как областями чистого черного цвета, а блики настолько светлые, что это просто области чистого белого. Возможно, вы слышали, что это называется «затушевывание» или «разрушение» теней или «выдувание» бликов, но все это означает одно и то же; мы потеряли детали изображения.

    Как и в случае плохой контрастности, нам не всегда легко распознать эти проблемы отсечения, просто взглянув на фотографию на экране. Наши глаза просто недостаточно чувствительны, и дисплей нашего компьютера может не показывать нам действительно точное представление изображения. Гистограмма, однако, всегда будет показывать нам, если мы зашли слишком далеко с нашим редактированием и должны отступить, чтобы вернуть детали. Или, если мы восстанавливаем старую фотографию, гистограмма может сказать нам, если в самом оригинальном изображении отсутствуют детали в светлых или темных участках, чтобы мы знали, с чего начинаем и с чем имеем дело. В итоге, если вы ретушируете или восстанавливаете изображения и не знаете, как читать и понимать, что говорит вам гистограмма,

    Просмотр гистограммы в фотошопе

    В Photoshop есть несколько мест, где мы можем просматривать гистограмму изображения, над которым мы работаем, включая фактическую панель гистограммы. Но чтобы помочь нам понять, как именно работает гистограмма и что она нам показывает, лучшее место для ее просмотра — диалоговое окно « Уровни» в Photoshop . Чтобы получить доступ к уровням и просмотреть гистограмму, вам нужно открыть изображение. Ранее я упоминал, что гистограммы одинаково хорошо работают как с полноцветными, так и с черно-белыми фотографиями, но для простоты давайте начнем с черно-белого изображения ( черно-белый портрет от Fotolia):

    Черно-белое портретное фото.

    Чтобы выбрать уровни, я зайду в меню « Изображение» в строке меню в верхней части экрана, где я выберу « Настройки» , а затем « Уровни» :

    Идем в Изображение> Настройки> Уровни.

    Откроется диалоговое окно Уровни. Мы сохраним наше обсуждение о том, как использовать уровни для исправления изображений для другого урока. Здесь мы просто используем его, чтобы помочь нам понять, как работают гистограммы:

    Диалоговое окно Уровни.

    Гистограмма — это черная область посередине, которая выглядит как горная цепь. В зависимости от того, какое изображение вы просматриваете на экране, ваша гистограмма может выглядеть аналогично моей или она может выглядеть совершенно иначе, и это нормально. Каждое изображение будет иметь свою уникальную гистограмму, и вы поймете, почему это происходит через несколько минут:

    Гистограмма в центре диалогового окна уровней.

    Как просмотр гистограммы в диалоговом окне «Уровни» помогает нам понять? Это потому, что если вы посмотрите под гистограммой на уровнях, вы увидите горизонтальную градиентную полосу . Градиент начинается с чистого черного цвета в дальнем левом углу и постепенно становится ярче, пока не достигнет чистого белого цвета в дальнем правом углу:

    Черно-белая полоса градиента под гистограммой.

    Как мы узнали, гистограммы показывают нам текущий диапазон уровней яркости нашего изображения, а уровни яркости в гистограмме точно совпадают с полосой градиента под ним! Гистограммы начинаются с чистого черного слева, как и градиент. Они заканчиваются чистым белым в крайнем правом углу, точно так же, как градиент, и они постепенно увеличивают значения яркости слева направо, как … как вы уже догадались, градиент:

    Уровни яркости гистограммы соответствуют полосе градиента под ней.

    Так почему же гистограмма выглядит как горный массив? Это потому, что он показывает нам текущее распределение уровней яркости или тональных значений в изображении. Другими словами, он показывает нам, сколько изображения находится на определенном уровне яркости по сравнению с другими уровнями яркости. Вот почему некоторые части гистограммы кажутся выше других. Чем выше гистограмма появляется на определенном уровне яркости, тем больше количество пикселей в нашем изображении на том же уровне. В областях, где гистограмма короче, у нас меньше пикселей на этих уровнях яркости. И если гистограмма не появляется вообще в определенных областях градиента, это означает, что в настоящее время у нас нет пикселей в нашем изображении с этими уровнями яркости.

    Важно помнить, что гистограмма не показывает нам фактическое количество пикселей на изображении. Это связано с тем, что в наши дни большинство цифровых камер способны делать фотографии размером от 10 до 20 мегапикселей (миллионы пикселей) или более. Чтобы разместить их все в гистограмме, вам понадобится несколько экранов для просмотра! Таким образом, вместо этого гистограмма просто дает нам общий взгляд с высоты птичьего полета на то, как тональный диапазон изображения распределяется по светлым участкам, полутонам и теням, и если какие-либо области обрезаются до чисто черного или белого.

    Вообще говоря, хорошо экспонированное изображение будет отображать гистограмму, показывающую полный непрерывный диапазон уровней яркости от черного до белого, и мы видим пример этого с этим изображением. Левая сторона моей гистограммы начинается прямо напротив левой стены «гистограммы», прямо над чистым черным в градиенте под ней. Это означает, что некоторые пиксели на изображении уже черные (возможно, самые темные). Я увеличу масштаб, чтобы мы могли лучше рассмотреть:

    Левая сторона гистограммы начинается с чистого черного цвета.

    На другой стороне гистограммы мы видим, что она простирается почти вправо, насколько это возможно, с крошечной полоской, которая появляется прямо над чисто белым в градиенте под ней. Это говорит нам о том, что некоторые пиксели на изображении уже белые (самые светлые они могут быть). Итак, мы уже знаем, что наши черные и белые точки выглядят хорошо:

    Правая сторона гистограммы заканчивается чисто белым.

    Что говорит нам остальная часть гистограммы? Ну, как правило, мы читаем гистограмму слева направо (от самой темной к самой светлой). Если мы начнем слева и начнем движение вправо, мы увидим, что гистограмма сразу начинает подниматься над темными теневыми тонами, но затем падает, когда мы приближаемся к средним тонам в центре. Затем он снова поднимается и достигает своего пика в светлых тонах, а затем быстро падает, когда мы приближаемся к белому:

    Самые высокие точки гистограммы находятся в светлых и темных местах; самый низкий в средних тонах.

    Поскольку верхняя часть гистограммы находится над светлыми тонами (бликами), это говорит нам о том, что большинство пикселей на изображении попадают в этот более светлый диапазон тонов. У нас есть меньшее, но все же значительное количество очень темных тонов на изображении, на что указывает рост гистограммы над тенями. И наконец, наклон по средним тонам в центре говорит нам о том, что, хотя у нас есть детали в этом диапазоне средних тонов, их не так много, как в светлых и теневых участках.

    Давайте еще раз посмотрим на фотографию, где мы видим, что достаточно точно, большая ее часть состоит из более светлых тонов (кожа женщины, белки ее глаз, свитер и большая часть фона). У нас также есть значительное количество очень темных тонов (ее волосы, брови, глаза и меньшая часть фона). На самом деле полутонов не так много, по крайней мере, если сравнивать с количеством ярких и теневых деталей, и это типично для высококонтрастного черно-белого изображения. Таким образом, гистограмма отлично показала нам тональный диапазон этой фотографии:

    Фотография и гистограмма совпадают.

    Давайте посмотрим на второе изображение, на этот раз полноцветное фото (фото жениха и невесты из Fotolia):

    Полноцветное изображение.

    Я еще раз открою диалоговое окно Уровни, чтобы мы могли просмотреть гистограмму изображения. Но на этот раз вместо того, чтобы перейти в меню « Изображение» , выбрать « Настройки», а затем выбрать « Уровни» , я открою диалоговое окно «Уровни», просто нажав клавиши Ctrl + L (Победа) / Command + L (Mac) на клавиатуре. В любом случае работает; сочетание клавиш просто быстрее:

    Диалоговое окно Уровни, показывающее гистограмму для второго изображения.

    Давайте приблизимся и посмотрим, что говорит нам эта гистограмма. Здесь мы снова видим пример хорошо экспонированного изображения. Левая сторона гистограммы начинается с чистого черного, а правая — с чистого белого, поэтому мы знаем, что наш тональный диапазон распространяется на обе крайности:

    Гистограмма начинается с черного слева и заканчивается белым справа, что является хорошим признаком.

    Читая гистограмму слева направо (от самой темной к самой светлой), мы видим, что она быстро поднимается над тенями. Но, в отличие от предыдущего изображения, где гистограмма выпала в полутонах, она остается относительно постоянной вплоть до самых ярких участков, где требуется резкий резкий поворот вверх, прежде чем выпадет чистый белый цвет:

    Гистограмма для второго изображения показывает больше деталей в полутонах, чем на предыдущем изображении.

    Что это говорит нам? Это говорит нам о том, что у нас достаточно деталей изображения во всех трех областях (тени, средние тона и блики), но мы имеем больше деталей в светлых тонах, чем где-либо еще. Опять же, мы можем увидеть это, глядя на изображение. Мужская рубашка и женское платье, оба из которых являются белыми (или близкими к ним), составляют большую часть фотографии, поэтому это объясняет, почему гистограмма находится на самом высоком уровне по сравнению с основными моментами:

    Еще раз, фото и гистограмма совпадают.

    Использование гистограммы для выявления проблем

    До сих пор мы рассматривали гистограммы для изображений, которые были правильно выставлены, но гистограмма может также легко выявить проблемы. Например, что если гистограмма показала высокий всплеск прямо напротив этой правой стенки окна гистограммы:

    Высокий шип появляется в дальнем правом углу гистограммы.

    Обычно это признак того, что изображение переэкспонировано. Высокий всплеск, прижатый к этому правому краю, означает, что у нас есть много пикселей на изображении, которые являются чисто белыми, и это означает, что мы, скорее всего, пропускаем детали в бликах. Чтобы показать, как это влияет на изображение, вот сравнение мужской рубашки. Изображение слева выставлено правильно, раскрывая много деталей. Изображение справа переэкспонировано с бликами, обрезанными до чистого белого. Обратите внимание, как много деталей в рубашке потеряно:

    Обрезка светлых участков приводит к потере деталей в самых светлых областях изображения.

    Аналогично, что, если гистограмма показала подобный высокий шип, на этот раз против левой стены:

    Высокий шип, появляющийся в дальнем левом углу гистограммы.

    Обычно это означает, что изображение недоэкспонировано с большим количеством пикселей, обрезанных до чистого черного цвета, что означает, что мы потеряли детали в тенях. Снова, чтобы показать влияние, которое это оказывает на изображение, вот еще одно сравнение. В хорошо разоблаченной версии слева мы видим много деталей в волосах мужчины. В версии справа, которая страдает от стрижки теней, большая часть деталей в его волосах была потеряна до чисто черного:

    Обрезка теней приводит к потере деталей в самых темных областях изображения.

    Если вы заметили эти проблемы с отсечением при просмотре гистограммы на ЖК-экране вашей камеры сразу после съемки фотографий, вы, скорее всего, отрегулируете настройки экспозиции и повторите их съемку. В Photoshop вы можете исправить эти проблемы, используя Уровни, Кривые или Camera Raw, и мы узнаем, как это сделать, в других руководствах. На данный момент все, что нас интересует, — это изучение самой гистограммы.

    Сколько уровней яркости в гистограмме?

    На данный момент мы знаем, что гистограмма отображает диапазон тонов в изображении от чисто черного до чисто белого. Но сколько тонов в гистограмме? Есть ли определенное количество уровней яркости, отображаемых гистограммой? Почему да, есть! Гистограмма отображает ровно 256 уровней яркостис одной вертикальной черной полосой для каждого из этих 256 уровней, хотя в зависимости от тонального диапазона вашего изображения, вы можете не видеть черную полосу на каждом уровне. Если вы подойдете ближе и посмотрите на верхнюю часть гистограммы, вы заметите, что она не гладкая. Скорее, он состоит из крошечных маленьких шипов и гребней, каждый из которых является вершиной тонкой вертикальной планки. Если вы посчитаете их, предполагая, что у вас есть непрерывная гистограмма от черного до белого (и ничего лучше), вы найдете ровно 256 столбцов:

    Гистограмма отображает одну вертикальную полосу для каждого из 256 уровней яркости от черного до белого.

    Почему 256? Есть несколько причин для этого. Во-первых, большинству из нас требуется примерно 200 уровней яркости от черного до белого, чтобы наши глаза могли видеть то, что выглядит как непрерывный тон изображения; то есть изображение, которое плавно течет от одного тона к следующему без видимых промежутков или разрывов между ними. Если мы опустимся намного ниже этого уровня, мы начнем видеть полосатость и постеризацию, где переходы от одного тона к другому становятся очевидными. Так что это объясняет, почему число не менее 200. Но почему 256? Почему не 257, или 300, или 500?

    Это из-за того, как работают компьютеры. Наши изображения должны содержать не менее 200 уровней яркости, но компьютеры должны иметь возможность обрабатывать и хранить изображения в виде битов и байтов. Короче говоря, лучший способ удовлетворить обе эти потребности — хранить изображения в виде 8-битных файлов (стандартное изображение JPEG является примером 8-битного файла). 8-битный файл изображения содержит ровно 256 возможных уровней яркости, что дает нам около 200, которые нам нужны для непрерывного тона, плюс немного больше осталось для редактирования. Все еще задаетесь вопросом, откуда берется число 256? Если вы считаете, что 1 бит равен 2, то 8 бит — это 2 8 или 2x2x2x2x2x2x2x2, что равно 256.

    Если вы не совсем поняли это, не волнуйтесь. Вы можете получить все преимущества гистограмм, не зная ничего о битах и ​​байтах. Все, что нам действительно нужно знать, это то, что гистограмма отображает диапазон из 256 возможных уровней яркости от черного до белого. Фактически, мы можем увидеть это, если посмотрим на числа под левой и правой сторонами гистограммы в диалоговом окне Уровни. С левой стороны мы видим число 0, которое представляет чистый черный цвет. Справа мы видим число 255, которое представляет чистый белый цвет. Почему цифры идут от 0 до 255, а не от 1 до 256? Опять же, это из-за того, как работают компьютеры. Обычно мы начинаем считать с номера 1, но компьютеры начинают считать с 0:

    Числа под гистограммой представляют черный (0) и белый (255) с 254 уровнями между ними.

    И там у нас это есть! В этом уроке мы узнали, как читать гистограмму изображения и как распознавать разницу между хорошо экспонированной фотографией и фотографией, на которой наблюдается обрезка теней или бликов. Мы использовали диалоговое окно «Уровни» в Photoshop, чтобы помочь нам визуализировать тональный диапазон, который представляет гистограмма, с черным слева, белым справа и постепенным переходом от теней к средним тонам и между светлыми участками. Следует иметь в виду, что в зависимости от того, где вы просматриваете гистограмму, вы не всегда увидите удобный градиент от черного к белому. Это нормально, потому что теперь, когда вы понимаете, как работают гистограммы (и все они работают одинаково), вам это не нужно.

    До сих пор мы рассматривали примеры того, как обычно выглядит гистограмма, когда изображение правильно экспонируется с полным диапазоном тональных значений от черного до белого. Но это не всегда так. Иногда имеет смысл ограничить тональный диапазон изображения, подавив большую его часть в тени или блики, чтобы создать определенное настроение или стиль.

    В следующем уроке, Понимание гистограмм — изображения с низким и высоким ключом , мы рассмотрим примеры этих типов фотографий (известные как изображения с низким и высоким ключом ) и лучше поймем, почему на самом деле нет такая вещь, как «идеальная» или «идеальная» гистограмма.

    Использование гистограмм для понимания ваших данных

    Гистограммы — это графики, отображающие распределение ваших непрерывных данных. Это фантастические исследовательские инструменты, потому что они раскрывают свойства ваших выборочных данных способами, недоступными для сводной статистики. Например, в то время как среднее и стандартное отклонение могут численно суммировать ваши данные, гистограммы оживляют ваши выборочные данные.

    В этом сообщении блога я покажу вам, как гистограммы показывают форму распределения, его центральную тенденцию и разброс значений в ваших выборочных данных.Вы также узнаете, как определять выбросы, как гистограммы соотносятся с функциями распределения вероятностей и почему вам может потребоваться использовать их для проверки гипотез.

    Гистограммы, центральная тенденция и изменчивость

    Используйте гистограммы, когда у вас есть непрерывные измерения и вы хотите понять распределение значений и искать выбросы. Эти графики позволяют выполнять непрерывные измерения и помещать их в диапазоны значений, известные как интервалы. Каждая ячейка имеет полосу, которая представляет количество или процент наблюдений, попадающих в эту ячейку.

    Загрузите файл данных CSV, чтобы сделать большинство гистограмм в этом сообщении в блоге: Гистограммы.

    В области статистики мы часто используем сводную статистику для описания всего набора данных. Эти статистические данные используют одно число для количественной оценки характеристики образца. Например, мера центральной тенденции — это одно значение, которое представляет центральную точку или типичное значение набора данных, такое как среднее значение. Мера изменчивости — это еще один тип сводной статистики, который описывает, насколько разбросаны значения в вашем наборе данных.Стандартное отклонение — это обычная мера дисперсии.

    Эти сводные статистические данные имеют решающее значение. Как часто вы слышали, что среднее значение группы — это определенная ценность? Он предоставляет значимую информацию. Однако эти меры являются упрощением набора данных. Графическое представление данных оживляет их. В общем, я считаю, что использование графиков в сочетании со статистикой дает лучшее из обоих миров!

    Давайте посмотрим на это в действии.

    Соответствующие должности : Меры центральной тенденции и меры изменчивости

    Гистограммы и центральная тенденция

    Используйте гистограммы, чтобы понять центр данных.На гистограмме ниже вы можете видеть, что центр находится около 50. Большинство значений в наборе данных будут близки к 50, а значения, расположенные дальше, встречаются реже. Распределение примерно симметрично, и значения лежат между примерно 40 и 64.

    Разница в средних сдвигает распределения по оси X по горизонтали (если гистограмма не повернута). На гистограммах ниже среднее значение одной группы составляет 50, а для другой — 65.

    Кроме того, гистограммы помогают понять степень перекрытия между группами.На гистограммах выше наблюдается относительно небольшое перекрытие.

    Гистограммы и изменчивость

    Предположим, вы слышите, что две группы имеют одинаковое среднее значение 50. Похоже, что они практически эквивалентны. Однако после построения графика данных различия становятся очевидными, как показано ниже.

    Гистограммы сосредоточены на одном и том же значении 50, но разброс значений заметно отличается. Значения для группы A в основном находятся в диапазоне от 40 до 60, а для группы B — от 20 до 90.Среднее значение не раскрывает всей истории! С первого взгляда разница видна по гистограммам.

    Короче говоря, гистограммы показывают, какие значения более и менее распространены, а также их разброс. Вы не сможете понять это из необработанного списка ценностей. Сводная статистика, такая как среднее значение и стандартное отклонение, поможет вам отчасти. Но гистограммы делают данные всплывающими!

    Гистограммы и искаженные распределения

    Гистограммы — отличный инструмент для определения формы вашего распределения.До сих пор мы рассматривали симметричные распределения, такие как нормальное распределение. Однако не все распределения симметричны. У вас могут быть отклоненные от нормы данные.

    Форма распределения — это фундаментальная характеристика вашей выборки, которая может определить, какой показатель центральной тенденции лучше всего отражает центр ваших данных. Соответственно, форма также влияет на ваш выбор между использованием параметрической или непараметрической проверки гипотез. Таким образом, гистограммы информативны для сводной статистики и тестов гипотез, которые подходят для ваших данных.

    Для наклонных распределений направление перекоса указывает, в какую сторону простирается более длинный хвост.

    Для распределений со смещением вправо длинный хвост простирается вправо, в то время как большинство значений группируются слева, как показано ниже. Это реальные данные проведенного мной исследования.

    И наоборот, для распределений со смещением влево длинный хвост простирается влево, в то время как большинство значений группируются справа.

    Связанные сообщения : Нормальное распределение в статистике и параметрическом сравнении.Непараметрические проверки гипотез

    Использование гистограмм для выявления выбросов

    Гистограммы — удобный способ выявить выбросы. В мгновение ока вы увидите, нет ли необычных значений. Если вы обнаружите потенциальные выбросы, исследуйте их. Это ошибки ввода данных или они представляют собой наблюдения, которые произошли в необычных условиях? Или, возможно, это законные наблюдения, которые точно описывают изменчивость в районе исследования.

    На гистограмме выбросы отображаются в виде изолированной полосы.

    Связанные сообщения : 5 способов найти выбросы и рекомендации по удалению выбросов

    Определение мультимодальных распределений с помощью гистограмм

    Мультимодальное распределение имеет более одного пика. Если сосредоточиться на сводной статистике, такой как среднее значение и стандартное отклонение, легко упустить из виду мультимодальные распределения. Следовательно, гистограммы — лучший метод обнаружения мультимодальных распределений.

    Представьте, что ваш набор данных имеет свойства, показанные ниже.

    Это выглядит относительно просто, но если вы построите график, то увидите гистограмму ниже.

    Это бимодальное распределение — не совсем то, что вы ожидали! Эта гистограмма показывает, почему вы всегда должны строить график своих данных, а не просто рассчитывать сводную статистику!

    Использование гистограмм для определения субпопуляций

    Иногда эти мультимодальные распределения отражают реальное распространение явления, которое вы изучаете.Другими словами, существуют действительно разные пиковые значения в распределении одной популяции. Однако в других случаях мультимодальное распределение указывает на то, что вы объединяете субпопуляции с разными характеристиками. Гистограммы могут помочь подтвердить наличие этих субпопуляций и проиллюстрировать, чем они отличаются друг от друга.

    Предположим, мы изучаем рост американских граждан. Их средний рост составляет 168 см со стандартным отклонением 9,8 см. Гистограмма ниже.Похоже, что в центре необычно широкий пик — он не совсем двухрежимный.

    Когда мы разделим выборку по полу, причина этого станет ясна.

    Обратите внимание, как два более узких распределения заменили одно широкое распределение? Гистограммы помогают нам понять, что пол является важной категориальной переменной в исследованиях, связанных с ростом. Графики показывают, что среднее значение дает более точные оценки, когда мы оцениваем рост по полу. Фактически, среднее значение для всей популяции не равно среднему для любой из подгрупп.Это заблуждение!

    Связанное сообщение : Точечные графики: использование, примеры и интерпретация

    Использование гистограмм для оценки соответствия функции распределения вероятностей

    Аналитики могут наложить подобранную линию для функции распределения вероятностей на свою гистограмму. Вот быстрое различие между ними:

    • Гистограмма : отображает распределение значений в выборке.
    • Встроенная линия распределения : отображает функцию распределения вероятностей для определенного распределения (например,g., normal, Weibull и т. д.), которая лучше всего соответствует вашим данным.

    Гистограмма отображает данные выборки . С другой стороны, подобранная линия распределения пытается найти функцию распределения вероятностей для популяции (), которая имеет максимальную вероятность получения распределения, существующего в вашей выборке.

    Хотя вы можете использовать гистограммы для оценки того, насколько хорошо кривая распределения соответствует вашему образцу, я НЕ рекомендую это делать! Если вы настаиваете на использовании гистограммы, оцените, насколько точно полосы соответствуют форме подобранной линии.На приведенном ниже графике подобранная линия для нормального распределения, кажется, адекватно повторяет столбцы гистограммы. В легенде отображаются оценочные значения параметров подобранного распределения.

    Вместо использования гистограмм для определения того, насколько хорошо распределение соответствует вашим данным, я рекомендую использовать комбинацию тестов распределения и графиков вероятности. Графики вероятностей — это специальные графики, специально разработанные для отображения того, насколько хорошо функции распределения вероятностей соответствуют выборкам.Чтобы узнать больше об этих других подходах, прочитайте мои сообщения об определении распределения ваших данных и гистограммах в зависимости от графиков вероятностей.

    Связанное сообщение : Общие сведения о распределении вероятностей

    Использование гистограмм для сравнения распределений между группами

    Чтобы сравнить распределения между группами с помощью гистограмм, вам потребуются как непрерывная переменная, так и категориальная группирующая переменная. Есть два распространенных способа отображения групп в гистограммах.Вы можете либо наложить группы, либо изобразить их на разных панелях, как показано ниже.

    Может быть проще сравнивать дистрибутивы, когда они наложены, но иногда они получаются беспорядочными. Гистограммы на отдельных панелях отображают каждое распределение более четко, но сравнения и степень перекрытия не так ясны. В приведенных выше примерах панельные распределения явно более читабельны. Однако наложенные гистограммы могут хорошо работать и в других случаях, как вы видели в этом сообщении в блоге.Экспериментируйте, чтобы найти лучший подход для ваших данных!

    Хотя я считаю, что гистограммы — лучший график для понимания распределения значений для одной группы, их можно спутать с несколькими группами. Гистограммы обычно довольно хороши для отображения двух групп и до четырех групп, если вы отображаете их на отдельных панелях. Если ваша основная цель — сравнить распределения, а ваши гистограммы сложно интерпретировать, рассмотрите возможность использования коробчатых диаграмм или индивидуальных диаграмм. На мой взгляд, эти другие графики лучше подходят для сравнения распределений, когда у вас больше групп.Но они не предоставляют столько подробностей для каждого распределения, сколько гистограммы.

    Опять же, поэкспериментируйте и определите, какой график лучше всего подходит для ваших данных и целей!

    Связанное сообщение : Коробчатые диаграммы в сравнении с графиками отдельных значений: построение непрерывных данных по группам

    Гистограммы и размер выборки

    Какими бы фантастическими ни были гистограммы для изучения ваших данных, имейте в виду, что размер выборки является важным фактором, когда вам нужно, чтобы форма гистограммы напоминала распределение населения.Обычно я рекомендую иметь размер выборки не менее 50 на группу для гистограмм. При менее чем 50 наблюдениях у вас слишком мало данных для точного представления распределения населения.

    Обе гистограммы, представленные ниже, используют выборки, взятые из совокупности со средним значением 100 и стандартным отклонением 15. Эти характеристики описывают распределение оценок IQ. Однако одна гистограмма использует размер выборки 20, а другая — размер выборки 100. Обратите внимание, что я использую проценты на оси Y для сравнения столбцов гистограммы между различными размерами выборки.

    Это огромная разница! Чтобы получить хорошее представление обо всем распределении, требуется удивительно большой размер выборки. Если размер вашей выборки меньше 20, рассмотрите возможность использования графика индивидуальных значений.

    Использование проверки гипотез в сочетании с гистограммами

    Как вы видели в этом посте, гистограммы могут иллюстрировать распределение групп, а также различия между группами. Однако, если вы хотите использовать данные выборки, чтобы делать выводы о популяциях, вам нужно будет использовать проверку гипотез.Кроме того, убедитесь, что вы используете метод выборки, например случайную выборку, чтобы получить выборку, отражающую генеральную совокупность.

    Связанные сообщения : Разница между описательной и выводимой статистикой и популяциями, параметрами и выборками в выводной статистике

    Различия между группами, которые видны на гистограммах, могут быть причудами, вызванными случайной ошибкой выборки, а не отражением реальных различий между популяциями. На гистограммах случайная ошибка может проявляться как разница между центральной тенденцией и изменчивостью.Кроме того, произвольные графические факторы, такие как масштаб оси Y и различные размеры ячеек, могут преувеличивать различия.

    Проверка гипотез играет решающую роль в отделении сигнала (реальные различия в совокупности) от шума (случайная ошибка выборки). Эта защитная функция помогает не принять случайную ошибку за реальный эффект. Если соответствующая проверка гипотез не является статистически значимой, ваша выборка не дает достаточных доказательств для вывода о том, что модель на вашем графике представляет реальный эффект на уровне популяции.Другими словами, вы могли видеть шум в образце.

    Проверка гипотез для гистограмм

    Используйте следующие проверки гипотез вместе с гистограммами при сравнении групп:

    Двухвыборочный t-критерий: Оцените равенство двух групповых средних.

    ANOVA: проверьте равенство трех или более групповых средних.

    Манн-Уитни: Оцените равенство двух групповых медиан.

    Медиана Краскала-Уоллиса и настроения: проверьте равенство трех или более медианных групп.

    Тест равных отклонений: оцените равенство групповых отклонений или стандартных отклонений.

    Гистограммы

    — отличный способ исследовать ваши данные. Однако, когда вам нужно сделать выводы обо всей совокупности, обязательно используйте репрезентативный метод выборки и правильный тест гипотез.

    Связанные

    1.3.3.14. Гистограмма


    1. Исследовательский анализ данных
    1.3. Методы EDA
    1.3.3. Графические методы: алфавитный

    Назначение: Обобщение одномерного набора данных Назначение гистограммы (Камеры) графически суммировать распределение одномерного набор данных.

    Гистограмма графически показывает следующее:

    1. центр (то есть местоположение) данных;
    2. разброс (т.е. масштаб) данных;
    3. асимметрия данных;
    4. наличие выбросов; и
    5. наличие нескольких режимов в данных.

    Эти особенности четко указывают на то, что правильная модель распределения данных. В вероятностный график или проверка соответствия может быть используется для проверки модели распределения.

    Примеры В разделе показан внешний вид ряда общих функций выявляется по гистограммам.

    Образец участка
    Приведенный выше график представляет собой гистограмму скорость света Майкельсона набор данных.
    Определение Наиболее распространенный вид гистограммы получается путем разбиения диапазон данных в бункерах равного размера (называемых классами). Затем для каждого бина количество точек из набора данных, которые попадают в каждую корзину. Это
    • Вертикальная ось: частота (т. Е. Количество единиц для каждой ячейки)
    • Горизонтальная ось: переменная отклика
    Классы могут быть определены произвольно пользователем или через какое-то систематическое правило.Ряд теоретически производные правила были предложены Скоттом (Скотт 1992).

    Кумулятивная гистограмма — это вариант гистограммы на которой по вертикальной оси отложены не только значения отдельная корзина, но дает счетчики для этой корзины плюс все ячейки для меньших значений переменной ответа.

    И гистограмма, и кумулятивная гистограмма имеют дополнительный вариант, при котором подсчеты заменены нормализованными счетчиками.Названия этих вариантов относительная гистограмма и относительная кумулятивная гистограмма.

    Есть два распространенных способа нормализовать счет.

    1. Нормализованное количество — это количество в классе, деленное на общее количество наблюдений. В таком случае относительные числа нормализованы, чтобы сумма была равна одному (или 100, если используется процентная шкала). Это интуитивно понятный случай, когда высота полоса гистограммы представляет собой долю данные в каждом классе.
    2. Нормализованное количество — это количество в классе деленное на количество наблюдений, умноженное на ширина класса. Для этой нормализации площадь (или интеграл) под гистограммой равен единице. С вероятностной точки зрения эта нормализация приводит к относительной гистограмме, которая больше всего похожа на функция плотности вероятности и относительная кумулятивная гистограмма, которая больше всего похожа на кумулятивная функция распределения.Если хотите наложить плотность вероятности или кумулятивную функция распределения поверх гистограммы, используйте это нормализация. Хотя эта нормализация менее интуитивно понятный (относительные частоты больше 1 вполне допустимы), это уместно нормализация, если вы используете гистограмму для моделирования функция плотности вероятности.
    Вопросы Гистограмма может быть использована для ответа на следующие вопросы:
    1. Из какого распределения населения взяты данные?
    2. Где находятся данные?
    3. Насколько разбросаны данные?
    4. Данные симметричны или искажены?
    5. Есть ли в данных выбросы?
    Примеры
    1. Нормальный
    2. Симметричный, ненормальный, Короткохвостый
    3. Симметричный, ненормальный, Длиннохвостый
    4. Симметричный и бимодальный
    5. Бимодальная смесь 2 нормалей
    6. перекошенный (несимметричный) вправо
    7. Перекос (несимметричный) влево
    8. Симметричный с выбросом
    Связанные методы Коробчатая диаграмма
    Вероятностная диаграмма

    Приведенные ниже методы не обсуждаются в Руководстве.Однако по назначению они похожи на гистограмму. Дополнительная информация о них содержится в Палаты и Ссылки Скотта.

    График частот
    График стебля и листа
    График плотности

    Пример использования Гистограмма представлена ​​в счетчик теплового потока тематическое исследование данных.
    Программного обеспечения Гистограммы доступны в большинстве статистических программное обеспечение.Они также поддерживаются в большинстве случаев. программы для построения графиков, электронных таблиц и бизнес-графики.

    Характеристики гистограммы | Sciencing

    Гистограмма — это инструмент, используемый для графического представления информации. Обычно гистограммы представлены в виде гистограмм, используемых для отображения взаимосвязей между данными; они используются для многих типов информации. Из гистограммы вы можете легко экстраполировать среднее, минимальное, максимальное и другую статистическую информацию, часто используемую для анализа данных, чтобы понять предмет или внести какие-либо улучшения.

    Информация

    Гистограмма чаще всего представляет собой гистограмму (или гистограмму), которая содержит столбцы одинаковой ширины для иллюстрации набора информации. На гистограмме представлена ​​информация двух типов: «классы» (или «ячейки») — это группы данных, помещенные на диаграмму, представленные столбцами; другой тип информации — это «количество», представленное размером столбцов. Гистограмма наглядно показывает количество различных интервалов. Гистограмма всегда должна быть четко помечена заголовком диаграммы, а также тем, что представляют собой ячейки и количество.

    Гистограмма

    Гистограмма — это инструмент, завершенный в рамках гистограммы, которая отображает средние точки столбцов для представления изменений на графике. В то время как гистограмма использует прямоугольники для представления количества каждого бина, гистограмма показывает изменения в информации в виде линейного графика; то есть точки и линии на гистограмме визуально представляют дисперсию на гистограмме.

    Слабые стороны

    Гистограммы обычно имеют два основных недостатка.Во-первых, ими легко манипулировать, чтобы продемонстрировать или поддержать желаемый вывод; это достигается за счет использования большего или меньшего количества полосок для отображения информации. Другой недостаток заключается в том, что временные различия часто не принимаются во внимание при представлении данных; это важно, например, при анализе последовательных производственных циклов или дублирования производственных циклов. Эти две слабости могут ввести в заблуждение тех, кто анализирует информацию.

    Подробности

    Гистограмма предназначена для быстрого восприятия многих видов информации, включая среднее, минимальное и максимальное значения информации, нанесенной на диаграмму.Другие вычисления, сделанные на основе гистограмм, включают определение стандартного отклонения данных, а также ширины класса, которая представляет собой диапазон слева направо на диаграмме.

    3 вещи, о которых может рассказать гистограмма

    Гистограммы — один из наиболее распространенных графиков, используемых для отображения числовых данных. Любой, кто изучает статистику, наверняка узнает о гистограмме, и на то есть веские причины: гистограммы просты для понимания и могут сразу многое рассказать вам о ваших данных.

    Вот три наиболее важных вещи, которые вы можете узнать, глядя на гистограмму.

    Форма — зеркало, зеркало, на стене…

    Если левая часть гистограммы напоминает зеркальное отображение правой стороны, то данные называются симметричными. В этом случае среднее (или среднее) является хорошим приближением для центра данных. И поэтому мы можем безопасно использовать статистические инструменты, которые используют среднее значение для анализа наших данных, например t-тесты.

    Если данные не симметричны, то данные либо наклонены влево, либо вправо.Если данные искажены, то среднее значение может не обеспечивать хорошую оценку для центра данных и представлять, куда попадает большая часть данных. В этом случае вам следует рассмотреть возможность использования медианы для оценки центра данных, а не среднего.

    Знаете ли вы …

    Если данные смещены влево, то среднее значение обычно МЕНЬШЕ медианы.

    Если данные смещены вправо, то среднее значение обычно БОЛЬШЕ, чем медиана.

    Span — немного или много?

    Предположим, у вас есть набор данных, содержащий зарплаты людей, работающих в вашей организации. Было бы интересно узнать, где падают минимальное и максимальное значения и где вы находитесь относительно этих значений. Поскольку гистограммы используют интервалы для отображения данных, где интервал представляет заданный диапазон значений, вы не можете точно увидеть, каковы конкретные значения для минимума и максимума, как вы можете на графике отдельных значений.Тем не менее, вы все равно можете наблюдать приблизительное значение диапазона и увидеть, насколько разбросаны данные. И вы можете ответить на такие вопросы, как «Есть ли разница в зарплатах в моей организации или сильно?»

    Выбросы (и озоновый слой)

    Выбросы можно описать как чрезвычайно низкие или высокие значения, которые не попадают ни в какие другие точки данных. Иногда выбросы представляют собой необычные случаи. В других случаях они представляют собой ошибки ввода данных или, возможно, данные, которые не принадлежат другим интересующим данным.Как бы то ни было, выбросы можно легко идентифицировать с помощью гистограммы, и их следует исследовать, поскольку они могут пролить интересную информацию о ваших данных.

    Вернитесь в середину 1980-х годов, когда ученые сообщили об истощении уровней озона над Антарктидой. Космический центр Годдарда изучал уровень озона в атмосфере, но, к удивлению, не обнаружил этой проблемы. Почему? Анализ, который они использовали, автоматически исключил любые показания Добсона ниже 180 единиц, потому что такие низкие уровни озона считались невозможными.

    В чем разница между гистограммой и гистограммой?

    Если вы хотите, чтобы к вам серьезно относились как к профессионалу в области данных, вам просто нужно знать кое-что. Разница между столбчатой ​​диаграммой и гистограммой — одна из таких вещей.

    Этот пост представляет собой небольшой мультфильм, иллюстрированный объяснением различий.

    Вкратце: разница между гистограммой и гистограммой. Гистограммы — это группа столбиков, соединенных друг с другом, визуализирующих распределение некоторой непрерывной количественной переменной.Гистограммы (или гистограммы) используют прямоугольники пропорционального размера для визуализации некоторых типов категориальных данных.

    Назначение гистограммы (где вы часто видите гистограммы).

    Итак, я начал свою карьеру в качестве исследователя, уделяя много времени изучению данных опросов. Одно из первых действий, которое вы делаете после сбора данных (или действительно во время сбора данных), — это создание отчета со всеми таблицами частот отклика. Для категориальных данных вы должны визуализировать частоты с помощью гистограммы.С любыми количественными данными вы визуализируете частоты с помощью гистограммы.

    Гистограммы

    позволяют увидеть распределение данных, и это одна из первых вещей, на которую большинство исследователей будут обращать внимание при анализе количественных данных.

    Вызов гистограммы в виде столбчатой ​​диаграммы (или соединение столбцов) — это человек, работающий с данными, эквивалент использования неправильного «там». Неужели это так важно? Я не знаю … но это привлечет внимание в определенных толпах.

    Некоторые из основных различий между гистограммами и гистограммами.

    • Как уже обсуждалось, вся непрерывная переменная против категориальной переменной.
    • Полоски на гистограммах соприкасаются.
    • Вы не можете изменить порядок сортировки с помощью гистограммы (или, я думаю, вы могли бы, но не должны).
    • Гистограммы требуют объединения ваших числовых данных.

    Помещение данных в бункеры.

    Бункеры — это группы, в которые вы помещаете свои данные.

    Это что-то вроде оценок в школе. Есть ли огромная когнитивная разница между детьми, родившимися в июне и октябре одного и того же года? Чем он отличается от детей, рожденных в феврале и июне? Я бы подумал, что нет, но в какой-то момент людям нужно было определить границу для определенной группы детей, которую они хотели бы обучать вместе.Поэтому они разбили их на корзины (в данном случае они назвали их оценками).

    Не существует установленного правила, гласящего, что «вы должны мусорить, как ЭТО !!!!» Таким образом, многие корзины основаны на суждениях аналитика данных.

    Возьмем, к примеру, возраст, это непрерывная переменная. Допустим, у вас есть опрос сообщества, и ваши ответы варьируются от 17 до 93 лет. Как бы вы его убрали? Вы можете использовать 5-летние интервалы (например, 16-20, 21-25, 26-30…) или 10-летние интервалы (11-20, 21-30, 31-40…).

    Ресурсы гистограммы и гистограммы

    Гистограммы

    Гистограммы позволяют визуализировать распределение числовой переменной . Подобно гистограмме, в которой каждый уникальный ответ записан как отдельная полоса, гистограммы группируют числовые ответы в ячейки и отображают частоту ответов в каждой. Ось X гистограммы отражает диапазон значений числовой переменной, а ось Y может отражать либо частоты (количество), либо относительные частоты (процент от общего количества) для диапазона значений вашей числовой переменной.

    Обычно лучше иметь от 5 до 15 ячеек, в зависимости от количества различных значений, которые встречаются в вашей выборке. Чем больше у вас ответов, тем больше ящиков вы можете использовать. Ячейки создаются путем деления диапазона ответов на равное количество ячеек.

    Примечание: В Excel вы должны создать свои собственные диапазоны интервалов, в то время как в R и большинстве других программ статистического анализа интервалы будут автоматически созданы для вас (и при необходимости изменены).

    Создание ячеек

    Пример. Вы собрали данные о росте 100 старшеклассников. Высота измерялась в дюймах и составляла от 59 до 81 дюйма. Чтобы создать интервалы, разделите высоту на равномерно распределенные диапазоны и запишите, сколько учеников попало в каждый диапазон. На изображениях ниже мы использовали несколько различных размеров бинов для создания гистограмм одних и тех же данных выборки:

    Использование четырех интервалов не дает достаточно деталей для интерпретации распределения.Такая же общая форма этого распределения видна на двух гистограммах с использованием шести интервалов и 12 интервалов. Использование одного по сравнению с другим — это скорее вопрос вкуса, чем необходимый метод.

    Описание гистограмм

    Гистограммы

    полезны для отображения закономерностей в ваших данных и получения представления о распределении вашей переменной с первого взгляда. Первым отличительным признаком гистограммы является количество мод, или пиков в распределении. Пик возникает в любом месте, где распределение падает, а затем снова возрастает, даже если он не поднимается так высоко, как предыдущий пик.Унимодальное распределение имеет только один пик в распределении, бимодальное распределение имеет два пика, а мультимодальное распределение имеет три или более пика.

    Другой способ описать форму гистограмм — указать, являются ли данные перекосом или симметричными. Симметричные данные должны выглядеть почти одинаково, если их сложить пополам в центральной точке распределения. Симметричные и одномодальные данные часто описываются как нормальные, что важно для проверки предположений многих статистических тестов. Перекошенные данные указывают на то, что большая часть данных, собранных на одной стороне диаграммы, и только небольшая часть — на другой стороне. Мы называем прореживание части распределения «хвостом», и направление хвоста определяет, как мы определяем наклон распределения (наклон влево или наклон вправо).

    Приведенное выше распределение высот является одномодальным, наклонено вправо и содержит еще одну интересную особенность — выброс . Выбросы — это ответы, которые сильно отличаются от остальных значений.Определение наблюдения как выброса является субъективным и должно привести к исследованию этого значения (а не к автоматическому удалению из набора данных).

    Примеры изображений:

    Слева направо первое распределение является одномодальным и скошенным влево. Среднее распределение является унимодальным и довольно симметричным (по крайней мере, таким же симметричным, как обычно получают реальные данные). Это распределение достаточно близко, чтобы его можно было считать нормальным. Окончательное распределение искажено вправо.


    Пример 1: Создание гистограмм в Excel 2016 на

    Некоторые из этих анализов требуют, чтобы у вас была включена надстройка Data Analysis ToolPak в Excel.

    В этом примере вы узнаете, как создать гистограмму количества калорий, которые респонденты съели за завтраком.

    Набор данных, используемый в видео

    Метод № 1
    PDF-инструкции, соответствующие видео

    Метод № 2
    PDF-инструкции, соответствующие видео


    Пример 2: Создание гистограмм в R

    В этом примере описывается и отображается распределение измерений ИМТ для выборки пациентов.

    Набор данных, используемый в видео
    Файл сценария R, используемый в видео

    Tableau, Excel и Google Таблицы

    Гистограмма использует столбцы для визуализации распределения данных о том, сколько вещей, людей или происшествий произошло между диапазоном значений на оси. Хотя гистограммы выглядят как гистограммы, они отличаются тем, что каждая полоса представляет собой интервал значений метрики. Эти столбцы называются ячейками или сегментами, и вместе они представляют то, что называется частотным распределением.Частотное распределение — это отображение того, как часто что-то происходило на графике, таблице или диаграмме. Гистограммы представляют собой графики и являются одним из способов визуализации частотных распределений.

    Вы, наверное, видели гистограмму в поисках лучшего времени для посещения ресторана в Google!

    Эта гистограмма показывает частоту посетителей ресторана в одночасовых ячейках в диапазоне временного интервала. Однако не для всех гистограмм необходимо использовать период времени в качестве заданного диапазона.

    Гистограммы в статистике

    Гистограммы полезны для анализа наборов числовых данных. Аналитики и статистики используют их для анализа частотных закономерностей и визуализации числовой разбивки того, что собирается в данных.

    В статистике гистограммы используются для построения графика распределения вероятностей данных. Это представляет собой процентную вероятность попадания любой конкретной точки данных в каждый диапазон. Гистограмма вероятности показывает наиболее вероятные значения точек данных.Типичным примером является бросок игральных костей, при котором вычисляется и отображается прогнозируемое частотное распределение различных чисел, на которые могут выпасть кости.

    Краткая разбивка данных гистограммы

    Полосы на гистограмме представляют собой числовые интервалы (пример 0-19, 20-39, 40-59 и т. Д.) С данными, разделенными на заданный диапазон (пример 0-100). Распределение, отображаемое в визуализации, основано на том, как разделены интервалы. Например, вы можете разделить диапазон 0–100 на 5 или 4 ячейки, сделав интервал между ячейками 20 или 25 единиц.

    В этом руководстве объясняется, как построить гистограмму в Tableau (версия 2020.2), Excel 2016 + (версия 16.XX) или Google Sheets. Подумайте об использовании Tableau Desktop бесплатно.

    Загрузите пример данных Excel, чтобы следовать им в любом инструменте.

    Таблица данных Excel

    Чтобы построить гистограмму, выполните следующие действия.

    .

    alexxlab

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *