Информатика студентам

>
   
   
Главная

Windows XP

Word 2003

Excel 2003

на предыдущую  на следующую

Гистограмма

Наглядное представление о характере изменения частот вариационного ряда дают полигон и гистограмма.

Гистограмма — это способ графического изображения интервальных распределений вариант при непрерывном варьировании признака. Гистограмма распределения применяется только для изображения интервального вариационного ряда.

Гистограмма представляет собой столбчатый график, построенный по полученным за определенный период (например, за неделю или за месяц) данным, которые разбиваются на несколько интервалов; число данных, попадающих в каждый из интервалов (частота), выражается высотой столбика.

Данные для построения гистограммы собирают в течение длительного периода - недели, месяца, года и т. д.

Гистограмма – это серия столбиков одинаковой ширины, но разной высоты, показывающая рассеяние и распределение данных. Ширина столбика – это интервал в диапазоне наблюдений, высота – количество данных, приходящихся на тот или иной интервал, т.е. частость. По существу, гистограмма отображает распределение исследуемого показателя. Гистограмма позволяет оценить характер рассеивания показателя и разобраться в том, на чём следует сосредоточить усилия по улучшению.

Гистограмму используют для изображения только интервальных рядов.

Признак называется непрерывно варьирующим, если его значения отличаются друг от друга на сколь угодно малую величину, т.е. признак может принимать любые значения в некотором интервале. Непрерывный вариационный ряд такого признака называется интервальным (см. табл. 3 и 4).

Таблица 3

Общий вид интервального вариационного ряда частот

Интервалы

ai-ai+1


a1-a2

a2-a3

an-an+1

Частоты

mi


m1

m2

mn

Таблица 4

Общий вид интервального вариационного ряда частостей

Интервалы

ai-ai+1


a1-a2

a2-a3

an-an+1

Частости

wi


w1

w2

wn

Просматривая результаты проведенных наблюдений, определяют, сколько значений вариантов попало в каждый конкретный интервал. Предполагается, что каждому интервалу принадлежит один из его концов: либо во всех случаях левые (чаще), либо во всех случаях правые, а частоты или частости показывают число вариантов, заключенных в указанных границах. Разности (ai-ai+1) называются частичными интервалами или интервальными разностями.

Для того чтобы интервальный вариационный ряд не был громоздким и в то же время позволял выявить характерные черты изменения значений случайной величины, обычно число частичных интервалов выбирают от 7 до 10. Длина частичного интервала (интервальная разность) зависит от размаха варьирования и выбранного числа интервалов

Если окажется, что h – дробное число, то за длину частичного интервала следует брать либо ближайшее целое число, либо ближайшую простую дробь.

Для упрощения последующих расчетов интервальный вариационный ряд можно заменить условно дискретным. В этом случае серединное значение i-го интервала принимают за вариант xi, а соответствующую интервальную частоту mi– за частоту этого интервала.

Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины h, а высоты равны отношению  (плотность частоты). Площадь частичного i-го прямоугольника равна - сумме частот вариант, попавших в i-ый интервал. Площадь гистограммы частот равна сумме всех частот, т.е. объему выборки n

Если соединить середины верхних оснований прямоугольников отрезками прямой, то можно получить полигон того же распределения, который будет являться выборочным аналогом дифференциальной функции распределения f(x).

Гистограммой относительных частотназывают ступенчатую фигуру, со­стоящую из прямоугольников, основаниями которых служат частичные интервалы длины h, а высоты равны отношению (плотность относительной частоты). Площадь частичного i-го прямоугольника равна - сумме относительных час­тот вариант, попавших в i - ый интервал. Площадь гистограммы относительных частот равна сумме всех относительных частот, т.е. единице.

Характерные типы гистограмм показаны на рис. .

 

 

 

 


Рис. Характерные типы гистограмм

На рис.,а показан обычный тип гистограммы с двусторонней симметрией, что указывает на стабильность процесса.

На рис.,б в распределении имеется два пика (двугорбая гистограмма). Такая гистограмма получается при объединении двух распределений, например, в случае двух видов сырья, изменения настройки процесса или объединения в одну партию изделий, обработанных на двух разных станках. Требуется расслоение продукции.

На рис.,в показана гистограмма с обрывом. Такое распределение получается, когда невозможно получить значение ниже (или выше) некоторой величины. Подобное распределение имеет место также, когда из партии исключены все изделия с показателем ниже (и/или выше) нормы, т.е. изначально это была партия с большим количеством дефектных изделий. Такое же распределение получается, когда измерительные приборы были неисправны.

На рис.,г показана гистограмма с островком. Получается при ошибках в измерениях, или когда некоторое количество дефектных изделий перемешано с доброкачественными.

На рис.,д показана гистограмма с прогалами («гребёнка»). Получается, когда ширина интервала не кратна единице измерения или при ошибках оператора.

На рис.,е показана гистограмма в форме плато. Получается, когда объединяются несколько распределений при небольшой разнице средних значений. В этом случае требуется расслоение.

Гистограмма строится в следующем порядке. Систематизируют данные, собранные, например, за 10 дней или за месяц. Число данных должно быть не менее 30-50, оптимальное число - порядка 100. Если их оказывается более 300, затраты времени на их обработку оказываются слишком большими. Следующий шаг - определение наибольшего L и наименьшего S значений данных. При большом числе значений (порядка 100) определение L и S затруднительно, поэтому вначале определяют наибольшее и наименьшее значения в каждом десятке значений, а затем среди полученных значений определяют L и S. Интервал между наибольшим и наименьшим значениями делят на соответствующие участки. Число участков должно примерно соответствовать корню квадратному из числа данных. При числе данных З0-50 число участков должно быть равно 5-7, при числе данных 50-100-6-10; при числе данных 100-2008-15. Далее определяют ширину участка h. Разность между L и S делят на число участков и полученное число округляют. Например, для анализа результатов контроля толщины пластин при L=11,8 мм,S=7,1 мм и числе участков 10 получим h=(11,8-7,1):10=0,47 мм. Округляют это число до 0,5 мм и получают ширину участка h=0,5 мм.

Значения границ участков определяют следующим образом. Вначале находят наименьшее граничное значение для первого участка из условия S - единица измерения/2.

В приведенном примере S=7,1 мм; единица измерения составляет 0,1 мм . Таким образом, наименьшее граничное значение для первого участка оказывается равным

7,1 мм - 0,1 мм/2 = 7,05 мм

Прибавляя к полученному значению ширину участка h=0,5 мм, находим что первый участок занимает интервал на оси абсцисс от 7,05 мм до 7,55 мм . Аналогично, прибавляя 0,5 мм к 7,55 мм, получим интервал второго участка (7,55 мм- 8,05 мм ), и т. д.

В интервал последнего участка (11,55-12,05) входит наибольшее значение L.

Следующий шаг - определение центральных значений для участков. Центральное значение для участка определяют по формуле

Сумма граничных значений участка/2=нижнее граничное значение участка+верхнее граничное значение участка/2

В приведенном примере центральное значение для первого участка равно

7,05+7,55/2=7,3 мм

Центральные значения последующих участков находятся прибавлением ширины участка h=0,5 мм к значению для предыдущего участка.

В размеченные описанным выше образом интервалы участков размещают данные измеренных значений толщины пластин в каждом интервале, которые составляют частоту f попадания этих данных в соответствующий интервал (табл. 9).

Таблица 9

 

Интервал участка, мм

Центральное значение, мм  

Частота

7,05-7,55  

7,3

2

7,55-8,05  

7,8

9

8,05-8,55  

8,3

14

8,55-9,05  

8,8

17

9,05-9,55  

9,3

16

9,55-10,05  

9,8

15

10,05-10,55  

10,3

14

10,55-11,05  

10,8

9

11,05-11,55  

11,3

3

11,55-12,05  

11,8

1

 

 Сумма (f)100

Последним шагом является построение графика гистограммы. По оси абсцисс откладывают значения параметров качества, по оси ординат - частоту. Для каждого участка строят прямоугольник (столбик) с основанием, равным ширине интервала участка; высота его соответствует частоте попадания данных в этот интервал (см. рис. 20). Если на гистограмме от руки провести кривую распределения данных по частоте, а также верхнее и нижнее предельные значения нормы, то легко можно понять вид распределения гистограммы и соотношение значений контрольных нормативов. Анализ гистограммы позволяет сделать заключение о состоянии процесса, однако если неясны условия контроля процесса или временные изменения, необходимо в комбинации с гистограммой использовать также контрольные карты и график, представляемый ломаной линией. Полученная в результате анализа гистограммы информация может быть легко использована для построения и исследования причинно-следственной диаграммы, что повысит обоснованность мер, намеченных для улучшения процесса.

Поскольку гистограмма выражает условия процесса за период, в течение которого были получены данные, важную информацию может дать форма распределения гистограммы в сравнении с контрольными нормативами.

Режим «Гистограмма» Пакета Анализа Excel сслужит для вычисления частот попада­ния данных в указанные границы интервалов, а также для пост­роения гистограммы интервального вариационного ряда распре­деления.

 

в начало


предыдущую   на следующую

Copyright © 2010-2024
Ющик Е.В. All Rights Reserved

E-mail:
mailto:yuschikev@yandex.ru?subject=Письмо автору

Рейтинг@Mail.ru