Информатика студентам |
|
|
ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ДАННЫХ На первом этапе статистической обработки экспериментальных данных производят ранжирование выборки, т.е. упорядочивание чисел (вариантов) x1, x2, …, xn по возрастанию. При этом частота варианта mi показывает сколько раз i-вариант встречается в выборке, а относительная частота (частость) wi - отношение частоты данного варианта к общей сумме частот всех вариантов (объему выборки). Признак называется дискретно варьируемым, если его варианты отличаются друг от друга на некоторую конечную величину (обычно целое число). Вариационный ряд такого признака называется дискретным вариационным рядом. Таблица 1 Общий вид дискретного вариационного ряда частот
Таблица 2 Общий вид дискретного вариационного ряда частостей
Признак называется непрерывно варьирующим, если его значения отличаются друг от друга на сколь угодно малую величину, т.е. признак может принимать любые значения в некотором интервале. Непрерывный вариационный ряд такого признака называется интервальным (см. табл. 3 и 4). Таблица 3 Общий вид интервального вариационного ряда частот
Таблица 4 Общий вид интервального вариационного ряда частостей
Просматривая результаты проведенных наблюдений, определяют, сколько значений вариантов попало в каждый конкретный интервал. Предполагается, что каждому интервалу принадлежит один из его концов: либо во всех случаях левые (чаще), либо во всех случаях правые, а частоты или частости показывают число вариантов, заключенных в указанных границах. Разности ( ) называются частичными интервалами или интервальными разностями. Для того чтобы интервальный вариационный ряд не был громоздким и в то же время позволял выявить характерные черты изменения значений случайной величины, обычно число частичных интервалов выбирают от 7 до 10. Длина частичного интервала (интервальная разность) зависит от размаха варьирования и выбранного числа интервалов
Если окажется, что h – дробное число, то за длину частичного интервала следует брать либо ближайшее целое число, либо ближайшую простую дробь. Для упрощения последующих расчетов интервальный вариационный ряд можно заменить условно дискретным. В этом случае серединное значение i-го интервала принимают за вариант xi, а соответствующую интервальную частоту mi – за частоту этого интервала. Графическое изображение зависимости между величинами отличается наглядностью. Графики могут служить основой для открытия новых свойств, соотношений и закономерностей. Наиболее употребительными графиками для изображения вариационных рядов являются полигон, гистограмма и кумулята. Графики дают возможность оценить состояние процесса на данный момент, а также спрогнозировать более отдалённый результат по тенденциям процесса, которые можно обнаружить на графиках (конечно, надо учитывать, что такие прогнозы могут быть во многих случаях достаточно условными). При отражении на графике изменения данных во времени график ещё называют временным рядом. Обычно используют следующие виды графиков: Очень удобны для анализа столбчатые графики, которые наглядно характеризуют приоритеты тех или иных факторов при оценке какого-либо события. Частным случаем столбчатого графика является гистограмма распределения, которая применяется для регистрации распределения какого-то показателя (частоты) от одного фактора Гистограмма — это способ графического изображения интервальных распределений вариант при непрерывном варьировании признака. Гистограмма распределения применяется только для изображения интервального вариационного ряда. Гистограмма – это серия столбиков одинаковой ширины, но разной высоты, показывающая рассеяние и распределение данных. Ширина столбика – это интервал в диапазоне наблюдений, высота – количество данных, приходящихся на тот или иной интервал, т.е. частость. По существу, гистограмма отображает распределение исследуемого показателя. Гистограмма позволяет оценить характер рассеивания показателя и разобраться в том, на чём следует сосредоточить усилия по улучшению. Гистограмму используют для изображения только интервальных рядов. Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины h, а высоты равны отношению (плотность частоты). Площадь частичного i-го прямоугольника равна - сумме частот вариант, попавших в i-ый интервал. Площадь гистограммы частот равна сумме всех частот, т.е. объему выборки n. Если соединить середины верхних оснований прямоугольников отрезками прямой, то можно получить полигон того же распределения, который будет являться выборочным аналогом дифференциальной функции распределения Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины h, а высоты равны отношению (плотность относительной частоты). Площадь частичного i-го прямоугольника равна - сумме относительных частот вариант, попавших в i-ый интервал. Площадь гистограммы относительных частот равна сумме всех относительных частот, т.е. единице. Характерные типы гистограмм показаны на рис. .
Рис. Характерные типы гистограмм На рис.,а показан обычный тип гистограммы с двусторонней симметрией, что указывает на стабильность процесса. На рис.,б в распределении имеется два пика (двугорбая гистограмма). Такая гистограмма получается при объединении двух распределений, например, в случае двух видов сырья, изменения настройки процесса или объединения в одну партию изделий, обработанных на двух разных станках. Требуется расслоение продукции. На рис.,в показана гистограмма с обрывом. Такое распределение получается, когда невозможно получить значение ниже (или выше) некоторой величины. Подобное распределение имеет место также, когда из партии исключены все изделия с показателем ниже (и/или выше) нормы, т.е. изначально это была партия с большим количеством дефектных изделий. Такое же распределение получается, когда измерительные приборы были неисправны. На рис.,г показана гистограмма с островком. Получается при ошибках в измерениях, или когда некоторое количество дефектных изделий перемешано с доброкачественными. На рис.,д показана гистограмма с прогалами («гребёнка»). Получается, когда ширина интервала не кратна единице измерения или при ошибках оператора. На рис.,е показана гистограмма в форме плато. Получается, когда объединяются несколько распределений при небольшой разнице средних значений. В этом случае требуется расслоение. Графики накопленных частот (огивы) представляют собой кривые накопленных частот. На таком графике по оси ординат (Y) откладывают либо общее количество, либо процент всех наблюдений, в которых значение некоторой величины не превышает данного значения из интервала возможных результатов. По оси ординат (Y) откладывают накопленные частоты. Поскольку частоты не могут принимать отрицательных значений, кривые накопленных частот являются монотонно неубывающими. Такой кривой описывают вероятность распределения параметра. Большой популярностью, особенно в отчетной документации, пользуются круговые графики. Ими выражают соотношение составляющих какого-либо целого параметра и всего параметра в целом.
График, выраженный ломаной линией, применяется, когда необходимо самым простым способом представить изменение данных за определённый период времени, например, изменение размера ежегодной выручки от продажи изделий, объёма производства или доли дефектных изделий. Полигон распределения можно построить и для интервального вариационного ряда. Для этого по вертикальной оси откладывают те же частоты, что и при построении гистограммы, а по горизонтальной - середины интервалов. Полигон чаще всего используют для изображения дискретных рядов. Полигоном частот называют ломаную, отрезки которой соединяют точки с координатами ( ), где - варианты выборки и - соответствующие им частоты. Если полигон строят по данным интервального ряда, то в качестве абсцисс точек берут середины соответствующих интервалов. Для построения полигона в прямоугольной системе координат в произвольно выбранном масштабе на оси абсцисс откладывают значения аргумента (варианты), а на оси ординат – значения частот. Масштаб выбирают такой, чтобы была обеспечена необходимая наглядность и желательный размер рисунка. Далее строят точки с координатами ( ) и последовательно соединяют их отрезками прямой. Полигоном относительных частот (частостей) называют ломаную, отрезки которой соединяют точки с координатами ( ), где - варианты выборки и - соответствующие им относительные частоты.
Преобразованной формой вариационного ряда является ряд накопленных частот (кумулятивныйряд). Кумулятивный ряд позволяет графически представить данные вариационного ряда в виде кумуляты и огивы. Накопленные частоты получаются в результате последовательного суммирования (кумуляции) всех значений частот, либо от минимального значения варианты к максимальному, либо, наоборот, от максимального к минимальному. Кумулята (кумулятивная кривая) представляет собой кривую накопленных частот (частостей). Для ее построения на оси абсцисс откладывают значения аргумента, а на оси ординат – накопленные частоты или накопленные относительные частоты. Масштаб на каждой оси выбирают произвольно. Далее строят точки, абсциссы которых равны вариантам (в случае дискретных рядов) или верхним границам интервалов (в случае интервальных рядов), а ординаты – соответствующим накопленным частотам. Эти точки соединяют отрезками прямой. Полученная ломаная и является кумулятой.
Ленточный график применяется, как и круговой, для наглядного представления соотношения составляющих какого-либо параметра, но вместе с этим он одновременно отражает изменение этих составляющих во времени. Z-образный график применяется для оценки общей тенденции при регистрации данных по месяцам (объем сбыта, объем производства и т.д.). Диаграмма рассеяния (разброса) показывает взаимосвязь между двумя видами связанных данных и подтверждает их зависимость. Такими двумя видами данных могут быть характеристика качества и влияющий на неё фактор, две различных характеристики качества, два фактора, влияющих на одну характеристику качества, и т.д. Для построения диаграммы рассеяния нужно не менее 30 пар данных (x,y). Оси x и y строят так, чтобы длины рабочих частей были примерно одинаковы. На диаграмму наносят точки (x,y), название диаграммы, а также интервал времени, число пар данных, названия осей, ФИО, должность исполнителя, и т.д. Точки, далеко отстоящие от основной группы, являются выбросами, и их исключают. Возможны различные варианты скоплений точек. Для установления силы связи полезно вычислить коэффициент корреляции по формуле
Коэффициент корреляции используют только при линейной связи между величинами. Значение r находится в пределах от –1 до +1. Если r близко к 1, имеется сильная положительная корреляция (сильная связь между рядами данных). Если r близко к –1, имеется сильная отрицательная корреляция. При r, близком к 0, корреляция слабая (отсутствует). Если r близко к 0,6 (или –0,6), корреляционная зависимость считается существующей. Характерные варианты скоплений точек показаны на рис.
Рис. Характерные варианты скоплений точек на диаграммах рассеяния Можно оценить достоверность коэффициента корреляции. Для этого вычисляют его среднюю ошибку по формуле
При r/mr >= 3 коэффициент корреляции считается достоверным, т.е. связь доказана. При r/mr < 3. связь недостоверна. Если исходные данные представлены в виде дискретного вариационного ряда, то может быть построен график прерывистого варьирования, представляющий собой ломаную кривую, которая называется полигоном распределения. Контрольные карты используются в виде графиков хода технологиче ского процесса, т.е. отражают динамику процесса. Можно с уверенностью сказать, что контрольные карты сегодня являются наиболее распространенным средством описательной статистики.
Диаграмма Парето Диаграмма Парето строится в виде столбчатого графика и показывает в убывающем порядке относительное влияние каждой причины на общую проблему. Кроме того, на диаграмме обычно приводят кумулятивную кривую накопленного процента причин. Диаграмма Парето позволяет анализировать проблемы из любой сферы деятельности предприятия, в том числе в сфере управления качеством. Причины изменений качества делятся на две группы: немногочисленные существенно важные и многочисленные несущественные. Устраняя причины первой группы, можно устранить почти все потери, вызванные снижением качества. Диаграмму Парето целесообразно применять вместе с причинно-следственной диаграммой. При использовании диаграммы Парето обычно сначала строят диаграмму по результатам деятельности для выявления главной из существующих проблем. Затем строят диаграмму по причинами для выявления главных причин этой проблемы и её решения и т.д. После проведения корректирующих мероприятий диаграмму Парето можно вновь построить и проверить эффективность проведённых улучшений. При использовании диаграммы Парето для контроля важнейших факторов распространён АВС-анализ. Например, если на складе находится большое число деталей, проводить контроль всех деталей без всякого различия неэффективно. Но если разделить детали на группы по их стоимости, то на долю группы наиболее дорогих деталей (группа А), составляющих 20-30% от общего числа деталей, придётся 70-80% от общей стоимости всех деталей. На долю группы самых дешёвых деталей (группа С), составляющей 40-50% от всего количества деталей, придётся всего 5-10% от общей стоимости. Стоимость промежуточной группы (группа В) составляет 20-30% от общей стоимости. Контроль деталей на складе будет эффективным, если контроль деталей группы А будет самым жёстким, а контроль деталей группы С – упрощённым. Рекомендуется составлять несколько вспомогательных диаграмм, входящих в состав группы А, с тем чтобы, последовательно анализируя их, в конечном итоге составить отдельную диаграмму Парето для конкретных явлений недоброкачественности.
Эмпирическая функция распределения Для анализа экспериментальных данных большое значение может иметь эмпирическая функция распределения. Эмпирической функцией распределения называется относительная частота (частость) того, что признак (случайная величина X) примет значение, меньшее заданного x:
�.
Другими словами, для данного x эмпирическая функция распределения представляет накопленную частость:
�.
Для дискретного вариационного ряда эмпирическая функция распределения имеет ступенчатый вид, ее скачки соответствуют значениям признака и равны накопленным частостям. Для интервального вариационного ряда эмпирическая функция распределения совпадает с кумулятой относительных частот (частостей), если ее доопределить, продолжив график в область значений (рис. 8). Очевидно, что эмпирическая функция распределения является выборочным аналогом интегральной функции распределения , которую используют для задания случайной величины.
Графические возможности пакета STATISTICA В пакете существуют 2 типа графиков: 1) Quick Stat Graphs - быстрые графики, позволяющие построить графики для фиксированной заранее переменной . Эти графики могут быть построены практически из любого места пакета. 2) Custom Stat Graphs - пользовательские графики, в которых переменные и диапазон случаев (Cases)zyia которых эти графики могут быть построены задается пользователем и может быть изменен в процессе выполнения программы. Щелчок по кнопке Graphs активизирует панель графики. Все возможности ее перечислены в пунктах меню. Первый пункт Quick Stat Graphs позволяет строить графики только для той переменной, которая была выделена заранее. Следующая группа пунктов меню позволяет стоить пользовательские графики: Stats 2D Graphs - двумерные графики Stats 3D Sequenrial Graphs - трехмерные графики последовательностей Stats 3D XYZ Graphs - трехмерные графики. Контрольные листкиУчитывая системный характер работ по выявлению некачественной продукции, на многих предприятиях разработаны типовые бланки для заполнения информации о наблюдениях. Такой форме регистрации данных отвечает контрольный листок – бумажный бланк, на котором заранее напечатаны контролируемые параметры, с тем, чтобы можно было легко и точно записать данные наблюдений или измерений. Его назначение имеет две цели: облегчить процесс сбора данных и упорядочить их для последующей обработки. Рассмотрим некоторые типы контрольных листков в зависимости от назначения сбора информации.
Рис. Контрольный листок видов дефектов К недостаткам этого листка можно отнести невозможность проведения расслоения данных. Рис. Контрольный листок причин дефектов Контрольный листок локализации дефектов позволяет оценить качество отливки на наличие раковин как вдоль оси заготовки, так и по длине ее наружной и внутренней поверхностей. Такого типа контрольные листки полезны для диагноза процесса, поскольку причины дефектов часто можно найти, только исследуя места их возникновения. Рис. Контрольный листок локализации дефектов Контрольный листок для регистрации распределения измеряемого параметра позволяет выявить изменения в размерах детали после проведения механической обработки. Как правило, такие листки заполняются для анализа стабильности технологического процесса путем построения гистограмм. Рис. Контрольный листок для регистрации распределения измеряемого параметра |
Copyright © 2010-2024 |