Информатика студентам |
|
|
Генеральная и выборочная совокупностиИсходным понятием статистики является понятие совокупность, объединяющее обычно какое-либо множество испытуемых (учащихся) по одному или нескольким интересующим признакам. Главное требование к выделению изучаемой совокупности — это ее качественная однородность, например, по уровню знаний, росту, весу и другим признакам. Члены совокупности могут сравниваться между собой в отношении только того качества, которое становится предметом исследования. При этом обычно абстрагируются от других неинтересующих качеств. Так, если педагога интересует успеваемость учащихся, то он не принимает во внимание, как правило, их рост, вес и другие параметры, не относящиеся непосредственно к изучаемому вопросу. Применение большинства статистических методов основано на идее использования небольшой случайной совокупности испытуемых из общего числа тех, на которых можно было бы распространить (генерализовать) выводы, полученные в результате изучения совокупности. Эта небольшая совокупность в статистике называется выборочной совокупностью (или короче —выборкой). Главный принцип формирования выборки — это случайный отбор испытуемых из мыслимого множества учащихся, называемого генеральной совокупностью или популяцией объектов или явлений. Как по анализу элементов, содержащихся в капле крови, медики нередко судят о составе всей крови человека, так и по выборочной совокупности учащихся изучаются явления, характерные для всей генеральной совокупности. Когда для каждого объекта в выборке измерено значение одной переменной, популяция и выборка называются одномерными. Если же для каждого объекта регистрируются значения двух или нескольких переменных, такие данные называются многомерными. Одной из основных задач статистического анализа является получение по имеющейся выборке достоверных сведений о интересующих исследователя характеристиках генеральной совокупности. Поэтому важным требованием к выборке является ее репрезентативность, то есть правильная представимость в ней пропорций генеральной совокупности. Достижению репрезентативности может способствовать такая организация эксперимента, при которой элементы выборки извлекаются из генеральной совокупности случайным образом. Теория выборочного метода основана на законе больших
чисел. Закон больших чисел, в его математической трактовке,
говорит о том, что с увеличением числа наблюдений уменьшается
разница между выборочной средней и генеральной средней, и
наоборот, чем меньше выборка, тем меньше надежды на то, что
выборочная средняя совпадет по величине со средней
арифметической генеральной совокупности. Действие этого закона
основано на свойстве самих случайных величин, отрицательные и
положительные значения которых способны компенсировать друг При выборочном наблюдении закон больших чисел и
теоремы теории вероятностей в силу случайности отбора единиц
позволяют определить ошибки репрезентативности, допущенные
при выборочном обследовании. Зная предел допустимой
ошибки, на основе закона больших чисел можно определить
необходимую численность выборки. Необходимый объем выборочного наблюдения зависит от нескольких факторов: • показателей вариации наблюдаемого признака: чем больше
показатели вариации (средний квадрат отклонения), тем больше необходимая численность выборочной
совокупности; Обычно в статистике различают три типа значений переменных: количественные, номинальные и ранговые. Значения количественных переменных являются числовыми, могут быть упорядочены и для них имеют смысл различные вычисления (например, среднее значение). На обработку количественных переменных ориентировано подавляющее большинство статистических методов. Значения номинальных переменных (например: пол, вид, цвет) являются нечисловыми, они означают принадлежность к некоторым классам и не могут быть упорядочены или непосредственно использованы в вычислениях. Для анализа номинальных переменных специально предназначены лишь избранные разделы математической статистики, например, категориальный анализ. Однако в ряде случаев для этой цели могут быть использованы и некоторые ранговые и количественные методы, если номинальные значения предварительно заменить на числа, обозначающие их условные коды. Ранговые или порядковые переменные занимают промежуточное положение: их значения упорядочены (состояние больного, степень предпочтения), но не могут быть с уверенностью измерены и сопоставлены количественно. К анализу ранговых переменных применимы так называемые ранговые методы. Ранг наблюдения – это тот номер, который получит данное наблюдение в упорядоченной совокупности всех данных – после их упорядочивания по определенному правилу (например, от большего значения к меньшим). Процедура перехода от совокупности наблюдений к последовательности их рангов называется ранжированием. Ранговые и номинальные значения при вводе данных следует обозначать целыми числами. |
Copyright © 2010-2024 |