Как определить частоту

Шаги

Часть 1 Подготовка данных

  1. 1 Соберите данные. Если вы решаете математическую задачу, в ее условии должен быть дан набор данных (чисел). В противном случае проведите эксперимент или исследование и соберите необходимые данные. Подумайте, в какой форме записать исходные данные.
    • Например, нужно собрать данные о возрасте людей, которые посмотрели определенный фильм. Конечно, можно записать точный возраст каждого человека, но в этом случае вы получите довольно большой набор данных с 60-70 числами в пределах от 10 до 70 или 80. Поэтому лучше сгруппировать данные по категориям, таким как «Моложе 20», «20-29», «30-39» «40-49», «50-59» и «Старше 60». Получится упорядоченный набор данных с шестью группами чисел.
    • Другой пример: врач собирает данные о температуре пациентов в определенный день. Если записать округленные числа, например, 37, 38, 39, то результат будет не слишком точным, поэтому здесь данные нужно представить в виде десятичных дробей.
  2. 2 Упорядочьте данные. Когда вы соберете данные, у вас, скорее всего, получится хаотичный набор чисел, например, такой: 1, 2, 5, 4, 6, 4, 3, 7, 1, 5, 6, 5, 3, 4, 5, 1. Такая запись кажется практически бессмысленной и с ней сложно работать. Поэтому упорядочьте числа по возрастанию (от меньшего к большему), например, так: 1,1,1,2,3,3,4,4,4,5,5,5,5,6,6,7.
    • Упорядочивая данные, будьте внимательны, чтобы не пропустить ни одного числа. Посчитайте общее количество чисел в наборе данных, чтобы убедиться, что вы записали все числа.
  3. 3 Создайте таблицу с данными. Собранные данные можно организовать в виде таблицы. Такая таблица будет включать три столбца и использоваться для вычисления относительной частоты. Столбцы обозначьте следующим образом:
    • x

      Часть 2 Вычисление относительной частоты

      1. 1 Найдите количество чисел в наборе данных. Относительная частота характеризует, сколько раз конкретное число содержится в имеющемся наборе данных по отношению к общему количеству чисел. Чтобы найти относительную частоту, нужно посчитать общее количество чисел в наборе данных. Общее количество чисел станет знаменателем дроби, с помощью которой будет вычислена относительная частота.
        • В нашем примере набор данных содержит 16 чисел.
      2. 2 Найдите количество определенного числа. То есть посчитайте, сколько раз конкретное число встречается в наборе данных. Это можно сделать как для одного числа, так и для всех чисел из набора данных.
        • Например, в нашем примере число 4 3 Разделите количество конкретного числа на общее количество чисел. Так вы найдете относительную частоту для определенного числа. Вычисление можно представить в виде дроби или воспользоваться калькулятором или электронной таблицей, чтобы разделить два числа.
          • В нашем примере число 4

            Часть 3 Представление результатов

            1. 1 Результаты вычислений запишите в созданную ранее таблицу. Она позволит представить результаты в наглядной форме. По мере вычисления относительной частоты результаты записывайте в таблицу напротив соответствующего числа. Как правило, значение относительной частоты можно округлить до второго знака после десятичной запятой, но это на ваше усмотрение (в зависимости от требований задачи или исследования). Помните, что округленный результат не равен точному ответу.
              • В нашем примере таблица относительных частот будет выглядеть следующим образом:
              • x : n(x) : P(x)
              • 1 : 3 : 0,19
              • 2 : 1 : 0,06
              • 3 : 2 : 0,13
              • 4 : 3 : 0,19
              • 5 : 4 : 0,25
              • 6 : 2 : 0,13
              • 7 : 1 : 0,06
              • Итого : 16 : 1,01
            2. 2 Представьте числа (элементы), которых нет в наборе данных. Иногда представление чисел с нулевой частотой так же важно, как и представление чисел с ненулевой частотой. Обратите внимание на собранные данные; если между данными имеются пробелы, их нужно заполнить нулями.
              • В нашем примере набор данных включает все числа от 1 до 7. Но предположим, что числа 3 нет в наборе. Возможно, это немаловажный факт, поэтому нужно записать, что относительная частота числа 3 равна 0.
            3. 3 Выразите результаты в процентах. Иногда результаты вычислений нужно преобразовать из десятичных дробей в проценты. Это общепринятая практика, потому что относительная частота характеризует процент случаев появления определенного числа в наборе данных. Чтобы преобразовать десятичную дробь в проценты, нужно десятичную запятую передвинуть на две позиции вправо и приписать символ процента.
              • Например, десятичная дробь 0,13 равна 13%.
              • Десятичная дробь 0,06 равна 6% (обратите внимание, что перед 6 стоит 0).

            4. Рассмотрим любой из критериев оценки качеств педагога-профессионала,
            например, «успешное решение задач обучения и воспитания». Ответ на этот вопрос
            анкеты типа «да», «нет» достаточно груб. Чтобы уменьшить относительную ошибку
            такого измерения, необходимо увеличить число возможных ответов на конкретный
            критериальный вопрос. В табл. 1 представлены возможные варианты ответов.

            Рассмотренные в лабораторной работе 2 распределения вероятностей СВ опираются на знание закона распределения СВ. Для практических задач такое знание – редкость. Здесь закон распределения обычно неизвестен, или известен с точностью до некоторых неиз­вестных параметров. В частности, невозможно рассчитать точное значение соот­ветствующих вероятностей, так как нельзя определить количество общих и благо­приятных исходов. Поэтому вводится статистическое определение вероятности. По этому определению вероятность равна отношению числа испытаний, в ко­торых событие произошло, к общему числу произведенных испытаний. Такая вероятность называется статистической частотой.

            Связь между эмпирической функцией распределения и функцией распределения (теоретической функцией распределения) такая же, как связь между частотой со­бытия и его вероятностью.

            Для построения выборочной функции распределения весь диапазон изменения случайной величины X (выборки) разбивают на ряд интервалов (карманов) одинаковой ширины. Число интервалов обычно выбирают не менее 3 и не более 15. Затем определяют число значений случайной величины X, попавших в каждый интервал (абсолютная частота, частота интервалов).

            Частота интервалов – число, показывающее сколько раз значения, относящиеся к каждому интервалу группировки, встречаются в выборке. Поделив эти чис­ла на общее количество наблюдений (n), находят относительную частоту (частость) попадания случайной величины X в заданные интервалы.

            По найденным относительным час­тотам строят гистограммы выборочных функций распределения. Гистограмма распределения частот – это графическое представление выборки, где по оси абсцисс (ОХ) отложены величины интервалов, а по оси ординат (ОУ) – величины частот, попадающих в данный классовый интервал. При увеличении до бесконечности размера выборки выборочные функции распределения превращаются в теоретические: гистограмма превращается в график плотности распределения.

            Накопленная частота интервалов – это число, полученное последовательным суммированием частот в направлении от первого интервала к последнему, до того интервала включительно, для которого определяется накопленная частота.

            В Excel для построения выборочных функций распределения используются спе­циальная функция ЧАСТОТА и процедура Гистограмма из пакета анализа.

            Функция ЧАСТОТА (массив_данных, двоичный_массив) вычисляет частоты появления случайной величины в интер­валах значений и выводит их как массив цифр, где

            • массив_данных — это массив или ссылка на множество данных, для которых
            вычисляются частоты;

            • двоичный_массив — это массив интервалов, по ко­торым группируются значения выборки.

            Процедура Гистограмма из Пакета анализа выводит результаты выборочного распределения в виде таблицы и графика. Параметры диалогового окна Гистограмма:

            • Входной диапазон — диапазон исследуемых данных (выборка);

            • Интервал карманов — диа­пазон ячеек или набор граничных значений, определяющих выбранные интервалы (карманы). Эти значения должны быть введены в воз­растающем порядке. Если диапазон карманов не был введен, то набор интерва­лов, равномерно распределенных между минимальным и максимальным зна­чениями данных, будет создан автоматически.

            • выходной диапазон предназначен для ввода ссылки на левую верхнюю ячейку выходного диапазона.

            • переключатель Интегральный процент позволяет установить режим включения в гистограмму гра­фика интегральных процентов.

            • переключатель Вывод графика позволяет установить режим автоматическо­го создания встроенной диаграммы на листе, содержащем выходной диапа­зон.

            Пример 1. Построить эмпирическое распределение веса студентов в килограм­мах для следующей выборки: 64, 57, 63, 62, 58, 61, 63, 70, 60, 61, 65, 62, 62, 40, 64, 61, 59, 59, 63, 61.

            Решение

            1. В ячейку А1 введите слово Наблюдения, а в диапазон А2:А21 — значения веса
            студентов (см. рис. 1).

            2. В ячейку В1 введите названия интервалов Вес, кг. В диапазон В2:В8 введите граничные значения ин­тервалов (40, 45, 50, 55, 60, 65, 70).

            3. Введите заголовки создаваемой таблицы: в ячейки С1 — Абсолютные час­тоты, в ячейки D1 — Относительные частоты, в ячейки E1 — Накоплен­ные частоты.(см. рис. 1).

            4. С помощью функции Частота заполните столбец абсолютных частот, для этого выделите блок ячеек С2:С8. С па­нели инструментов Стандартная вызовите Мастер функций (кнопка fx). В появив­шемся диалоговом окне выберите категорию Статистические и функцию ЧАСТОТА, после чего нажмите кнопку ОК. Указателем мыши в рабочее поле Массив_данных введите диапазон данных наблюдений (А2:А8). В рабочее поле Двоичный_массив мышью введите диапазон интервалов (В2:В8). Слева на клавиатуре последовательно нажмите комбинацию клавиш Ctrl+Shift+Enter. В столбце C должен появиться мас­сив абсолютных частот (см. рис.1).

            5. В ячейке C9 найдите общее количество наблюдений. Активизируйте ячейку С9, на панели инструментов Стандартная нажмите кнопку Ав­тосумма. Убедитесь, что диапазон суммирования указан правильно и нажмите клавишу Enter.

            6. Заполните столбец относительных частот. В ячейку введите формулу для вычисления относительной частоты: =C2/$C$9. Нажмите клавишу Enter. Протягиванием (за правый нижний угол при нажатой левой кнопке мыши) скопируйте введенную формулу в диапазон и получите массив относительных частот.

            7. Заполните столбец накопленных частот. В ячейку D2 скопируйте значение от­носительной частоты из ячейки E2. В ячейку D3 введите формулу: =E2+D3. Нажмите клавишу Enter. Протягиванием (за правый нижний угол при нажатой левой кнопке мыши) скопируйте введенную формулу в диапазон D3:D8. Получим массив накопленных частот.

            Рис. 1. Результат вычислений из примера 1

            8. Постройте диаграмму относительных и накопленных частот. Щелчком ука­зателя мыши по кнопке на панели инструментов вызовите Мастер диаграмм. В появившемся диалоговом окне выберите закладку Нестандартные и тип диаг­раммы График/гистограмма. После редактирования диаграмма будет иметь такой вид, как на рис. 2.

            Рис. 2 Диаграмма относительных и накопленных частот из примера 1

            Задания для самостоятельной работы

            1. Для данных из примера 1 построить выборочные функции распределения, воспользовавшись процедурой Гистограмма из пакета Анализа.

            2. Построить выборочные функции распределения (относительные и накопленные частоты) для роста в см. 20 студентов: 181, 169, 178, 178, 171, 179, 172, 181, 179, 168, 174, 167, 169, 171, 179, 181, 181, 183, 172, 176.

            3. Найдите распределение по абсолютным частотам для следующих результатов тестирования в баллах: 79, 85, 78, 85, 83, 81, 95, 88, 97, 85 (используйте границы интервалов 70, 80, 90).

            Обозначим этот параметр через х. Тогда в процессе ответа на вопрос величина х примет дискретное значение х, принадлежащее определенному интервалу значений. Поставим в соответствие каждому из ответов определенное числовое значение параметра х (см. табл. 1).

            Табл. 1 Критериальный вопрос: успешное решение задач обучения и воспитания

            № п/п

            Варианты ответов

            Х

            1

            Абсолютно неуспешно

            0,1

            2

            Неуспешно

            0,2

            3

            Успешно в очень малой степени

            0,3

            4

            В определенной степени успешно, но еще много недостатков

            0,4

            5

            В среднем успешно, но недостатки имеются

            0,5

            6

            Успешно с некоторыми оговорками

            0,6

            7

            Успешно, но хотелось бы улучшить результат

            0,7

            8

            Достаточно успешно

            0,8

            9

            Очень успешно

            0,9

            10

            Абсолютно успешно

            1

            При проведении анкетирования в каждой отдельной анкете параметр х принимает случайное значение, но только в пределах числового интервала от 0,1 до 1.

            Тогда в результате измерений мы получаем неранжированный ряд случайных значений (см. табл. 2).

            Таблица 2. Результаты опроса ста учителей

            Сгруппируйте полученную выборку, рассчитайте среднее значение выборки, стандартное отклонение, абсолютную и относительную частоту появления параметра, а также постройте график плотности вероятности f(x)=


            где

            W(x) – относительная частота наступления события;

            — стандартное отклонение;