Описательная статистика

Если вам нужны более усовершенствованные функции статистики, вы можете хотеть использовать программное обеспечение Statistics и Machine Learning Toolbox™.

Функции для вычисления описательной статистики

Используйте следующие функции MATLAB®, чтобы вычислить описательную статистику для ваших данных.

Примечание

Для матричных данных описательная статистика для каждого столбца вычисляется независимо.

Сводные данные функции статистики

Функция

Описание

max

Максимальное значение

среднее значение

Среднее или среднее значение

медиана

Среднее значение

min

Наименьшее значение

режим

Самое частое значение

станд

Стандартное отклонение

var

Отклонение, которое измеряет распространение или дисперсию значений

Следующие примеры применяют функции MATLAB, чтобы вычислить описательную статистику:

Пример 1 - вычисление максимума, среднего значения и стандартного отклонения

Этот пример показывает, как использовать функции MATLAB, чтобы вычислить максимум, среднее значение и значения стандартного отклонения для 24 3 матрица под названием count. MATLAB вычисляет эти статистические данные независимо для каждого столбца в матрице.

% Load the sample data
load count.dat
% Find the maximum value in each column
mx = max(count)
% Calculate the mean of each column
mu = mean(count)
% Calculate the standard deviation of each column
sigma = std(count)

Результаты

mx =
          114          145          257

mu = 
      32.0000      46.5417      65.5833

sigma =
      25.3703      41.4057      68.0281

Чтобы получить номера строк, где максимальные значения данных происходят в каждом столбце данных, задайте второй выходной параметр indx, чтобы возвратить индекс строки. Например:

[mx,indx] = max(count)

Эти результаты

mx =
      114     145     257

indx =
      20    20    20

Здесь, переменный mx является вектором - строкой, который содержит максимальное значение в каждом из этих трех столбцов данных. Переменный indx содержит индексы строки в каждом столбце, которые соответствуют максимальным значениям.

Найти минимальное значение в целой матрице count, 24 3 матрица в 72 1 вектор - столбец при помощи синтаксиса count(:). Затем чтобы найти минимальное значение в отдельном столбце, используйте следующий синтаксис:

min(count(:))

ans =
      7

Пример 2 - вычитание среднего значения

Вычтите среднее значение из каждого столбца матрицы при помощи следующего синтаксиса:

% Get the size of the count matrix
[n,p] = size(count)
% Compute the mean of each column
mu = mean(count)
% Create a matrix of mean values by
% replicating the mu vector for n rows
MeanMat = repmat(mu,n,1)
% Subtract the column mean from each element
% in that column
x = count - MeanMat

Примечание

Вычитание среднего значения от данных также называется detrending. Для получения дополнительной информации об удалении среднего значения или хорошо-подходящей строки от данных, смотрите Вычитание тренда из данных.

Пример: Используя статистику данных MATLAB

Диалоговое окно Data Statistics помогает вам вычислить и построить график описательной статистики с данными. Этот пример показывает, как использовать Статистику Данных MATLAB, чтобы вычислить и построить график статистики для 24 3 матрица, названная count. Данные представляют сколько механизмов, переданных станциями подсчета трафика трем улицам.

Этот раздел содержит следующие темы:

Примечание

Статистика Данных MATLAB доступна для 2D графиков только.

Вычисление и графическое изображение описательной статистики

  1. Загрузите и отобразите данные на графике:

    load count.dat
    [n,p] = size(count);
    
    % Define the x-values
    t = 1:n;
    
    % Plot the data and annotate the graph
    plot(t,count)
    legend('Station 1','Station 2','Station 3','Location','northwest')
    xlabel('Time')
    ylabel('Vehicle Count')
    

    Примечание

    Легенда содержит имя каждого набора данных, как задано функцией legend: Station 1, Station 2 и Station 3. Набор данных обращается к каждому столбцу данных в массиве, которого вы построили график. Если вы не называете наборы данных, имена по умолчанию присвоены: data1, data2, и так далее.

  2. В Окне фигуры выберите Tools> Data Statistics.

    Диалоговое окно Data Statistics открывает и отображается описательную статистику для X - и Y - данные набора данных Station 1.

    Примечание

    Диалоговое окно Data Statistics отображается область значений, которая является различием между минимальными и максимальными значениями в выбранном наборе данных. Диалоговое окно не отображается область значений на графике.

  3. Выберите различный набор данных в Статистике для списка: Station 2.

    Это отображает статистику для X и данных Y набора данных Station 2.

  4. Установите флажок для каждой статистической величины, которую вы хотите отобразить на графике, и затем нажать Save к рабочей области.

    Например, чтобы построить график среднего значения Station 2, установите средний флажок в столбце Y.

    Это строит горизонтальный график, чтобы представлять среднее значение Station 2 и обновляет легенду, чтобы включать эту статистическую величину.

Форматирование статистики данных по графикам

Диалоговое окно Data Statistics использует цвета и стили линии, чтобы отличить статистику от данных по графику. Этот фрагмент примера показывает, как настроить отображение описательной статистики по графику, такому как цвет, ширина линии, стиль линии или маркер.

Примечание

Не редактируйте свойства отображения статистики, пока вы не закончите строить график всей статистики с данными. Если вы добавляете или удаляете статистику после редактирования свойств графика, изменения, чтобы построить график свойств потеряны.

Изменить отображение статистики данных по графику:

  1. В окне MATLAB Figure нажмите кнопку (Edit Plot) на панели инструментов.

    Этот шаг включает редактирование графика.

  2. Дважды кликните статистическую величину на графике, для которого вы хотите отредактировать свойства отображения. Например, дважды кликните горизонтальную строку, представляющую среднее значение Station 2.

    Этот шаг открывает Property Editor ниже окна MATLAB Figure, где можно изменить внешний вид строки, используемой, чтобы представлять эту статистическую величину.

  3. В Property Editor задайте стили Строки и Маркера, размеры и цвета.

    Совет

    Также щелкните правой кнопкой по статистической величине по графику и выберите опцию из контекстного меню.

Сохранение статистики к MATLAB workspace

Выполните эти шаги, чтобы сохранить статистику в MATLAB workspace.

Примечание

Когда ваш график будет содержать несколько наборов данных, сохраните статистику для каждого набора данных индивидуально. Чтобы отобразить статистику для различного набора данных, выберите его из Статистики для списка в диалоговом окне Data Statistics.

  1. В диалоговом окне Data Statistics нажмите Save к кнопке рабочей области.

  2. В диалоговом окне Save Statistics to Workspace выберите опции, чтобы сохранить статистику или для данных X, данных Y или для обоих. Затем введите соответствующие имена переменных.

    В этом примере сохраните только данные Y. Введите имя переменной как Loc2countstats.

  3. Нажать ОК.

    Этот шаг сохраняет описательную статистику в структуру. Новая переменная добавляется к MATLAB workspace.

Чтобы просмотреть новую переменную структуры, введите имя переменной в посдказке MATLAB:

Loc2countstats
Loc2countstats = 

       min: 9
       max: 145
      mean: 46.5417
    median: 36
      mode: 9
       std: 41.4057
     range: 136

Генерация файлов кода

Этот фрагмент примера показывает, как сгенерировать файл, содержащий код MATLAB, который воспроизводит формат графика и нанесенной на график статистики с новыми данными. Генерация файла кода не доступна в MATLAB Online™.

  1. В Окне фигуры выберите File> Generate Code.

    Этот шаг создает функциональный файл кода и отображает его в редакторе MATLAB.

  2. Измените имя функции на первой строке файла от createfigure до чего-то более определенного, как countplot. Сохраните файл к своей текущей папке с именем файла countplot.m m.

  3. Сгенерируйте некоторые новые, случайные данные количества:

    randcount = 300*rand(24,3);
  4. Воспроизведите график с новыми данными и повторно вычисленной статистикой:

    countplot(t,randcount)

Была ли эта тема полезной?