Вычисления с описательной статистикой

Если вам нужны дополнительные функции статистики, можно использовать программное обеспечение Statistics and Machine Learning Toolbox™.

Функции для вычисления описательной статистики

Используйте следующий MATLAB® функции для вычисления описательной статистики для ваших данных.

Примечание

Для матричных данных описательная статистика для каждого столбца вычисляется независимо.

Сводные данные функций статистики

Функция

Описание

max

Максимальное значение

mean

Среднее или среднее значение

median

Медианное значение

min

Наименьшее значение

mode

Наиболее частое значение

std

Стандартное отклонение

var

Отклонение, которая измеряет разброс или дисперсию значений

Следующие примеры применяют функции MATLAB для вычисления описательной статистики:

Пример 1 - Вычисление максимального, среднего и стандартного отклонения

В этом примере показано, как использовать функции MATLAB для вычисления максимальных, средних и стандартных значений отклонения для матрицы 24 на 3 count. MATLAB вычисляет эти статистические данные независимо для каждого столбца в матрице.

% Load the sample data
load count.dat
% Find the maximum value in each column
mx = max(count)
% Calculate the mean of each column
mu = mean(count)
% Calculate the standard deviation of each column
sigma = std(count)

Результаты:

mx =
          114          145          257

mu = 
      32.0000      46.5417      65.5833

sigma =
      25.3703      41.4057      68.0281

Чтобы получить номера строк, где максимальные значения данных происходят в каждом столбце данных, задайте второй выходной параметр indx для возврата индекса строки. Для примера:

[mx,indx] = max(count)

Эти результаты

mx =
      114     145     257

indx =
      20    20    20

Здесь переменная mx - вектор-строка, который содержит максимальное значение в каждом из трех столбцов данных. Переменная indx содержит индексы строк в каждом столбце, которые соответствуют максимальным значениям.

Чтобы найти минимальное значение во всем count матрица, 24 на 3 матрица в вектор-столбец 72 на 1 с помощью синтаксиса count(:). Затем, чтобы найти минимальное значение в одном столбце, используйте следующий синтаксис:

min(count(:))

ans =
      7

Пример 2 - Вычитание среднего значения

Вычесть среднее значение из каждого столбца матрицы можно используя следующий синтаксис:

% Get the size of the count matrix
[n,p] = size(count)
% Compute the mean of each column
mu = mean(count)
% Create a matrix of mean values by
% replicating the mu vector for n rows
MeanMat = repmat(mu,n,1)
% Subtract the column mean from each element
% in that column
x = count - MeanMat

Примечание

Вычитание среднего значения из данных также называется удалением тренда. Для получения дополнительной информации об удалении средней или оптимальной линии из данных, смотрите Вычитание тренда из данных.

Пример: Использование статистики данных MATLAB

Диалоговое окно Data Statistics помогает вычислять и отображать описательную статистику с данными. В этом примере показано, как использовать MATLAB Data Statistics для вычисления и построения статистики для матрицы 24 на 3, называемой count. Данные представляют, сколько транспортных средств прошло мимо станций подсчета трафика на трех улицах.

Этот раздел содержит следующие темы:

Примечание

Статистика данных MATLAB доступна только для 2-D графиков.

Вычисление и графическое изображение графика описательной статистики

  1. Загрузите и постройте график данных:

    load count.dat
    [n,p] = size(count);
    
    % Define the x-values
    t = 1:n;
    
    % Plot the data and annotate the graph
    plot(t,count)
    legend('Station 1','Station 2','Station 3','Location','northwest')
    xlabel('Time')
    ylabel('Vehicle Count')
    

    Примечание

    Легенда содержит имя каждого набора данных, заданное в legend функция: Station 1, Station 2, и Station 3. Набор данных относится к каждому столбцу данных в нанесенном массиве. Если вы не называете наборы данных, присваиваются имена по умолчанию: data1, data2и так далее.

  2. В окне рисунка выберите Tools > Data Statistics.

    Откроется диалоговое окно Data Statistics, в котором появится описательная статистика для X- и Y-data Station 1 набор данных.

    Примечание

    В диалоговом окне Data Statistics отображается область значений, представляющий собой различие между минимальным и максимальным значениями в выбранном наборе данных. Диалоговое окно не отображает область значений на графике.

  3. Выберите другой набор данных в списке Data Statistics for: Station 2.

    Это отображает статистику для X и Y данные Station 2 набор данных.

  4. Установите флажок для каждой статистики, которую вы хотите отобразить на графике, и нажмите Save to Workspace.

    Для примера построить среднее значение Station 2установите флажок mean в столбце Y.

    Это строит горизонтальную линию, чтобы представлять среднее значение Station 2 и обновляет легенду, чтобы включить эту статистику.

Форматирование статистики данных на графиках

Диалоговое окно Data Statistics использует цвета и стили линии, чтобы отличить статистику от данных на графике. В этом фрагменте примера показано, как настроить отображение описательной статистики на графике, таком как цвет, ширина линии, стиль линии или маркер.

Примечание

Не редактируйте графические свойства статистики, пока вы не закончите построение графика всей статистики с данными. Если вы добавляете или удаляете статистику после редактирования свойств графика, изменения свойств графика теряются.

Чтобы изменить отображение статистики данных на графике:

  1. В графическом окне MATLAB нажмите кнопку (Edit Plot) на панели инструментов.

    Этот шаг включает редактирование графика.

  2. Дважды кликните статистику на графике, для которого необходимо отредактировать отображение свойства. Для примера дважды кликните горизонтальную линию, представляющую среднее значение Station 2.

    Этот шаг открывает Property Inspector, где можно изменить внешний вид линии, используемого для представления этой статистики.

  3. В окне Property Inspector задайте стили линий и маркеров, размеры и цвета.

    Совет

    Кроме того, щелкните правой кнопкой мыши статистику на графике и выберите опцию из контекстного меню.

Сохранение статистики в рабочем пространстве MATLAB

Выполните следующие шаги, чтобы сохранить статистику в рабочем пространстве MATLAB.

Примечание

Когда ваш график содержит несколько наборов данных, сохраните статистику для каждого набора данных по отдельности. Чтобы отобразить статистику для другого набора данных, выберите ее из списка Data Statistics for в диалоговом окне Data Statistics.

  1. В диалоговом окне Data Statistics нажмите кнопку Save to Workspace.

  2. В диалоговом окне «Сохранение статистики в рабочей области» выберите опции для сохранения статистики для любого из них X данные, Y данные, или и то, и другое. Затем введите соответствующие имена переменных.

    В этом примере сохраните только Y данные. Введите имя переменной следующим Loc2countstats.

  3. Нажмите OK.

    Этот шаг сохраняет описательную статистику в структуре. Новая переменная добавляется в рабочее пространство MATLAB.

Чтобы просмотреть новую структурную переменную, введите имя переменной в подсказке MATLAB:

Loc2countstats
Loc2countstats = 

  struct with fields:

       min: 9
       max: 145
      mean: 46.5417
    median: 36
      mode: 9
       std: 41.4057
     range: 136

Генерация файлов кода

Этот фрагмент примера показывает, как сгенерировать файл, содержащий код MATLAB, который воспроизводит формат графика и построенной статистики с новыми данными. Генерация файла кода недоступна в Online™ MATLAB.

  1. В окне рисунка выберите File > Generate Code.

    Этот шаг создает файл кода функции и отображает его в редакторе MATLAB.

  2. Измените имя функции в первой линии файла из createfigure к чему-то более конкретному, например countplot. Сохраните файл в текущую папку с именем файла countplot.m.

  3. Сгенерируйте некоторые новые, случайные данные счета:

    rng('default')
    randcount = 300*rand(24,3);
  4. Воспроизведите график с новыми данными и пересчитанной статистикой:

    countplot(t,randcount)