exponenta event banner

Анализ больших данных в базе данных с помощью массивов Tall

Этот пример определяет минимальную задержку прибытия большого набора данных полета, который хранится в базе данных. Вы можете получить доступ к большим наборам данных и создать высокий массив с помощью DatabaseDatastore с Toolbox™ базы данных. После создания массива высокого уровня можно визуализировать данные в массиве высокого уровня. Кроме того, можно написать алгоритм MapReduce, который определяет порцию и уменьшение данных.

DatabaseDatastore не поддерживает использование параллельного пула с установленным Toolbox™ Parallel Computing. Для анализа данных с помощью массивов tall или выполнения алгоритмов MapReduce установите глобальную среду выполнения в качестве локальной сессии MATLAB ®.

В этом примере для создания подключения к базе данных используется предварительно настроенный источник данных JDBC. Дополнительные сведения см. в разделе configureJDBCDataSource функция.

Создать DatabaseDatastore Объект

Установите в качестве глобальной среды выполнения локальный сеанс MATLAB ®.

mapreducer(0);

Файл airlinesmall.csv содержит большой набор полетных данных. Загрузить этот файл в таблицу базы данных Microsoft ® SQL Server ®airlinesmall. Эта таблица содержит 123 523 записи.

Создание подключения базы данных к источнику данных JDBC MSSQLServerJDBCAuth. Этот источник данных настраивает драйвер JDBC для базы данных Microsoft ® SQL Server ® с проверкой подлинности Windows ®. Укажите пустое имя пользователя и пароль.

datasource = "MSSQLServerJDBCAuth";
username = "";
password = "";
conn = database(datasource,username,password);

Создать DatabaseDatastore с использованием подключения к базе данных и SQL-запроса. Этот SQL-запрос получает данные о задержке поступления из airlinesmall таблица. databaseDatastore выполняет SQL-запрос.

sqlquery = 'select ArrDelay from airlinesmall';

dbds = databaseDatastore(conn,sqlquery,'ReadSize',50000);

Найти минимальную задержку поступления с помощью массива Tall

Потому что DatabaseDatastore объект возвращает таблицу, создает таблицу высокого уровня.

tt = tall(dbds);

Найдите минимальную задержку поступления.

minArrDelay = min(tt.ArrDelay);

minArrDelay содержит неоцениваемую минимальную задержку поступления. Чтобы вернуть выходное значение, используйте gather. Дополнительные сведения см. в разделе Отложенная оценка массивов Tall.

minArrDelayValue = gather(minArrDelay)
Evaluating tall expression using the Local MATLAB Session:
- Pass 1 of 1: Completed in 1.6 sec
Evaluation completed in 1.9 sec

minArrDelayValue =

   -64

Помимо определения минимума, массивы tall поддерживают множество других функций. Дополнительные сведения см. в разделе Вспомогательные функции.

Закрыть DatabaseDatastore Подключение к объекту и базе данных

close(dbds)

См. также

| | | | | |

Связанные примеры

Подробнее

Внешние веб-сайты