splitsqlquery

Разделите SQL-запрос с помощью разбивки на страницы

Синтаксис

querybasket = splitsqlquery(conn,sqlquery)

querybasket = splitsqlquery(conn,sqlquery,'SplitSize',splitsize)

Описание

querybasket = splitsqlquery(conn,sqlquery) разделяет SQL-запрос в корзину нескольких SQL-запросов. По умолчанию каждый SQL-запрос в корзине возвращает 100 000 строк в пакете. Получившееся количество SQL-запросов в корзине зависит от размера исходных результатов SQL-запроса.

пример

querybasket = splitsqlquery(conn,sqlquery,'SplitSize',splitsize) задает пользовательский пакетный размер для количества строк, возвращенных каждым SQL-запросом в корзине.

Примеры

свернуть все

Доступ к большим данным из SQL-запроса Используя Database Toolbox™

Открыть скрипт

Определите минимальную задержку прибытия с помощью большого набора полетных данных, сохраненных в базе данных. Доступ к базе данных в последовательной среде MATLAB®.

Используя функцию splitsqlquery, можно разделить исходный SQL-запрос в несколько запросов страницы SQL. Затем можно получить доступ к большим данным во фрагментах при помощи функции fetch.

Чтобы запустить этот пример, необходимо сконфигурировать источник данных JDBC. Для получения дополнительной информации смотрите, что configureJDBCDataSource функционирует.

Создайте соединение с базой данных к источнику данных JDBC MSSQLServerJDBCAuth. Этот источник данных конфигурирует драйвер JDBC к базе данных Microsoft® SQL Server® с аутентификацией Windows®. Задайте пустое имя пользователя и пароль.

datasource = "MSSQLServerJDBCAuth";
username = "";
password = "";
conn = database(datasource,username,password);

Задайте SQL-запрос, чтобы выбрать все столбцы из таблицы airlinesmall, которая содержит 123 523 строки и 29 столбцов.

sqlquery = 'SELECT * FROM airlinesmall';

Разделите исходный SQL-запрос в несколько запросов страницы и отобразите их.

querybasket = splitsqlquery(conn,sqlquery)

querybasket = 

  2×1 string array

    " SELECT * FROM (SELECT * FROM airlinesmall) temp ORDER BY 1 OFFSET 0 ROWS FETCH NEXT 100000 ROWS ONLY"
    " SELECT * FROM (SELECT * FROM airlinesmall) temp ORDER BY 1 OFFSET 100000 ROWS FETCH NEXT 23523 ROWS ONLY"

Корзина запроса содержит запросы страницы в массиве строк. Функция splitsqlquery разделяет запросы с помощью количества по умолчанию строк (100,000).

Задайте переменную airlinesdata.

airlinesdata = [];

Задайте минимальную переменную minArrDelay задержки прибытия.

minArrDelay = [];

Выполните запросы страницы SQL в querybasket при помощи цикла for и импортируйте данные во фрагментах. Выполните запросы страницы SQL в корзине запроса и импортируйте большие данные с помощью функции fetch. Найдите и сохраните локальную минимальную задержку прибытия каждого фрагмента.

for i = 1: length(querybasket)

    local_airlinesdata = fetch(conn,querybasket(i));

    local_minArrDelay = min(local_airlinesdata.ArrDelay);

    minArrDelay = [minArrDelay; local_minArrDelay];

end

Найдите минимальную задержку прибытия от всех сохраненных задержек.

minArrDelay = min(minArrDelay)

minArrDelay =

   -64

Закройте соединение с базой данных.

close(conn)

Доступ к большим данным из SQL-запроса Используя Database Toolbox и Parallel Computing Toolbox

Этот пример использование:

Открыть скрипт

Определите минимальную задержку прибытия с помощью большого набора полетных данных, сохраненных в базе данных. Доступ к базе данных с помощью параллельного пула.

Чтобы инициализировать параллельный пул с соединением с базой данных JDBC, необходимо сконфигурировать источник данных JDBC. Для получения дополнительной информации смотрите, что configureJDBCDataSource функционирует.

Используя функцию splitsqlquery, можно разделить исходный SQL-запрос в несколько запросов страницы SQL. Затем можно получить доступ к большим данным во фрагментах путем выполнения каждого запроса страницы SQL на отдельном рабочем в пуле.

Когда вы импортируете большие данные, производительность зависит от SQL-запроса, объема данных, спецификаций машины и типа анализа данных. Чтобы управлять производительностью, используйте входной параметр splitsize функции splitsqlquery.

Если у вас есть лицензия MATLAB® Parallel Server™, то используйте функцию parpool с кластерным профилем по вашему выбору вместо функции gcp.



Создайте соединение с базой данных к источнику данных JDBC MSSQLServerJDBCAuth. Этот источник данных конфигурирует драйвер JDBC к базе данных Microsoft® SQL Server® с аутентификацией Windows®. Задайте пустое имя пользователя и пароль.
datasource = "MSSQLServerJDBCAuth";
username = "";
password = "";
conn = database(datasource,username,password);
Задайте SQL-запрос, чтобы выбрать все столбцы из таблицы airlinesmall, которая содержит 123 523 строки и 29 столбцов.
sqlquery = 'SELECT * FROM airlinesmall';
Разделите исходный SQL-запрос в несколько запросов страницы и отобразите их. Задайте размер разделения 10 000 строк.
splitsize = 10000;
querybasket = splitsqlquery(conn,sqlquery,'SplitSize',splitsize)
querybasket = 

  13×1 string array

    " SELECT * FROM (SELECT * FROM airlinesmall) temp ORDER BY 1 OFFSET 0 ROWS FETCH NEXT 10000 ROWS ONLY"
    " SELECT * FROM (SELECT * FROM airlinesmall) temp ORDER BY 1 OFFSET 10000 ROWS FETCH NEXT 10000 ROWS ONLY"
    " SELECT * FROM (SELECT * FROM airlinesmall) temp ORDER BY 1 OFFSET 20000 ROWS FETCH NEXT 10000 ROWS ONLY"
    " SELECT * FROM (SELECT * FROM airlinesmall) temp ORDER BY 1 OFFSET 30000 ROWS FETCH NEXT 10000 ROWS ONLY"
    " SELECT * FROM (SELECT * FROM airlinesmall) temp ORDER BY 1 OFFSET 40000 ROWS FETCH NEXT 10000 ROWS ONLY"
    " SELECT * FROM (SELECT * FROM airlinesmall) temp ORDER BY 1 OFFSET 50000 ROWS FETCH NEXT 10000 ROWS ONLY"
    " SELECT * FROM (SELECT * FROM airlinesmall) temp ORDER BY 1 OFFSET 60000 ROWS FETCH NEXT 10000 ROWS ONLY"
    " SELECT * FROM (SELECT * FROM airlinesmall) temp ORDER BY 1 OFFSET 70000 ROWS FETCH NEXT 10000 ROWS ONLY"
    " SELECT * FROM (SELECT * FROM airlinesmall) temp ORDER BY 1 OFFSET 80000 ROWS FETCH NEXT 10000 ROWS ONLY"
    " SELECT * FROM (SELECT * FROM airlinesmall) temp ORDER BY 1 OFFSET 90000 ROWS FETCH NEXT 10000 ROWS ONLY"
    " SELECT * FROM (SELECT * FROM airlinesmall) temp ORDER BY 1 OFFSET 100000 ROWS FETCH NEXT 10000 ROWS ONLY"
    " SELECT * FROM (SELECT * FROM airlinesmall) temp ORDER BY 1 OFFSET 110000 ROWS FETCH NEXT 10000 ROWS ONLY"
    " SELECT * FROM (SELECT * FROM airlinesmall) temp ORDER BY 1 OFFSET 120000 ROWS FETCH NEXT 3523 ROWS ONLY"

Корзина запроса содержит запросы страницы в массиве строк. Каждый SQL-запрос в корзине, кроме последней, возвращает 10 000 строк.
Закройте соединение с базой данных.
close(conn)
Запустите параллельный пул.
pool = gcp;
Starting parallel pool (parpool) using the 'local' profile ...
Connected to the parallel pool (number of workers: 6).
Инициализируйте параллельный пул с помощью источника данных JDBC.
c = createConnectionForPool(pool,datasource,username,password);
Задайте переменную airlinesdata.
airlinesdata = [];
Задайте минимальную переменную minArrDelay задержки прибытия.
minArrDelay = [];
Используйте функцию parfor, чтобы параллелизировать доступ к данным с помощью корзины запроса.
Для каждого рабочего:
Получите объект соединения с базой данных.
Выполните запрос страницы SQL от корзины запроса и импортируйте данные локально.
Найдите локальную минимальную задержку прибытия.
Сохраните локальную минимальную задержку прибытия.
parfor i = 1: length(querybasket)

    conn = c.Value;

    local_airlinesdata = fetch(conn,querybasket(i));

    local_minArrDelay = min(local_airlinesdata.ArrDelay);

    minArrDelay = [minArrDelay; local_minArrDelay];

end
Найдите минимальную задержку прибытия с помощью сохраненных задержек от каждого рабочего.
minArrDelay = min(minArrDelay)
minArrDelay =

   -64

Закройте параллельный пул.
delete(pool)

`Входные параметры`

свернуть все

conn — Соединение с базой данных
 Объект connection


Соединение с базой данных, заданное как объект connection, создается с функцией database.

sqlquery — SQL-оператор
 вектор символов | представляет скаляр в виде строки


SQL-оператор, заданный как вектор символов или скаляр строки.
                Для получения информации о языке SQL-запроса см. Пример по SQL.
                Пример: SELECT * FROM invoice выбирает все столбцы и строки из таблицы invoice.
Типы данных: char | string

splitsize — SQL-запрос разделил размер
 100000 (значение по умолчанию) | числовой скаляр


                    SQL-запрос разделил размер, заданный в виде числа. Задайте этот номер, чтобы разделить SQL-запрос в пользовательское количество строк для каждого пакета.
                    Если общее количество строк, возвращенных в исходный SQL-запрос, является меньше чем 100 000 (значение по умолчанию), то функция splitsqlquery возвращает исходный SQL-запрос. Используйте этот входной параметр, чтобы задать меньшее число строк в пакете.
                Типы данных: double

`Выходные аргументы`

свернуть все

querybasket — Корзина SQL-запроса
 stringArray


                    Корзина SQL-запроса, возвращенная как массив строк. Каждый SQL-запрос в корзине возвращен как скаляр строки в массиве строк.
                    Можно выполнить каждый SQL-запрос в корзине с помощью функции fetch. Или, можно запустить параллельный пул и присвоить каждый SQL-запрос рабочему для выполнения.

`Ограничения`

Функция splitsqlquery поддерживает эти базы данных только:
- Microsoft^® SQL Server^® 2012 и позже
- Oracle^®
- MySQL^®
- PostgreSQL
- SQLite
- Amazon Redshift^®
- Amazon Aurora^®
- Google^® Cloud SQL, который запускает экземпляр MySQL или PostgreSQL
- MariaDB^®
Если объект connection использует неподдерживаемую базу данных, функция splitsqlquery выводит предупреждение и возвращает исходный SQL-запрос.
Функция splitsqlquery не поддерживает интерфейс MATLAB^® к SQLite.

`Смотрите также`

`Темы`

Анализируйте большие данные в базе данных Используя длинные массивы

`Внешние веб-сайты`

Пример по SQL

`Введенный в R2017b`






Документация Database Toolbox
Функции и другая ссылка
Информация о релизах
PDF-документация


Поддержка
MATLAB Answers
Помощь в установке
Отчеты об ошибках
Требования к продукту
Загрузка программного обеспечения











© 1994-2019 The MathWorks, Inc.
Условия использования
Патенты
Торговые марки
Список благодарностей

Документация

splitsqlquery

Синтаксис

Описание

Примеры

Доступ к большим данным из SQL-запроса Используя Database Toolbox™

Доступ к большим данным из SQL-запроса Используя Database Toolbox и Parallel Computing Toolbox

`Входные параметры`

`conn` — Соединение с базой данных
Объект `connection`

`sqlquery` — SQL-оператор
вектор символов | представляет скаляр в виде строки

`splitsize` — SQL-запрос разделил размер
`100000` (значение по умолчанию) | числовой скаляр

`Выходные аргументы`

`querybasket` — Корзина SQL-запроса
stringArray

`Ограничения`

`Смотрите также`

`Темы`

`Внешние веб-сайты`

`Введенный в R2017b`

Документация Database Toolbox

Поддержка

Документация

splitsqlquery

Синтаксис

Описание

Примеры

Доступ к большим данным из SQL-запроса Используя Database Toolbox™

Доступ к большим данным из SQL-запроса Используя Database Toolbox и Parallel Computing Toolbox

Входные параметры

conn — Соединение с базой данных Объект connection

sqlquery — SQL-оператор вектор символов | представляет скаляр в виде строки

splitsize — SQL-запрос разделил размер 100000 (значение по умолчанию) | числовой скаляр

Выходные аргументы

querybasket — Корзина SQL-запроса stringArray

Ограничения

Смотрите также

Темы

Внешние веб-сайты

Введенный в R2017b

Документация Database Toolbox

Поддержка

`Входные параметры`

`conn` — Соединение с базой данных
Объект `connection`

`sqlquery` — SQL-оператор
вектор символов | представляет скаляр в виде строки

`splitsize` — SQL-запрос разделил размер
`100000` (значение по умолчанию) | числовой скаляр

`Выходные аргументы`

`querybasket` — Корзина SQL-запроса
stringArray

`Ограничения`

`Смотрите также`

`Темы`

`Внешние веб-сайты`

`Введенный в R2017b`