sqlread

Импорт данных в MATLAB из таблицы базы данных PostgreSQL

Описание

пример

data = sqlread(conn,tablename) возвращает таблицу путем импорта данных в MATLAB® из таблицы базы данных PostgreSQL. Выполнение этой функции эквивалентно записи SELECT * FROM tablename SQL- оператора в ANSI SQL.

пример

data = sqlread(conn,tablename,opts) настраивает опции для импорта данных из таблицы базы данных с помощью SQLImportOptions объект.

пример

data = sqlread(___,Name,Value) задает дополнительные опции, используя один или несколько аргументы пары "имя-значение" и любую из предыдущих комбинаций входных аргументов. Для примера, 'Catalog','cat' импортирует данные из таблицы базы данных, хранящейся в 'cat' каталог.

пример

[data,metadata] = sqlread(___) также возвращает metadata таблица, содержащая метаданные об импортированных данных.

Примеры

свернуть все

Используйте подключение базы данных собственного интерфейса PostgreSQL для импорта данных продукта из таблицы базы данных в MATLAB ® с помощью базы данных PostgreSQL. Затем выполните простой анализ данных.

Создайте подключение базы данных собственного интерфейса PostgreSQL к базе данных PostgreSQL. База данных содержит таблицу productTable.

datasource = "PostgreSQLDataSource";
username = "dbdev";
password = "matlab";

conn = postgresql(datasource,username,password);

Импортируйте данные из таблицы базы данных productTable. The sqlread функция возвращает таблицу MATLAB, которая содержит данные о продукте.

tablename = "productTable";
data = sqlread(conn,tablename);

Отображение первых нескольких строк данных о продукте.

head(data,3)
ans=3×5 table
    productnumber    stocknumber    suppliernumber    unitcost    productdescription
    _____________    ___________    ______________    ________    __________________

          9          1.2597e+05          1003            13        "Victorian Doll" 
          8          2.1257e+05          1001             5        "Train Set"      
          7          3.8912e+05          1007            16        "Engine Kit"     

Закройте подключение к базе данных.

close(conn)

Настройте настройки импорта при импорте данных из таблицы базы данных с помощью собственного интерфейса PostgreSQL. Управляйте настройками импорта путем создания SQLImportOptions объект. Затем настройте настройки импорта для различных столбцов базы данных. Импортируйте данные с помощью sqlread функция.

Этот пример использует patients.xls файл, содержащий столбцы Gender, Location, SelfAssessedHealthStatus, и Smoker. В примере используется база данных PostgreSQL версии 9.405 и драйвер libpq версии 10.12.

Создайте подключение базы данных собственного интерфейса PostgreSQL к базе данных PostgreSQL.

datasource = "PostgreSQLDataSource";
username = "dbdev";
password = "matlab";

conn = postgresql(datasource,username,password);

Загрузите информацию о пациенте в рабочую область MATLAB ®.

patients = readtable("patients.xls");

Создайте patients таблица базы данных с использованием информации о пациенте.

tablename = "patients";
sqlwrite(conn,tablename,patients)

Создайте SQLImportOptions объект с использованием patients таблица базы данных и databaseImportOptions функция.

opts = databaseImportOptions(conn,tablename)
opts = 
  SQLImportOptions with properties:

           ExcludeDuplicates: false
          VariableNamingRule: 'preserve'

               VariableNames: {'lastname', 'gender', 'age' ... and 7 more}
               VariableTypes: {'string', 'string', 'double' ... and 7 more}
       SelectedVariableNames: {'lastname', 'gender', 'age' ... and 7 more}
                  FillValues: { <missing>,  <missing>,  NaN  ... and 7 more }

             VariableOptions: Show all 10 VariableOptions

Отобразите текущие настройки импорта для переменных в SelectedVariableNames свойство SQLImportOptions объект.

vars = opts.SelectedVariableNames;
varOpts = getoptions(opts,vars)
varOpts = 
    1x10 SQLVariableImportOptions array with properties:

   Variable Options:
                      (1) |       (2) |      (3) |        (4) |      (5) |      (6) |       (7) |        (8) |         (9) |                       (10)
         Name: 'lastname' |  'gender' |    'age' | 'location' | 'height' | 'weight' |  'smoker' | 'systolic' | 'diastolic' | 'selfassessedhealthstatus'
         Type:   'string' |  'string' | 'double' |   'string' | 'double' | 'double' | 'logical' |   'double' |    'double' |                   'string'
  MissingRule:     'fill' |    'fill' |   'fill' |     'fill' |   'fill' |   'fill' |    'fill' |     'fill' |      'fill' |                     'fill'
    FillValue:  <missing> | <missing> |      NaN |  <missing> |      NaN |      NaN |         0 |        NaN |         NaN |                  <missing>

	To access sub-properties of each variable, use getoptions

Измените типы данных для gender, location, smoker, и selfassessedhealthstatus переменные, использующие setoptions функция. Потому что gender, location, и selfassessedhealthstatus переменные указывают конечный набор повторяющихся значений, меняют тип данных на categorical. Потому что Smoker переменная сохраняет значения 0 и 1, измените его тип данных на double. Затем отобразите обновленные настройки импорта.

opts = setoptions(opts,{'gender','location','selfassessedhealthstatus'}, ...
    'Type','categorical');
opts = setoptions(opts,'smoker','Type','double');

varOpts = getoptions(opts,{'gender','location','smoker', ...
    'selfassessedhealthstatus'})
varOpts = 
    1x4 SQLVariableImportOptions array with properties:

   Variable Options:
                         (1) |           (2) |      (3) |                        (4)
         Name:      'gender' |    'location' | 'smoker' | 'selfassessedhealthstatus'
         Type: 'categorical' | 'categorical' | 'double' |              'categorical'
  MissingRule:        'fill' |        'fill' |   'fill' |                     'fill'
    FillValue:   <undefined> |   <undefined> |        0 |                <undefined>

	To access sub-properties of each variable, use getoptions

Импортируйте patients таблица базы данных с использованием sqlread и отобразите последние восемь строк таблицы.

data = sqlread(conn,tablename,opts);
tail(data)
ans=8×10 table
     lastname      gender    age            location             height    weight    smoker    systolic    diastolic    selfassessedhealthstatus
    ___________    ______    ___    _________________________    ______    ______    ______    ________    _________    ________________________

    "Foster"       Female    30     St. Mary's Medical Center      70       124        0         130          91               Fair             
    "Gonzales"     Male      48     County General Hospital        71       174        0         123          79               Good             
    "Bryant"       Female    48     County General Hospital        66       134        0         129          73               Excellent        
    "Alexander"    Male      25     County General Hospital        69       171        1         128          99               Good             
    "Russell"      Male      44     VA Hospital                    69       188        1         124          92               Good             
    "Griffin"      Male      49     County General Hospital        70       186        0         119          74               Fair             
    "Diaz"         Male      45     County General Hospital        68       172        1         136          93               Good             
    "Hayes"        Male      48     County General Hospital        66       177        0         114          86               Fair             

Отображение сводных данных импортированных данных. The sqlread функция применяет настройки импорта к переменным в импортированных данных.

summary(data)
Variables:

    lastname: 100×1 string

    gender: 100×1 categorical

        Values:

            Female       53   
            Male         47   

    age: 100×1 double

        Values:

            Min          25   
            Median       39   
            Max          50   

    location: 100×1 categorical

        Values:

            County General Hospital         39   
            St. Mary s Medical Center       24   
            VA Hospital                     37   

    height: 100×1 double

        Values:

            Min          60   
            Median       67   
            Max          72   

    weight: 100×1 double

        Values:

            Min          111  
            Median     142.5  
            Max          202  

    smoker: 100×1 double

        Values:

            Min          0    
            Median       0    
            Max          1    

    systolic: 100×1 double

        Values:

            Min         109   
            Median      122   
            Max         138   

    diastolic: 100×1 double

        Values:

            Min           68  
            Median      81.5  
            Max           99  

    selfassessedhealthstatus: 100×1 categorical

        Values:

            Excellent       34   
            Fair            15   
            Good            40   
            Poor            11   

Удалите patients таблица базы данных с использованием execute функция.

sqlquery = strcat("DROP TABLE ",tablename);
execute(conn,sqlquery)

Закройте подключение к базе данных.

close(conn)

Используйте подключение базы данных собственного интерфейса PostgreSQL для импорта ограниченного количества строк данных о продукте из таблицы базы данных в MATLAB ®. Затем отсортируйте и фильтруйте строки в импортированных данных и выполните простой анализ данных.

Создайте подключение базы данных собственного интерфейса PostgreSQL к базе данных PostgreSQL с помощью имени источника данных, имени пользователя и пароля. База данных содержит таблицу productTable.

datasource = "PostgreSQLDataSource";
username = "dbdev";
password = "matlab";
conn = postgresql(datasource,username,password);

Импортируйте данные из таблицы productTable. Ограничьте количество строк, установив 'MaxRows' аргумент пары "имя-значение" в 10. The data таблица содержит данные о продукте.

tablename = "productTable";
data = sqlread(conn,tablename,'MaxRows',10);

Отображение первых нескольких строк данных о продукте.

head(data,3)
ans=3×5 table
    productnumber    stocknumber    suppliernumber    unitcost    productdescription
    _____________    ___________    ______________    ________    __________________

          9          1.2597e+05          1003            13        "Victorian Doll" 
          8          2.1257e+05          1001             5        "Train Set"      
          7          3.8912e+05          1007            16        "Engine Kit"     

Отображение первых нескольких описаний продуктов.

data.productdescription(1:3)
ans = 3×1 string
    "Victorian Doll"
    "Train Set"
    "Engine Kit"

Отсортируйте строки в data по столбцу описания продукта в алфавитном порядке.

column = "productdescription";
data = sortrows(data,column);

Отображение первых нескольких описаний продуктов после сортировки.

data.productdescription(1:3)
ans = 3×1 string
    "Building Blocks"
    "Engine Kit"
    "Painting Set"

Закройте подключение к базе данных.

close(conn)

Получение информации о метаданных при импорте данных из таблицы базы данных с помощью собственного интерфейса PostgreSQL. Импортируйте данные с помощью sqlread выполнять функцию и исследовать информацию метаданных при помощи записи через точку.

Этот пример использует outages.csv файл, который содержит данные о отключении. В примере используется база данных PostgreSQL версии 9.405 и драйвер libpq версии 10.12.

Создайте подключение базы данных собственного интерфейса PostgreSQL к базе данных PostgreSQL с помощью имени источника данных, имени пользователя и пароля.

datasource = "PostgreSQLDataSource";
username = "dbdev";
password = "matlab";
conn = postgresql(datasource,username,password);

Загрузите информацию о отключении в рабочую область MATLAB ®.

outages = readtable("outages.csv");

Создайте outages таблица базы данных с использованием информации об отключении. Используйте 'ColumnType' аргумент пары "имя-значение" для определения типов данных переменных в таблице MATLAB ®.

tablename = "outages";
sqlwrite(conn,tablename,outages, ...
    'ColumnType',["varchar(120)","timestamp","numeric(38,16)", ...
    "numeric(38,16)","timestamp","varchar(150)"])

Импортируйте данные в рабочее пространство MATLAB и возвращайте метаданные об импортированных данных.

[data,metadata] = sqlread(conn,tablename);

Просмотрите имена переменных в импортированных данных.

metadata.Properties.RowNames
ans = 6×1 cell
    {'region'         }
    {'outagetime'     }
    {'loss'           }
    {'customers'      }
    {'restorationtime'}
    {'cause'          }

Просмотрите тип данных каждой переменной в импортированных данных.

metadata.VariableType
ans = 6×1 cell
    {'string'  }
    {'datetime'}
    {'double'  }
    {'double'  }
    {'datetime'}
    {'string'  }

Просмотрите отсутствующие значения данных для каждой переменной в импортированных данных.

metadata.FillValue
ans=6×1 cell array
    {1×1 missing}
    {[NaT      ]}
    {[      NaN]}
    {[      NaN]}
    {[NaT      ]}
    {1×1 missing}

Просмотрите индексы отсутствующих данных для каждой переменной в импортированных данных.

metadata.MissingRows
ans=6×1 cell array
    {  0×1 double}
    {  0×1 double}
    {604×1 double}
    {328×1 double}
    { 29×1 double}
    {  0×1 double}

Отображение первых восьми строк импортированных данных, которые содержат отсутствующие значения времени восстановления. data содержит значения времени восстановления в пятой переменной. Используйте числовые индексы, чтобы найти строки с отсутствующими данными.

index = metadata.MissingRows{5,1};
nullrestoration = data(index,:);
head(nullrestoration)
ans=8×6 table
      region            outagetime          loss     customers     restorationtime          cause       
    ___________    ____________________    ______    __________    _______________    __________________

    "SouthEast"    23-Jan-2003 00:49:00    530.14    2.1204e+05          NaT          "winter storm"    
    "NorthEast"    18-Sep-2004 05:54:00         0             0          NaT          "equipment fault" 
    "MidWest"      20-Apr-2002 16:46:00     23141           NaN          NaT          "unknown"         
    "NorthEast"    16-Sep-2004 19:42:00      4718           NaN          NaT          "unknown"         
    "SouthEast"    14-Sep-2005 15:45:00    1839.2    3.4144e+05          NaT          "severe storm"    
    "SouthEast"    17-Aug-2004 17:34:00     624.1    1.7879e+05          NaT          "severe storm"    
    "SouthEast"    28-Jan-2006 23:13:00    498.78           NaN          NaT          "energy emergency"
    "West"         20-Jun-2003 18:22:00         0             0          NaT          "energy emergency"

Удалите outages таблица базы данных с использованием execute функция.

sqlstr = "DROP TABLE ";
sqlquery = strcat(sqlstr,tablename);
execute(conn,sqlquery)

Закройте подключение к базе данных.

close(conn)

Входные параметры

свернуть все

Подключение к базе данных собственного интерфейса PostgreSQL, заданное как connection объект.

Имя таблицы базы данных, заданное как вектор символов или строковый скаляр, обозначающий имя таблицы в базе данных.

Пример: 'employees'

Типы данных: char | string

Настройки импорта базы данных, заданные как SQLImportOptions объект.

Аргументы в виде пар имя-значение

Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.

Пример: data = sqlread(conn,"inventoryTable",'Catalog',"toystore_doc",'Schema',"dbo",'MaxRows',5) импортирует пять строк данных из таблицы базы данных inventoryTable хранится в toystore_doc каталог и dbo схема.

Имя каталога базы данных, заданное как разделенная разделенными запятой парами, состоящая из 'Catalog' и вектор символов или строковый скаляр. Каталог служит контейнером для схем в базе данных и содержит связанную информацию о метаданных. База данных может иметь множество каталогов.

Пример: 'Catalog','toy_store'

Типы данных: char | string

Имя схемы базы данных, заданное как разделенная разделенными запятой парами, состоящая из 'Schema' и вектор символов или строковый скаляр. Схема определяет таблицы базы данных, представления, связи между таблицами и другими элементами. Каталог базы данных может иметь множество схем.

Пример: 'Schema','dbo'

Типы данных: char | string

Максимальное количество возвращаемых строк, заданное как разделенная разделенными запятой парами, состоящая из 'MaxRows' и положительный числовой скаляр. По умолчанию, sqlread функция возвращает все строки из выполненного SQL-запроса. Используйте этот аргумент пары "имя-значение", чтобы ограничить количество строк, импортированных в MATLAB.

Пример: 'MaxRows',10

Типы данных: double

Правило именования переменной, заданное как разделенная разделенными запятой парами, состоящая из 'VariableNamingRule' и одно из следующих значений:

  • "preserve" - Сохраните большинство имен переменных, когда sqlread функция импортирует данные. Для получения дополнительной информации см. раздел «Ограничения».

  • "modify" - Удалите символы, отличные от ASCII, из имен переменных, когда sqlread функция импортирует данные.

Пример: 'VariableNamingRule',"modify"

Типы данных: string

Выходные аргументы

свернуть все

Импортированные данные, возвращенные как таблица. Строки таблицы соответствуют строкам в таблице базы данных tablename. Переменные в таблице соответствуют каждому столбцу в таблице базы данных.

Если таблица базы данных не содержит данных для импорта, то data - пустая таблица.

Когда вы импортируете данные, sqlread функция преобразует тип данных каждого столбца из базы данных PostgreSQL в тип данных MATLAB. Эта таблица сопоставляет тип данных столбца базы данных с преобразованным типом данных MATLAB.

Тип данных PostgreSQLТип данных MATLAB

Boolean

logical

Smallint

double

Integer

double

Bigint

double

Decimal

double

Numeric

double

Real

double

Double precision

double

Smallserial

double

Serial

double

Bigserial

double

Money

double

Varchar

string

Char

string

Text

string

Bytea

string

Timestamp

datetime

Timestampz

datetime

Abstime

datetime

Date

datetime

Time

duration

Timez

duration

Interval

calendarDuration

Reltime

calendarDuration

Enum

categorical

Cidr

string

Inet

string

Macaddr

string

Uuid

string

Xml

string

Сведения о метаданных, возвращенные как таблица с этими переменными.

Имя переменнойОписание переменнойТипы данных переменных

VariableType

Тип данных каждой переменной в импортированных данных

Массив ячеек из символьных векторов

FillValue

Значение отсутствующих данных для каждой переменной в импортированных данных

Массив ячеек с отсутствующими значениями данных

MissingRows

Индексы для каждого вхождения отсутствующих данных в каждой переменной импортированных данных

Массив ячеек из числовых индексов

По умолчанию, sqlread функция импортирует текстовые данные как вектор символов, а числовые как double. FillValue является пустым символьным массивом (для текстовых данных) или NaN (для числовых данных) по умолчанию. Чтобы изменить отсутствующее значение данных на другое, используйте SQLImportOptions объект.

The RowNames свойство metadata таблица содержит имена переменных в импортированных данных.

Ограничения

Область аргумента пары "имя-значение" 'VariableNamingRule' имеет следующие ограничения:

  • sqlread функция возвращает ошибку, когда вы используете 'VariableNamingRule' аргумент пары "имя-значение" со SQLImportOptions opts объекта.

  • Когда 'VariableNamingRule' Аргумент пары "имя-значение" задано значение 'modify':

    • Имена переменных Properties, RowNames, и VariableNames являются зарезервированными идентификаторами для table тип данных.

    • Длина каждого имени переменной должна быть меньше, чем число, возвращаемое namelengthmax.

Введенный в R2020b