Экспорт данных MATLAB в базу данных Cassandra

В этом примере показано, как экспортировать данные из таблицы MATLAB ® в базу данных Apache Cassandra ® с помощью соединения базы данных Cassandra с интерфейсом C++ базы данных Apache Cassandra.

В этом примере база данных Cassandra включает в себя employees_by_job таблица базы данных, содержащая данные о сотрудниках и job_id ключ раздела.

Создание соединения с базой данных Cassandra

Создайте соединение с базой данных Cassandra с помощью настроенного источника данных CassandraDataSource и пустые имя пользователя и пароль. The apacheCassandra функция возвращает conn как connection объект.

datasource = "CassandraDataSource";
username = "";
password = "";
conn = apacheCassandra(datasource,username,password);

Исследуйте данные из базы данных Cassandra

Возвращает имена таблиц базы данных Cassandra в employeedata keyspace. t - строковые массивы, содержащий имена этих таблиц.

keyspace = "employeedata";
t = tablenames(conn,keyspace)
t = 3×1 string
    "employees_by_id"
    "employees_by_job"
    "employees_by_name"

Импорт данных о сотрудниках в MATLAB из employees_by_job таблица в employeedata keyspace при помощи подключения базы данных Cassandra.

keyspace = "employeedata";
tablename = "employees_by_job";
results = partitionRead(conn,keyspace,tablename);

Отображение последних нескольких строк импортированных данных о сотруднике.

tail(results)
ans=8×13 table
       job_id        hire_date     employee_id    commission_pct    department_id      email       first_name      last_name      manager_id         office         performance_ratings     phone_number     salary
                                                                                                                                                building    room                                                   
    ____________    ___________    ___________    ______________    _____________    __________    ___________    ____________    __________    ________________    ___________________    ______________    ______

    "SH_CLERK"      27-Jan-2004        184              NaN               50         "NSARCHAN"    "Nandita"      "Sarchand"         121        "North"     256         {2×1 int32}        "650.509.1876"     4200 
    "MK_REP"        17-Aug-2005        202             0.25               20         "PFAY"        "Pat"          "Fay"              201        "East"      349         {3×1 int32}        "603.123.6666"     6000 
    "PU_CLERK"      10-Aug-2007        119              NaN               30         "KCOLMENA"    "Karen"        "Colmenares"       114        "West"      252         {5×1 int32}        "515.127.4566"     2500 
    "PU_CLERK"      15-Nov-2006        118              NaN               30         "GHIMURO"     "Guy"          "Himuro"           114        "East"      227         {4×1 int32}        "515.127.4565"     2600 
    "PU_CLERK"      24-Dec-2005        116              NaN               30         "SBAIDA"      "Shelli"       "Baida"            114        "North"     189         {2×1 int32}        "515.127.4563"     2900 
    "PU_CLERK"      24-Jul-2005        117              NaN               30         "STOBIAS"     "Sigal"        "Tobias"           114        "South"     195         {2×1 int32}        "515.127.4564"     2800 
    "PU_CLERK"      18-May-2003        115              NaN               30         "AKHOO"       "Alexander"    "Khoo"             114        "West"      135         {2×1 int32}        "515.127.4562"     3100 
    "AC_ACCOUNT"    07-Jun-2002        206              NaN              110         "WGIETZ"      "William"      "Gietz"            205        "East"      258         {2×1 int32}        "515.123.8181"     8300 

results - таблица, содержащая следующие переменные:

  • job_id - Идентификатор задания

  • hire_date - Дата найма

  • employee_id - Идентификатор сотрудника

  • commission_pct - Процент комиссионных

  • department_id - Идентификатор отдела

  • email - Адрес электронной почты

  • first_name - Имя

  • last_name - Фамилия

  • manager_id - Идентификатор менеджера

  • office - Расположение офиса (таблица, содержащая две переменные для создания и комнаты)

  • performance_ratings - Рейтинги эффективности

  • phone_number - Номер телефона

  • salary - Зарплата

Отображение типов данных CQL столбцов в employees_by_job таблица базы данных.

cols = columninfo(conn,keyspace,tablename);
cols(:,1:2)
ans=13×2 table
            Name              DataType  
    _____________________    ___________

    "job_id"                 "text"     
    "hire_date"              "date"     
    "employee_id"            "int"      
    "commission_pct"         "double"   
    "department_id"          "int"      
    "email"                  "text"     
    "first_name"             "text"     
    "last_name"              "text"     
    "manager_id"             "int"      
    "office"                 "office"   
    "performance_ratings"    "list<int>"
    "phone_number"           "text"     
    "salary"                 "int"      

Вставка данных из MATLAB в базу данных Cassandra

Составьте таблицу данных, представляющую одного сотрудника, для вставки в базу данных Cassandra. Задайте имена переменных. Составьте таблицу для сведений о офисе. Затем составьте таблицу с информацией о сотруднике, которая содержит вложенную таблицу данных о офисе. Установите имена переменных.

varnames = ["job_id" "hire_date" "employee_id" ...
    "commission_pct" "department_id" "email" "first_name" ...
    "last_name" "manager_id" "office" "performance_ratings" ... 
    "phone_number" "salary"];
office = table("South",160, ...
    'VariableNames',["building" "room"]);
data = table("IT_ADMIN",datetime('today'),301,0.25,30,"SMITH123", ...
    "Alex","Smith",114,office,{[4 5]},"515.123.2345",3000);
data.Properties.VariableNames = varnames;

Вставьте информацию о сотруднике в базу данных Cassandra.

upsert(conn,keyspace,tablename,data)

Отобразите вставленные данные путем импорта их в MATLAB с помощью ключа раздела IT_ADMIN. The employees_by_job таблица содержит новую строку.

keyValue = "IT_ADMIN";
results = partitionRead(conn,keyspace,tablename,keyValue)
results=1×13 table
      job_id       hire_date     employee_id    commission_pct    department_id      email       first_name    last_name    manager_id         office         performance_ratings     phone_number     salary
                                                                                                                                          building    room                                                   
    __________    ___________    ___________    ______________    _____________    __________    __________    _________    __________    ________________    ___________________    ______________    ______

    "IT_ADMIN"    07-Oct-2020        301             0.25              30          "SMITH123"      "Alex"       "Smith"        114        "South"     160         {2×1 int32}        "515.123.2345"     3000 

Обновление данных в базе данных Cassandra

Обновление email переменная в новой строке информации о сотруднике.

results.email = "SMITH456";
upsert(conn,keyspace,tablename,results)

Отображение обновленных данных путем импорта их в MATLAB. Строка содержит обновленные данные в email переменная employees_by_job таблица.

results = partitionRead(conn,keyspace,tablename,keyValue)
results=1×13 table
      job_id       hire_date     employee_id    commission_pct    department_id      email       first_name    last_name    manager_id         office         performance_ratings     phone_number     salary
                                                                                                                                          building    room                                                   
    __________    ___________    ___________    ______________    _____________    __________    __________    _________    __________    ________________    ___________________    ______________    ______

    "IT_ADMIN"    07-Oct-2020        301             0.25              30          "SMITH456"      "Alex"       "Smith"        114        "South"     160         {2×1 int32}        "515.123.2345"     3000 

Закрытие соединения с базой данных Cassandra

close(conn)