Развертывание приложений с помощью MATLAB API для Spark

Создайте и выполните MATLAB® приложения против Spark™, использующие MATLAB API для Spark

Поддерживаемая платформа: Linux® только.

Использование MATLAB API для Spark для развертывания приложения состоит из двух частей:

  • Создание вашего приложения с помощью MATLAB API для Spark и упаковка его как автономного приложения в среде рабочего стола MATLAB.

  • Выполнение автономного приложения против кластера с поддержкой Spark из интерпретатора Linux.

При создании вашего приложения с помощью MATLAB API для Spark, вы сможете использовать такие функции Spark, как flatMap, mapPartitions, aggregate и другие в коде MATLAB. API выставляет модель программирования Spark на MATLAB, позволяя MATLAB реализаций многочисленные функции Spark. Многие из этих реализаций MATLAB принимают указатели на функцию или анонимные функции в качестве входов для выполнения различных типов анализа.

API позволяет вам в интерактивном режиме запускать приложение из среды рабочего стола MATLAB в неразмещенном режиме на одной машине. Второй сеанс работы с MATLAB на той же машине служит рабочим. Эта функциональность может быть полезна при отладке вашего приложения перед его развертыванием в кластере с поддержкой Spark. Необходимо сконфигурировать окружение MATLAB для интерактивной отладки с помощью MATLAB API для Spark. Дополнительные сведения см. в разделе Настройка окружении для интерактивной отладки.

Общий рабочий процесс использования MATLAB API для Spark следующий:

  1. Задайте свойства Spark.

  2. Создайте объект SparkConf.

  3. Создайте объект SparkContext.

  4. Создайте объект RDD из данных.

  5. Выполните операции с объектом RDD.

Вы можете упаковать приложение, созданное с помощью этого API, в автономное приложение, используя mcc команда или deploytool. Затем можно запустить приложение в кластере с поддержкой Spark из интерпретатора Linux.

Примечание

Приложения MATLAB, разработанные с помощью MATLAB API для Spark, не могут быть развернуты, если они содержат длинные массивы.

Полный пример см. в Примере Развертывания приложений в Spark с использованием MATLAB API для Spark. Можно следовать тем же инструкциям для развертывания приложений, созданных с помощью MATLAB API для Spark на Cloudera® CDH.

Классы

matlab.compiler.mlspark.SparkConfКласс интерфейса, чтобы сконфигурировать приложение с параметрами Spark как пары "ключ-значение"
matlab.compiler.mlspark.SparkContextКласс интерфейса для инициализации соединения с кластером с поддержкой Spark
matlab.compiler.mlspark.RDDКласс интерфейса для представления Spark Resilient Distributed Dataset (RDD)

Темы

Сконфигурируйте окружение для интерактивной отладки

Сконфигурируйте окружение MATLAB для интерактивного совершения вызовов и отладки приложения с помощью MATLAB API для Spark.

Основы искр Apache

Узнайте основные концепции Spark™ Apache и посмотрите, как эти концепции связаны с развертыванием приложений MATLAB в Spark.

Примеры

Пример развертывания приложений в Spark с помощью MATLAB API для Spark

Полный пример, показывающий, как развернуть приложение в Spark с помощью MATLAB API для Spark.