Рабочий процесс, чтобы включить map и reduce функции MATLAB в Хэдупа Джоба

  1. Запишите картопостроитель и функции редуктора в MATLAB®.

  2. Создайте MAT-файл, который содержит datastore, который описывает структуру данных и имена переменных, чтобы анализировать. Datastore в MAT-файле может быть создан из набора тестовых данных, который является представительным для фактического набора данных.

  3. Создайте текстовый файл, который содержит настройки Hadoop®, такие как имя картопостроителя, редуктора и типа анализируемых данных. Этот файл автоматически создается, если вы используете приложение Hadoop Compiler.

  4. Используйте приложение Hadoop Compiler или команду mcc, чтобы группировать компоненты в развертываемый архив. Обе опции генерируют развертываемый архив (.ctf файл), который может быть включен в задание mapreduce Hadoop.

  5. Включите развертываемый архив в задание mapreduce Hadoop с помощью команды hadoop и синтаксиса.

    Подпись выполнения

    Ключ

    БукваОписание
    AКоманда Hadoop
    BОпция JAR
    CСтандартное имя файла JAR. Все приложения имеют тот же JAR: mwmapreduce.jar.The путь к JAR также фиксируется относительно местоположения MATLAB Runtime.
    DСтандартное имя драйвера. Все приложения имеют то же имя драйвера: MWMapReduceDriver
    EТипичная опция, задающая местоположение MATLAB Runtime как пара "ключ-значение".
    FРазвертываемый архив (файл .ctf) сгенерированный приложением Hadoop Compiler или mcc передается в качестве аргумента полезной нагрузки заданию.
    GМестоположение входных файлов на HDFS™.
    HМестоположение на HDFS, где выведенный может быть записан.

Чтобы упростить включение развертываемого архива (файл .ctf ) в задание mapreduce Hadoop, и приложение Hadoop Compiler и команда mcc генерируют сценарий оболочки вместе с развертываемым архивом. Сценарий оболочки имеет следующее соглашение о присвоении имен: run_<deployableArchiveName>.sh

Чтобы запустить развертываемый архив с помощью сценария оболочки, используйте следующий синтаксис:

Похожие темы