Запишите картопостроитель и функции редуктора в MATLAB®.
Создайте MAT-файл, который содержит datastore, который описывает структуру данных и имена переменных, чтобы анализировать. Datastore в MAT-файле может быть создан из набора тестовых данных, который является представительным для фактического набора данных.
Создайте текстовый файл, который содержит Hadoop® настройки, такие как имя картопостроителя, редуктора и типа анализируемых данных. Этот файл автоматически создается, если вы используете приложение Hadoop Compiler.
Используйте приложение Hadoop Compiler или mcc
команда, чтобы группировать компоненты в развертываемый архив. Обе опции генерируют развертываемый архив (.ctf файл), который может быть включен в задание mapreduce Hadoop.
Включите развертываемый архив в задание mapreduce Hadoop с помощью hadoop
команда и синтаксис.
Подпись выполнения
Ключ
Буква | Описание |
---|---|
A | Команда Hadoop |
B | Опция JAR |
C | Стандартное имя файла JAR. Все приложения имеют тот же JAR: mwmapreduce.jar Путь к.The к JAR также фиксируется относительно местоположения MATLAB Runtime. |
D | Стандартное имя драйвера. Все приложения имеют то же имя драйвера: MWMapReduceDriver |
E | Типовая опция, задающая местоположение MATLAB Runtime как пара "ключ-значение". |
F | Развертываемый архив (.ctf файл) сгенерированный приложением Hadoop Compiler или mcc передается в качестве аргумента полезной нагрузки заданию. |
G | Местоположение входных файлов на HDFS™. |
H | Местоположение на HDFS, где выведенный может быть записан. |
Упростить включение развертываемого архива (.ctf
файл) в задание mapreduce Hadoop, и приложение Hadoop Compiler и mcc
команда генерирует сценарий оболочки вместе с развертываемым архивом. Сценарий оболочки имеет следующее соглашение о присвоении имен: run_<deployableArchiveName>.sh
Чтобы запустить развертываемый архив с помощью сценария оболочки, используйте следующий синтаксис: