Сконфигурируйте кластер Hadoop

Найдите что-либо подобное коду MATLAB®, который содержит массивы tall, и функции mapreduce могут быть представлены кластеру Hadoop от соответственно сконфигурированных клиентов MATLAB.

Чтобы сконфигурировать клиент, чтобы запустить код MATLAB по кластеру, необходимо уже смочь подчиниться кластеру от намеченной клиентской машины. Клиентская машина должна иметь установку Hadoop®, которая может получить доступ к кластеру за пределами MATLAB.

Много дистрибутивов Hadoop не поддерживают прямой доступ основанных на Linux® кластеров от клиентов Windows®. Пользователи клиентов Windows обычно должны настраивать узел шлюза Linux, к которому можно получить доступ от клиента Windows через SSH или VNC. К кластеру можно затем получить доступ от этого узла шлюза.

Кластерная конфигурация

  1. Интегрируйте MATLAB Parallel Server™ со своей кластерной инфраструктурой. Для инструкций смотрите, Интегрируют MATLAB со Сторонними Планировщиками.

  2. Если ваш кластер требует аутентификации Kerberos, гарантируйте, что ваши установки MATLAB Parallel Server были сконфигурированы правильно. Для инструкций смотрите Аутентификацию Kerberos.

Клиентская настройка

  1. Гарантируйте, что ваш клиент может получить доступ к кластеру Hadoop вне MATLAB.

  2. Обеспечьте вашему клиенту, установка MATLAB была сконфигурирована для аутентификации Kerberos, если ваш кластер требует его. Для инструкций смотрите Аутентификацию Kerberos.

Чтобы получить доступ к кластеру из MATLAB, настройте объект parallel.cluster.Hadoop с помощью следующих операторов.

setenv('HADOOP_HOME', '/path/to/hadoop/install')
cluster = parallel.cluster.Hadoop;

Используйте mapreducer, чтобы задать mapreduce, чтобы работать на объекте кластера Hadoop.

Для примеров того, как идти параллельно код MATLAB по вашему кластеру Hadoop, см. mapreduce Выполнения на Кластере Hadoop (Parallel Computing Toolbox) и Длинные массивы Использования на Spark Enabled Кластер Hadoop (Parallel Computing Toolbox).

Аутентификация Kerberos

Если кластер использует аутентификацию Kerberos, которая требует Oracle® Java® Cryptography Extension, необходимо сконфигурировать все установки MATLAB и MATLAB Parallel Server. Если вы используете Hortonworks® или дистрибутивы Cloudera®, вероятно, что необходимо завершить эти шаги настройки.

Инструкции по настройке являются тем же самым для клиента и рабочего установки MATLAB.

При запуске в R2018b сконфигурируйте установку MATLAB путем включения соответствующей политики безопасности в установке Java.

  1. В редакторе MATLAB откройте файл ${MATLAB_ROOT}/sys/java/jre/${ARCH}/jre/lib/security/java.security.

  2. Измените строку

    #crypto.policy=unlimited
    к
    crypto.policy=unlimited

Для предыдущих релизов необходимо загрузить дополнительные файлы защиты с Oracle.

  1. Загрузите zip-файл Расширения Криптографии Oracle Java со страницы Oracle Java SE.

  2. Разархивируйте загруженный zip-файл во временную папку.

  3. Замените файлы local_policy.jar и US_export_policy.jar в папке ${MATLABROOT}/sys/java/jre/${ARCH}/jre/lib/security с загруженными версиями.

Поддержка версии Hadoop

  • MATLAB mapreduce поддерживается на Hadoop 2.x кластеры. Обратите внимание на то, что поддержка Hadoop 1.x кластеры была удалена.

  • Длинные массивы MATLAB поддерживаются на Spark®, включенном Hadoop 2.x кластеры. Можно использовать длинные массивы на включенных кластерах Hadoop Spark, поддерживающих всю архитектуру для клиента при поддержке архитектуры Linux и Mac для кластера. Это включает кросс-платформенную поддержку.

ФункциональностьРезультатИспользуйте вместо этогоВопросы совместимости
Поддержка рабочего MATLAB mapreduce на Hadoop 1.x кластеры была удалена. ОшибкиИспользуйте кластеры, которые имеют Hadoop 2.x установленный, чтобы запустить MATLAB mapreduce. Переместите MATLAB код mapreduce, который работает на Hadoop 1.x к Hadoop 2.x.

Смотрите также

Похожие темы

Для просмотра документации необходимо авторизоваться на сайте