matlab.mapreduce.DeploySparkMapReducer class

Пакет: matlab.mapreduce
Суперклассы:

Сконфигурируйте приложение длинного массива MATLAB параметрами Spark как пары "ключ-значение"

Описание

DeploySparkMapReducer объектно-ориентированная память параметры конфигурации приложения длинного массива, развертываемого на Spark™. Каждое приложение длинного массива должно быть сконфигурировано до того, чтобы быть развернутым на кластере Spark. Некоторые параметры конфигурации задают свойства приложения, и некоторые используются Spark, чтобы выделить ресурсы на кластере. Параметры конфигурации передаются на кластер Spark через mapreducer функция.

Конструкция

conf = matlab.mapreduce.DeploySparkMapReducer('AppName',name,'Master',url,'SparkProperties',prop) создает DeploySparkMapReducer объект с заданными параметрами конфигурации.

conf = matlab.mapreduce.DeploySparkMapReducer('AppName',name,'Master',url,'SparkProperties',prop,Name,Value) создает DeploySparkMapReducer объект с дополнительными параметрами конфигурации, заданными одним или несколькими Имя, аргументы пары Значения. Name имя свойства класса и Value соответствующее значение. Name должен появиться в одинарных кавычках (''). Можно задать несколько аргументов пары "имя-значение" в любом порядке как Name1,Value1,...,NameN,ValueN.

Входные параметры

развернуть все

`name` — Имя приложения MATLAB^® развертывается на Spark
вектор символов | строка

Имя приложения, заданного как вектор символов в одинарных кавычках ('').

Пример: 'AppName', 'myApp'

Типы данных: char | string

`url` — Основной URL, чтобы соединиться с
вектор символов | строка

Имя основного URL, заданного как вектор символов в одинарных кавычках ('').

URL	Описание
`yarn-client`	Соединитесь с кластером YARN Hadoop^® в клиентском режиме. Кластерное местоположение найдено на основе `HADOOP_CONF_DIR` или `YARN_CONF_DIR` переменная.

Пример: 'Master', 'yarn-client'

Типы данных: char | string

`prop` — Карта пар "ключ-значение", которые задают свойства настройки Spark
`containers.Map` объект

containers.Map объект, содержащий свойства настройки Spark как пары "ключ-значение".

При развертывании к кластеру YARN Hadoop, установленному значение для prop с соответствующими свойствами настройки Spark как пары "ключ-значение". Точный набор свойств настройки Spark варьируется от одного сценария развертывания до другого, на основе кластерной среды развертывания. Пользователи должны проверить настройку Spark с системным администратором, чтобы использовать соответствующие свойства настройки. См. таблицу для обычно используемых свойств Spark. Для полного набора свойств см. последнюю документацию Spark.

Под управлением Spark на YARN

Имя свойства (ключ)	Значение по умолчанию (Значение)	Описание
`spark.executor.cores`	1	Количество ядер, чтобы использовать на каждом исполнителе. Для автономного режима YARN и Spark только. В автономном режиме Spark, устанавливая этот параметр позволяет приложению запускать несколько исполнителей на том же рабочем, при условии, что существует достаточно ядер на том рабочем. В противном случае, только один исполнитель на выполнение приложения на каждом рабочем.
`spark.executor.instances`	2	Количество исполнителей. Примечание Это свойство несовместимо с `spark.dynamicAllocation.enabled`. Если оба `spark.dynamicAllocation.enabled` и `spark.executor.instances` заданы, динамическое выделение выключено и конкретное количество `spark.executor.instances` используется.
`spark.driver.memory`	`1g` `2048m` (рекомендуемый)	Объем памяти, чтобы использовать в процессе драйвера. Если вы вытаскиваете кого-либо из ошибок памяти при использовании `tall/gather`, рассмотрите увеличение этого значения.
`spark.executor.memory`	`1g` `2048m` (рекомендуемый)	Объем памяти, чтобы использовать на процесс исполнителя. Если вы вытаскиваете кого-либо из ошибок памяти при использовании `tall/gather`, рассмотрите увеличение этого значения.
`spark.yarn.executor.memoryOverhead`	`executorMemory * 0.10`, с минимумом `384`. `4096m` (рекомендуемый)	Сумма памяти вне кучи (в MBS), чтобы быть выделенным на исполнителя. Если вы вытаскиваете кого-либо из ошибок памяти при использовании `tall/gather`, рассмотрите увеличение этого значения.
`spark.dynamicAllocation.enabled`	`false`	Эта опция интегрирует Spark с управлением ресурсами YARN. Spark инициирует как можно больше исполнителей, учитывая требования к памяти исполнителя и количество ядер. Это свойство требует, чтобы кластер был настроен. Установка этого свойства к `true` задает, использовать ли динамическое распределение ресурсов, которое масштабирует количество исполнителей, указанных с этим приложением вверх и вниз на основе рабочей нагрузки. Это свойство требует `spark.shuffle.service.enabled` быть установленным. Следующие настройки также релевантны: `spark.dynamicAllocation.minExecutors`, `spark.dynamicAllocation.maxExecutors`, и `spark.dynamicAllocation.initialExecutors`
`spark.shuffle.service.enabled`	`false`	Включает внешний сервис перестановки. Этот сервис сохраняет файлы перестановки, записанные исполнителями, таким образом, исполнители могут быть безопасно удалены. Это должно быть включено если `spark.dynamicAllocation.enabled` установлен в `true`. Внешний сервис перестановки должен быть настроен для того, чтобы включить его.

MATLAB определенные свойства

Имя свойства (ключ)	Значение по умолчанию (Значение)	Описание
`spark.matlab.worker.debug`	`false`	Для использования в автономном / интерактивном режиме только. Если установлено в истину, Spark развертываемое приложение MATLAB, выполняемое в среде рабочего стола MATLAB, запускает другой сеанс работы с MATLAB как рабочего и введет отладчик. Логгирование информации направлено к `log_<nbr>.txt`.
`spark.matlab.worker.reuse`	`true`	Когда установлено в `true`, исполнитель Spark объединяет рабочих и снова использует их от одного этапа до следующего. Рабочие отключают, когда исполнитель, при котором запускаются рабочие, отключает.
`spark.matlab.worker.profile`	`false`	Только допустимый при использовании сеанса MATLAB как рабочий. Когда установлено в `true`, это включает профилировщика MATLAB и генерирует отчет Профиля, который сохранен в файл `profworker_<split_index>_<socket>_<worker pass>.mat`.
`spark.matlab.worker.numberOfKeys`	10000	Количество уникальных клавиш, которые могут быть удержаны в `containers.Map` возразите при выполнении `*ByKey` операции перед данными о карте пролиты к файлу.
`spark.matlab.executor.timeout`	600000	Тайм-аут исполнителя Spark в миллисекундах. Не применимый при развертывании длинных массивов.

Контроль и логгирование

Имя свойства (ключ)	Значение по умолчанию (Значение)	Описание
`spark.history.fs.logDirectory`	`file:/tmp/spark-events`	Директория, которая содержит журналы событий приложения, чтобы загрузиться сервером истории.
`spark.eventLog.dir`	`file:///tmp/spark-events`	Основная директория, в которой события Spark регистрируются, если `spark.eventLog.enabled` `true`. В рамках этой основной директории Spark создает sub директорию для каждого приложения и регистрирует события, характерные для приложения в этой директории. Можно установить это на объединенное местоположение как директория HDFS™, таким образом, файлы истории могут быть считаны сервером истории.
`spark.eventLog.enabled`	`false`	Регистрировать ли события Spark. Это полезно для восстановления веб-пользовательского интерфейса после того, как приложение закончилось.

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

`'MCRRoot'` — Путь к MATLAB Runtime, который используется, чтобы выполнить приложение драйвера
вектор символов | строка

Вектор символов, задающий путь к MATLAB Runtime в одинарных кавычках ''.

Пример: 'MCRRoot', '/share/MATLAB/MATLAB_Runtime/v91'

Типы данных: char | string

`'SparkLogLevel'` — Установите логарифмический уровень Spark
`'ALL'` | `'DEBUG'` | `'ERROR'` | `'FATAL'` | `'INFO'` | `'OFF'` | `'TRACE'` | `'WARN'`

Задайте логарифмический уровень, чтобы установить как вектор символов с логарифмическим уровнем, заключенным в ''.

Типы данных: char | string

Свойства

Свойства этого класса скрыты.

Методы

Нет никаких пользовательских исполнимых методов для этого класса.

Примеры

свернуть все

Создайте объект DeploySparkMapReducer

Задайте свойства Spark и создайте DeploySparkMapReducer объект.

sparkProperties = containers.Map( ...
 {'spark.executor.cores', ...
 'spark.executor.memory', ...
 'spark.yarn.executor.memoryOverhead', ...
 'spark.dynamicAllocation.enabled', ...
 'spark.shuffle.service.enabled', ...
 'spark.eventLog.enabled', ...
 'spark.eventLog.dir'}, ...
 {'1', ...
  '2g', ...
  '1024', ...
  'true', ...
  'true', ...
  'true', ...
  'hdfs://hadoopfs:54310/user/<username>/sparkdeploy'});

conf = matlab.mapreduce.DeploySparkMapReducer( ...
      'AppName','myTallApp', ...
      'Master','yarn-client', ...
      'SparkProperties',sparkProperties);

mapreducer(conf);

Документация

matlab.mapreduce.DeploySparkMapReducer class

Описание

Конструкция

Входные параметры

`name` — Имя приложения MATLAB^® развертывается на Spark
вектор символов | строка

`url` — Основной URL, чтобы соединиться с
вектор символов | строка

`prop` — Карта пар "ключ-значение", которые задают свойства настройки Spark
`containers.Map` объект

Примечание

Аргументы в виде пар имя-значение

`'MCRRoot'` — Путь к MATLAB Runtime, который используется, чтобы выполнить приложение драйвера
вектор символов | строка

`'SparkLogLevel'` — Установите логарифмический уровень Spark
`'ALL'` | `'DEBUG'` | `'ERROR'` | `'FATAL'` | `'INFO'` | `'OFF'` | `'TRACE'` | `'WARN'`

Свойства

Методы

Примеры

Создайте объект DeploySparkMapReducer

Смотрите также

Темы

Введенный в R2017b

Документация MATLAB Compiler

Поддержка

Документация

matlab.mapreduce.DeploySparkMapReducer class

Описание

Конструкция

Входные параметры

name — Имя приложения MATLAB® развертывается на Spark вектор символов | строка

url — Основной URL, чтобы соединиться с вектор символов | строка

prop — Карта пар "ключ-значение", которые задают свойства настройки Spark containers.Map объект

Примечание

Аргументы в виде пар имя-значение

'MCRRoot' — Путь к MATLAB Runtime, который используется, чтобы выполнить приложение драйвера вектор символов | строка

'SparkLogLevel' — Установите логарифмический уровень Spark 'ALL' | 'DEBUG' | 'ERROR' | 'FATAL' | 'INFO' | 'OFF' | 'TRACE' | 'WARN'

Свойства

Методы

Примеры

Создайте объект DeploySparkMapReducer

Смотрите также

Темы

Введенный в R2017b

Документация MATLAB Compiler

Поддержка

`name` — Имя приложения MATLAB^® развертывается на Spark
вектор символов | строка

`url` — Основной URL, чтобы соединиться с
вектор символов | строка

`prop` — Карта пар "ключ-значение", которые задают свойства настройки Spark
`containers.Map` объект

`'MCRRoot'` — Путь к MATLAB Runtime, который используется, чтобы выполнить приложение драйвера
вектор символов | строка

`'SparkLogLevel'` — Установите логарифмический уровень Spark
`'ALL'` | `'DEBUG'` | `'ERROR'` | `'FATAL'` | `'INFO'` | `'OFF'` | `'TRACE'` | `'WARN'`