Метод программирования для анализа наборов данных, которые не умещаются в памяти
применяет функцию карты outds
= mapreduce(ds
,mapfun
,reducefun
)mapfun
вводить datastore ds
, и затем передает значения, сопоставленные с каждым уникальным ключом, чтобы уменьшать функциональный reducefun
. Выходным datastore является KeyValueDatastore
возразите что точки против .mat
файлы в текущей папке.
опционально задает параметры конфигурации во время выполнения для outds
= mapreduce(ds
,mapfun
,reducefun
,mr
)mapreduce
. mr
вход является результатом вызова mapreducer
функция. Как правило, этот аргумент используется с Parallel Computing Toolbox™, MATLAB® Parallel Server™ или MATLAB Compiler™. Для получения дополнительной информации смотрите, Убыстряются и Развертывают MapReduce Используя Другие продукты.
задает дополнительные опции с одним или несколькими outds
= mapreduce(___,Name,Value
)Name,Value
парные аргументы с помощью любого из предыдущих синтаксисов. Например, можно задать 'OutputFolder'
сопровождаемый вектором символов, задающим путь к выходной папке.
Отладка ваш mapreduce
алгоритмы, чтобы исследовать, как пары "ключ-значение" перемещаются через различные фазы, всегда полезны. Чтобы исследовать перемещение данных, установите точки останова в своих map и reduce функциях. Точки останова останавливают выполнение mapreduce
, разрешение вам исследовать текущий статус следующих переменных, как KeyValueStore
или ValueIterator
. Для получения дополнительной информации см. Алгоритмы MapReduce Отладки.
Некоторые рекомендации оптимизировать mapreduce
эффективность на любой платформе:
Минимизируйте количество вызовов функции карты. Самый легкий подход должен увеличить значение ReadSize
свойство входного datastore. Результат - это mapreduce
передает большие блоки данных функции карты, и datastore истощает с меньшим количеством чтений.
Уменьшите сумму промежуточных данных, отправленных между map и reduce функциями. Один подход должен использовать unique
в карте функционируют, чтобы объединить подобные ключи. Смотрите Вычисляют, Подразумевают под Группой Используя MapReduce для примера этого метода.