Обработка Больших данных

Анализируйте большие наборы данных в параллели с помощью распределенных массивов, длинных массивов, хранилищ данных, или mapreduce, на Spark® и кластерах Hadoop®

Можно использовать Parallel Computing Toolbox™, чтобы распределить большие массивы параллельно на нескольких рабочих MATLAB®, так, чтобы можно было запустить большие применения данных, которые используют объединенную память о кластере. Вы работаете с целым массивом как одна сущность, однако, рабочие действуют только с их стороны массива, и автоматически передают данные между собой при необходимости. Parallel Computing Toolbox также позволяет вам выполнить длинный массив MATLAB® и datastore вычисления параллельно, так, чтобы можно было анализировать большие наборы данных, которые не помещаются в память о кластере. Можно использовать MATLAB Parallel Server™, чтобы запустить длинный массив и datastore вычисления параллельно на Spark включили кластеры Hadoop. Выполнение так значительно уменьшает время выполнения очень больших вычислений данных.

  • Распределенные массивы
    Анализируйте большие наборы данных в параллели с помощью распределенных массивов и одновременного выполнения
  • Длинные массивы и mapreduce
    Анализируйте большие наборы данных в использовании параллели длинные массивы MATLAB и хранилища данных или mapreduce в кластерах Spark и Hadoop и параллельных пулах

Рекомендуемые примеры