Хранилище данных

Чтение больших коллекций данных

datastore создает хранилище данных, которое является хранилищем для коллекций данных, слишком больших для размещения в памяти. Хранилище данных позволяет считывать и обрабатывать данные, хранящиеся в нескольких файлах на диске, в удаленном расположении или в базе данных, как единый объект. Если данные слишком велики для размещения в памяти, можно управлять инкрементным импортом данных, создать tall массив для работы с данными или использовать хранилище данных в качестве входных данных для mapreduce для дальнейшей обработки. Дополнительные сведения см. в разделе Начало работы с хранилищем данных.

Функции

развернуть все

Создание хранилища данных

`datastore`	Создание хранилища данных для больших коллекций данных
`tabularTextDatastore`	Хранилище данных для табличных текстовых файлов
`spreadsheetDatastore`	Хранилище данных для файлов электронных таблиц
`imageDatastore`	Хранилище данных для данных изображения
`parquetDatastore`	Хранилище данных для коллекции паркетных файлов
`fileDatastore`	Хранилище данных с пользовательским средством чтения файлов
`arrayDatastore`	Хранилище данных для данных в памяти

Чтение и запись из хранилища данных

`read`	Считывание данных в хранилище данных
`readall`	Считывание всех данных в хранилище данных
`preview`	Предварительный просмотр подмножества данных в хранилище данных
`hasdata`	Определение доступности данных для чтения
`reset`	Сброс хранилища данных в исходное состояние
`writeall`	Запись хранилища данных в файлы

Хранилище данных секционирования и перетасовки

`shuffle`	Перетасовка всех данных в хранилище данных
`isShuffleable`	Определение возможности тасования хранилища данных
`numpartitions`	Количество разделов хранилища данных
`partition`	Разделение хранилища данных
`isPartitionable`	Определение возможности разделения хранилища данных

Объединение или преобразование хранилищ данных

Функции

`combine`	Объединение данных из нескольких хранилищ данных
`transform`	Преобразовать хранилище данных

Объекты

`CombinedDatastore`	Хранилище данных для объединения данных, считанных из нескольких базовых хранилищ данных
`TransformedDatastore`	Хранилище данных для преобразования базового хранилища данных

Интеграция с массивами MapReduce и Tall

`KeyValueDatastore`	Хранилище данных для данных пары ключ-значение для использования с `mapreduce`
`TallDatastore`	Хранилище данных для контрольных точек `tall` множества

Классы

развернуть все

Разработка пользовательского хранилища данных

`matlab.io.Datastore`	Базовый класс хранилища данных
`matlab.io.datastore.Partitionable`	Добавление поддержки параллелизма в хранилище данных
`matlab.io.datastore.HadoopLocationBased`	Добавление поддержки Hadoop в хранилище данных
`matlab.io.datastore.Shuffleable`	Добавление поддержки тасования в хранилище данных
`matlab.io.datastore.DsFileSet`	Объект набора файлов для сбора файлов в хранилище данных
`matlab.io.datastore.DsFileReader`	Объект чтения файлов для файлов в хранилище данных
`matlab.io.datastore.FileWritable`	Добавление поддержки записи файлов в хранилище данных
`matlab.io.datastore.FoldersPropertyProvider`	Добавить поддержку свойств папки в хранилище данных
`matlab.io.datastore.FileSet`	Набор файлов для сбора файлов в хранилище данных
`matlab.io.datastore.BlockedFileSet`	Заблокированный набор файлов для сбора блоков в файле

Темы

Начало работы с хранилищем данных

Хранилище данных - это объект для чтения одного файла или коллекции файлов или данных.

Выберите хранилище данных для формата файла или приложения

Выберите правильное хранилище данных в соответствии с форматом файла данных или приложения.

Чтение и анализ большого табличного текстового файла

В этом примере показано, как создать хранилище данных для большого текстового файла, содержащего табличные данные, а затем считывать и обрабатывать данные по одному блоку или по одному файлу за один раз.

Чтение и анализ файлов изображений

В этом примере показано, как создать хранилище данных для коллекции изображений, прочитать файлы изображений и найти изображения с максимальным средним оттенком, насыщенностью и яркостью (HSV).

Чтение и анализ MAT-файла с данными ключевых значений

В этом примере показано, как создать хранилище данных для данных пары ключ-значение в MAT-файле, который является выходом mapreduce.

Чтение и анализ файла последовательности Hadoop

В этом примере показано, как создать хранилище данных для файла Sequence, содержащего данные ключевых значений.

Работа с удаленными данными

Работа с удаленными данными в Amazon S3™, Azure ® Blob Storage или HDFS™.

Настройка хранилища данных для обработки на различных машинах или кластерах

Установите на компьютере хранилище данных, которое можно загрузить и обработать на другом компьютере или кластере.

Разработка пользовательского хранилища данных

Создайте полностью настроенное хранилище данных для пользовательских или собственных данных.

Разработка пользовательского хранилища данных для данных DICOM

В этом примере показано, как создать пользовательское хранилище данных, поддерживающее операции записи.

После внедрения настраиваемого хранилища данных выполните эту процедуру тестирования, чтобы получить квалификацию настраиваемого хранилища данных.

Связанная информация

Массивы Tall для данных без памяти

Вычисление максимального среднего HSV изображений с помощью MapReduce

Документация

Хранилище данных

Функции

Создание хранилища данных

Чтение и запись из хранилища данных

Хранилище данных секционирования и перетасовки

Объединение или преобразование хранилищ данных

Функции

Объекты

Интеграция с массивами MapReduce и Tall

Классы

Разработка пользовательского хранилища данных

Темы

Связанная информация

Документация MATLAB

Поддержка