Низкоуровневые функции ввода-вывода файлов позволяют максимально контролировать чтение или запись данных в файл. Однако эти функции требуют, чтобы вы указали более подробную информацию о своем файле, чем более простые в использовании высокоуровневые функции, такие как importdata
. Для получения дополнительной информации о высокоуровневых функциях, которые читают текстовые файлы, смотрите Способы Импортировать Текстовые файлы.
Если высокоуровневые функции не могут импортировать ваши данные, используйте одно из следующего:
fscanf
, который читает отформатированные данные в тексте или ASCII-файле; то есть, файл можно просмотреть в текстовом редакторе. Для получения дополнительной информации смотрите Данные о Чтении в Отформатированном Шаблоне.
fgetl
и fgets
, которые читают одну строку файла за один раз, где символ новой строки разделяет каждую строку. Для получения дополнительной информации см. Построчное чтение данных.
fread
, который считывает поток данных на байтовом или битовом уровне. Для получения дополнительной информации см. Импорт бинарных данных с низкоуровневым вводом - выводом.
Для получения дополнительной информации см.:
Низкоуровневые функции ввода-вывода файлов основаны на функциях в библиотеке ANSI® Standard C Library. Однако<sup class="" contenteditable="">However, MATLAB®</sup> включает векторизованные версии функций для чтения и записи данных в массив с минимальными циклами управления.
Чтобы импортировать текстовые файлы, которые не могут считать importdata
и textscan
, рассмотрите использование fscanf
. Функция fscanf
требует, чтобы вы описали формат своего файла, но включает много опций для этого описания формата.
Например, создайте текстовый файл mymeas.dat
как показано. Данные в mymeas.dat
включают повторенные наборы времен, дат и измерений. Текст заголовка включает количество наборов измерений, N
:
Measurement Data N=3 12:00:00 01-Jan-1977 4.21 6.55 6.78 6.55 9.15 0.35 7.57 NaN 7.92 8.49 7.43 7.06 9.59 9.33 3.92 0.31 09:10:02 23-Aug-1990 2.76 6.94 4.38 1.86 0.46 3.17 NaN 4.89 0.97 9.50 7.65 4.45 8.23 0.34 7.95 6.46 15:03:40 15-Apr-2003 7.09 6.55 9.59 7.51 7.54 1.62 3.40 2.55 NaN 1.19 5.85 5.05 6.79 4.98 2.23 6.99
Как с любой из низкоуровневых функций ввода-вывода, перед чтением, открывают файл с fopen
и получают идентификатор файла. По умолчанию fopen
открывает файлы для доступа для чтения с разрешением 'r'
.
Когда вы закончили обрабатывать файл, закрываете его с fclose
.(fid)
Опишите данные в файле со спецификаторами формата, такими как '%s'
для текста, '%d'
для целого числа или '%f'
для числа с плавающей запятой. (Для полного списка спецификаторов смотрите страницу с описанием fscanf
.)
Чтобы пропустить буквенные символы в файле, включайте их в описание формата. Чтобы пропустить поле данных, используйте звездочку ('*'
) в спецификаторе.
Например, рассмотрите строки заголовка mymeas.dat
:
Measurement Data % skip the first 2 words, go to next line: %*s %*s\n N=3 % ignore 'N=', read integer: N=%d\n % go to next line: \n 12:00:00 01-Jan-1977 4.21 6.55 6.78 6.55 ...
Считать заголовки и возвратить одно значение для N
:
N = fscanf(fid, '%*s %*s\nN=%d\n\n', 1);
По умолчанию fscanf
повторно применяет ваше описание формата, пока это не может совпадать с описанием к данным, или это достигает конца файла.
Опционально, задайте количество значений, чтобы читать, так, чтобы fscanf
не пытался считать целый файл. Например, в mymeas.dat
, каждый набор измерений включает постоянное число строк и столбцов:
measrows = 4; meascols = 4; meas = fscanf(fid, '%f', [measrows, meascols])';
Существует несколько способов сохранить mymeas.dat
в рабочем пространстве MATLAB. В этом случае считайте значения в структуру. Каждый элемент структуры имеет три поля: mtime
, mdate
и meas
.
fscanf
заполняет массивы с числовыми значениями в порядке следования столбцов. Чтобы заставить выходной массив совпадать с ориентацией числовых данных в файле, транспонируйте массив.
filename = 'mymeas.dat'; measrows = 4; meascols = 4; % open the file fid = fopen(filename); % read the file headers, find N (one value) N = fscanf(fid, '%*s %*s\nN=%d\n\n', 1); % read each set of measurements for n = 1:N mystruct(n).mtime = fscanf(fid, '%s', 1); mystruct(n).mdate = fscanf(fid, '%s', 1); % fscanf fills the array in column order, % so transpose the results mystruct(n).meas = ... fscanf(fid, '%f', [measrows, meascols])'; end % close the file fclose(fid);
MATLAB обеспечивает две функции, которые читают строки из файлов и хранят их как векторы символов: fgetl
и fgets
. Функция fgets
копирует строку наряду с символом новой строки к выводу, но fgetl
не делает.
Следующий пример использует fgetl
, чтобы считать целый файл одна строка за один раз. Функциональный litcount
определяет, появляется ли данная последовательность символов (literal
) в каждой строке. Если это так, функция печатает всю строку, столько раз, сколько литерал появляется в строке.
function y = litcount(filename, literal) % Count the number of times a given literal appears in each line. fid = fopen(filename); y = 0; tline = fgetl(fid); while ischar(tline) matches = strfind(tline, literal); num = length(matches); if num > 0 y = y + num; fprintf(1,'%d:%s\n',num,tline); end tline = fgetl(fid); end fclose(fid);
Создайте файл входных данных под названием badpoem
:
Oranges and lemons, Pineapples and tea. Orangutans and monkeys, Dragonflys or fleas.
Чтобы узнать, сколько раз 'an'
появляется в этом файле, вызовите litcount
:
litcount('badpoem','an')
Это возвращается:
2: Oranges and lemons, 1: Pineapples and tea. 3: Orangutans and monkeys, ans = 6
Когда вы читаете фрагмент своих данных за один раз, можно использовать feof
, чтобы проверять, достигли ли вы конца файла. feof
возвращает значение 1
, когда указатель файла в конце файла. В противном случае это возвращает 0
.
Открытие пустого файла не перемещает индикатор позиции в файле в конец файла. Операции чтения, и fseek
и функции frewind
, перемещают индикатор позиции в файле.
Когда вы используете textscan
, fscanf
или fread
, чтобы считать фрагменты данных за один раз, используйте feof
, чтобы проверять, достигли ли вы конца файла.
Например, предположите, что гипотетический файл mymeas.dat
имеет следующую форму без информации о количестве наборов измерения. Считайте данные в структуру с полями для mtime
, mdate
и meas
:
12:00:00 01-Jan-1977 4.21 6.55 6.78 6.55 9.15 0.35 7.57 NaN 7.92 8.49 7.43 7.06 9.59 9.33 3.92 0.31 09:10:02 23-Aug-1990 2.76 6.94 4.38 1.86 0.46 3.17 NaN 4.89 0.97 9.50 7.65 4.45 8.23 0.34 7.95 6.46
Считать файл:
filename = 'mymeas.dat'; measrows = 4; meascols = 4; % open the file fid = fopen(filename); % make sure the file is not empty finfo = dir(filename); fsize = finfo.bytes; if fsize > 0 % read the file block = 1; while ~feof(fid) mystruct(block).mtime = fscanf(fid, '%s', 1); mystruct(block).mdate = fscanf(fid, '%s', 1); % fscanf fills the array in column order, % so transpose the results mystruct(block).meas = ... fscanf(fid, '%f', [measrows, meascols])'; block = block + 1; end end % close the file fclose(fid);
Если вы используете fgetl
или fgets
в цикле управления, feof
является не всегда лучшим способом протестировать на конец файла. Как альтернатива, рассмотрите проверку, ли значение, что возвраты fgetl
или fgets
являются вектором символов.
Например, функциональный litcount
, описанный в Построчном чтении данных, включает следующий цикл while
и вызовы fgetl
:
y = 0; tline = fgetl(fid); while ischar(tline) matches = strfind(tline, literal); num = length(matches); if num > 0 y = y + num; fprintf(1,'%d:%s\n',num,tline); end tline = fgetl(fid); end
Этот подход более устойчив, чем тестирование ~feof(fid)
по двум причинам:
Если fgetl
или fgets
находят данные, они возвращают вектор символов. В противном случае они возвращают номер (-1
).
После каждой операции чтения fgetl
и fgets
проверяют следующий символ в файл для маркера конца файла. Поэтому эти функции иногда устанавливают индикатор конца файла, прежде чем они возвратят значение -1
. Например, рассмотрите следующий текстовый файл с тремя строками. Каждый из первых двух концов строк с символом новой строки и третьей строки содержит только маркер конца файла:
123 456
Три последовательных вызова fgetl
приводят к следующим результатам:
t1 = fgetl(fid); % t1 = '123', feof(fid) = false t2 = fgetl(fid); % t2 = '456', feof(fid) = true t3 = fgetl(fid); % t3 = -1, feof(fid) = true
Это поведение не соответствует спецификациям ANSI для связанных функций языка C.
Схемы кодирования поддерживают символы, требуемые для конкретных алфавитов, таких как те для японского или европейских языков. Общие схемы кодирования включают US-ASCII или UTF-8.
Если вы не задаете схему кодирования, fopen
открывает файлы для обработки использования кодировки по умолчанию для вашей системы. Чтобы определить значение по умолчанию, откройте файл и вызовите fopen
снова с синтаксисом:
[filename, permission, machineformat, encoding] = fopen(fid);
Если вы задаете схему кодирования, когда вы открываете файл, следующие функции применяют ту схему: fscanf
, fprintf
, fgetl
, fgets
, fread
и fwrite
.
Для полного списка поддерживаемых схем кодирования и синтаксиса для определения кодирования, смотрите страницу с описанием fopen
.