Обновите код, чтобы принять строки

В R2016b MATLAB ® ввел массивы строк в качестве типа данных для текста. С R2018b года все продукты ^MathWorks ® совместимы со строковыми массивами. Совместимость означает, что если можно указать текст как символьный вектор или массив ячеек символьных векторов, то можно также указать его как строковый массив. Теперь можно использовать массивы строк в качестве текстового типа данных в собственном коде.

При написании кода для других пользователей MATLAB необходимо обновить API, чтобы принять массивы строк, сохраняя обратную совместимость с другими типами текстовых данных. Принятие строк приводит код в соответствие с продуктами MathWorks.

Если у кода мало зависимостей или вы разрабатываете новый код, попробуйте использовать массивы строк в качестве основного типа текстовых данных для повышения производительности. В этом случае рекомендуется записать или обновить API, чтобы принять входные аргументы, которые являются символьными векторами, массивами ячеек символьных векторов или строковыми массивами.

Определения строкового массива и других терминов см. в разделе Терминология для символьных и строковых массивов.

Что такое массивы строк?

В MATLAB текстовые данные можно хранить двумя способами. Одним из способов является использование символьного массива, который является последовательностью символов, так же как числовой массив является последовательностью чисел. Или, начиная с R2016b, другим способом является сохранение последовательности символов в строке. В массиве строк можно хранить несколько строк. Дополнительные сведения см. в разделе Символы и строки.

Как использовать массивы строк в старых API-интерфейсах

Можно использовать строки в старых API, принимая массивы строк в качестве входных аргументов, а затем преобразовывая их в символьные векторы или массивы ячеек символьных векторов. Если такое преобразование выполняется в начале функции, то не нужно обновлять остальную ее часть.

convertStringsToChars функция обеспечивает способ обработки всех входных аргументов, преобразуя только те аргументы, которые являются строковыми массивами. Чтобы разрешить существующему коду принимать массивы строк в качестве входных данных, добавьте вызов convertStringsToChars в начале ваших функций и методов.

Например, если определена функция myFunc который принимает три входных аргумента, обрабатывает все три ввода, используя convertStringsToChars. Оставь остальную часть кода неизменной.

function y = myFunc(a,b,c)
    [a,b,c] = convertStringsToChars(a,b,c);
    <line 1 of original code>
    <line 2 of original code>
    ...

В этом примере аргументы [a,b,c] перезаписать имеющиеся входные аргументы. Если какой-либо входной аргумент не является строковым массивом, он не изменяется.

Если myFunc принимает переменное количество входных аргументов, затем обрабатывает все аргументы, указанные varargin.

function y = myFunc(varargin)
    [varargin{:}] = convertStringsToChars(varargin{:});
    ...

Соображения по производительности

convertStringsToChars функция более эффективна при преобразовании одного входного аргумента. Если функция чувствительна к производительности, то можно преобразовывать входные аргументы по одному, оставляя остальную часть кода неизменной.

function y = myFunc(a,b,c)
    a = convertStringsToChars(a);
    b = convertStringsToChars(b);
    c = convertStringsToChars(c);
    ...

Как поддерживать совместимость в новом коде

При написании нового кода или изменении кода для использования массивов строк в качестве основного типа текстовых данных необходимо поддерживать обратную совместимость с другими типами текстовых данных. В качестве входных аргументов можно принять символьные векторы или массивы ячеек символьных векторов, а затем немедленно преобразовать их в строковые массивы. Если такое преобразование выполняется в начале функции, то остальная часть кода может использовать только массивы строк.

convertCharsToStrings функция обеспечивает способ обработки всех входных аргументов, преобразуя только те аргументы, которые являются символьными векторами или массивами ячеек символьных векторов. Чтобы новый код мог принимать эти текстовые типы данных в качестве входных данных, добавьте вызов convertCharsToStrings в начале ваших функций и методов.

Например, если определена функция myFunc который принимает три входных аргумента, обрабатывает все три ввода, используя convertCharsToStrings.

function y = myFunc(a,b,c)
    [a,b,c] = convertCharsToStrings(a,b,c);
    <line 1 of original code>
    <line 2 of original code>
    ...

В этом примере аргументы [a,b,c] перезаписать имеющиеся входные аргументы. Если какой-либо входной аргумент не является символьным вектором или массивом ячеек символьных векторов, то он не изменяется.

function y = myFunc(varargin)
    [varargin{:}] = convertCharsToStrings(varargin{:});
    ...

Соображения по производительности

convertCharsToStrings функция более эффективна при преобразовании одного входного аргумента. Если функция чувствительна к производительности, то можно преобразовывать входные аргументы по одному, оставляя остальную часть кода неизменной.

function y = myFunc(a,b,c)
    a = convertCharsToStrings(a);
    b = convertCharsToStrings(b);
    c = convertCharsToStrings(c);
    ...

Как вручную преобразовать входные аргументы

Если это вообще возможно, избегайте ручного преобразования входных аргументов, содержащих текст, и вместо этого используйте convertStringsToChars или convertCharsToStrings функции. Проверять типы данных входных аргументов и преобразовывать их самостоятельно - утомительный подход, склонный к ошибкам.

Если необходимо преобразовать входные аргументы, используйте функции в этой таблице.

Преобразование	Функция
Строковый скаляр для символьного вектора	`char`
Строковый массив к массиву ячеек символьных векторов	`cellstr`
Вектор символов в строковый скаляр	`string`
Массив ячеек векторов символов в строковый массив	`string`

Проверка типов данных аргументов

Чтобы проверить тип данных входного аргумента, который может содержать текст, попробуйте использовать шаблоны, показанные в этой таблице.

Требуемый тип входного аргумента	Старый чек	Новый чек
Вектор символов или строковый скаляр	`ischar(X)`	`ischar(X) \|\| isStringScalar(X)`
Вектор символов или строковый скаляр	`ischar(X)`	`validateattributes(X,{'char','string'},{'scalartext'})`
Вектор символов или строковый скаляр	`validateattributes(X,{'char'},{'row'})`	`validateattributes(X,{'char','string'},{'scalartext'})`
Непустой вектор символов или строковый скаляр	`ischar(X) && ~isempty(X)`	`(ischar(X) \|\| isStringScalar(X)) && strlength(X) ~= 0`
Непустой вектор символов или строковый скаляр	`ischar(X) && ~isempty(X)`	`(ischar(X) \|\| isStringScalar(X)) && X ~= ""`
Массив ячеек символьных векторов или строкового массива	`iscellstr(X)`	`iscellstr(X) \|\| isstring(X)`
Любой текстовый тип данных	`ischar(X) \|\| iscellstr(X)`	`ischar(X) \|\| iscellstr(X) \|\| isstring(X)`

Проверка пустых строк

Пустая строка - это строка без символов. MATLAB отображает пустую строку как пару двойных кавычек, между которыми нет ничего (""). Однако пустая строка по-прежнему является строковым массивом 1 на 1. Это не пустой массив.

Рекомендуемым способом проверки пустости строки является использование strlength функция.

str = "";
tf = (strlength(str) ~= 0)

Примечание

Не используйте isempty для проверки пустой строки. Пустая строка не содержит символов, но по-прежнему является строковым массивом 1 на 1.

strlength функция возвращает длину каждой строки в строковом массиве. Если строка должна быть скалярной и не пустой, проверьте оба условия.

tf = (isStringScalar(str) && strlength(str) ~= 0)

Если str может быть либо символьным вектором, либо строковым скаляром, то вы все еще можете использовать strlength для определения его длины. strlength прибыль 0 если входной аргумент является пустым символьным вектором ('').

tf = ((ischar(str) || isStringScalar(str)) && strlength(str) ~= 0)

Проверка пустых массивов строк

Пустой строковый массив фактически является пустым массивом, то есть массивом, имеющим по крайней мере одно измерение, длина которого равна0.

Рекомендуемый способ создания пустого строкового массива: strings функция, указание 0 в качестве, по меньшей мере, одного из входных аргументов. isempty функция возвращает 1 если входные данные представляют собой пустой строковый массив.

str = strings(0);
tf = isempty(str)

strlength функция возвращает числовой массив того же размера, что и массив входной строки. Если вход является пустым строковым массивом, то strlength возвращает пустой массив.

str = strings(0);
L = strlength(str)

Проверка отсутствующих строк

Массивы строк также могут содержать отсутствующие строки. Отсутствующая строка является строкой, эквивалентной NaN для числовых массивов. Указывает, где строковый массив имеет отсутствующие значения. Отсутствующая строка отображается как <missing>, без кавычек.

Отсутствующие строки можно создать с помощью missing функция. Рекомендуемый способ проверки отсутствующих строк - использование ismissing функция.

str = string(missing);
tf = ismissing(str)

Примечание

Не проверяйте отсутствующие строки, сравнивая строку с отсутствующей строкой.

Отсутствующая строка не равна самой себе. NaN не равен самому себе.

str = string(missing);
f = (str == missing)

Терминология для символьных и строковых массивов

В документации MathWorks эти термины используются для описания символьных и строковых массивов. Для обеспечения согласованности используйте эти термины в собственной документации, сообщениях об ошибках и предупреждениях.

Символьный вектор - 1около-n массив символов, типа данных char.
Символьный массив - mоколо-n массив символов, типа данных char.
Массив ячеек символьных векторов - массив ячеек, в котором каждая ячейка содержит символьный вектор.
Строковый или строковый скаляр - 1около-1 строковый массив. Строковый скаляр может содержать 1около-n последовательность символов, но сама по себе является одним объектом. Используйте термины «строковый скаляр» и «символьный вектор» рядом друг с другом, если говорить точно о размере и типе данных. В противном случае в описаниях можно использовать термин «строка».
Строковый вектор - 1около-n или nоколо-1 строковый массив. Если возможен только один размер, используйте его в описании. Например, используйте "1около-n string array "для описания массива такого размера.
Строковый массив - mоколо-n строковый массив.
Пустая строка - скаляр строки, не содержащий символов.
Пустой строковый массив - строковый массив по крайней мере с одним измерением, размер которого равен 0.
Отсутствующая строка - скаляр строки, являющийся отсутствующим значением (отображается как <missing>).

См. также

Документация