exponenta event banner

whitespaceBoundary

Сопоставление границы между символами пробела и символами, не являющимися пробелами

Описание

пример

pat = whitespaceBoundary создает образец, соответствующий началу или концу последовательности символов пробела. whitespaceBoundary может быть сведен на нет с помощью ~ оператор. При отрицании ~whitespaceBoundary соответствует границе между любыми двумя символами, за исключением начала или конца пробела.

пример

pat = whitespaceBoundary(type) указывает, должно ли совпадать в начале или в конце пробела. type может быть 'start', 'end', или 'either' (по умолчанию).

Примеры

свернуть все

Использовать whitespaceBoundary для разделения строки вдоль границ пробела. Этот образец соответствует границам между символом пробела и символом, не являющимся пробелом.

Создайте образец, соответствующий всем границам пробела.

txt = "123 abc .?! def 456";
pat = whitespaceBoundary ;

Использовать replace для вставки символов «|» на соответствующих границах.

replace(txt,pat,"|")
ans = 
"123| |abc| |.?!| |def| |456"

Используйте "start" и "end" опции для whitespaceBoundary для соответствия границе между пробелами и символами, не являющимися пробелами.

Создайте строку, содержащую несколько различных типов символов. Создание шаблона, соответствующего любым символам между "end" границы пробелов и "start" граница.

txt = "123 abc .?! def 456";
pat = whitespaceBoundary("end") + wildcardPattern(1,inf) + whitespaceBoundary("start");

Извлеките образец.

boundaries = extract(txt,pat)
boundaries = 3x1 string
    "abc"
    ".?!"
    "def"

Используйте ~ оператор для отрицания whitespaceBoundary. Это соответствует границам между двумя символами, если оба являются символами пробела или ни один из них не является символом пробела.

Создайте строку, содержащую несколько различных типов символов. Создание массива, соответствующего сведенному на нет whitespaceBoundary.

txt = "123 abc .?!";
pat = ~whitespaceBoundary;

Использовать replace вставить "|" символы, чтобы показать, где ~whitespaceBoundary спички.

boundaries = replace(txt,pat,"|")
boundaries = 
"|1|2|3 a|b|c .|?|!|"

Входные аргументы

свернуть все

Тип границы, указанный как 'start', 'end', или 'either'.

Типы данных: char | string

Выходные аргументы

свернуть все

Выражение шаблона, возвращаемое как pattern объект.

Подробнее

свернуть все

Определения

Пробел - это любой символ или последовательность символов, представляющих собой горизонтальное или вертикальное пространство. При визуализации символ пробела не соответствует видимой метке, но обычно занимает область на странице. К общим пробелам относятся:

Значимый пробел

Описание

char(32)

Стандартный пробел, ' '

char(133)

Следующая строка

char(160)

Безразрывное пространство

char(8199)

Фигурное пространство

char(8239)

Узкое безразрывное пространство

Дополнительные сведения см. в разделе Символ пробела.

Представлен в R2020b