exponenta event banner

сокращения

Таблица общих сокращений

Описание

Сокращения, содержащие периоды, такие как «appt»., «Dr». и «fig»., влияют на обнаружение предложений. addSentenceDetails и addPartOfSpeechDetails функции используют таблицы сокращений для определения границ предложений. abbreviations выводит таблицу по умолчанию, используемую этими функциями. Эту таблицу можно использовать для создания пользовательских таблиц сокращений для определения поведения обнаружения предложений.

Функция поддерживает английский, японский, немецкий и корейский языки. Японские и корейские списки сокращений пусты, поскольку в этих языках сокращения обычно не влияют на обнаружение предложений.

пример

tbl = abbreviations возвращает таблицу общих английских сокращений.

пример

tbl = abbreviations('Language',language) задает язык сокращения.

Примеры

свернуть все

Просмотр таблицы сокращений. Эту таблицу можно использовать для обнаружения сокращений и предложений при использовании addSentenceDetails.

tbl = abbreviations;
head(tbl)
ans=8×2 table
    Abbreviation     Usage 
    ____________    _______

       "ATS"        regular
       "Ao"         regular
       "BEF"        regular
       "Ba"         regular
       "Bd"         regular
       "Bi"         regular
       "Bq"         regular
       "Cent"       regular

Просмотр таблицы сокращений на немецком языке. Эта таблица используется для создания пользовательских таблиц сокращений для обнаружения предложений при использовании addSentenceDetails.

tbl = abbreviations('Language','de');
head(tbl)
ans=8×2 table
    Abbreviation     Usage 
    ____________    _______

       "A.T"        regular
       "ABl"        regular
       "Abb"        regular
       "Abdr"       regular
       "Abf"        regular
       "Abfl"       regular
       "Abh"        regular
       "Abk"        regular

Входные аргументы

свернуть все

Язык сокращения, указанный как одно из следующих:

  • 'en' - английский

  • 'ja' - японский язык

  • 'de' - немецкий язык

  • 'ko' - корейский

При указании 'ja' или 'ko', то функция возвращает пустую таблицу. Дополнительные сведения о языковой поддержке в Toolbox™ Text Analytics см. в разделе Языковые рекомендации.

Выходные аргументы

свернуть все

Таблица сокращений. addSentenceDetails и splitSentences по умолчанию эта таблица используется для определения границ предложений. Эта таблица содержит только сокращения, обычно записываемые с точками.

Таблица содержит две переменные:

  • Abbreviation - Сокращение, указанное как строка

  • Usage - Тип аббревиатуры, определяемый как категориальный скаляр

В следующей таблице описаны возможные значения Usage и поведение addSentenceDetails и splitSentences при соблюдении аббревиатур этих типов.

ИспользованиеПоведениеПример сокращенияПример текстаОбнаруженные предложения
regularЕсли следующее слово является стартером предложения с заглавной буквы, то делитесь на конец периода. В противном случае не делайте перерыв в конечном периоде.«appt.»"Book an appt. We'll meet then."

"Book an appt."

"We'll meet then."

"Book an appt. today.""Book an appt. today."
innerНе прерывать после завершающего периода.«Доктор»."Dr. Smith.""Dr. Smith."
referenceЕсли следующий маркер не является числом, то разрыв выполняется в конечном периоде. Если следующий маркер является числом, то не делайте перерыв в конечном периоде.«рис»."See fig. 3.""See fig. 3."
"Try a fig. They are nice."

"Try a fig."

"They are nice."

unitЕсли предыдущее слово является числом, а следующее слово является начальным предложением с заглавной буквы, то следует прерваться в завершающем периоде.«в»."The height is 30 in. The width is 10 in."

"The height is 30 in."

"The width is 10 in."

Если предыдущее слово является числом, а следующее слово не заглавно, то не делайте разрыв в завершающем периоде."The item is 10 in. wide.""The item is 10 in. wide."
Если предыдущее слово не является числом, то разрыв выполняется в конце периода."Come in. Sit down."

"Come in."

"Sit down."

Японские и корейские списки сокращений пусты, поскольку в этих языках сокращения обычно не влияют на обнаружение предложений

Представлен в R2018a