abbreviations

Таблица простых сокращений

Описание

Сокращения, содержащие периоды, такие как «appt»., «Dr». и «fig»., влияют на обнаружение предложений. addSentenceDetails и addPartOfSpeechDetails функции используют таблицы сокращений для обнаружения контуров предложения. abbreviations функция выводит таблицу по умолчанию, используемую этими функциями. Можно использовать эту таблицу, чтобы помочь создать пользовательские таблицы сокращений для определения поведения обнаружения предложений.

Функция поддерживает английский, японский, немецкий и корейский языки. Японский и корейский аббревиатуры списков пустыми, поскольку в этих языках аббревиатуры обычно не влияют на обнаружение предложений.

пример

tbl = abbreviations возвращает таблицу общих английских сокращений.

пример

tbl = abbreviations('Language',language) задает сокращение язык.

Примеры

свернуть все

Просмотр таблицы сокращений. Можно использовать эту таблицу для обнаружения сокращений и предложений при использовании addSentenceDetails.

tbl = abbreviations;
head(tbl)
ans=8×2 table
    Abbreviation     Usage 
    ____________    _______

       "ATS"        regular
       "Ao"         regular
       "BEF"        regular
       "Ba"         regular
       "Bd"         regular
       "Bi"         regular
       "Bq"         regular
       "Cent"       regular

Просмотр таблицы немецких сокращений. Используйте эту таблицу, чтобы помочь создать пользовательские таблицы сокращений для обнаружения предложений при использовании addSentenceDetails.

tbl = abbreviations('Language','de');
head(tbl)
ans=8×2 table
    Abbreviation     Usage 
    ____________    _______

       "A.T"        regular
       "ABl"        regular
       "Abb"        regular
       "Abdr"       regular
       "Abf"        regular
       "Abfl"       regular
       "Abh"        regular
       "Abk"        regular

Входные параметры

свернуть все

Сокращение, указанный как один из следующих:

  • 'en' - Английский

  • 'ja' - японский

  • 'de' - Немецкий

  • 'ko' - Корейский

Если вы задаете 'ja' или 'ko', затем функция возвращает пустую таблицу. Дополнительные сведения о поддержке языка в Text Analytics Toolbox™ см. в разделе Языковые факторы.

Выходные аргументы

свернуть все

Таблица сокращений. addSentenceDetails и splitSentences функции по умолчанию используют эту таблицу для обнаружения контуров предложения. Эта таблица содержит только сокращения, обычно записываемые с точками.

Таблица имеет две переменные:

  • Abbreviation - Сокращение, заданная как строка

  • Usage - Тип сокращения, заданный как категориальный скаляр

В следующей таблице описаны возможные значения Usage и поведение addSentenceDetails и splitSentences при наблюдении сокращений этих типов.

ИспользованиеПоведениеПример сокращенияПример текстаОбнаруженные предложения
regularЕсли следующее слово является заглавным стартером предложения, то прерывание в конечном периоде. В противном случае не ломайтесь в конечный период.«appt»."Book an appt. We'll meet then."

"Book an appt."

"We'll meet then."

"Book an appt. today.""Book an appt. today."
innerНе ломайтесь после окончания периода.«Доктор»."Dr. Smith.""Dr. Smith."
referenceЕсли следующая лексема не является числом, то прерывание происходит в конечный период. Если следующая лексема является числом, не ломайте его в конечный период.«fig»."See fig. 3.""See fig. 3."
"Try a fig. They are nice."

"Try a fig."

"They are nice."

unitЕсли предыдущее слово является числом, а следующее слово является заглавным стартером предложения, то прерывание в конечном периоде.«в»."The height is 30 in. The width is 10 in."

"The height is 30 in."

"The width is 10 in."

Если предыдущее слово является числом и следующее слово не заглавно, то не ломайтесь в конечный период."The item is 10 in. wide.""The item is 10 in. wide."
Если предыдущее слово не является числом, то ломайте в конечный период."Come in. Sit down."

"Come in."

"Sit down."

Японский и корейский аббревиатуры списков пусты, потому что в этих языках аббревиатуры обычно не влияют на обнаружение предложений

Введенный в R2018a