exponenta event banner

isVocabularyWord

Проверка, является ли слово элементом встраивания или кодирования слов

Описание

пример

tf = isVocabularyWord(emb,words) проверяет, если элементы words являются членами вложенного слова emb. Функция возвращает логический массив, содержащий 1 (true), где слова являются членами встраивания слова. В другом месте массив содержит 0 (false). Функция по умолчанию чувствительна к регистру.

tf = isVocabularyWord(enc,words) проверяет, если элементы words являются членами кодировки слова enc. Функция по умолчанию чувствительна к регистру.

tf = isVocabularyWord(___,'IgnoreCase',true) проверяет, находятся ли указанные слова в словаре, игнорируя регистр, используя любой из предыдущих синтаксисов.

Примеры

свернуть все

Проверьте, являются ли слова элементами встраивания слов.

Загрузите предварительно подготовленное вложение слов с помощью fastTextWordEmbedding функция. Для выполнения этой функции требуется модель Text Analytics Toolbox™ для пакета поддержки внедрения Token Word на английском языке на 16 миллиардов. Если этот пакет поддержки не установлен, функция предоставляет ссылку для загрузки.

emb = fastTextWordEmbedding
emb = 
  wordEmbedding with properties:

     Dimension: 300
    Vocabulary: [1×999994 string]

Проверка слов "I", "love", и "fastTextWordEmbedding" находятся в слове встраивание.

words = ["I" "love" "fastTextWordEmbedding"];
tf = isVocabularyWord(emb,words)
tf = 1×3 logical array

   1   1   0

Входные аргументы

свернуть все

Встраивание входного слова, указанное как wordEmbedding объект.

Кодировка входного слова, указанная как wordEncoding объект.

Входные слова, указанные как строковый вектор, символьный вектор или массив ячеек символьных векторов. При указании words как символьный вектор, то функция рассматривает аргумент как одно слово.

Типы данных: string | char | cell

Представлен в R2018b