isVocabularyWord

Проверяйте, является ли слово представителем встраивания или кодирования слов

Описание

пример

tf = isVocabularyWord(emb,words) проверяет, являются ли элементы words являются представителями слова embedding emb. Функция возвращает логический массив, содержащий 1 (true) где слова являются представителями слова embedding. В другом месте массив содержит 0 (false). Функция по умолчанию чувствительна к регистру.

tf = isVocabularyWord(enc,words) проверяет, являются ли элементы words являются представителями кодировки слов enc. Функция по умолчанию чувствительна к регистру.

tf = isVocabularyWord(___,'IgnoreCase',true) проверяет, находятся ли указанные слова в случае игнорирования словаря, используя любой из предыдущих синтаксисов.

Примеры

свернуть все

Тест, чтобы определить, являются ли слова представителями внедрения слова.

Загрузите предварительно обученное встраивание слова с помощью fastTextWordEmbedding функция. Эта функция требует Text Analytics Toolbox™ Model для fastText English 16 млрд Token Word Embedding пакет поддержки. Если этот пакет поддержки не установлен, то функция предоставляет ссылку на загрузку.

emb = fastTextWordEmbedding
emb = 
  wordEmbedding with properties:

     Dimension: 300
    Vocabulary: [1×999994 string]

Проверяйте, "I" ли слова, "love", и "fastTextWordEmbedding" есть в слове embedding.

words = ["I" "love" "fastTextWordEmbedding"];
tf = isVocabularyWord(emb,words)
tf = 1×3 logical array

   1   1   0

Входные параметры

свернуть все

Вход слова, заданное как wordEmbedding объект.

Вход слова, заданная как wordEncoding объект.

Входы слова, заданные как вектор строки, вектор символов или массив ячеек векторов символов. Если вы задаете words как вектор символов, тогда функция обрабатывает аргумент как одно слово.

Типы данных: string | char | cell

Введенный в R2018b