exponenta event banner

word2vec

Сопоставить слово с вектором встраивания

Описание

пример

M = word2vec(emb,words) возвращает векторы внедрения words во вложении emb. Если слово отсутствует в словаре вложения, то функция возвращает строку из NaNs. Функция по умолчанию чувствительна к регистру.

M = word2vec(emb,words,'IgnoreCase',true) возвращает векторы внедрения words игнорирование регистра с использованием любого из предыдущих синтаксисов. Если несколько слов во вложении различаются только в случае, то функция возвращает вектор, соответствующий одному из них, и не возвращает какой-либо конкретный вектор.

Примеры

свернуть все

Загрузить предварительно подготовленное вложение слов с помощью fastTextWordEmbedding. Для выполнения этой функции требуется модель Text Analytics Toolbox™ для пакета поддержки внедрения Token Word на английском языке на 16 миллиардов. Если этот пакет поддержки не установлен, функция предоставляет ссылку для загрузки.

emb = fastTextWordEmbedding
emb = 
  wordEmbedding with properties:

     Dimension: 300
    Vocabulary: [1×1000000 string]

Отображение слов «Италия», «Рим» и «Париж» на векторы с использованием word2vec.

italy = word2vec(emb,"Italy");
rome = word2vec(emb,"Rome");
paris = word2vec(emb,"Paris");

Отображение вектора italy - rome + paris к слову, использующему vec2word.

word = vec2word(emb,italy - rome + paris)
word = 
"France"

Входные аргументы

свернуть все

Встраивание входного слова, указанное как wordEmbedding объект.

Входные слова, указанные как строковый вектор, символьный вектор или массив ячеек символьных векторов. При указании words как символьный вектор, то функция рассматривает аргумент как одно слово.

Типы данных: string | char | cell

Выходные аргументы

свернуть все

Матрица векторов встраивания слов.

Представлен в R2017b