vec2word

Сопоставьте вектор встраивания с словом

Описание

пример

words = vec2word(emb,M) возвращает ближайшие слова к векторам встраивания в строки M.

пример

[words,dist] = vec2word(emb,M) возвращает ближайшие слова к векторам встраивания в M, и возвращает расстояния dist каждого в свои исходные векторы.

пример

___ = vec2word(emb,M,k) возвращает верхний k ближайшие слова.

пример

___ = vec2word(___,'Distance',distance) задает метрику расстояния.

Примеры

свернуть все

Загрузите предварительно обученное встраивание слов с помощью fastTextWordEmbedding. Эта функция требует Text Analytics Toolbox™ Model для fastText English 16 млрд Token Word Embedding пакет поддержки. Если этот пакет поддержки не установлен, то функция предоставляет ссылку на загрузку.

emb = fastTextWordEmbedding
emb = 
  wordEmbedding with properties:

     Dimension: 300
    Vocabulary: [1×1000000 string]

Сопоставьте слова «Италия», «Рим» и «Париж» с векторами, использующими word2vec.

italy = word2vec(emb,"Italy");
rome = word2vec(emb,"Rome");
paris = word2vec(emb,"Paris");

Сопоставьте векторные italy - rome + paris к слову, использующему vec2word.

word = vec2word(emb,italy - rome + paris)
word = 
"France"

Найдите пять лучших ближайших слов к вектору встраивания слов и их расстояниям.

Загрузите предварительно обученное встраивание слов с помощью fastTextWordEmbedding. Эта функция требует Text Analytics Toolbox™ Model для fastText English 16 млрд Token Word Embedding пакет поддержки. Если этот пакет поддержки не установлен, то функция предоставляет ссылку на загрузку.

emb = fastTextWordEmbedding;

Сопоставьте слова «Италия», «Рим» и «Париж» с векторами, использующими word2vec.

italy = word2vec(emb,"Italy");
rome = word2vec(emb,"Rome");
paris = word2vec(emb,"Paris");

Сопоставьте векторные italy - rome + paris к слову, использующему vec2word. Найдите пять лучших ближайших слов с помощью метрики Евклидова расстояния.

k = 5;
M = italy - rome + paris;
[words,dist] = vec2word(emb,M,k,'Distance','euclidean');

Постройте график слов и расстояний в столбчатой диаграмме.

figure;
bar(dist)
xticklabels(words)
xlabel("Word")
ylabel("Distance")
title("Distances to Vector")

Входные параметры

свернуть все

Вход слова, заданное как wordEmbedding объект.

Векторы встраивания слов, заданные как матрица. Каждая строка M - вектор встраивания слов. M должно иметь emb.Dimension столбцы.

Количество ближайших слов для возврата, заданное как положительное целое число.

Метрика расстояния, заданная как 'cosine' или 'euclidean'.

Выходные аргументы

свернуть все

Выходные слова, возвращенные как строковый вектор.

Расстояние слов до их исходных векторов, возвращаемое как вектор.

Введенный в R2017b