readWordEmbedding

Чтение встраивания слова из файла

Описание

пример

emb = readWordEmbedding(filename) считывает предварительно обученное встраивание слов, сохраненное в текстовом файле или zip-файле filename. Входным файлом должен быть текстовый файл с UTF-8 кодировкой в формате word2vec или GloVe text embedding или zip-файл, содержащий текстовый файл этого формата.

Если файл встраивания слова содержит повторяющиеся слова, то программа использует вектор слова, соответствующий последней повторяющейся записи.

Примеры

свернуть все

Прочитайте пример встраивания слова. Эта модель была выведена путем анализа текста из Википедии.

filename = "exampleWordEmbedding.vec";
emb = readWordEmbedding(filename)
emb = 
  wordEmbedding with properties:

     Dimension: 50
    Vocabulary: [1x9999 string]

Исследуйте встраивание слов с помощью word2vec и vec2word.

king = word2vec(emb,"king");
man = word2vec(emb,"man");
woman = word2vec(emb,"woman");
word = vec2word(emb,king - man + woman)
word = 
"queen"

Входные параметры

свернуть все

Имя файла, заданное как строковый скаляр или вектор символов.

Типы данных: string | char

Выходные аргументы

свернуть все

Выход слова embedding, возвращенный как wordEmbedding объект.

Введенный в R2017b