exponenta event banner

readWordEmbedding

Чтение слова встраивания из файла

Описание

пример

emb = readWordEmbedding(filename) считывает предварительно подготовленное вложение слов, сохраненное в текстовом файле или zip-файле filename. Входной файл должен быть текстовым файлом с кодировкой UTF-8 в формате внедрения текста word2vec или GloVe, или zip-файлом, содержащим текстовый файл этого формата.

Если файл встраивания слов содержит повторяющиеся слова, то программа использует вектор слов, соответствующий последней повторяющейся записи.

Примеры

свернуть все

Прочитайте пример встраивания слов. Эта модель была получена путем анализа текста из Википедии.

filename = "exampleWordEmbedding.vec";
emb = readWordEmbedding(filename)
emb = 
  wordEmbedding with properties:

     Dimension: 50
    Vocabulary: [1x9999 string]

Узнайте о встраивании слов с помощью word2vec и vec2word.

king = word2vec(emb,"king");
man = word2vec(emb,"man");
woman = word2vec(emb,"woman");
word = vec2word(emb,king - man + woman)
word = 
"queen"

Входные аргументы

свернуть все

Имя файла, указанное как строковый скалярный или символьный вектор.

Типы данных: string | char

Выходные аргументы

свернуть все

Встраивание выходного слова, возвращаемое как wordEmbedding объект.

Представлен в R2017b