exponenta event banner

writeWordEmbedding

Запись файла встраивания слов

Описание

пример

writeWordEmbedding(emb,filename) записывает слово встраивание emb в файл filename. Функция записывает словарь в UTF-8 в текстовом формате word2vec.

Примеры

свернуть все

Обучение встраиванию слова и запись его в текстовый файл.

Загрузите данные примера. Файл sonnetsPreprocessed.txt содержит предварительно обработанные версии сонетов Шекспира. Файл содержит один сонет на строку со словами, разделенными пробелом. Извлечь текст из sonnetsPreprocessed.txtразделите текст на документы с новыми символами, а затем пометьте документы.

filename = "sonnetsPreprocessed.txt";
str = extractFileText(filename);
textData = split(str,newline);
documents = tokenizedDocument(textData);

Обучение встраиванию слов с помощью trainWordEmbedding.

emb = trainWordEmbedding(documents)
Training: 100% Loss: 0        Remaining time: 0 hours 0 minutes.
emb = 
  wordEmbedding with properties:

     Dimension: 100
    Vocabulary: [1x401 string]

Запишите слово встраивание в текстовый файл.

filename = "exampleSonnetsEmbedding.vec";
writeWordEmbedding(emb,filename)

Прочитайте слово embedding file с помощью readWordEmbedding.

emb = readWordEmbedding(filename)
emb = 
  wordEmbedding with properties:

     Dimension: 100
    Vocabulary: [1x401 string]

Входные аргументы

свернуть все

Встраивание входного слова, указанное как wordEmbedding объект.

Имя файла, указанное как строковый скалярный или символьный вектор.

Типы данных: string | char

Представлен в R2017b