writeWordEmbedding

Запись файла встраивания слов

Описание

пример

writeWordEmbedding(emb,filename) записывает слово embedding emb в файл filename. Функция записывает словарь в UTF-8 в текстовом формате word2vec.

Примеры

свернуть все

Обучите встраивание слов и запишите их в текстовый файл.

Загрузите данные примера. Файл sonnetsPreprocessed.txt содержит предварительно обработанные версии сонетов Шекспира. Файл содержит по одному сонету на линию со словами, разделенными пространством. Извлеките текст из sonnetsPreprocessed.txtразделите текст на документы в символах новой строки, а затем пометьте его токеном.

filename = "sonnetsPreprocessed.txt";
str = extractFileText(filename);
textData = split(str,newline);
documents = tokenizedDocument(textData);

Обучите встраивание слов с помощью trainWordEmbedding.

emb = trainWordEmbedding(documents)
Training: 100% Loss: 0        Remaining time: 0 hours 0 minutes.
emb = 
  wordEmbedding with properties:

     Dimension: 100
    Vocabulary: [1x401 string]

Запишите встраивание слова в текстовый файл.

filename = "exampleSonnetsEmbedding.vec";
writeWordEmbedding(emb,filename)

Чтение файла встраивания слов с помощью readWordEmbedding.

emb = readWordEmbedding(filename)
emb = 
  wordEmbedding with properties:

     Dimension: 100
    Vocabulary: [1x401 string]

Входные параметры

свернуть все

Вход слова, заданное как wordEmbedding объект.

Имя файла, заданное как строковый скаляр или вектор символов.

Типы данных: string | char

Введенный в R2017b