ratioSentimentScores

Баллы чувства с правилом отношения

Описание

Использование ratioSentimentScores оценивать чувство в маркируемом тексте с правилом отношения. ratioSentimentScores функция, по умолчанию, использует словарь чувства VADER.

пример

compoundScores = ratioSentimentScores(documents) возвращает музыку чувства к маркируемым документам на основе отношения положительных и отрицательных лексем. Для каждого документа, где отношение положительного счета к отрицательному счету больше, чем 1, функция возвращается 1. Для каждого документа, где отношение отрицательного счета к положительному счету больше, чем 1, функция возвращается-1. В противном случае функция возвращается 0.

[compoundScores,positiveScores,negativeScores] = ratioSentimentScores(documents) также возвращает суммы положительного и отрицательного маркерного множества документов соответственно.

пример

___ = ratioSentimentScores(___,Name,Value) задает дополнительные опции с помощью одной или нескольких пар "имя-значение".

Примеры

свернуть все

Создайте маркируемый документ.

str = [
    "The book was VERY good!!!!"
    "The book was terrible."];
documents = tokenizedDocument(str); 

Оцените чувство маркируемых документов. Счет 1 указывает на положительное чувство, счет-1 указывает на отрицательное чувство, и счет 0 указывает на нейтральное чувство.

compoundScores = ratioSentimentScores(documents)
compoundScores = 2×1

     1
    -1

Алгоритмы анализа мнений используют аннотируемые списки названных словарей чувства слов. Например, ratioSentimentScores функционируйте использует словарь чувства со словами, аннотируемыми счетом чувства в пределах от-1 к 1, где баллы близко к 1 указывают на сильное положительное чувство, баллы близко к-1 указывают на сильное отрицательное чувство, и баллы близко к нулю указывают на нейтральное чувство.

Если словарь чувства используется ratioSentimentScores функция не удовлетворяет данным, которые вы анализируете, например, если у вас есть проблемно-ориентированный набор данных как медицинские или технические данные, затем можно использовать собственный словарь чувства. Для примера, показывающего, как сгенерировать зависящий от домена словарь чувства, смотрите, Генерируют Зависящий от домена Словарь Чувства.

Создайте маркируемый массив документа, содержащий текстовые данные, чтобы анализировать.

textData = [ 
    "This company is showing extremely strong growth."
    "This other company is accused of misleading consumers."];
documents = tokenizedDocument(textData);

Загрузите пример зависящий от домена словарь для финансовых данных.

filename = "financeSentimentLexicon.csv";
tbl = readtable(filename);
head(tbl)
ans=8×2 table
         Token         SentimentScore
    _______________    ______________

    {'innovative' }             1    
    {'efficiency' }       0.91852    
    {'strong'     }       0.82362    
    {'efficiently'}       0.81475    
    {'creative'   }       0.74264    
    {'enhance'    }       0.73791    
    {'innovations'}       0.72985    
    {'improved'   }       0.71476    

Оцените чувство с помощью ratioSentimentScores функционируйте и задайте пользовательский словарь чувства с помощью 'SentimentLexicon' опция. Счет 1 указывает на положительное чувство, счет-1 указывает на отрицательное чувство, и счет 0 указывает на нейтральное чувство.

compoundScores = ratioSentimentScores(documents,'SentimentLexicon',tbl)
compoundScores = 2×1

     1
    -1

Входные параметры

свернуть все

Введите документы в виде tokenizedDocument массив.

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: Threshold,0.5 устанавливает порог отношения к 0,5

Словарь чувства в виде таблицы со следующими столбцами:

  • Token – Лексема в виде строкового скаляра.

  • SentimentScore – Счет чувства лексемы в виде числового скаляра.

Словарь чувства по умолчанию является словарем чувства VADER.

Типы данных: table

Порог отношения в виде неотрицательного скаляра.

Если отношение положительного счета к отрицательному счету documents(i) больше, чем Threshold, затем compoundScores(i) 1. Если отношение отрицательного счета к положительному счету documents(i) больше, чем Threshold, затем compoundScores(i) -1. В противном случае, compoundScores(i) 0.

Типы данных: single | double | int8 | int16 | int32 | int64 | uint8 | uint16 | uint32 | uint64

Выходные аргументы

свернуть все

Составные баллы чувства, возвращенные как числовой вектор. Функция возвращает один счет к каждому входному документу.

Если отношение положительного счета к отрицательному счету documents(i) больше, чем Threshold, затем compoundScores(i) 1. Если отношение отрицательного счета к положительному счету documents(i) больше, чем Threshold, затем compoundScores(i) -1. В противном случае, compoundScores(i) 0.

Положительные баллы чувства, возвращенные как числовой вектор. Функция возвращает один счет к каждому входному документу. Значение positiveScores(i) соответствует положительному счету чувства documents(i).

Отрицательные баллы чувства, возвращенные как числовой вектор. Функция возвращает один счет к каждому входному документу. Значение negativeScores(i) соответствует отрицательному счету чувства documents(i).

Введенный в R2019b