vaderSentimentScores

Баллы чувства с алгоритмом VADER

Синтаксис

compoundScores = vaderSentimentScores(documents)

[compoundScores,positiveScores,negativeScores,neutralScores] = vaderSentimentScores(documents)

___ = vaderSentimentScores(___,Name,Value)

Описание

Используйте vaderSentimentScores оценивать чувство в маркируемом тексте с Валентностью Осведомленный Словарь и чувство Reasoner (VADER) алгоритм. vaderSentimentScores функционируйте использование, по умолчанию, словарь чувства VADER и списки слов модификатора.

Функция поддерживает английский текст только.

пример

compoundScores = vaderSentimentScores(documents) возвращает музыку чувства к маркируемым документам. Функция вычисляет составные баллы путем агрегации отдельных маркерных баллов, настроенных согласно правилам алгоритма и затем нормированных между-1 и 1. Функция отбрасывает все лексемы с отдельным символом, не существующим в словаре чувства.

[compoundScores,positiveScores,negativeScores,neutralScores] = vaderSentimentScores(documents)также возвращает отношения для пропорций документов, которые положительны, отрицательны, и нейтральны, соответственно.

___ = vaderSentimentScores(___,Name,Value) задает дополнительные опции с помощью одной или нескольких пар "имя-значение".

Примеры

свернуть все

Оцените чувство в тексте

Скрипт Open Live Script

Создайте маркируемый документ.

str = [
    "The book was VERY good!!!!"
    "The book was not very good."];
documents = tokenizedDocument(str);

Оцените чувство маркируемых документов. Баллы близко к 1 указывают на положительное чувство, баллы близко к-1 указывают на отрицательное чувство, и баллы близко к 0 указывают на нейтральное чувство.

compoundScores = vaderSentimentScores(documents)

compoundScores = 2×1

    0.7264
   -0.3865

Входные параметры

свернуть все

`documents` — Введите документы
`tokenizedDocument` массив

Введите документы в виде tokenizedDocument массив.

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'Boosters',["verry" "verrry"] задает, чтобы использовать усилителей "verry" и "verrrry".

`'SentimentLexicon'` — Словарь чувства
таблица

Словарь чувства в виде таблицы со следующими столбцами:

Token – Лексема в виде строкового скаляра.
SentimentScore – Счет чувства лексемы в виде числового скаляра.

При оценке чувства программное обеспечение, по умолчанию, игнорирует лексемы с одним символом и заменяет эмодзи на эквивалентное текстовое описание прежде, чем вычислить баллы чувства. Например, программное обеспечение заменяет экземпляры эмодзи "" с текстом, "усмехающимся поверхность", и затем оценивает баллы чувства. Если вы предоставляете лексемам один символ или эмодзи с соответствующими баллами чувства в SentimentLexicon, затем функция не удаляет или заменяет эти лексемы.

Словарь чувства по умолчанию является словарем чувства VADER.

Типы данных: table

`'Boosters'` — Список слов усилителя или N-грамм
массив строк

Список слов усилителя или N-грамм в виде массива строк.

Функция использует N-граммы усилителя, чтобы повысить чувство продолжающих лексем. Например, слова как "абсолютно" и "удивительно".

Для списка слов список должен быть вектор-столбцом. Для списка N-грамм список имеет размер NumNgrams- maxN , где NumNgrams количество N-грамм и maxN длина самой большой n-граммы. (i,j)элементом th списка является jслово th in-грамма th. Если количество слов в in-грамма th меньше maxN, затем остающиеся записи iстрока th списка пуста.

Список по умолчанию N-грамм усилителя является списком усилителей VADER.

Типы данных: string

`'Dampeners'` — Список слов демпфера или N-грамм
массив строк

Список слов демпфера или N-грамм в виде массива строк.

Функция использует N-граммы демпфера, чтобы ослабить чувство продолжающих лексем. Например, слова как "едва" и "несколько".

Список по умолчанию N-грамм демпфера является списком усилителей VADER.

Типы данных: string

`'Negations'` — Список слов отрицания
массив строк

Список слов отрицания в виде массива строк.

Функция использует слова отрицания, чтобы инвертировать чувство продолжающих лексем. Например, слова как "не" и "не".

Список по умолчанию слов отрицания является списком отрицания VADER.

Типы данных: string

Выходные аргументы

свернуть все

`compoundScores` — Составные баллы чувства
числовой вектор

Составные баллы чувства, возвращенные как числовой вектор. Функция возвращает один счет к каждому входному документу. Значение compoundScores(i) соответствует составному счету чувства documents(i).

Функция решает, что составные баллы вычисляются путем агрегации отдельных маркерных баллов, настраивают их согласно правилам алгоритма VADER, и затем нормируют их между-1 и 1.

`positiveScores` — Положительные баллы чувства
числовой вектор

Положительные баллы чувства, возвращенные как числовой вектор. Функция возвращает один счет к каждому входному документу. Значение positiveScores(i) соответствует положительному счету чувства documents(i).

`negativeScores` — Отрицательные баллы чувства
числовой вектор

Отрицательные баллы чувства, возвращенные как числовой вектор. Функция возвращает один счет к каждому входному документу. Значение negativeScores(i) соответствует отрицательному счету чувства documents(i).

`neutralScores` — Нейтральные баллы чувства
числовой вектор

Нейтральные баллы чувства, возвращенные как числовой вектор. Функция возвращает один счет к каждому входному документу. Значение neutralScores(i) соответствует нейтральному счету чувства documents(i).

Ссылки

[1] Хатто, Клейтон Дж. и Эрик Гильберт. "Вейдер: экономная основанная на правилах модель для анализа мнений текста социальных сетей". На Восьмой международной конференции AAAI по блогам и социальным сетям. 2014.

Документация

vaderSentimentScores

Синтаксис

Описание

Примеры

Оцените чувство в тексте

Входные параметры

`documents` — Введите документы
`tokenizedDocument` массив

Аргументы в виде пар имя-значение

`'SentimentLexicon'` — Словарь чувства
таблица

`'Boosters'` — Список слов усилителя или N-грамм
массив строк

`'Dampeners'` — Список слов демпфера или N-грамм
массив строк

`'Negations'` — Список слов отрицания
массив строк

Выходные аргументы

`compoundScores` — Составные баллы чувства
числовой вектор

`positiveScores` — Положительные баллы чувства
числовой вектор

`negativeScores` — Отрицательные баллы чувства
числовой вектор

`neutralScores` — Нейтральные баллы чувства
числовой вектор

Ссылки

Смотрите также

Темы

Введенный в R2019b

Документация Text Analytics Toolbox

Поддержка

Документация

vaderSentimentScores

Синтаксис

Описание

Примеры

Оцените чувство в тексте

Входные параметры

documents — Введите документы tokenizedDocument массив

Аргументы в виде пар имя-значение

'SentimentLexicon' — Словарь чувства таблица

'Boosters' — Список слов усилителя или N-грамм массив строк

'Dampeners' — Список слов демпфера или N-грамм массив строк

'Negations' — Список слов отрицания массив строк

Выходные аргументы

compoundScores — Составные баллы чувства числовой вектор

positiveScores — Положительные баллы чувства числовой вектор

negativeScores — Отрицательные баллы чувства числовой вектор

neutralScores — Нейтральные баллы чувства числовой вектор

Ссылки

Смотрите также

Темы

Введенный в R2019b

Документация Text Analytics Toolbox

Поддержка

`documents` — Введите документы
`tokenizedDocument` массив

`'SentimentLexicon'` — Словарь чувства
таблица

`'Boosters'` — Список слов усилителя или N-грамм
массив строк

`'Dampeners'` — Список слов демпфера или N-грамм
массив строк

`'Negations'` — Список слов отрицания
массив строк

`compoundScores` — Составные баллы чувства
числовой вектор

`positiveScores` — Положительные баллы чувства
числовой вектор

`negativeScores` — Отрицательные баллы чувства
числовой вектор

`neutralScores` — Нейтральные баллы чувства
числовой вектор