lexrankScores

Документ, выигрывающий с алгоритмом LexRank

Синтаксис

scores = lexrankScores(documents)

scores = lexrankScores(bag)

Описание

scores = lexrankScores(documents) баллы заданные документы для важности согласно попарным значениям подобия с помощью алгоритма LexRank. Функция использует подобие косинуса и вычисляет важность с помощью алгоритма PageRank.

пример

scores = lexrankScores(bag) документы баллов закодированы сумкой слов или мешком n модели граммов.

Примеры

свернуть все

Важность документов

Скрипт Open Live Script

Создайте массив маркируемых документов.

str = [
    "the quick brown fox jumped over the lazy dog"
    "the fast brown fox jumped over the lazy dog"
    "the lazy dog sat there and did nothing"
    "the other animals sat there watching"];
documents = tokenizedDocument(str)

documents = 
  4x1 tokenizedDocument:

    9 tokens: the quick brown fox jumped over the lazy dog
    9 tokens: the fast brown fox jumped over the lazy dog
    8 tokens: the lazy dog sat there and did nothing
    6 tokens: the other animals sat there watching

Вычислите их баллы LexRank.

scores = lexrankScores(documents);

Визуализируйте баллы в столбчатой диаграмме.

figure
bar(scores)
xlabel("Document")
ylabel("Score")
title("LexRank Scores")

Figure contains an axes. The axes with title LexRank Scores contains an object of type bar.

Баллы Используя модель сумки слов

Скрипт Open Live Script

Создайте модель сумки слов из текстовых данных в sonnets.csv.

filename = "sonnets.csv";
tbl = readtable(filename,'TextType','string');
textData = tbl.Sonnet;
documents = tokenizedDocument(textData);
bag = bagOfWords(documents)

bag = 
  bagOfWords with properties:

          Counts: [154x3527 double]
      Vocabulary: [1x3527 string]
        NumWords: 3527
    NumDocuments: 154

Вычислите музыку LexRank к каждому сонету.

scores = lexrankScores(bag);

Визуализируйте баллы в столбчатой диаграмме.

figure
bar(scores)
xlabel("Document")
ylabel("Score")
title("LexRank Scores")

Figure contains an axes. The axes with title LexRank Scores contains an object of type bar.

Входные параметры

свернуть все

`documents` — Введите документы
`tokenizedDocument` массив | массив строк слов | массив ячеек из символьных векторов

Введите документы в виде tokenizedDocument массив, массив строк слов или массив ячеек из символьных векторов. Если documents не tokenizedDocument массив, затем это должен быть вектор-строка, представляющий единый документ, где каждым элементом является слово. Чтобы задать несколько документов, используйте tokenizedDocument массив.

`bag` — Модель Input
`bagOfWords` возразите | `bagOfNgrams` объект

Введите сумку слов или мешок n модели граммов в виде bagOfWords возразите или bagOfNgrams объект. Если bag bagOfNgrams объект, затем функция обрабатывает каждую n-грамму как отдельное слово.

Выходные аргументы

свернуть все

`scores` — Баллы LexRank
вектор

Баллы LexRank, возвращенные как N-by-1 вектор, где scores(i) соответствует счету к ith вводят документ, и N является количеством входных документов.

Ссылки

[1] Erkan, Günes и Драгомир Р. Радев. "Lexrank: основанная на графике лексическая центрированность как выпуклость в текстовом резюмировании". Журнал исследования искусственного интеллекта 22 (2004): 457-479.

Темы

Перевод от последовательности к последовательности Используя внимание

Введенный в R2020a

Документация

lexrankScores

Синтаксис

Описание

Примеры

Важность документов

Баллы Используя модель сумки слов

Входные параметры

`documents` — Введите документы
`tokenizedDocument` массив | массив строк слов | массив ячеек из символьных векторов

`bag` — Модель Input
`bagOfWords` возразите | `bagOfNgrams` объект

Выходные аргументы

`scores` — Баллы LexRank
вектор

Ссылки

Смотрите также

Темы

Документация Text Analytics Toolbox

Поддержка

Документация

lexrankScores

Синтаксис

Описание

Примеры

Важность документов

Баллы Используя модель сумки слов

Входные параметры

documents — Введите документы tokenizedDocument массив | массив строк слов | массив ячеек из символьных векторов

bag — Модель Input bagOfWords возразите | bagOfNgrams объект

Выходные аргументы

scores — Баллы LexRank вектор

Ссылки

Смотрите также

Темы

Документация Text Analytics Toolbox

Поддержка

`documents` — Введите документы
`tokenizedDocument` массив | массив строк слов | массив ячеек из символьных векторов

`bag` — Модель Input
`bagOfWords` возразите | `bagOfNgrams` объект

`scores` — Баллы LexRank
вектор