Оцените перевод или суммирование с счетом подобия ROUGE
Ориентированный на отзыв алгоритм оценки дублеров для гистинговой оценки (ROUGE) оценивает сходство между документом-кандидатом и набором ссылки документов. Используйте счет ROUGE для оценки качества моделей перевода и суммирования документов.
возвращает счет ROUGE между указанным документом-кандидатом и ссылкой документами. Функция по умолчанию вычисляет перекрытия unigram между score
= rougeEvaluationScore(candidate
,references
)candidate
и references
. Это также известно как метрика ROUGE-N с длиной n-грамм 1. Для получения дополнительной информации смотрите Счет ROUGE.
задает дополнительные опции, используя одну или несколько пары "имя-значение".score
= rougeEvaluationScore(candidate
,references
,Name,Value
)
Задайте документ-кандидат как tokenizedDocument
объект.
str = "the fast brown fox jumped over the lazy dog";
candidate = tokenizedDocument(str)
candidate = tokenizedDocument: 9 tokens: the fast brown fox jumped over the lazy dog
Задайте ссылочные документы как tokenizedDocument
массив.
str = [ "the quick brown animal jumped over the lazy dog" "the quick brown fox jumped over the lazy dog"]; references = tokenizedDocument(str)
references = 2x1 tokenizedDocument: 9 tokens: the quick brown animal jumped over the lazy dog 9 tokens: the quick brown fox jumped over the lazy dog
Вычислите счет ROUGE между документом-кандидатом и документами- ссылку.
score = rougeEvaluationScore(candidate,references)
score = 0.8889
Задайте документ-кандидат как tokenizedDocument
объект.
str = "a simple summary document containing some words";
candidate = tokenizedDocument(str)
candidate = tokenizedDocument: 7 tokens: a simple summary document containing some words
Задайте ссылочные документы как tokenizedDocument
массив.
str = [ "a simple document" "another document with some words"]; references = tokenizedDocument(str)
references = 2x1 tokenizedDocument: 3 tokens: a simple document 5 tokens: another document with some words
Рассчитать счет ROUGE между документом-кандидатом и ссылочными документами можно используя опции по умолчанию.
score = rougeEvaluationScore(candidate,references)
score = 1
The rougeEvaluationScore
функция по умолчанию сравнивает перекрывания unigram (с одним маркером) между документом-кандидатом и ссылкой документами. Поскольку счет ROUGE является мерой, основанной на отзыве, если один из ссылочных документов составлен полностью из униграмм, которые появляются в документе-кандидате, полученный счет ROUGE равен единице. В этом сценарии выход rougeEvaluationScore
функция неинформативна.
Для более значимого результата вычислите счет ROUGE снова с помощью биграмм путем установки 'NgramLength'
опция для 2
. Получившийся счет меньше единицы, поскольку каждый ссылочный документ содержит биграммы, которые не появляются в документе кандидата.
score = rougeEvaluationScore(candidate,references,'NgramLength',2)
score = 0.5000
candidate
- Документ кандидатаtokenizedDocument
скалярный | строковые массивы | массив ячеек из векторов символовДокумент кандидата, заданный как tokenizedDocument
скаляр, строковые массивы или массив ячеек из векторов символов. Если candidate
не является tokenizedDocument
скаляром, тогда это должно быть вектор-строка, представляющее один документ, где каждый элемент является словом.
references
- Справочные документыtokenizedDocument
массив | строковые массивы | массивов ячеек из векторов символовСправочные документы, заданные как tokenizedDocument
массив, строковые массивы или массив ячеек из векторов символов. Если references
не является tokenizedDocument
Массив это должно быть вектор-строка, представляющее один документ, где каждый элемент является словом. Для анализа по нескольким ссылочным документам используйте tokenizedDocument
массив.
Задайте необязательные разделенные разделенными запятой парами Name,Value
аргументы. Name
- имя аргумента и Value
- соответствующее значение. Name
должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN
.
scores = rougeEvaluationScore(candidate,references,'ROUGEMethod','weighted-subsequences')
задает использование метода ROUGE взвешенных подпоследовательностей.'ROUGEMethod'
- МЕТОД ROUGE'n-grams'
(по умолчанию) | 'longest-common-subsequences'
| 'weighted-subsequences'
| 'skip-bigrams'
| 'skip-bigrams-and-unigrams'
Метод ROUGE, заданный как разделенная разделенными запятой парами, состоящая из 'ROUGEMethod'
и одно из следующих:
'n-grams'
- Оцените счет ROUGE с помощью n-граммовых перекрытий между документом-кандидатом и ссылкой документами. Это также известно как метрика ROUGE-N.
'longest-common-subsequences'
- Оцените счет ROUGE с помощью статистики самой длинной общей подпоследовательности (LCS). Это также известно как метрика ROUGE-L.
'weighted-subsequences'
- Оцените счет ROUGE, используя взвешенную самую длинную статистику общей подпоследовательности. Этот метод благоприятствует последовательным LCS. Это также известно как метрика ROUGE-W.
'skip-bigrams'
- Оцените счет ROUGE, используя статистику сопутствующих событий скип-биграммы (любая пара слов в порядке предложения). Это также известно как метрика ROUGE-S.
'skip-bigrams-and-unigrams'
- Оцените счет ROUGE с помощью статистики сопутствующих явлений скип-биграммы и униграммы. Это также известно как метрика ROUGE-SU.
'NgramLength'
- Длина N-граммаДлина N-грамма, используемая для 'n-grams'
МЕТОД ROUGE (ROUGE-N), заданный как разделенная разделенными запятой парами, состоящая из 'NgramLength'
и положительное целое число.
Если на 'ROUGEMethod'
опция не 'n-grams'
, затем 'NgramLength'
опция не влияет.
Совет
Если самый длинный документ в references
имеет меньше, чем NgramLength
слова, тогда получившийся счет ROUGE NaN
. Если candidate
имеет меньше, чем NgramLength
слова, тогда результирующий счет ROUGE равен нулю. Чтобы гарантировать, что rougeEvaluationScore
возвращает ненулевые счета для очень коротких документов, задает NgramLength
в положительное целое число, меньше длины candidate
и длина самого длинного документа в references
.
Типы данных: single
| double
| int8
| int16
| int32
| int64
| uint8
| uint16
| uint32
| uint64
'SkipDistance'
- Пропустить расстояниеПропустите расстояние, используемое для 'skip-bigrams'
и 'skip-bigrams-and-unigrams'
МЕТОДЫ ROUGE (ROUGE-S и ROUGE-SU), заданные как разделенная разделенными запятой парами, состоящая из 'SkipDistance'
и положительное целое число.
Если на 'ROUGEMethod'
опция не 'skip-bigrams'
или 'skip-bigrams-and-unigrams'
, затем 'SkipDistance'
опция не влияет.
Типы данных: single
| double
| int8
| int16
| int32
| int64
| uint8
| uint16
| uint32
| uint64
score
- ОЦЕНКА ROUGEROUGE счета, возвращается как скалярное значение в область значений [0,1] или NaN
.
Счет ROUGE, близкая к нулю, указывает на плохое сходство между candidate
и references
. Счет ROUGE, близкая к единице, указывает на сильное сходство между candidate
и references
. Если candidate
идентичен одному из ссылочных документов, затем score
равен 1. Если candidate
и references
оба являются пустыми документами, тогда получившийся счет ROUGE равен NaN
.
Совет
Если самый длинный документ в references
имеет меньше, чем NgramLength
слова, тогда получившийся счет ROUGE NaN
. Если candidate
имеет меньше, чем NgramLength
слова, тогда результирующий счет ROUGE равен нулю. Чтобы гарантировать, что rougeEvaluationScore
возвращает ненулевые счета для очень коротких документов, задает NgramLength
в положительное целое число, меньше длины candidate
и длина самого длинного документа в references
.
Ориентированный на Recall-Oriented дублер для оценки гистинга (ROUGE) алгоритм оценки [1] вычисляет сходство между документом-кандидатом и набором ссылки документов. Используйте счет ROUGE для оценки качества моделей перевода и суммирования документов.
Учитывая n длины n-граммов, метрика ROUGE-N между документом-кандидатом и одним справочным документом задается как
где элементы ri являются предложениями в ссылку документе, количество раз, когда заданный n-грамм встречается в документе-кандидате, и numNgrams(ri) количество n-граммов в заданном ri ссылочного предложения.
Для наборов нескольких ссылочных документов метрика ROUGE-N задается как
Чтобы использовать метрику ROUGE-N, установите 'ROUGEMethod'
опция для 'n-grams'
.
Учитывая предложение и s предложения, где элементы si соответствовать словам, подпоследовательность является общей подпоследовательностью d и s, если для и , где элементами s являются слова предложения, а k - длина подпоследовательности. Подпоследовательность является самой длинной общей подпоследовательностью (LCS), если k длины подпоследовательности является максимальным.
Учитывая документ кандидата и один справочный документ, объединение самых длинных общих подпоследовательностей задается как
где - набор самых длинных общих подпоследовательностей в документе-кандидате и предложение, ri из ссылочного документа.
Метрика ROUGE-L является показателем F-балла. Чтобы вычислить его, сначала вычислите счета отзыва и точности, заданные
Затем метрика ROUGE-L между документом-кандидатом и одним справочным документом задается мерой F-score
где параметр управляет относительной важностью точности и отзыва. Потому что счет ROUGE предпочитает вспоминать, обычно устанавливается на высокое значение.
Для наборов нескольких ссылочных документов метрика ROUGE-L задается как
Чтобы использовать метрику ROUGE-L, установите 'ROUGEMethod'
опция для 'longest-common-subsequences'
.
Учитывая функцию взвешивания f такую что f имеет свойство, f(x+y)>f(x)+f(y) для любых положительных целых чисел x и y, задайте - длина самых длинных последовательных совпадений, встречающихся в документе-кандидате, и один ссылочный документ, оцененный функцией взвешивания f. Для получения дополнительной информации о вычислении этого значения см. [1].
ROUGE-W является метрикой, заданной мерой F-балла, которая требует отзыва и точности счетов, заданных
Метрика ROUGE-W между документом-кандидатом и одним справочным документом задается мерой F-score
где параметр управляет относительной важностью точности и отзыва. Потому что счет ROUGE предпочитает вспоминать, обычно устанавливается на высокое значение.
Для нескольких ссылочных документов метрика ROUGE-W задается как
Чтобы использовать метрику ROUGE-W, установите 'ROUGEMethod'
опция для 'weighted-longest-common-subsequences'
.
Скип-биграмма - это упорядоченная пара слов в предложении, допускающая произвольные погрешности между ними. То есть, учитывая предложение из документа-кандидата, где элементы cij соответствовать словам в предложении, паре слов является скип-биграммой, если.
Метрика ROUGE-S является показателем F-балла. Чтобы вычислить его, сначала вычислите счета отзыва и точности, заданные
где элементами ri и ci являются предложения в ссылку документе и документе-кандидате, соответственно, количество раз, когда указанная скип-биграмма возникает в документе-кандидате, и numSkipBigrams(s) количество скип-биграмм в s предложений.
Затем метрика ROUGE-S между документом-кандидатом и одним справочным документом задается мерой F-балла
Для наборов нескольких ссылочных документов метрика ROUGE-S задается как
Чтобы использовать метрику ROUGE-S, установите 'ROUGEMethod'
опция для 'skip-bigrams'
.
Чтобы также включить статистику сопутствующих явлений unigram в метрику ROUGE-S, введите счетчики unigram в счета отзыва и точности для ROUGE-S. Это эквивалентно включению лексем в кандидат и справочные документы, поскольку
где Count(unigram,candidate) количество раз, когда указанная unigram появляется в документе кандидата, и и обозначает ссылочное предложение и документ-кандидат, дополненный стартовыми лексемами, соответственно.
Для наборов нескольких ссылочных документов метрика ROUGE-SU задается как
где - ссылочный документ с предложениями, дополненными стартовыми лексемами.
Чтобы использовать метрику ROUGE-SU, установите 'ROUGEMethod'
опция для 'skip-bigrams-and-unigrams'
.
[1] Лин, Чин-Ю. «Rouge: пакет для автоматической оценки сводных данных». В Text Summarization Branches Out, стр. 74-81. 2004.
bleuEvaluationScore
| bm25Similarity
| cosineSimilarity
| extractSummary
| lexrankScores
| mmrScores
| textrankScores
| tokenizedDocument
У вас есть измененная версия этого примера. Вы хотите открыть этот пример с вашими правками?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.