Общие черты документа с подобием косинуса
возвращает попарные общие черты косинуса для заданных документов с помощью tf-idf матрицы, выведенной из их подсчетов слов. Счет в similarities
= cosineSimilarity(documents
)similarities(i,j)
представляет подобие между documents(i)
и documents(j)
.
возвращает общие черты между similarities
= cosineSimilarity(documents
,queries
)documents
и queries
использование tf-idf матрицы выведено из подсчетов слов в documents
. Счет в similarities(i,j)
представляет подобие между documents(i)
и queries(j)
.
возвращает попарные общие черты для документов, закодированных заданной сумкой слов или мешком n модели граммов использование tf-idf матрицы, выведенной из подсчетов слов в similarities
= cosineSimilarity(bag
)bag
. Счет в similarities(i,j)
представляет подобие между i
th и j
документы th закодированы bag
.
возвращает общие черты между документами, закодированными сумкой слов или мешком n модели similarities
= cosineSimilarity(bag
,queries
)bag
граммов и
queries
использование tf-idf матрицы выведено из подсчетов слов в bag
. Счет в similarities(i,j)
представляет подобие между i
документ th закодирован bag
и queries(j)
.
возвращает общие черты для данных, закодированных в векторах-строках из матричного similarities
= cosineSimilarity(M
)M
. Счет в similarities(i,j)
представляет подобие между M(i,:)
и M(j,:)
.
возвращает общие черты между документами, закодированными в матрицах similarities
= cosineSimilarity(M1,M2)M1
и M2
. Счет в similarities(i,j)
соответствует подобию между M1(i,:)
и M2(j,:)
.
tokenizedDocument
| bleuEvaluationScore
| rougeEvaluationScore
| bm25Similarity
| textrankScores
| lexrankScores
| mmrScores
| extractSummary