Создайте массив входных документов.
Создайте модель пакета слов из входных документов.
bag =
bagOfWords with properties:
Counts: [6x17 double]
Vocabulary: [1x17 string]
NumWords: 17
NumDocuments: 6
Создайте массив документов запроса.
queries =
2x1 tokenizedDocument:
8 tokens: a brown fox leaped over the lazy dog
6 tokens: another fox leaped over the dog
Вычислите оценки MMR. Выходной сигнал является разреженной матрицей.
Визуализация показателей MMR в тепловой карте.
Теперь вычислите баллы еще раз и установите значение лямбда равным 0,01. Когда лямбда-значение близко к 0, избыточные документы дают более низкие баллы и разнообразные (но менее релевантные для запросов) документы дают более высокие баллы.
Визуализация показателей MMR в тепловой карте.
Наконец, вычислите баллы еще раз и установите лямбда значение 1. Когда лямбда-значение равно 1, релевантные для запроса документы дают более высокие баллы, несмотря на то, что другие документы дают высокие баллы.
Визуализация показателей MMR в тепловой карте.