Подтвердите кластеры в филогенетическом дереве
LeafClusters
= cluster(Tree
, Threshold
)
[LeafClusters
, NodeClusters
]
= cluster(Tree
, Threshold
)
[LeafClusters
, NodeClusters
, Branches
]
= cluster(Tree
, Threshold
)
cluster(..., 'Criterion', CriterionValue
,
...)
cluster(..., 'MaxClust', MaxClustValue
,
...)
cluster(..., 'Distances', DistancesValue
,
...)
Tree | Филогенетический древовидный созданный объект, такой, как создано с |
Threshold | Скаляр, задающий пороговое значение. |
CriterionValue | Вектор символов или строка, задающая критерий, чтобы определить количество кластеров как функция разновидностей попарные расстояния. Выбор:
|
MaxClustValue | Положительное целое число, задающее максимальное количество возможных кластеров для протестированных разделов. Значением по умолчанию является количество листов в дереве. СоветПри использовании СоветПри использовании |
DistancesValue | Матрица попарных расстояний, такой, как возвращено |
LeafClusters | Вектор-столбец, содержащий кластерный индекс для каждой разновидности (лист) в |
NodeClusters | Вектор-столбец, содержащий кластерный индекс для каждой вершины и узла ветви в |
Branches | Матрица 2D столбца, содержащая, для каждого шага в алгоритме, индексе рассматриваемой ветви и значение критерия. Каждая строка соответствует шагу в алгоритме. Первый столбец содержит индексы ветви, и второй столбец содержит значения критерия. СоветПолучить целую кривую критерия по сравнению с количеством кластеров в |
возвращает вектор-столбец, содержащий кластерный индекс для каждой разновидности (лист) в филогенетическом древовидном объекте. Это определяет оптимальное количество кластеров можно следующим образом:LeafClusters
= cluster(Tree
, Threshold
)
Начиная с двух кластеров (k = 2
), выбирает раздел, который оптимизирует критерий, заданный 'Criterion'
свойство
Шаг k 1
и снова выбирает оптимальный раздел
Продолжает постепенно увеличивать k и выбирать оптимальный раздел до значения критерия = Threshold
или k = максимальное количество кластеров (то есть, количество листов)
От всех возможных значений k, выбирает значение k, раздел которого оптимизирует критерий
[
возвращает вектор-столбец, содержащий кластерный индекс для каждой вершины и узла ветви в LeafClusters
, NodeClusters
]
= cluster(Tree
, Threshold
)Tree
.
[
возвращает матрицу 2D столбца, содержащую, для каждого шага в алгоритме, индексе рассматриваемой ветви и значение критерия. Каждая строка соответствует шагу в алгоритме. Первый столбец содержит индексы ветви, и второй столбец содержит значения критерия.LeafClusters
, NodeClusters
, Branches
]
= cluster(Tree
, Threshold
)
кластер (..., '
вызовы PropertyName
', PropertyValue
, ...)cluster
с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Заключите каждый PropertyName
в одинарных кавычках. Каждый PropertyName
является нечувствительным к регистру. Это имя свойства / пары значения свойства как follows:.
cluster(..., 'Criterion',
задает критерий, чтобы определить количество кластеров как функция разновидностей попарные расстояния. CriterionValue
,
...)
cluster(..., 'MaxClust',
задает максимальное количество возможных кластеров для протестированных разделов. Значением по умолчанию является количество листов в дереве.MaxClustValue
,
...)
cluster(..., 'Distances',
заменяет принадлежащими отцам церкви расстояниями в DistancesValue
,
...)Tree
с обеспеченной пользователями попарной матрицей расстояния.
Подтвердите кластеры в филогенетическом дереве:
% Read sequences from a multiple alignment file into a MATLAB % structure gagaa = multialignread('aagag.aln'); % Build a phylogenetic tree from the sequences gag_tree = seqneighjoin(seqpdist(gagaa),'equivar',gagaa); % Validate the clusters in the tree and find the best partition % using the 'gain' criterion [i,j] = cluster(gag_tree,[],'criterion','gain','maxclust',10); % Use the returned vector of indices to color the branches of each % cluster in a plot of the tree h = plot(gag_tree); set(h.BranchLines(j==2),'Color','b') set(h.BranchLines(j==1),'Color','r')
[1] Dudoit, S. и Fridlyan, J. (2002). Основанный на предсказании метод передискретизации для оценки количества кластеров в наборе данных. Биология генома 3 (7), исследование 0036.1–0036.21.
[2] Theodoridis, S. и Koutroumbas, K. (1999). Распознавание образов (Academic Press), стр 434–435.
[3] Кауфман, L. и Rousseeuw, P.J. (1990). Нахождение групп в данных: введение в кластерный анализ (Нью-Йорк, Вайли).
[4] Калинский, R. и Harabasz, J. (1974). Метод дендрита для кластерного анализа. Статистика Commun 3, 1–27.
[5] Хартигэн, J.A. (1985). Статистическая теория в кластеризации. J Классификация 2, 63-76.
cluster
| phytree
| phytreeread
| phytreeviewer
| plot
| seqlinkage
| seqneighjoin
| seqpdist
| silhouette
| view