Вычислите попарное расстояние между последовательностями
D = seqpdist(Seqs)
D = seqpdist(Seqs,
...'PropertyName', PropertyValue,
...)
D = seqpdist(Seqs,
...'Method', MethodValue, ...)
D = seqpdist(Seqs,
...'Indels', IndelsValue, ...)
D = seqpdist(Seqs,
...'OptArgs', OptArgsValue, ...)
D = seqpdist(Seqs,
...'PairwiseAlignment', PairwiseAlignmentValue,
...)
D = seqpdist(Seqs,
...'UseParallel', UseParallelValue, ...)
D = seqpdist(Seqs,
...'SquareForm', SquareFormValue ...)
D = seqpdist(Seqs,
...'Alphabet', AlphabetValue, ...)
D = seqpdist(Seqs,
...'ScoringMatrix', ScoringMatrixValue, ...)
D = seqpdist(Seqs,
...'Scale', ScaleValue, ...)
D = seqpdist(Seqs,
...'GapOpen', GapOpenValue, ...)
D = seqpdist(Seqs,
...'ExtendGap', ExtendGapValue, ...)
Seqs | Любое следующее:
|
MethodValue | Вектор символов или строка, которая задает метод, чтобы вычислить попарные расстояния. Значением по умолчанию является 'Jukes-Cantor'. |
IndelsValue | Вектор символов или строка, которая задает, как обработать сайты с разрывами. Значением по умолчанию является 'score'. |
OptArgsValue | Вектор символов или массив ячеек, который задает один или несколько входных параметров, требуемых или принятых методом расстояния, заданным Method свойство. |
PairwiseAlignmentValue | Управляет глобальным попарным выравниванием входных последовательностей (использующий nwalign функция), при игнорировании нескольких выравнивание входных последовательностей (если таковые имеются). Выбором является true или false. Значение по умолчанию:
СоветЕсли ваши входные последовательности являются той же длиной,
|
UseParallelValue | Управляет расчетом попарных расстояний с помощью parfor- циклы. Когда true, и Parallel Computing Toolbox™ установлен и parpool открыто, расчет происходит параллельно. Если нет никакого открытого parpool, но автоматическое создание включено в Параллельных Настройках, пул по умолчанию будет автоматически открыт, и расчет происходит параллельно. Если Parallel Computing Toolbox установлен, но нет никакого открытого parpool и автоматическое создание отключено, затем расчет использует parfor- циклы в последовательном режиме. Если Parallel Computing Toolbox не установлен, то расчет использует parfor- циклы в последовательном режиме. Значением по умолчанию является false, который использует циклы for в последовательном режиме. |
SquareFormValue | Управляет преобразованием выхода в квадратную матрицу. Выбором является |
AlphabetValue | Вектор символов или строка, задающая тип последовательности (нуклеотид или аминокислота). Выбором является 'NT' или 'AA' (значение по умолчанию). |
ScoringMatrixValue | Любое из следующего:
ПримечаниеЕсли необходимо скомпилировать |
ScaleValue | Положительное значение, которое задает масштабный коэффициент, раньше возвращало счет в произвольных модулях. Если выигрывающая матричная информация также обеспечивает масштабный коэффициент, то оба используются. |
GapOpenValue | Положительное целое число, которое задает штраф за открытие разрыва в выравнивании. Значением по умолчанию является 8. |
ExtendedGapValue | Положительное целое число, которое задает штраф за расширение разрыва. Значение по умолчанию равно GapOpenValue. |
D | Вектор, который содержит биологические расстояния между каждой парой последовательностей, сохраненных в M элементы Seqs. |
возвращает D = seqpdist(Seqs)D, вектор, содержащий биологические расстояния между каждой парой последовательностей, сохранен в M последовательности Seqs, массив ячеек последовательностей, вектор структур, или матрица или последовательности.
D1- (M*(M-1)/2) вектор-строка, соответствующий M*(M-1)/2 пары последовательностей в Seqs. Выход располагается в порядке D((2,1),(3,1),..., (M,1),(3,2),...(M,2),...(M,M-1)). Это - нижний левый треугольник полного M- M матрица расстояния. Получить расстояние между Ith и Jпоследовательности th для I > J, используйте формулу D((J-1)*(M-J/2)+I-J).
вызовы D = seqpdist(Seqs,
...'PropertyName', PropertyValue,
...)seqpdist с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Задайте одно или несколько свойств в любом порядке. Заключите каждый PropertyName в одинарных кавычках. Каждый PropertyName является нечувствительным к регистру. Это имя свойства / пары значения свойства следующие:
задает метод, чтобы вычислить расстояния между каждой парой последовательности. Выбор показывают в следующих таблицах.D = seqpdist(Seqs,
...'Method', MethodValue, ...)
Методы для нуклеотидов и аминокислот
| Метод | Описание |
|---|---|
p-distance | Пропорция сайтов, на которых эти две последовательности отличаются. p близко к 1 для плохо связанных последовательностей и p близко к 0 для подобных последовательностей.d = p |
Jukes-Cantor (значение по умолчанию) | Оценка наибольшего правдоподобия количества замен между двумя последовательностями. Для нуклеотидов: Для аминокислот: |
alignment-score | Расстояние (d) между двумя последовательностями (1, 2) вычисляется из попарного счета выравнивания между этими двумя последовательностями (score12), и попарное выравнивание выигрывает между каждой последовательностью и им (score11, score22) можно следующим образом:d = (1-score12/score11)* (1-score12/score22) d = 0 |
Методы без выигрыша разрывов (только нуклеотиды)
| Метод | Описание |
|---|---|
Tajima-Nei | Оценка наибольшего правдоподобия, рассматривая фоновые частоты нуклеотида. Это может быть вычислено из входных последовательностей или дано установкой OptArgs к [gA gC gG gT]. gA, gC, gG> скалярные значения для частот нуклеотида. |
Kimura | Рассматривает отдельно переходную замену нуклеотида и transversional замену нуклеотида. |
Tamura | Рассматривает отдельно переходную замену нуклеотида, transversional замену нуклеотида и содержимое GC. Содержимое GC может быть вычислено из входных последовательностей или дано установкой OptArgs к пропорции содержимого GC (скалярное значение от 0 к 1). |
Hasegawa | Рассматривает отдельно переходную замену нуклеотида, transversional замену нуклеотида и фоновые частоты нуклеотида. Фоновые частоты могут быть вычислены из входных последовательностей или даны путем установки OptArgs свойство к [gA gC gG gT]. |
Nei-Tamura | Рассматривает отдельно переходную замену нуклеотида между пуринами, переходную замену нуклеотида между пиримидинами, transversional замену нуклеотида и фоновые частоты нуклеотида. Фоновые частоты могут быть вычислены из входных последовательностей или даны путем установки OptArgs свойство к [gA gC gG gT]. |
Методы без выигрыша разрывов (только аминокислоты)
| Метод | Описание |
|---|---|
Poisson | Принимает, что количество замен аминокислоты на каждом сайте имеет распределение Пуассона. |
Gamma | Принимает, что количество замен аминокислоты на каждом сайте имеет Гамма распределение параметром a. Установите a использование OptArgs свойство. Значением по умолчанию является 2. |
Можно также задать пользовательскую функцию расстояния использование @, например, @distfun. Функция расстояния должна иметь форму:
function D = distfun(S1, S2, OptArgsValue)
distfun функционируйте берет следующие аргументы:
S1 S2 — Две последовательности той же длины (нуклеотид или аминокислота).
OptArgsValue — Дополнительные зависимые проблемой аргументы.
distfun функция возвращает скаляр, который представляет расстояние между S1 и S2.
задает, как обработать сайты с разрывами. Выбор:D = seqpdist(Seqs,
...'Indels', IndelsValue, ...)
score (значение по умолчанию) — Баллы эти сайты или как точечная мутация или параметрами выравнивания, в зависимости от метода выбраны.
pairwise-del — Для каждого попарного сравнения это игнорирует сайты с разрывами.
complete-del — Игнорирует все столбцы в нескольких выравнивание, которые содержат разрыв. Эта опция доступна, только если вы обеспечили выравнивание кратного как вход Seqs.
передачи один или несколько аргументов, требуемых или принятых методом расстояния, заданы D = seqpdist(Seqs,
...'OptArgs', OptArgsValue, ...)Method свойство. Используйте вектор символов или массив ячеек, чтобы передать один или несколько входных параметров. Например, обеспечьте частоты нуклеотида для Tajima-Nei метод расстояния, вместо того, чтобы вычислить их из входных последовательностей.
управляет глобальным попарным выравниванием входных последовательностей (использующий D = seqpdist(Seqs,
...'PairwiseAlignment', PairwiseAlignmentValue,
...)nwalign функция), при игнорировании нескольких выравнивание входных последовательностей (если таковые имеются). Значение по умолчанию:
true — Когда все входные последовательности не имеют той же длины.
false — Когда все входные последовательности имеют ту же длину.
Если ваши входные последовательности имеют ту же длину, seqpdist принимает, что они выравниваются. Если они не выравниваются, выполнить одно из следующих действий:
Выровняйте последовательности прежде, чем передать их seqpdist, например, использование multialign функция.
Установите PairwiseAlignment к true при использовании seqpdist.
задает, использовать ли D = seqpdist(Seqs,
...'UseParallel', UseParallelValue, ...)parfor- циклы при вычислении попарных расстояний. Когда true, и Parallel Computing Toolbox установлен и parpool открыто, расчет происходит параллельно. Если нет никакого открытого parpool, но автоматическое создание включено в Параллельных Настройках, пул по умолчанию будет автоматически открыт, и расчет происходит параллельно. Если Parallel Computing Toolbox установлен, но нет никакого открытого parpool и автоматическое создание отключено, затем расчет использует parfor- циклы в последовательном режиме. Если Parallel Computing Toolbox не установлен, то расчет использует parfor- циклы в последовательном режиме. Значением по умолчанию является false, который использует циклы for в последовательном режиме.
управляет преобразованием выхода в квадратную матрицу, таким образом что D = seqpdist(Seqs,
...'SquareForm', SquareFormValue ...) обозначает расстояние между DiJ)Ith и Jпоследовательности th. Квадратная матрица симметрична и имеет нулевую диагональ. Выбором является true или false (значение по умолчанию). Установка Squareform к true совпадает с использованием squareform функция в Statistics and Machine Learning Toolbox™.
задает тип последовательности (нуклеотид или аминокислота). Выбором является D = seqpdist(Seqs,
...'Alphabet', AlphabetValue, ...)'NT' или 'AA' (значение по умолчанию).
Остающиеся входные свойства доступны когда Method свойство равняется 'alignment-score' или PairwiseAlignment свойство равняется true.
задает матрицу выигрыша, чтобы использовать в глобальном попарном выравнивании. Значение по умолчанию:D = seqpdist(Seqs,
...'ScoringMatrix', ScoringMatrixValue, ...)
'NUC44' — Когда AlphabetValue равняется 'NT'.
'BLOSUM50' — Когда AlphabetValue равняется 'AA'.
указывает, что масштабный коэффициент раньше возвращал счет в произвольных модулях. Выбором является любое положительное значение. Если выигрывающая матричная информация также обеспечивает масштабный коэффициент, то оба используются.D = seqpdist(Seqs,
...'Scale', ScaleValue, ...)
задает штраф за открытие разрыва в выравнивании. Выбором является любое положительное целое число. Значением по умолчанию является D = seqpdist(Seqs,
...'GapOpen', GapOpenValue, ...)8.
задает штраф за расширение разрыва в выравнивании. Выбором является любое положительное целое число. Значение по умолчанию равно D = seqpdist(Seqs,
...'ExtendGap', ExtendGapValue, ...)GapOpenValue.
Считайте данные о выравнивании аминокислоты в структуру MATLAB.
seqs = fastaread('pf00002.fa');Для каждой возможной пары последовательностей в нескольких выравнивание проигнорируйте сайты с разрывами и счет с выигрывающим матричным PAM250.
dist = seqpdist(seqs,'Method','alignment-score',...
'Indels','pairwise-delete',...
'ScoringMatrix','pam250');Обеспечьте перестройку каждой пары последовательности игнорирование обеспеченного несколько выравнивание.
dist = seqpdist(seqs,'Method','alignment-score',...
'Indels','pairwise-delete',...
'ScoringMatrix','pam250',...
'PairwiseAlignment',true);Измерьте Jukes-Cantor попарные расстояния после перестройки каждой пары последовательности, считая разрывы как точечные мутации.
dist = seqpdist(seqs,'Method','jukes-cantor',...
'Indels','score',...
'Scoringmatrix','pam250',...
'PairwiseAlignment',true);