Вычислите попарное расстояние между последовательностями
D
= seqpdist(Seqs
)
D
= seqpdist(Seqs
,
...'PropertyName
', PropertyValue
,
...)
D
= seqpdist(Seqs
,
...'Method', MethodValue
, ...)
D
= seqpdist(Seqs
,
...'Indels', IndelsValue
, ...)
D
= seqpdist(Seqs
,
...'OptArgs', OptArgsValue
, ...)
D
= seqpdist(Seqs
,
...'PairwiseAlignment', PairwiseAlignmentValue
,
...)
D
= seqpdist(Seqs
,
...'UseParallel', UseParallelValue
, ...)
D
= seqpdist(Seqs
,
...'SquareForm', SquareFormValue
...)
D
= seqpdist(Seqs
,
...'Alphabet', AlphabetValue
, ...)
D
= seqpdist(Seqs
,
...'ScoringMatrix', ScoringMatrixValue
, ...)
D
= seqpdist(Seqs
,
...'Scale', ScaleValue
, ...)
D
= seqpdist(Seqs
,
...'GapOpen', GapOpenValue
, ...)
D
= seqpdist(Seqs
,
...'ExtendGap', ExtendGapValue
, ...)
Seqs | Любое следующее:
|
MethodValue | Вектор символов или строка, которая задает метод, чтобы вычислить попарные расстояния. Значением по умолчанию является 'Jukes-Cantor' . |
IndelsValue | Вектор символов или строка, которая задает, как обработать сайты с разрывами. Значением по умолчанию является 'score' . |
OptArgsValue | Вектор символов или массив ячеек, который задает один или несколько входных параметров, требуемых или принятых методом расстояния, заданным Method свойство. |
PairwiseAlignmentValue | Управляет глобальным попарным выравниванием входных последовательностей (использующий nwalign функция), при игнорировании нескольких выравнивание входных последовательностей (если таковые имеются). Выбором является true или false . Значение по умолчанию:
Совет Если ваши входные последовательности являются той же длиной,
|
UseParallelValue | Управляет вычислением попарного использования расстояний parfor - циклы. Когда true , и Parallel Computing Toolbox™ установлен и parpool открыто, расчет происходит параллельно. Если нет никакого открытого parpool , но автоматическое создание включено в Параллельных Настройках, пул по умолчанию будет автоматически открыт, и расчет происходит параллельно. Если Parallel Computing Toolbox установлен, но нет никакого открытого parpool и автоматическое создание отключено, затем расчет использует parfor - циклы в последовательном режиме. Если Parallel Computing Toolbox не установлен, то расчет использует parfor - циклы в последовательном режиме. Значением по умолчанию является false , который использует циклы for в последовательном режиме. |
SquareFormValue | Управляет преобразованием выхода в квадратную матрицу. Выбором является |
AlphabetValue | Вектор символов или строка, задающая тип последовательности (нуклеотид или аминокислота). Выбором является 'NT' или 'AA' (значение по умолчанию). |
ScoringMatrixValue | Любое из следующего:
Примечание Если необходимо скомпилировать |
ScaleValue | Положительное значение, которое задает масштабный коэффициент, раньше возвращало счет в произвольных модулях. Если выигрывающая матричная информация также обеспечивает масштабный коэффициент, то оба используются. |
GapOpenValue | Положительное целое число, которое задает штраф за открытие разрыва в выравнивании. Значением по умолчанию является 8 . |
ExtendedGapValue | Положительное целое число, которое задает штраф за расширение разрыва. Значение по умолчанию равно GapOpenValue . |
D | Вектор, который содержит биологические расстояния между каждой парой последовательностей, сохраненных в M элементы Seqs . |
возвращает D
= seqpdist(Seqs
)D
, вектор, содержащий биологические расстояния между каждой парой последовательностей, сохранен в M
последовательности Seqs
, массив ячеек последовательностей, вектор из структур, или матрица или последовательности.
D
1
- (M*(M-1)/2)
вектор-строка, соответствующий M*(M-1)/2
пары последовательностей в Seqs
. Выход
располагается в порядке D
((2,1),(3,1),..., (M,1),(3,2),...(M,2),...(M,M-1))
. Это - нижний левый треугольник полного M
- M
матрица расстояния. Получить расстояние между I
th и J
последовательности th для I > J
, используйте формулу D((J-1)*(M-J/2)+I-J)
.
вызовы D
= seqpdist(Seqs
,
...'PropertyName
', PropertyValue
,
...)seqpdist
с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Задайте одно или несколько свойств в любом порядке. Заключите каждый PropertyName
в одинарных кавычках. Каждый PropertyName
является нечувствительным к регистру. Это имя свойства / пары значения свойства следующие:
задает метод, чтобы вычислить расстояния между каждой парой последовательности. Выбор показывают в следующих таблицах.D
= seqpdist(Seqs
,
...'Method', MethodValue
, ...)
Методы для нуклеотидов и аминокислот
Метод | Описание |
---|---|
p-distance | Пропорция сайтов, на которых эти две последовательности отличаются. p близко к 1 для плохо связанных последовательностей и p близко к 0 для подобных последовательностей.d = p |
Jukes-Cantor (значение по умолчанию) | Оценка наибольшего правдоподобия количества замен между двумя последовательностями. Для нуклеотидов:
Для аминокислот:
|
alignment-score | Расстояние (d ) между двумя последовательностями (1, 2 ) вычисляется из попарного счета выравнивания между этими двумя последовательностями (score12 ), и попарное выравнивание выигрывает между каждой последовательностью и им (score11 , score22 ) можно следующим образом:d = (1-score12/score11)* (1-score12/score22) d = 0 |
Методы без выигрыша разрывов (только нуклеотиды)
Метод | Описание |
---|---|
Tajima-Nei | Оценка наибольшего правдоподобия, рассматривая фоновые частоты нуклеотида. Это может быть вычислено из входных последовательностей или дано установкой OptArgs к [gA gC gG gT] . gA , gC , gG > скалярные значения для частот нуклеотида. |
Kimura | Рассматривает отдельно переходную замену нуклеотида и transversional замену нуклеотида. |
Tamura | Рассматривает отдельно переходную замену нуклеотида, transversional замену нуклеотида и содержимое GC. Содержимое GC может быть вычислено из входных последовательностей или дано установкой OptArgs к пропорции содержимого GC (скалярное значение от 0 к 1 ). |
Hasegawa | Рассматривает отдельно переходную замену нуклеотида, transversional замену нуклеотида и фоновые частоты нуклеотида. Фоновые частоты могут быть вычислены из входных последовательностей или даны путем установки OptArgs свойство к [gA gC gG gT] . |
Nei-Tamura | Рассматривает отдельно переходную замену нуклеотида между пуринами, переходную замену нуклеотида между пиримидинами, transversional замену нуклеотида и фоновые частоты нуклеотида. Фоновые частоты могут быть вычислены из входных последовательностей или даны путем установки OptArgs свойство к [gA gC gG gT] . |
Методы без выигрыша разрывов (только аминокислоты)
Метод | Описание |
---|---|
Poisson | Принимает, что количество замен аминокислоты на каждом сайте имеет распределение Пуассона. |
Gamma | Принимает, что количество замен аминокислоты на каждом сайте имеет Гамма распределение параметром a . Установите a использование OptArgs свойство. Значением по умолчанию является 2 . |
Можно также задать пользовательскую функцию расстояния использование @
, например, @distfun
. Функция расстояния должна иметь форму:
function D = distfun(S1, S2, OptArgsValue)
distfun
функционируйте берет следующие аргументы:
S1
S2
— Две последовательности той же длины (нуклеотид или аминокислота).
OptArgsValue
— Дополнительные зависимые проблемой аргументы.
distfun
функция возвращает скаляр, который представляет расстояние между S1
и S2
.
задает, как обработать сайты с разрывами. Выбор:D
= seqpdist(Seqs
,
...'Indels', IndelsValue
, ...)
score
(значение по умолчанию) — Баллы эти сайты или как точечная мутация или параметрами выравнивания, в зависимости от метода выбраны.
pairwise-del
— Для каждого попарного сравнения это игнорирует сайты с разрывами.
complete-del
— Игнорирует все столбцы в нескольких выравнивание, которые содержат разрыв. Эта опция доступна, только если вы обеспечили выравнивание кратного как вход Seqs
.
передачи один или несколько аргументов, требуемых или принятых методом расстояния, заданы D
= seqpdist(Seqs
,
...'OptArgs', OptArgsValue
, ...)Method
свойство. Используйте вектор символов или массив ячеек, чтобы передать один или несколько входных параметров. Например, обеспечьте частоты нуклеотида для Tajima-Nei
метод расстояния, вместо того, чтобы вычислить их из входных последовательностей.
управляет глобальным попарным выравниванием входных последовательностей (использующий D
= seqpdist(Seqs
,
...'PairwiseAlignment', PairwiseAlignmentValue
,
...)nwalign
функция), при игнорировании нескольких выравнивание входных последовательностей (если таковые имеются). Значение по умолчанию:
true
— Когда все входные последовательности не имеют той же длины.
false
— Когда все входные последовательности имеют ту же длину.
Совет
Если ваши входные последовательности имеют ту же длину, seqpdist
принимает, что они выравниваются. Если они не выравниваются, выполнить одно из следующих действий:
Выровняйте последовательности прежде, чем передать их seqpdist
, например, использование multialign
функция.
Установите PairwiseAlignment
к true
при использовании seqpdist
.
задает, использовать ли D
= seqpdist(Seqs
,
...'UseParallel', UseParallelValue
, ...)parfor
- циклы при вычислении попарных расстояний. Когда true
, и Parallel Computing Toolbox установлен и parpool
открыто, расчет происходит параллельно. Если нет никакого открытого parpool
, но автоматическое создание включено в Параллельных Настройках, пул по умолчанию будет автоматически открыт, и расчет происходит параллельно. Если Parallel Computing Toolbox установлен, но нет никакого открытого parpool
и автоматическое создание отключено, затем расчет использует parfor
- циклы в последовательном режиме. Если Parallel Computing Toolbox не установлен, то расчет использует parfor
- циклы в последовательном режиме. Значением по умолчанию является false
, который использует циклы for в последовательном режиме.
управляет преобразованием выхода в квадратную матрицу, таким образом что D
= seqpdist(Seqs
,
...'SquareForm', SquareFormValue
...)
обозначает расстояние между D
i
J
)I
th и J
последовательности th. Квадратная матрица симметрична и имеет нулевую диагональ. Выбором является true
или false
(значение по умолчанию). Установка Squareform
к true
совпадает с использованием squareform
функция в Statistics and Machine Learning Toolbox™.
задает тип последовательности (нуклеотид или аминокислота). Выбором является D
= seqpdist(Seqs
,
...'Alphabet', AlphabetValue
, ...)'NT'
или 'AA'
(значение по умолчанию).
Остающиеся входные свойства доступны когда Method
свойство равняется 'alignment-score'
или PairwiseAlignment
свойство равняется true
.
задает матрицу выигрыша, чтобы использовать для глобального попарного выравнивания. Значение по умолчанию:D
= seqpdist(Seqs
,
...'ScoringMatrix', ScoringMatrixValue
, ...)
'NUC44'
— Когда AlphabetValue
равняется 'NT'
.
'BLOSUM50'
— Когда AlphabetValue
равняется 'AA'
.
указывает, что масштабный коэффициент раньше возвращал счет в произвольных модулях. Выбором является любое положительное значение. Если выигрывающая матричная информация также обеспечивает масштабный коэффициент, то оба используются.D
= seqpdist(Seqs
,
...'Scale', ScaleValue
, ...)
задает штраф за открытие разрыва в выравнивании. Выбором является любое положительное целое число. Значением по умолчанию является D
= seqpdist(Seqs
,
...'GapOpen', GapOpenValue
, ...)8
.
задает штраф за расширение разрыва в выравнивании. Выбором является любое положительное целое число. Значение по умолчанию равно D
= seqpdist(Seqs
,
...'ExtendGap', ExtendGapValue
, ...)GapOpenValue
.
Считайте данные о выравнивании аминокислоты в структуру MATLAB.
seqs = fastaread('pf00002.fa');
Для каждой возможной пары последовательностей в нескольких выравнивание проигнорируйте сайты с разрывами и счет с выигрывающим матричным PAM250
.
dist = seqpdist(seqs,'Method','alignment-score',... 'Indels','pairwise-delete',... 'ScoringMatrix','pam250');
Обеспечьте перестройку каждой пары последовательности игнорирование обеспеченного несколько выравнивание.
dist = seqpdist(seqs,'Method','alignment-score',... 'Indels','pairwise-delete',... 'ScoringMatrix','pam250',... 'PairwiseAlignment',true);
Измерьте Jukes-Cantor попарные расстояния после перестройки каждой пары последовательности, считая разрывы как точечные мутации.
dist = seqpdist(seqs,'Method','jukes-cantor',... 'Indels','score',... 'Scoringmatrix','pam250',... 'PairwiseAlignment',true);