Вычислите попарное расстояние между последовательностями
D
= seqpdist(Seqs
)
D
= seqpdist(Seqs
,
...'PropertyName
', PropertyValue
,
...)
D
= seqpdist(Seqs
,
...'Method', MethodValue
, ...)
D
= seqpdist(Seqs
,
...'Indels', IndelsValue
, ...)
D
= seqpdist(Seqs
,
...'OptArgs', OptArgsValue
, ...)
D
= seqpdist(Seqs
,
...'PairwiseAlignment', PairwiseAlignmentValue
,
...)
D
= seqpdist(Seqs
,
...'UseParallel', UseParallelValue
, ...)
D
= seqpdist(Seqs
,
...'SquareForm', SquareFormValue
...)
D
= seqpdist(Seqs
,
...'Alphabet', AlphabetValue
, ...)
D
= seqpdist(Seqs
,
...'ScoringMatrix', ScoringMatrixValue
, ...)
D
= seqpdist(Seqs
,
...'Scale', ScaleValue
, ...)
D
= seqpdist(Seqs
,
...'GapOpen', GapOpenValue
, ...)
D
= seqpdist(Seqs
,
...'ExtendGap', ExtendGapValue
, ...)
Seqs | Любое следующее:
|
MethodValue | Вектор символов или строка, которая задает метод, чтобы вычислить попарные расстояния. Значением по умолчанию является 'Jukes-Cantor' . |
IndelsValue | Вектор символов или строка, которая задает, как обработать сайты с разрывами. Значением по умолчанию является 'score' . |
OptArgsValue | Вектор символов или массив ячеек, который задает один или несколько входных параметров, требуемых или принятых методом расстояния, заданным Method свойство. |
PairwiseAlignmentValue | Управляет глобальным попарным выравниванием входных последовательностей (использующий nwalign функция), при игнорировании нескольких выравнивание входных последовательностей (если таковые имеются). Выбором является true или false . Значение по умолчанию:
СоветЕсли ваши входные последовательности являются той же длиной,
|
UseParallelValue | Управляет расчетом попарных расстояний с помощью parfor - циклы. Когда true , и Parallel Computing Toolbox™ установлен и parpool открыто, расчет происходит параллельно. Если нет никакого открытого parpool , но автоматическое создание включено в Параллельных Настройках, пул по умолчанию будет автоматически открыт, и расчет происходит параллельно. Если Parallel Computing Toolbox установлен, но нет никакого открытого parpool и автоматическое создание отключено, затем расчет использует parfor - циклы в последовательном режиме. Если Parallel Computing Toolbox не установлен, то расчет использует parfor - циклы в последовательном режиме. Значением по умолчанию является false , который использует циклы for в последовательном режиме. |
SquareFormValue | Управляет преобразованием выхода в квадратную матрицу. Выбором является |
AlphabetValue | Вектор символов или строка, задающая тип последовательности (нуклеотид или аминокислота). Выбором является 'NT' или 'AA' (значение по умолчанию). |
ScoringMatrixValue | Любое из следующего:
ПримечаниеЕсли необходимо скомпилировать |
ScaleValue | Положительное значение, которое задает масштабный коэффициент, раньше возвращало счет в произвольных модулях. Если выигрывающая матричная информация также обеспечивает масштабный коэффициент, то оба используются. |
GapOpenValue | Положительное целое число, которое задает штраф за открытие разрыва в выравнивании. Значением по умолчанию является 8 . |
ExtendedGapValue | Положительное целое число, которое задает штраф за расширение разрыва. Значение по умолчанию равно GapOpenValue . |
D | Вектор, который содержит биологические расстояния между каждой парой последовательностей, сохраненных в M элементы Seqs . |
возвращает D
= seqpdist(Seqs
)D
, вектор, содержащий биологические расстояния между каждой парой последовательностей, сохранен в M
последовательности Seqs
, массив ячеек последовательностей, вектор структур, или матрица или последовательности.
D
1
- (M*(M-1)/2)
вектор-строка, соответствующий M*(M-1)/2
пары последовательностей в Seqs
. Выход
располагается в порядке D
((2,1),(3,1),..., (M,1),(3,2),...(M,2),...(M,M-1))
. Это - нижний левый треугольник полного M
- M
матрица расстояния. Получить расстояние между I
th и J
последовательности th для I > J
, используйте формулу D((J-1)*(M-J/2)+I-J)
.
вызовы D
= seqpdist(Seqs
,
...'PropertyName
', PropertyValue
,
...)seqpdist
с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Задайте одно или несколько свойств в любом порядке. Заключите каждый PropertyName
в одинарных кавычках. Каждый PropertyName
является нечувствительным к регистру. Это имя свойства / пары значения свойства следующие:
задает метод, чтобы вычислить расстояния между каждой парой последовательности. Выбор показывают в следующих таблицах.D
= seqpdist(Seqs
,
...'Method', MethodValue
, ...)
Методы для нуклеотидов и аминокислот
Метод | Описание |
---|---|
p-distance | Пропорция сайтов, на которых эти две последовательности отличаются. p близко к 1 для плохо связанных последовательностей и p близко к 0 для подобных последовательностей.d = p |
Jukes-Cantor (значение по умолчанию) | Оценка наибольшего правдоподобия количества замен между двумя последовательностями. Для нуклеотидов:
Для аминокислот:
|
alignment-score | Расстояние (d ) между двумя последовательностями (1, 2 ) вычисляется из попарного счета выравнивания между этими двумя последовательностями (score12 ), и попарное выравнивание выигрывает между каждой последовательностью и им (score11 , score22 ) можно следующим образом:d = (1-score12/score11)* (1-score12/score22) d = 0 |
Методы без выигрыша разрывов (только нуклеотиды)
Метод | Описание |
---|---|
Tajima-Nei | Оценка наибольшего правдоподобия, рассматривая фоновые частоты нуклеотида. Это может быть вычислено из входных последовательностей или дано установкой OptArgs к [gA gC gG gT] . gA , gC , gG > скалярные значения для частот нуклеотида. |
Kimura | Рассматривает отдельно переходную замену нуклеотида и transversional замену нуклеотида. |
Tamura | Рассматривает отдельно переходную замену нуклеотида, transversional замену нуклеотида и содержимое GC. Содержимое GC может быть вычислено из входных последовательностей или дано установкой OptArgs к пропорции содержимого GC (скалярное значение от 0 к 1 ). |
Hasegawa | Рассматривает отдельно переходную замену нуклеотида, transversional замену нуклеотида и фоновые частоты нуклеотида. Фоновые частоты могут быть вычислены из входных последовательностей или даны путем установки OptArgs свойство к [gA gC gG gT] . |
Nei-Tamura | Рассматривает отдельно переходную замену нуклеотида между пуринами, переходную замену нуклеотида между пиримидинами, transversional замену нуклеотида и фоновые частоты нуклеотида. Фоновые частоты могут быть вычислены из входных последовательностей или даны путем установки OptArgs свойство к [gA gC gG gT] . |
Методы без выигрыша разрывов (только аминокислоты)
Метод | Описание |
---|---|
Poisson | Принимает, что количество замен аминокислоты на каждом сайте имеет распределение Пуассона. |
Gamma | Принимает, что количество замен аминокислоты на каждом сайте имеет Гамма распределение параметром a . Установите a использование OptArgs свойство. Значением по умолчанию является 2 . |
Можно также задать пользовательскую функцию расстояния использование @
, например, @distfun
. Функция расстояния должна иметь форму:
function D = distfun(S1, S2, OptArgsValue)
distfun
функционируйте берет следующие аргументы:
S1
S2
— Две последовательности той же длины (нуклеотид или аминокислота).
OptArgsValue
— Дополнительные зависимые проблемой аргументы.
distfun
функция возвращает скаляр, который представляет расстояние между S1
и S2
.
задает, как обработать сайты с разрывами. Выбор:D
= seqpdist(Seqs
,
...'Indels', IndelsValue
, ...)
score
(значение по умолчанию) — Баллы эти сайты или как точечная мутация или параметрами выравнивания, в зависимости от метода выбраны.
pairwise-del
— Для каждого попарного сравнения это игнорирует сайты с разрывами.
complete-del
— Игнорирует все столбцы в нескольких выравнивание, которые содержат разрыв. Эта опция доступна, только если вы обеспечили выравнивание кратного как вход Seqs
.
передачи один или несколько аргументов, требуемых или принятых методом расстояния, заданы D
= seqpdist(Seqs
,
...'OptArgs', OptArgsValue
, ...)Method
свойство. Используйте вектор символов или массив ячеек, чтобы передать один или несколько входных параметров. Например, обеспечьте частоты нуклеотида для Tajima-Nei
метод расстояния, вместо того, чтобы вычислить их из входных последовательностей.
управляет глобальным попарным выравниванием входных последовательностей (использующий D
= seqpdist(Seqs
,
...'PairwiseAlignment', PairwiseAlignmentValue
,
...)nwalign
функция), при игнорировании нескольких выравнивание входных последовательностей (если таковые имеются). Значение по умолчанию:
true
— Когда все входные последовательности не имеют той же длины.
false
— Когда все входные последовательности имеют ту же длину.
Если ваши входные последовательности имеют ту же длину, seqpdist
принимает, что они выравниваются. Если они не выравниваются, выполнить одно из следующих действий:
Выровняйте последовательности прежде, чем передать их seqpdist
, например, использование multialign
функция.
Установите PairwiseAlignment
к true
при использовании seqpdist
.
задает, использовать ли D
= seqpdist(Seqs
,
...'UseParallel', UseParallelValue
, ...)parfor
- циклы при вычислении попарных расстояний. Когда true
, и Parallel Computing Toolbox установлен и parpool
открыто, расчет происходит параллельно. Если нет никакого открытого parpool
, но автоматическое создание включено в Параллельных Настройках, пул по умолчанию будет автоматически открыт, и расчет происходит параллельно. Если Parallel Computing Toolbox установлен, но нет никакого открытого parpool
и автоматическое создание отключено, затем расчет использует parfor
- циклы в последовательном режиме. Если Parallel Computing Toolbox не установлен, то расчет использует parfor
- циклы в последовательном режиме. Значением по умолчанию является false
, который использует циклы for в последовательном режиме.
управляет преобразованием выхода в квадратную матрицу, таким образом что D
= seqpdist(Seqs
,
...'SquareForm', SquareFormValue
...)
обозначает расстояние между D
i
J
)I
th и J
последовательности th. Квадратная матрица симметрична и имеет нулевую диагональ. Выбором является true
или false
(значение по умолчанию). Установка Squareform
к true
совпадает с использованием squareform
функция в Statistics and Machine Learning Toolbox™.
задает тип последовательности (нуклеотид или аминокислота). Выбором является D
= seqpdist(Seqs
,
...'Alphabet', AlphabetValue
, ...)'NT'
или 'AA'
(значение по умолчанию).
Остающиеся входные свойства доступны когда Method
свойство равняется 'alignment-score'
или PairwiseAlignment
свойство равняется true
.
задает матрицу выигрыша, чтобы использовать в глобальном попарном выравнивании. Значение по умолчанию:D
= seqpdist(Seqs
,
...'ScoringMatrix', ScoringMatrixValue
, ...)
'NUC44'
— Когда AlphabetValue
равняется 'NT'
.
'BLOSUM50'
— Когда AlphabetValue
равняется 'AA'
.
указывает, что масштабный коэффициент раньше возвращал счет в произвольных модулях. Выбором является любое положительное значение. Если выигрывающая матричная информация также обеспечивает масштабный коэффициент, то оба используются.D
= seqpdist(Seqs
,
...'Scale', ScaleValue
, ...)
задает штраф за открытие разрыва в выравнивании. Выбором является любое положительное целое число. Значением по умолчанию является D
= seqpdist(Seqs
,
...'GapOpen', GapOpenValue
, ...)8
.
задает штраф за расширение разрыва в выравнивании. Выбором является любое положительное целое число. Значение по умолчанию равно D
= seqpdist(Seqs
,
...'ExtendGap', ExtendGapValue
, ...)GapOpenValue
.
Считайте данные о выравнивании аминокислоты в структуру MATLAB.
seqs = fastaread('pf00002.fa');
Для каждой возможной пары последовательностей в нескольких выравнивание проигнорируйте сайты с разрывами и счет с выигрывающим матричным PAM250
.
dist = seqpdist(seqs,'Method','alignment-score',... 'Indels','pairwise-delete',... 'ScoringMatrix','pam250');
Обеспечьте перестройку каждой пары последовательности игнорирование обеспеченного несколько выравнивание.
dist = seqpdist(seqs,'Method','alignment-score',... 'Indels','pairwise-delete',... 'ScoringMatrix','pam250',... 'PairwiseAlignment',true);
Измерьте Jukes-Cantor попарные расстояния после перестройки каждой пары последовательности, считая разрывы как точечные мутации.
dist = seqpdist(seqs,'Method','jukes-cantor',... 'Indels','score',... 'Scoringmatrix','pam250',... 'PairwiseAlignment',true);