Вычислите попарное расстояние между последовательностями
D
= seqpdist(Seqs
)
D
= seqpdist(Seqs
,
...'PropertyName
', PropertyValue
,
...)
D
= seqpdist(Seqs
,
...'Method', MethodValue
, ...)
D
= seqpdist(Seqs
,
...'Indels', IndelsValue
, ...)
D
= seqpdist(Seqs
,
...'OptArgs', OptArgsValue
, ...)
D
= seqpdist(Seqs
,
...'PairwiseAlignment', PairwiseAlignmentValue
,
...)
D
= seqpdist(Seqs
,
...'UseParallel', UseParallelValue
, ...)
D
= seqpdist(Seqs
,
...'SquareForm', SquareFormValue
...)
D
= seqpdist(Seqs
,
...'Alphabet', AlphabetValue
, ...)
D
= seqpdist(Seqs
,
...'ScoringMatrix', ScoringMatrixValue
, ...)
D
= seqpdist(Seqs
,
...'Scale', ScaleValue
, ...)
D
= seqpdist(Seqs
,
...'GapOpen', GapOpenValue
, ...)
D
= seqpdist(Seqs
,
...'ExtendGap', ExtendGapValue
, ...)
Seqs | Любое следующее:
|
MethodValue | Вектор символов или строка, которая задает метод, чтобы вычислить попарные расстояния. Значением по умолчанию является 'Jukes-Cantor' . |
IndelsValue | Вектор символов или строка, которая задает, как обработать сайты с разрывами. Значением по умолчанию является 'score' . |
OptArgsValue | Вектор символов или массив ячеек, который задает один или несколько входных параметров, требуемых или принятых методом расстояния, заданным свойством Method . |
PairwiseAlignmentValue | Управляет глобальным попарным выравниванием входных последовательностей (использующий функцию nwalign ), при игнорировании нескольких выравнивание входных последовательностей (если таковые имеются). Выбором является true или false . Значение по умолчанию:
СоветЕсли ваши входные последовательности являются той же длиной,
|
UseParallelValue | Управляет расчетом попарных расстояний с помощью parfor - циклы. Когда true и Parallel Computing Toolbox™ установлены, и parpool открыт, вычисление происходит параллельно. Если не будет никакого открытого parpool , но автоматическое создание включено в Параллельных Настройках, пул по умолчанию будет автоматически открыт, и вычисление происходит параллельно. Если Parallel Computing Toolbox установлен, но нет никакого открытого parpool , и автоматическое создание отключено, то вычисление использует parfor - циклы в последовательном режиме. Если Parallel Computing Toolbox не установлен, то вычисление использует parfor - циклы в последовательном режиме. Значением по умолчанию является false , который использует циклы for в последовательном режиме. |
SquareFormValue | Управляет преобразованием вывода в квадратную матрицу. Выбором является |
AlphabetValue | Вектор символов или строка, задающая тип последовательности (нуклеотид или аминокислота). Выбором является 'NT' или 'AA' (значение по умолчанию). |
ScoringMatrixValue | Любое из следующего:
ПримечаниеЕсли необходимо скомпилировать |
ScaleValue | Положительное значение, которое задает масштабный коэффициент, раньше возвращало счет в произвольных модулях. Если выигрывающая матричная информация также обеспечивает масштабный коэффициент, то оба используются. |
GapOpenValue | Положительное целое число, которое задает штраф за открытие разрыва в выравнивании. Значением по умолчанию является 8 . |
ExtendedGapValue | Положительное целое число, которое задает штраф за расширение разрыва. Значение по умолчанию равно GapOpenValue . |
D | Вектор, который содержит биологические расстояния между каждой парой последовательностей, сохраненных в элементах M Seqs . |
возвращает D
= seqpdist(Seqs
)D
, вектор, содержащий биологические расстояния между каждой парой последовательностей, сохраненных в последовательностях M
Seqs
, массиве ячеек последовательностей, векторе структур, или матрице или последовательностях.
является D
1
-by-(M*(M-1)/2)
вектор - строка, соответствующий парам M*(M-1)/2
последовательностей в Seqs
. Вывод
располагается в порядке D
((2,1),(3,1),..., (M,1),(3,2),...(M,2),...(M,M-1))
. Это - нижний левый треугольник полного M
-by-M
матрица расстояния. Чтобы получить расстояние между I
th и J
th последовательности для I > J
, используйте формулу D((J-1)*(M-J/2)+I-J)
.
D
= seqpdist(Seqs
,
...'PropertyName
', PropertyValue
,
...)seqpdist
вызовов с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Задайте одно или несколько свойств в любом порядке. Заключите каждый PropertyName
в одинарные кавычки. Каждый PropertyName
является нечувствительным к регистру. Это имя свойства / пары значения свойства следующие:
задает метод, чтобы вычислить расстояния между каждой парой последовательности. Выбор показывают в следующих таблицах.D
= seqpdist(Seqs
,
...'Method', MethodValue
, ...)
Методы для нуклеотидов и аминокислот
Метод | Описание |
---|---|
p-distance | Пропорция сайтов, на которых эти две последовательности отличаются. p близко к 1 для плохо связанных последовательностей, и p близко к 0 для подобных последовательностей.d = p |
Jukes-Cantor (значение по умолчанию) | Оценка наибольшего правдоподобия количества замен между двумя последовательностями. Для нуклеотидов:
Для аминокислот:
|
alignment-score | Расстояние (d ) между двумя последовательностями (1, 2 ) вычисляется из попарного счета выравнивания между этими двумя последовательностями (score12 ) и попарный счет выравнивания между каждой последовательностью и им (score11 , score22 ) можно следующим образом:d = (1-score12/score11)* (1-score12/score22) d = 0 |
Методы без выигрыша разрывов (только нуклеотиды)
Метод | Описание |
---|---|
Tajima-Nei | Оценка наибольшего правдоподобия, рассматривая фоновые частоты нуклеотида. Это может быть вычислено из входных последовательностей или дано установкой OptArgs [gA gC gG gT] . gA , gC , gG , gT является скалярными значениями для частот нуклеотида. |
Kimura | Рассматривает отдельно переходную замену нуклеотида и transversional замену нуклеотида. |
Tamura | Рассматривает отдельно переходную замену нуклеотида, transversional замену нуклеотида и содержимое GC. Содержимое GC может быть вычислено из входных последовательностей или дано установкой OptArgs пропорции содержимого GC (скалярное значение от 0 до 1 ). |
Hasegawa | Рассматривает отдельно переходную замену нуклеотида, transversional замену нуклеотида и фоновые частоты нуклеотида. Фоновые частоты могут быть вычислены из входных последовательностей или даны путем установки свойства OptArgs на [gA gC gG gT] . |
Nei-Tamura | Рассматривает отдельно переходную замену нуклеотида между пуринами, переходную замену нуклеотида между пиримидинами, transversional замену нуклеотида и фоновые частоты нуклеотида. Фоновые частоты могут быть вычислены из входных последовательностей или даны путем установки свойства OptArgs на [gA gC gG gT] . |
Методы без выигрыша разрывов (только аминокислоты)
Метод | Описание |
---|---|
Poisson | Принимает, что количество замен аминокислоты на каждом сайте имеет распределение Пуассона. |
Gamma | Принимает, что количество замен аминокислоты на каждом сайте имеет Гамма распределение с параметром a . Установите a с помощью свойства OptArgs . Значением по умолчанию является 2 . |
Можно также задать пользовательскую функцию расстояния использование @
, например, @distfun
. Функция расстояния должна иметь форму:
function D = distfun(S1, S2, OptArgsValue)
Функция distfun
берет следующие аргументы:
S1, s2
Две последовательности той же длины (нуклеотид или аминокислота).
OptArgsValue
— Дополнительные зависимые проблемой аргументы.
Функция distfun
возвращает скаляр, который представляет расстояние между S1
и S2
.
задает, как обработать сайты с разрывами. Выбор:D
= seqpdist(Seqs
,
...'Indels', IndelsValue
, ...)
score
(значение по умолчанию) — Очки эти сайты или как точечная мутация или с параметрами выравнивания, в зависимости от метода выбраны.
pairwise-del
— Для каждого попарного сравнения это игнорирует сайты с разрывами.
complete-del
— Игнорирует все столбцы в нескольких выравнивание, которые содержат разрыв. Эта опция доступна, только если вы обеспечили выравнивание кратного как вход Seqs
.
передачи один или несколько аргументов, требуемых или принятых методом расстояния, заданы свойством D
= seqpdist(Seqs
,
...'OptArgs', OptArgsValue
, ...)Method
. Используйте вектор символов или массив ячеек, чтобы передать один или несколько входных параметров. Например, обеспечьте частоты нуклеотида для метода расстояния Tajima-Nei
, вместо того, чтобы вычислить их из входных последовательностей.
управляет глобальным попарным выравниванием входных последовательностей (использующий функцию D
= seqpdist(Seqs
,
...'PairwiseAlignment', PairwiseAlignmentValue
,
...)nwalign
), при игнорировании нескольких выравнивание входных последовательностей (если таковые имеются). Значение по умолчанию:
tRUE
Когда все входные последовательности не имеют той же длины.
ложь
Когда все входные последовательности имеют ту же длину.
Если ваши входные последовательности имеют ту же длину, seqpdist
принимает, что они выравниваются. Если они не выравниваются, выполнить одно из следующих действий:
Выровняйте последовательности прежде, чем передать их seqpdist
, например, с помощью функции multialign
.
Установите PairwiseAlignment
на true
при использовании seqpdist
.
задает, использовать ли D
= seqpdist(Seqs
,
...'UseParallel', UseParallelValue
, ...)parfor
- циклы при вычислении попарных расстояний. Когда true
и Parallel Computing Toolbox установлены, и parpool
открыт, вычисление происходит параллельно. Если не будет никакого открытого parpool
, но автоматическое создание включено в Параллельных Настройках, пул по умолчанию будет автоматически открыт, и вычисление происходит параллельно. Если Parallel Computing Toolbox установлен, но нет никакого открытого parpool
, и автоматическое создание отключено, то вычисление использует parfor
- циклы в последовательном режиме. Если Parallel Computing Toolbox не установлен, то вычисление использует parfor
- циклы в последовательном режиме. Значением по умолчанию является false
, который использует циклы for в последовательном режиме.
управляет преобразованием вывода в квадратную матрицу, таким образом, что D
= seqpdist(Seqs
,
...'SquareForm', SquareFormValue
...)
обозначает расстояние между D(I,J)
I
th и J
th последовательности. Квадратная матрица симметрична и имеет нулевую диагональ. Выбором является true
или false
(значение по умолчанию). Установка Squareform
к true
совпадает с использованием функции squareform
в Statistics and Machine Learning Toolbox™.
задает тип последовательности (нуклеотид или аминокислота). Выбором является D
= seqpdist(Seqs
,
...'Alphabet', AlphabetValue
, ...)'NT'
или 'AA'
(значение по умолчанию).
Остающиеся входные свойства доступны, когда свойство Method
равняется 'alignment-score'
, или свойство PairwiseAlignment
равняется true
.
задает матрицу выигрыша, чтобы использовать для глобального попарного выравнивания. Значение по умолчанию:D
= seqpdist(Seqs
,
...'ScoringMatrix', ScoringMatrixValue
, ...)
'NUC44'
— Когда AlphabetValue
равняется 'NT'
.
'BLOSUM50'
— Когда AlphabetValue
равняется 'AA'
.
указывает, что масштабный коэффициент раньше возвращал счет в произвольных модулях. Выбором является любое положительное значение. Если выигрывающая матричная информация также обеспечивает масштабный коэффициент, то оба используются.D
= seqpdist(Seqs
,
...'Scale', ScaleValue
, ...)
задает штраф за открытие разрыва в выравнивании. Выбором является любое положительное целое число. Значением по умолчанию является D
= seqpdist(Seqs
,
...'GapOpen', GapOpenValue
, ...)8
.
задает штраф за расширение разрыва в выравнивании. Выбором является любое положительное целое число. Значение по умолчанию равно D
= seqpdist(Seqs
,
...'ExtendGap', ExtendGapValue
, ...)GapOpenValue
.
Считайте данные о выравнивании аминокислоты в структуру MATLAB.
seqs = fastaread('pf00002.fa');
Для каждой возможной пары последовательностей в нескольких выравнивание проигнорируйте сайты с разрывами и счет с выигрывающим матричным PAM250
.
dist = seqpdist(seqs,'Method','alignment-score',... 'Indels','pairwise-delete',... 'ScoringMatrix','pam250');
Обеспечьте перестройку каждой пары последовательности игнорирование обеспеченного несколько выравнивание.
dist = seqpdist(seqs,'Method','alignment-score',... 'Indels','pairwise-delete',... 'ScoringMatrix','pam250',... 'PairwiseAlignment',true);
Измерьте Jukes-Cantor попарные расстояния после перестройки каждой пары последовательности, считая разрывы как точечные мутации.
dist = seqpdist(seqs,'Method','jukes-cantor',... 'Indels','score',... 'Scoringmatrix','pam250',... 'PairwiseAlignment',true);