Считывание файла данных, содержащего информацию о последовательности зондов для массива Affymetrix GeneChip
Struct = affyprobeseqread(SeqFile, CDFFile)
Struct = affyprobeseqread(SeqFile, CDFFile, ...'SeqPath', SeqPathValue, ...)
Struct = affyprobeseqread(SeqFile, CDFFile, ...'CDFPath', CDFPathValue, ...)
Struct = affyprobeseqread(SeqFile, CDFFile, ...'SeqOnly', SeqOnlyValue, ...)
SeqFile | Символьный вектор или строка, указывающая имя файла последовательности (с разделением табуляцией или FASTA), который содержит следующую информацию для определенного типа массива Affymetrix ® GeneChip ®:
Файл последовательности (разделенный табуляцией или FASTA) должен находиться в пути поиска MATLAB ® или в текущей папке (если не используется |
CDFFile | Одно из следующих действий:
Внимание Убедитесь, что |
SeqPathValue | Символьный вектор или строка, указывающая папку или путь и папку, где SeqFile хранится. |
CDFPathValue | Символьный вектор или строка, указывающая папку или путь и папку, где CDFFile хранится. |
SeqOnlyValue | Управляет возвратом структуры, Struct, только с одним полем, SequenceMatrix. Варианты: true или false (по умолчанию). |
Struct | Структура MATLAB содержит следующие поля:
|
считывает данные из файлов Struct = affyprobeseqread(SeqFile, CDFFile)SeqFile и CDFFileи сохраняет данные в структуре MATLAB Struct, который содержит следующие поля.
| Область | Описание |
|---|---|
ProbeSetIDs | Массив ячеек, содержащий идентификаторы наборов зондов из файла библиотеки Affymetrix CDF. |
ProbeIndices | Вектор столбца, содержащий информацию индексации зонда. Зонды в наборе зондов пронумерованы от 0 до N-1, где N - количество зондов в наборе зондов. |
SequenceMatrix | Матрица N-by-25 информации о последовательности для зондов идеального соответствия (PM) в массиве Affymetrix GeneChip, где N - количество зондов в массиве. Каждая строка соответствует зонду, и каждый столбец соответствует одной из 25 позиций последовательности. Нуклеотиды в последовательностях представлены одним из следующих целых чисел:
Примечание Зонды без информации о последовательности представлены в Совет Вы можете использовать |
требования Struct = affyprobeseqread(SeqFile, CDFFile, ...'PropertyName', PropertyValue, ...)affyprobeseqread с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:
позволяет указать путь и папку, где Struct = affyprobeseqread(SeqFile, CDFFile, ...'SeqPath', SeqPathValue, ...)SeqFile хранится.
позволяет указать путь и папку, где Struct = affyprobeseqread(SeqFile, CDFFile, ...'CDFPath', CDFPathValue, ...)CDFFile хранится.
управляет возвратом структуры, Struct = affyprobeseqread(SeqFile, CDFFile, ...'SeqOnly', SeqOnlyValue, ...)Struct, только с одним полем, SequenceMatrix. Варианты: true или false (по умолчанию).
Считывайте данные из файла FASTA и связанного файла библиотеки CDF, предполагая, что оба файла находятся в пути поиска MATLAB или в текущей папке.
S1 = affyprobeseqread('HG-U95A_probe_fasta', 'HG_U95A.CDF');
Считывайте данные из файла, разделенного табуляцией, и связанной структуры CDF, предполагая, что файл, разделенный табуляцией, находится в указанной папке, а структура CDF находится в рабочей области MATLAB.
S2 = affyprobeseqread('HG-U95A_probe_tab',hgu95aCDFStruct,...
'seqpath','C:\Affymetrix\SequenceFiles\HGGenome');
Доступ к нуклеотидным последовательностям первого набора зондов (строки 1-20) в SequenceMatrix области S2 структура.
seq = int2nt(S2.SequenceMatrix(1:20,:))
affygcrma | affyinvarsetnorm | affyread | celintensityread | int2nt | probelibraryinfo | probesetlink | probesetlookup | probesetplot | probesetvalues