exponenta event banner

affyprobeseqread

Считывание файла данных, содержащего информацию о последовательности зондов для массива Affymetrix GeneChip

Синтаксис

Struct = affyprobeseqread(SeqFile, CDFFile)
Struct = affyprobeseqread(SeqFile, CDFFile, ...'SeqPath', SeqPathValue, ...)
Struct = affyprobeseqread(SeqFile, CDFFile, ...'CDFPath', CDFPathValue, ...)
Struct = affyprobeseqread(SeqFile, CDFFile, ...'SeqOnly', SeqOnlyValue, ...)

Входные аргументы

SeqFile

Символьный вектор или строка, указывающая имя файла последовательности (с разделением табуляцией или FASTA), который содержит следующую информацию для определенного типа массива Affymetrix ® GeneChip ®:

  • Идентификаторы наборов зондов

  • X-координаты зонда

  • Y-координаты зонда

  • Последовательности зондов в каждом наборе зондов

  • Тип массива Affymetrix GeneChip (только файл FASTA)

Файл последовательности (разделенный табуляцией или FASTA) должен находиться в пути поиска MATLAB ® или в текущей папке (если не используется SeqPath свойство). В файле, разделенном табуляцией, каждая строка представляет зонд; в файле FASTA каждый заголовок представляет пробу.

CDFFile

Одно из следующих действий:

  • Символьный вектор или строка, указывающая имя файла библиотеки Affymetrix CDF, который содержит информацию, которая указывает, какому набору зондов принадлежит каждый зонд в определенном типе массива Affymetrix GeneChip. Файл библиотеки CDF должен находиться в пути поиска MATLAB или в текущей папке MATLAB (если не используется CDFPath свойство).

  • Структура CDF, например, возвращенная affyread функция, которая содержит информацию, которая указывает, какому набору зондов принадлежит каждый зонд в определенном типе массива Affymetrix GeneChip.

Внимание

Убедитесь, что SeqFile и CDFFile содержат информацию для того же типа массива Affymetrix GeneChip.

SeqPathValueСимвольный вектор или строка, указывающая папку или путь и папку, где SeqFile хранится.
CDFPathValueСимвольный вектор или строка, указывающая папку или путь и папку, где CDFFile хранится.
SeqOnlyValueУправляет возвратом структуры, Struct, только с одним полем, SequenceMatrix. Варианты: true или false (по умолчанию).

Выходные аргументы

Struct

Структура MATLAB содержит следующие поля:

  • ProbeSetIDs

  • ProbeIndices

  • SequenceMatrix

Описание

Struct = affyprobeseqread(SeqFile, CDFFile) считывает данные из файлов SeqFile и CDFFileи сохраняет данные в структуре MATLAB Struct, который содержит следующие поля.

ОбластьОписание
ProbeSetIDs

Массив ячеек, содержащий идентификаторы наборов зондов из файла библиотеки Affymetrix CDF.

ProbeIndices

Вектор столбца, содержащий информацию индексации зонда. Зонды в наборе зондов пронумерованы от 0 до N-1, где N - количество зондов в наборе зондов.

SequenceMatrix

Матрица N-by-25 информации о последовательности для зондов идеального соответствия (PM) в массиве Affymetrix GeneChip, где N - количество зондов в массиве. Каждая строка соответствует зонду, и каждый столбец соответствует одной из 25 позиций последовательности. Нуклеотиды в последовательностях представлены одним из следующих целых чисел:

  • 0 Ничего

  • 1 - A

  • 2 - C

  • 3 - G

  • 4 - Т

Примечание

Зонды без информации о последовательности представлены в SequenceMatrix как строка, содержащая все 0s.

Совет

Вы можете использовать int2nt функция преобразования нуклеотидных последовательностей в SequenceMatrix к буквенному представлению.

Struct = affyprobeseqread(SeqFile, CDFFile, ...'PropertyName', PropertyValue, ...) требования affyprobeseqread с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:

Struct = affyprobeseqread(SeqFile, CDFFile, ...'SeqPath', SeqPathValue, ...) позволяет указать путь и папку, где SeqFile хранится.

Struct = affyprobeseqread(SeqFile, CDFFile, ...'CDFPath', CDFPathValue, ...) позволяет указать путь и папку, где CDFFile хранится.

Struct = affyprobeseqread(SeqFile, CDFFile, ...'SeqOnly', SeqOnlyValue, ...) управляет возвратом структуры, Struct, только с одним полем, SequenceMatrix. Варианты: true или false (по умолчанию).

Примеры

  1. Считывайте данные из файла FASTA и связанного файла библиотеки CDF, предполагая, что оба файла находятся в пути поиска MATLAB или в текущей папке.

    S1 = affyprobeseqread('HG-U95A_probe_fasta', 'HG_U95A.CDF');
    
  2. Считывайте данные из файла, разделенного табуляцией, и связанной структуры CDF, предполагая, что файл, разделенный табуляцией, находится в указанной папке, а структура CDF находится в рабочей области MATLAB.

    S2 = affyprobeseqread('HG-U95A_probe_tab',hgu95aCDFStruct,...
         'seqpath','C:\Affymetrix\SequenceFiles\HGGenome');
    
  3. Доступ к нуклеотидным последовательностям первого набора зондов (строки 1-20) в SequenceMatrix области S2 структура.

    seq = int2nt(S2.SequenceMatrix(1:20,:))
Представлен в R2007a