affyprobeseqread

Считайте файл данных, содержащий информацию о последовательности зондов для массива Affymetrix GeneChip

Синтаксис

Struct = affyprobeseqread(SeqFile, CDFFile)
Struct = affyprobeseqread(SeqFile, CDFFile, ...'SeqPath', SeqPathValue, ...)
Struct = affyprobeseqread(SeqFile, CDFFile, ...'CDFPath', CDFPathValue, ...)
Struct = affyprobeseqread(SeqFile, CDFFile, ...'SeqOnly', SeqOnlyValue, ...)

Входные параметры

SeqFile

Вектор символов или строка, задающая имя файла последовательности (разделенный табуляцией или FASTA), который содержит следующую информацию для определенного типа Affymetrix® GeneChip® массив:

  • Идентификаторы набора зондов

  • Зондируйте x-координаты

  • Зондируйте y-координаты

  • Последовательности зондов в каждом наборе зондов

  • Тип массива Affymetrix GeneChip (только файл FASTA)

Файл последовательности (разделенный табуляцией или FASTA) должен находиться в MATLAB® путь поиска файлов или в текущей папке (если вы не используете SeqPath свойство). В файле, разделенном табуляцией, каждая строка представляет собой зонд; в файле FASTA каждый заголовок представляет зонд.

CDFFile

Одно из следующих:

  • Вектор символов или строка, задающая имя файла библиотеки Affymetrix CDF, который содержит информацию, которая определяет, к какому набору зондов принадлежит каждый зонд для определенного типа массива Affymetrix GeneChip. Файл библиотеки CDF должен находиться в пути поиска файлов MATLAB или в текущей папке MATLAB (если вы не используете CDFPath свойство).

  • Структура CDF, например, возвращенная affyread функция, которая содержит информацию, которая определяет, к какому набору зондов принадлежит каждый зонд в определенном типе массива Affymetrix GeneChip.

Внимание

Убедитесь, что SeqFile и CDFFile содержит информацию для массива Affymetrix GeneChip того же типа.

SeqPathValueВектор символов или строка, задающая папку или путь и папку где SeqFile сохранен.
CDFPathValueВектор символов или строка, задающая папку или путь и папку где CDFFile сохранен.
SeqOnlyValueУправляет возвратом структуры, Struct, только с одним полем, SequenceMatrix. Варианты true или false (по умолчанию).

Выходные аргументы

Struct

Структура MATLAB, содержащая следующие поля:

  • ProbeSetIDs

  • ProbeIndices

  • SequenceMatrix

Описание

Struct = affyprobeseqread(SeqFile, CDFFile) считывает данные из файлов SeqFile и CDFFile, и сохраняет данные в структуре MATLAB Struct, который содержит следующие поля.

ОбластьОписание
ProbeSetIDs

Массив ячеек, содержащий идентификаторы набора зондов из файла библиотеки Affymetrix CDF.

ProbeIndices

Вектор-столбец, содержащая информацию индексации зонда. Зонды в наборе зондов пронумерованы с 0 по N-1, где N - количество зондов в наборе зондов.

SequenceMatrix

Матрица N -by-25 информации о последовательности для зондов идеального соответствия (PM) в массиве Affymetrix GeneChip, где N количество зондов в массиве. Каждая строка соответствует зонду, и каждый столбец соответствует одной из 25 позиций последовательности. Нуклеотиды в последовательностях представлены одним из следующих целых чисел:

  • 0 Ничего

  • 1 - A

  • 2 - C

  • 3 - G

  • 4 - Т

Примечание

Зонды без информации о последовательности представлены в SequenceMatrix как строка, содержащая все 0с.

Совет

Вы можете использовать int2nt функция для преобразования нуклеотидных последовательностей в SequenceMatrix в буквенное представление.

Struct = affyprobeseqread (SeqFile, CDFFile... 'PropertyName', PropertyValue, ...) вызывает affyprobeseqread с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:

Struct = affyprobeseqread(SeqFile, CDFFile, ...'SeqPath', SeqPathValue, ...) позволяет вам задать путь и папку, где SeqFile сохранен.

Struct = affyprobeseqread(SeqFile, CDFFile, ...'CDFPath', CDFPathValue, ...) позволяет вам задать путь и папку, где CDFFile сохранен.

Struct = affyprobeseqread(SeqFile, CDFFile, ...'SeqOnly', SeqOnlyValue, ...) управляет возвратом структуры, Struct, только с одним полем, SequenceMatrix. Варианты true или false (по умолчанию).

Примеры

  1. Считайте данные из файла FASTA и связанного файла библиотеки CDF, если оба находятся в пути поиска файлов MATLAB или в Текущей папке.

    S1 = affyprobeseqread('HG-U95A_probe_fasta', 'HG_U95A.CDF');
    
  2. Считайте данные из файла, разделенного табуляцией, и связанной структуры CDF, предположим, что файл, разделенный табуляцией, расположен в указанной папке, а структура CDF находится в вашем Рабочем пространстве MATLAB.

    S2 = affyprobeseqread('HG-U95A_probe_tab',hgu95aCDFStruct,...
         'seqpath','C:\Affymetrix\SequenceFiles\HGGenome');
    
  3. Доступ к нуклеотидным последовательностям первого набора зондов (строки с 1 по 20) в SequenceMatrix поле S2 структура.

    seq = int2nt(S2.SequenceMatrix(1:20,:))
Введенный в R2007a