affyprobeseqread

Считайте файл данных, содержащий тестовую информацию о последовательности для массива Affymetrix GeneChip

Синтаксис

Struct = affyprobeseqread(SeqFile, CDFFile)
Struct = affyprobeseqread(SeqFile, CDFFile, ...'SeqPath', SeqPathValue, ...)
Struct = affyprobeseqread(SeqFile, CDFFile, ...'CDFPath', CDFPathValue, ...)
Struct = affyprobeseqread(SeqFile, CDFFile, ...'SeqOnly', SeqOnlyValue, ...)

Входные параметры

SeqFile

Вектор символов или строка, задающая имя файла файла последовательности (разделенный от вкладки или FASTA), который содержит следующую информацию для определенного типа массива Affymetrix® GeneChip®:

  • Тестовые идентификаторы набора

  • Тестовые x-координаты

  • Тестовые y-координаты

  • Тестовые последовательности в каждом тестовом наборе

  • Тип массива Affymetrix GeneChip (только файл FASTA)

Файл последовательности (разделенный от вкладки или FASTA) должен быть на пути поиска файлов MATLAB® или в Текущей папке (если вы не используете свойство SeqPath). В разделенном от вкладки файле каждая строка представляет зонд; в файле FASTA каждый заголовок представляет зонд.

CDFFile

Любое из следующего:

  • Вектор символов или строка, задающая имя файла файла библиотеки Affymetrix CDF, который содержит информацию, которая задает, какой зонд установил каждый зонд, принадлежат на определенном типе массива Affymetrix GeneChip. Файл библиотеки CDF должен быть на пути поиска файлов MATLAB или в Текущей папке MATLAB (если вы не используете свойство CDFPath).

  • Структура CDF, такой, как возвращено функцией affyread, которая содержит информацию, которая задает, какой зонд установил каждый зонд, принадлежит на определенном типе массива Affymetrix GeneChip.

Внимание

Убедитесь, что SeqFile и CDFFile содержат информацию для того же типа массива Affymetrix GeneChip.

SeqPathValueВектор символов или строка, задающая папку или путь и папку, где SeqFile хранится.
CDFPathValueВектор символов или строка, задающая папку или путь и папку, где CDFFile хранится.
SeqOnlyValueУправляет возвратом структуры, Struct, только с одним полем, SequenceMatrix. Выбором является true или false (значение по умолчанию).

Выходные аргументы

Struct

Структура MATLAB, содержащая следующие поля:

  • ProbeSetIDs

  • ProbeIndices

  • SequenceMatrix

Описание

Struct = affyprobeseqread(SeqFile, CDFFile) считывает данные из файлов SeqFile и CDFFile, и хранит данные в структуре MATLAB Struct, который содержит следующие поля.

Поле Описание
ProbeSetIDs

Массив ячеек, содержащий тестовые идентификаторы набора из файла библиотеки Affymetrix CDF.

ProbeIndices

Вектор-столбец, содержащий информацию об индексации зонда. Зонды в тестовом наборе пронумерованы 0 через N - 1, где N является количеством зондов в тестовом наборе.

SequenceMatrix

N-by-25 матрица информации о последовательности для идеальной пары (PM), зондирует на массиве Affymetrix GeneChip, где N является количеством зондов на массиве. Каждая строка соответствует зонду, и каждый столбец соответствует одному из 25 положений последовательности. Нуклеотиды в последовательностях представлены одним из следующих целых чисел:

  • 0 — 'none'

  • 1 — A

  • 2 — C

  • 3 — G

  • 4 — T

Примечание

Зонды без информации о последовательности представлены в SequenceMatrix как строка, содержащая весь 0 s.

Совет

Можно использовать функцию int2nt, чтобы преобразовать последовательности нуклеотида в SequenceMatrix, чтобы обозначить буквами представление.

Struct = affyprobeseqread(SeqFile, CDFFile, ...'PropertyName', PropertyValue, ...) вызывает affyprobeseqread с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

Struct = affyprobeseqread(SeqFile, CDFFile, ...'SeqPath', SeqPathValue, ...) позволяет вам задать путь и папку, где SeqFile хранится.

Struct = affyprobeseqread(SeqFile, CDFFile, ...'CDFPath', CDFPathValue, ...) позволяет вам задать путь и папку, где CDFFile хранится.

Struct = affyprobeseqread(SeqFile, CDFFile, ...'SeqOnly', SeqOnlyValue, ...) управляет возвратом структуры, Struct, только с одним полем, SequenceMatrix. Выбором является true или false (значение по умолчанию).

Примеры

  1. Считайте данные из файла FASTA и сопоставленного файла библиотеки CDF, приняв, что оба расположены на пути поиска файлов MATLAB или в Текущей папке.

    S1 = affyprobeseqread('HG-U95A_probe_fasta', 'HG_U95A.CDF');
    
  2. Считайте данные из разделенного от вкладки файла, и сопоставил структуру CDF, приняв, что разделенный от вкладки файл расположен в заданной папке, и структура CDF находится в вашем рабочем пространстве MATLAB.

    S2 = affyprobeseqread('HG-U95A_probe_tab',hgu95aCDFStruct,...
         'seqpath','C:\Affymetrix\SequenceFiles\HGGenome');
    
  3. Доступ к последовательностям нуклеотида первого тестового набора (строки 1 - 20) в поле SequenceMatrix структуры S2.

    seq = int2nt(S2.SequenceMatrix(1:20,:))

Представленный в R2007a