goannotread

Чтение аннотаций из аннотированного файла Gene Ontology

Синтаксис

Annotation = goannotread(File)
Annotation = goannotread(File, ...'Fields', FieldsValue, ...)
Annotation = goannotread(File, ...'Aspect', AspectValue, ...)

Входные параметры

File

Вектор символов или строка, задающая имя файла в формате аннотации Gene Ontology (GO) (GAF).

FieldsValue

Вектор символов, строка, строковый вектор или массив ячеек из векторов символов, задающих одно или несколько полей для чтения из аннотированного файла Gene Ontology. По умолчанию считываются все поля. Допустимые поля перечислены ниже.

AspectValue

Вектор символов или строка, задающая один или несколько символов. Допустимыми аспектами являются:

  • P - Биологический процесс

  • F - Молекулярная функция

  • C - Клеточный компонент

По умолчанию это 'CFP', который задает чтение всех аспектов.

Выходные аргументы

AnnotationMATLAB® массив структур, содержащих аннотации из аннотированного файла Gene Ontology.

Описание

Примечание

goannotread функция поддерживает форматы файлов GAF 1.0 и 2.0.

Annotation = goannotread(File) преобразует содержимое File, аннотированный файл Gene Ontology, в Annotation, массив структур. Файлы должны иметь структуру, заданную консорциумом Gene Ontology, доступную в:

Annotation = goannotread (File... 'PropertyName', PropertyValue, ...) вызывает goannotread с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:

Annotation = goannotread(File, ...'Fields', FieldsValue, ...) задает поля для чтения из аннотированного файла Gene Ontology. FieldsValue - вектор символов, строка, строковый вектор или массив ячеек векторов символов, задающих одно или несколько полей. По умолчанию считываются все поля. Допустимые поля:

  • Database

  • DB_Object_ID

  • DB_Object_Symbol

  • Qualifier

  • GOid

  • DBReference

  • Evidence

  • WithFrom

  • Aspect

  • DB_Object_Name

  • Synonym

  • DB_Object_Type

  • Taxon

  • Date

  • Assigned_by

Annotation = goannotread(File, ...'Aspect', AspectValue, ...) задает аспекты для чтения из аннотированного файла Gene Ontology. AspectValue - вектор символов или строка, задающая один или несколько символов. Допустимыми аспектами являются:

  • P - Биологический процесс

  • F - Молекулярная функция

  • C - Клеточный компонент

По умолчанию это 'CFP', который задает чтение всех аспектов.

Примеры

свернуть все

  1. Загрузка gene_association.sgd.gz, файл, содержащий GO аннотации для генных продуктов Saccharomyces cerevisiae, от сайта генома дрожжей до текущей папки MATLAB.

  2. Распаковка файла с помощью gunzip функция.

    gunzip('gene_association.sgd.gz')
  3. Загрузите файл.

    SGDGenes = goannotread('gene_association.sgd');
  4. Создайте структуру с GO аннотации и отображение списка первых пяти генов.

    S = struct2cell(SGDGenes);
    genes = S(3,1:5)'
    
    genes = 
    
        '15S_RRNA'
        '15S_RRNA'
        '15S_RRNA'
        '15S_RRNA'
        '21S_RRNA'
  5. Можно ограничить аннотации генами, связанными с молекулярной функцией (F) и полям для символа гена и связанного с ним идентификатора, то есть DB_Object_Symbol и GOid.

    sgdSelect = goannotread('gene_association.sgd','Aspect','F','Fields',{'DB_Object_Symbol','GOid'})
    sgdSelect = 
    
      30701×1 struct array with fields:
    
        DB_Object_Symbol
        GOid
  6. Создайте список генов и связанных с ними терминов GO.

    selectGenes = {sgdSelect.DB_Object_Symbol};
    selectGO = [sgdSelect.GOid];
Представлено до R2006a