Импорт данных - поддерживаемые файлы и типы данных

Поддерживаемые файлы и типы данных

Можно импортировать табличные данные в приложение SimBiology Model Analyzer или в MATLAB® Рабочая область. Поддерживаемые типы файлов Excel® файлы (.xls, .xlsx), текстовые файлы (.csv, .txt) и SAS® XPORT- файлов (.xpt). Можно также указать, что данные находятся в NONMEM® форматированный файл. Процесс импорта интерпретирует столбцы в соответствии с определениями NONMEM. Дополнительные сведения см. в разделе Поддержка импорта форматированных файлов NONMEM.

Примечание

Если ваш набор данных содержит информацию о дозах, которая является данными о инфузии, набор данных должен содержать скорость, а не длительность инфузии.

Модуль измерения

Независимо от того, включена ли функция преобразования модулей измерения или отключена, дозирование в файле данных должно быть выражено в количествах (или как amount/time для скорости введения). По умолчанию Unit Conversion отключен, поэтому необходимо убедиться, что модули измерения для данных согласованы друг с другом. Если требуется включить преобразование модулей измерения, см. Раздел «Преобразование модулей измерения для импортированных данных».

Создайте файл данных с определениями SimBiology

Если вы создаете файл, содержащий данные временного курса, которые хотите импортировать в SimBiology для подбора кривой, создайте файл данных со следующими столбцами:

  • Столбец группы - Задайте текст, число или категориальные значения. Например, этот столбец можно использовать для группирования нескольких индивидуумов в отдельные группы. Затем можно использовать эту группировку или категориальную информацию для иерархических подгонок. Этот столбец является необязательным.

  • Столбец ID - Задайте текст, число или категориальные значения. Строки в файле, которые имеют одно и то же значение идентификационного столбца, предназначены для одного и того же индивидуума. Этот столбец является необязательным, если данные измерений поступают всего от одного индивидуума.

  • Столбец времени - Задайте монотонно увеличивающиеся положительные значения в каждом идентификаторе, которые определяют время дозы, измерения наблюдений и ковариатные измерения.

  • Нуль или более дозирующих столбцов - создайте по одной дозирующему столбцу для каждого дозируемого отсека. В каждом столбце задайте положительные значения, представляющие суммарные дозы, которые добавляются к видам. Использовать NaN (не число), чтобы указать, что никакая доза не применялась в указанное время. Другими словами, укажите суммарную дозу следующим NaN когда наблюдение регистрировали, но дозу не применяли.

  • Ноль или больше столбцов скорости - Задайте положительные значения, нули или NaN. Нуль задает бесконечную скорость и NaN указывает, что тариф не применяется. Столбец скорости сопоставлен с дозирующей колонкой и определяет скорость, с которой вводят дозу. Для примера, если вы можете задать капельное внутривенное введение в Dose1 столбец, задайте его скорость в Rate1 столбец.

  • Нуль или больше столбцов наблюдения - Задайте числовые значения или NaN. NaN значения определяют, что ни одно наблюдение не было зарегистрировано в указанное время. Использование NaN для случаев, когда применяли дозу, но наблюдение не регистрировалось. Можно задать одно значение наблюдения в конкретное время для каждого идентификатора. Когда у вас будут реплики, задайте несколько значений наблюдений для одной и той же временной точки, добавив больше строк с таким же временным значением. Для получения примера см. строки 2 и 3 на снимке экрана ниже, где CentralConc имеет два измерения во времени = 0.

  • Нуль или более ковариатных столбцов - Задайте текст, число или категориальные значения или NaN. Каждое значение определяет ковариационное значение в заданный момент времени. NaN значения указывают, что ковариатное наблюдение не было зарегистрировано в указанное время. SimBiology поддерживает только ковариаты, которые не изменяются во времени. Например, см. Sex и Age столбцы в примере ниже. Для примера, в котором показано, как использовать категории для подбора кривой, см. Оценка параметров PK для категории для нескольких индивидуумов.

Ниже приведен снимок экрана файла выборочных данных.

Image showing an excel sheet with columns that correspond to group, ID, time, measured data, covariate data, dose, and dose rate.

Образец файла Excel можно скачать из следующего расположения: matlabroot/examples/simbio/data/sample_data_simbiology.xlsx. matlabroot корневая директория, в котором вы установили MATLAB. Можно также ввести matlabroot в командной строке, чтобы увидеть путь к файлу корневой директории.

Поддержка импорта форматированных файлов NONMEM

Можно указать, что данные находятся в форматированном файле NONMEM. В следующей таблице описывается интерпретация этих данных в SimBiology® программное обеспечение.

Заголовок столбцаИнтерпретация
ID

Текст (вектор символов), число или категориальные значения, идентифицирующие запись или группу. Процесс импорта принимает, что смежные данные с таким же значением содержат данные от одного индивидуума. Если данные содержат несмежные ссылки на то же значение, процесс импорта присваивает второму идентификатору обнаруженное индексированное значение, полученное из первой обнаруженной группы. Для примера, если столбцы с идентификатором содержат [1 1 1 2 2 2 1 1 1], назначенные идентификаторы 1, 2, 1_1.

TIME

Монотонно увеличивающиеся положительные значения в каждой группе, указывающие время наблюдения или дозу или текст (вектор символов). Файл данных может задать часы (2:30 как вектор символов) или десятичное число значений (6.25). Процесс импорта присваивает значение 0 на первый TIME значение в файле данных. Процесс импорта присваивает последующие значения относительно первого значения.

Следующая таблица является примером того, как процесс импорта интерпретирует значения синхроимпульса как десятичные значения.

Исходные значения синхроимпульсаИмпортированные значения
10:000
10:300.5
111
12:302.5

Если файл данных также содержит DATE столбец, процесс импорта использует его со TIME столбец в вычислении относительной TIME значения. Столбец не может содержать Inf.

DATE, DAT1, DAT2, или DAT3

Определяет день наблюдения или дозу. Столбец может содержать месяц в виде числа (9) или вектор символов (Sep). Укажите дату в следующих форматах:

  • DATE - Столбец может задавать month/day/year или month-day-year. Если вы задаете две цифры, процесс импорта принимает, что они являются месяцем и днем. Можно использовать любой из / или - как диафрагма.

  • DAT1 - Столбец может задавать day/month/year или day-month-year. Если вы задаете две цифры, процесс импорта принимает, что они день и месяц.

  • DAT2 - Столбец может задавать year/month/day или year-month-day. Если вы задаете две цифры, процесс импорта принимает, что они являются месяцем и днем.

  • DAT3 - Столбец может задавать year/day/month или year-day-month. Если вы задаете две цифры, процесс импорта принимает, что они день и месяц.

Примечание

  • Если вы задаете только один номер, процесс импорта принимает, что это день.

  • Можно опустить год или указать 1, 2, 3 или 4 цифры. Если вы задаете двухзначные годы, это принято в 1900-х годах.

  • Если данные имеют DAT1, DAT2, или DAT3 столбец, установите DateLabel свойство NMFileDef объект соответственно используя sbionmfiledef. Затем задайте объект как второй входной параметр, когда вы запускаете sbionmimport.

DVЧисловое значение наблюдения. Столбец не может содержать Inf или –Inf.
MDV Определяет, описывает ли строка наблюдение:
  • Строка содержит 0 - Событие наблюдения

  • Строка содержит 1 - не событие наблюдения

EVIDОпределяет тип события, описываемого для строки в записи:
  • 0 - Событие наблюдения; строка содержит наблюдаемое значение.

  • 1 - Событие дозы; строка описывает дозу.

  • 2 - иное событие; строка описывает некоторое другое событие, такое как измерение ковариаты.

Если столбец содержит значения дозы, но EVID не 1процесс импорта игнорирует значение. Вы видите предупреждение, и значение игнорируется.

Если EVID установлено значение 2, тогда только указанные данные строки импортируются как ковариатные данные. Однако, если у вас есть EVID столбец, а также один или несколько ковариатных столбцов, но не задают значение 2 в любом месте EVID затем SimBiology импортирует все данные строк как ковариатные значения.

Процесс импорта не поддерживает значения 3 и 4. Вы видите предупреждение, и значение игнорируется.

CMT Указывает, какой отсек используется для значения наблюдения или для полученной дозы. Толкование также зависит от EVID:
  • Событие наблюдения (EVID = 0 ) — CMT столбец указывает, какой отсек использовался для значения наблюдения.

  • Событие дозы (EVID = 1) — CMT столбец указывает, какой отсек получил дозу.

Примечание

SimBiology определяет отсеки, начиная с 1, в то время как NONMEM определяет их, начиная с 0. Например, если файл данных NONMEM содержит дозы и измерения для CMT = 0SimBiology генерирует столбцы данных с именем Dose1 и Response1 соответственно.

AMT Положительное число, указывающее на дозу. 0 или NaN не задает введенную дозу. Столбец не может содержать Inf.
RATEПоложительное число, указывающее на скорость инфузии. 0 задает бесконечную скорость (эквивалентную болюсной дозе) и NaN не задает скорость. Столбец не может содержать Inf.
IIПоложительное число, определяющее время между дозами.
ADDLКогда данные задают количество одинаковых последовательных доз через определенные интервалы времени (определяется II), ADDL определяет количество доз в серии, исключая начальную дозу. Если данные задают II но не ADDLзатем SimBiology принимает, что дозирование происходит на время этой записи данных.

Неподдерживаемые определения NONMEM

Процесс импорта не поддерживает (и поэтому игнорирует) строки, содержащие следующие значения или определения:

  • EVID значения 3 и 4

  • SS столбец для определения доз в установившемся состоянии

  • PCMT столбец, чтобы определить, вычислять ли предсказание для строки

  • CALL столбец для вызова ОШИБКА или стандартной подпрограммы PK

  • Если скорость задана как меньше нуля, она принимается равной нулю

Поддерживаемые типы столбцов таблицы в SimBiology Model Analyzer

Когда вы импортируете данные из таблицы, используя SimBiology Model Analyzer, приложение поддерживает следующие типы данных столбцов: double, char, массив ячеек из векторов символов, categorical, duration, logical, и datetime.

Поддержка импорта многомерных SimData в анализатор SimBiology Model Analyzer

Когда вы импортируете многомерную SimData массив в приложение, приложение уплощает SimData Массив и использует один индекс (линейная индексация) в соответствующей таблице данных. Для примера, если вы импортируете 2x2x2 A массива SimData приложение создает таблицу данных с 8 группами (по одной на каждую SimData объект), индексация от 1 до 8. Приложение все еще отображает исходный размер SimData массив в Browser.

См. также

| |