exponenta event banner

Импорт данных - поддерживаемые файлы и типы данных

Поддерживаемые файлы и типы данных

Табличные данные можно импортировать в приложение SimBiology Model Analyzer или в рабочую область MATLAB ®. Поддерживаемые типы файлов: файлы Excel ® (.xls, .xlsx), текстовые файлы (.csv, .txt) и файлы SAS ® XPORT (.xpt). Можно также указать, что данные находятся в файле в формате NONMEM ®. Процесс импорта интерпретирует столбцы в соответствии с определениями NONMEM. Дополнительные сведения см. в разделе Поддержка импорта форматированных файлов NONMEM.

Примечание

Если набор данных содержит информацию о дозировке, которая является данными инфузии, набор данных должен содержать скорость, а не продолжительность инфузии.

Преобразование единиц

Независимо от того, включена или выключена функция преобразования единиц измерения, дозировка в файле данных должна быть выражена в количествах (или как amount/time для скорости инфузии). По умолчанию преобразование единиц измерения отключено, поэтому необходимо убедиться, что единицы измерения для данных согласуются друг с другом. Если требуется включить преобразование единиц измерения, см. раздел Преобразование единиц измерения для импортированных данных.

Создание файла данных с определениями SimBiology

При создании файла, содержащего данные временного курса, которые необходимо импортировать в SimBiology для подгонки, создайте файл данных со следующими столбцами:

  • Столбец группы - укажите текст, числовые или категориальные значения. Например, этот столбец можно использовать для группировки нескольких отдельных пользователей в отдельные группы. Затем можно использовать эту группировку или категориальную информацию для иерархических посадок. Этот столбец является необязательным.

  • Столбец ID - укажите текст, числовые или категориальные значения. Строки в файле, имеющие одно и то же значение столбца идентификатора, предназначены для одного и того же пользователя. Этот столбец является необязательным, если данные измерения получены только от одного отдельного пользователя.

  • Столбец времени - укажите монотонно увеличивающиеся положительные значения в каждом идентификаторе, которые определяют время дозы, наблюдаемые измерения и ковариатные измерения.

  • Ноль или более дозирующих колонн - создать одну дозирующую колонку для каждого дозированного отсека. В каждом столбце укажите положительные значения, представляющие количества доз, которые добавляются к виду. Использовать NaN (не число), чтобы указать, что доза не применялась в указанное время. Другими словами, укажите количество дозы как NaN когда было зарегистрировано наблюдение, но доза не применялась.

  • Столбцы нулевой или более ставок - укажите положительные значения, ноль или NaN. Ноль задает бесконечную скорость и NaN указывает, что ставка не применяется. Колонка скорости связана с дозирующей колонкой и определяет скорость, с которой вводят дозу. Например, если вы можете указать дозу инфузии в Dose1 укажите его курс в столбце Rate1 столбец.

  • Ноль или несколько столбцов наблюдения - укажите числовые значения или NaN. NaN значения определяют, что наблюдение не было зарегистрировано в указанное время. Использовать NaN для случаев, когда применяли дозу, но наблюдения не регистрировали. Для каждого идентификатора можно указать одно значение наблюдения в конкретный момент времени. При наличии репликаций укажите несколько значений наблюдения для одной и той же точки времени путем добавления дополнительных строк с одним и тем же значением времени. Для примера см. строки 2 и 3 на снимке экрана ниже, где CentralConc имеет два измерения в момент времени = 0.

  • Ноль или несколько ковариатных столбцов - укажите текст, числовые или категориальные значения или NaN. Каждое значение определяет ковариатное значение в указанное время. NaN значения указывают, что ковариатное наблюдение не было зарегистрировано в указанное время. SimBiology поддерживает только ковариаты, не изменяющиеся во времени. Например, см. столбцы «Пол и возраст» в приведенном ниже примере. Пример использования категорий для фитинга см. в разделе Оценка параметров PK для нескольких категорий.

Ниже приводится снимок экрана образца файла данных.

Image showing an excel sheet with columns that correspond to group, ID, time, measured data, covariate data, dose, and dose rate.

Образец файла Excel можно загрузить из следующего расположения: matlabroot/examples/simbio/data/sample_data_simbiology.xlsx. matlabroot - корневой каталог, в котором установлен MATLAB. Также можно ввести matlabroot в командной строке для просмотра пути к файлу корневого каталога.

Поддержка импорта форматированных файлов NONMEM

Можно указать, что данные находятся в файле в формате NONMEM. В следующей таблице представлена интерпретация этих данных в программном обеспечении SimBiology ®.

Заголовок столбцаИнтерпретация
ID

Текст (символьный вектор), числовые или категориальные значения, идентифицирующие запись или группу. Процесс импорта предполагает, что непрерывные данные с одинаковым значением содержат данные от одного отдельного пользователя. Если данные содержат несмежные ссылки на одно и то же значение, процесс импорта присваивает второму идентификатору обнаруженное индексированное значение, полученное из первой обнаруженной группы. Например, если столбцы ID содержат [1 1 1 2 2 2 1 1 1], присвоенные идентификаторы: 1, 2, 1_1.

TIME

Монотонно возрастающие положительные значения внутри каждой группы, указывающие время наблюдения или дозу или текст (символьный вектор). Файл данных может указывать часы (2:30 в виде символьного вектора) или десятичных значений (6.25). Процесс импорта присваивает значение 0 к первому TIME значение в файле данных. Процесс импорта назначает последующие значения относительно первого значения.

В следующей таблице приведен пример того, как процесс импорта интерпретирует значения часов как десятичные значения.

Исходные значения часовИмпортированные значения
10:000
10:300.5
111
12:302.5

Если файл данных также содержит DATE , процесс импорта использует его с TIME столбец при вычислении относительного TIME значения. Столбец не может содержать Inf.

DATE, DAT1, DAT2, или DAT3

Определяет день наблюдения или дозу. Столбец может содержать месяц как число (9) или символьный вектор (Sep). Укажите дату в следующих форматах:

  • DATE - Столбец может указывать month/day/year или month-day-year. При указании двух чисел процесс импорта предполагает, что они являются месяцами и днями. Вы можете использовать либо / или - в качестве разделителя.

  • DAT1 - Столбец может указывать day/month/year или day-month-year. При указании двух чисел процесс импорта предполагает, что они являются днём и месяцем.

  • DAT2 - Столбец может указывать year/month/day или year-month-day. При указании двух чисел процесс импорта предполагает, что они являются месяцами и днями.

  • DAT3 - Столбец может указывать year/day/month или year-day-month. При указании двух чисел процесс импорта предполагает, что они являются днём и месяцем.

Примечание

  • Если указан только один номер, процесс импорта предполагает, что это день.

  • Можно опустить год или указать 1, 2, 3 или 4 цифры. Если указать двухзначные годы, предполагается, что это будет в 1900-х годах.

  • Если данные имеют DAT1, DAT2, или DAT3 , установите DateLabel свойство NMFileDef объект соответственно с использованием sbionmfiledef. Затем укажите объект в качестве второго входного аргумента при выполнении sbionmimport.

DVЧисловое значение наблюдения. Столбец не может содержать Inf или –Inf.
MDV Определяет, описывает ли строка наблюдение:
  • Строка содержит 0 - событие наблюдения

  • Строка содержит 1 - не событие наблюдения

EVIDОпределяет тип события, описанного для строки в записи:
  • 0 - событие наблюдения; строка содержит наблюдаемое значение.

  • 1 - дозовое событие; строка описывает дозу.

  • 2 - Другое событие; В строке описывается другое событие, например измерение ковариаты.

Если столбец содержит значения для дозы, но EVID не является 1, процесс импорта игнорирует значение. Отображается предупреждение, и значение игнорируется.

Если EVID имеет значение 2, то в качестве ковариатных данных импортируются только указанные данные строк. Однако, если у вас есть EVID столбец, а также один или несколько ковариатных столбцов, но не указывайте значение 2 в любом месте EVID затем SimBiology импортирует все данные строк в виде ковариатных значений.

Процесс импорта не поддерживает значения 3 и 4. Отображается предупреждение, и значение игнорируется.

CMT Указывает, какой отсек используется для значения наблюдения или для полученной дозы. Интерпретация также зависит от EVID:
  • Событие наблюдения (EVID = 0 ) — CMT в столбце указывается, какой отсек использовался для измерения значения.

  • Событие дозы (EVID = 1) — CMT в колонке указано, какой отсек получил дозу.

Примечание

SimBiology нумерует отсеки, начиная с 1, в то время как NONMEM нумерует их, начиная с 0. Например, если файл данных NONMEM содержит дозы и измерения для CMT = 0, SimBiology генерирует столбцы данных с именем Dose1 и Response1 соответственно.

AMT Положительное число, указывающее дозу. 0 или NaN указывает на отсутствие введенной дозы. Столбец не может содержать Inf.
RATEПоложительное число, указывающее скорость инфузии. 0 задает бесконечную скорость (эквивалентную болюсной дозе), и NaN указывает на отсутствие скорости. Столбец не может содержать Inf.
IIПоложительное число, определяющее время между дозами.
ADDLКогда данные указывают количество идентичных последовательных доз через определенные интервалы (определенные II), ADDL определяет количество доз в серии, исключая начальную дозу. Если данные указаны II но не ADDL, то SimBiology предполагает, что дозирование происходит в течение этой записи данных.

Неподдерживаемые определения NONMEM

Процесс импорта не поддерживает (и, следовательно, игнорирует) строки, содержащие следующие значения или определения:

  • EVID значения 3 и 4

  • SS столбец для указания доз в установившемся режиме

  • PCMT столбец для определения необходимости вычисления прогноза для строки

  • CALL столбец для вызова подпрограммы ERROR или PK

  • Если скорость указана как меньше нуля, предполагается, что она равна нулю

Поддерживаемые типы столбцов таблицы в анализаторе модели SimBiology

При импорте данных из таблицы с помощью SimBiology Model Analyzer приложение поддерживает следующие типы данных столбцов: double, char, массив ячеек символьных векторов, categorical, duration, logical, и datetime.

Поддержка импорта многомерных SimData в анализатор моделей SimBiology

При импорте многомерного SimData массив к приложению, приложение выравнивает SimData и использует один индекс (линейное индексирование) в соответствующей таблице данных. Например, при импорте 2x2x2 SimData массив A, приложение создает таблицу данных с 8 группами (по одной для каждой SimData объект), индексация от 1 до 8. Приложение по-прежнему отображает исходный размер SimData массив в браузере.

См. также

| |