Страница 1 из 1
форматирование данных для surivival analysis
Добавлено: 08 дек 2014, 16:09
Анна
Добрый день,
Как правильно форматировать данные для survival analysis (пакет survival) в случае если данные: right-censored staggered entry with time-dependent covariates?
Особенно непонятно, как кодировать staggered entry при наличии time-dependent covariate.
Например:
Код: Выделить всё
start stop arrest.time week arrest fin age race wexp mar paro prio educ employed
1.1 0 1 0 20 1 0 27 1 0 0 1 3 3 0
1.2 1 2 0 20 1 0 27 1 0 0 1 3 3 0
...
1.19 18 19 0 20 1 0 27 1 0 0 1 3 3 0
1.20 19 20 1 20 1 0 27 1 0 0 1 3 3 0
2.1 0 1 0 17 1 0 18 1 0 0 1 8 4 0
2.2 1 2 0 17 1 0 18 1 0 0 1 8 4 0
...
2.16 15 16 0 17 1 0 18 1 0 0 1 8 4 0
2.17 16 17 1 17 1 0 18 1 0 0 1 8 4 0
Это пример без staggered entry - но если представить, что 1ый объект попал под наблюдение только на 5 неделю - как его кодировать первые 5 недель?
Спасибо
Re: форматирование данных для surivival analysis
Добавлено: 08 дек 2014, 19:12
gamm
Анна писал(а):Это пример без staggered entry - но если представить, что 1ый объект попал под наблюдение только на 5 неделю - как его кодировать первые 5 недель?
survival анализирует события, причем необратимые ("смерть"). Время отсчитывается от момента "рождения" объекта. Что такое "попал под наблюдение"? если он в этот момент "родился", то просто время для него в этот момент равно 0. Если он уже жил до этого (с первой недели), то он был жив во все моменты от рождения - восполните данные в соответствующие моменты времени. Аналогично с цензорированием, просто там вместо момента времени задается диапазон.
в пакете есть helper function Surv(), посмотрите описание. Она позволяет все задавать
Re: форматирование данных для surivival analysis
Добавлено: 09 дек 2014, 01:31
Анна
Выше я привела формат как раз с использованием описания функции surv и я бы не задавала вопроса, если бы было очевидно, что делать с типом данных generalized type 1 censored (ака staggered entry).
Если наблюдения (например, телеметрия) сделана для животных, пойманных в разное время, а эксперимент начался в какой-то фиксированный более ранний момент, то неясно, нужно ли кодировать момент до поимки, но с начала эксперимента, иным образом (например, вводить код 99 для такого состояния по сравнению с состояниями 0 и 1 для статусов жив и умер)
Вы не могли бы привести конкретный пример кодирования такого случая (модифицировав например, мой пример) и именно с time-dependent covariate?
Хелп, также как и большое число сайтов и форумов, я уже пересмотрела и если бы "задачка так просто решалась армянское радио этого не спрашивало"
[ Сообщение с мобильного устройства ]
Re: форматирование данных для surivival analysis
Добавлено: 09 дек 2014, 01:37
Анна
И вот, кстати, детально описание случаев при которых эксперимент начинается в разное время для разных субъектов (стр.4 и 5)
http://www.cceb.med.upenn.edu/pages/cou ... cation.pdf
[ Сообщение с мобильного устройства ]
Re: форматирование данных для surivival analysis
Добавлено: 09 дек 2014, 06:00
gamm
Анна писал(а):Выше я привела формат как раз с использованием описания функции surv
вы не ответили на вопрос, какую задачу вы решаете - из перечисления терминов угадать это нельзя, неизвестно, имеют ли они к ней отношение. Нужна постановка задачи.
P.S. для зависимости от времени в coxph() есть сплайны и функция tt()
тыц
Re: форматирование данных для surivival analysis
Добавлено: 09 дек 2014, 12:20
Анна
Например, данные телеметрии (как я описала выше) - что непонятно в описании? поимка животных != дате начала эксперимента.
Вот пример с визуализацией
http://www.unc.edu/courses/2010spring/e ... 3/fig1.png
Re: форматирование данных для surivival analysis
Добавлено: 09 дек 2014, 14:01
gamm
del