форматирование данных для surivival analysis

Вопросы по статистическому пакету R. Не обязательно гео.
Ответить
Анна
Завсегдатай
Сообщения: 386
Зарегистрирован: 07 фев 2004, 14:31
Репутация: 7
Откуда: Лозанна
Контактная информация:

форматирование данных для surivival analysis

Сообщение Анна » 08 дек 2014, 16:09

Добрый день,

Как правильно форматировать данные для survival analysis (пакет survival) в случае если данные: right-censored staggered entry with time-dependent covariates?

Особенно непонятно, как кодировать staggered entry при наличии time-dependent covariate.

Например:

Код: Выделить всё

start stop arrest.time week arrest fin age race wexp mar paro prio educ employed
1.1 0 1 0 20 1 0 27 1 0 0 1 3 3 0
1.2 1 2 0 20 1 0 27 1 0 0 1 3 3 0
...
1.19 18 19 0 20 1 0 27 1 0 0 1 3 3 0
1.20 19 20 1 20 1 0 27 1 0 0 1 3 3 0
2.1 0 1 0 17 1 0 18 1 0 0 1 8 4 0
2.2 1 2 0 17 1 0 18 1 0 0 1 8 4 0
...
2.16 15 16 0 17 1 0 18 1 0 0 1 8 4 0
2.17 16 17 1 17 1 0 18 1 0 0 1 8 4 0
Это пример без staggered entry - но если представить, что 1ый объект попал под наблюдение только на 5 неделю - как его кодировать первые 5 недель?

Спасибо

gamm
Гуру
Сообщения: 4067
Зарегистрирован: 15 окт 2010, 08:33
Репутация: 1062
Ваше звание: программист
Откуда: Казань

Re: форматирование данных для surivival analysis

Сообщение gamm » 08 дек 2014, 19:12

Анна писал(а):Это пример без staggered entry - но если представить, что 1ый объект попал под наблюдение только на 5 неделю - как его кодировать первые 5 недель?
survival анализирует события, причем необратимые ("смерть"). Время отсчитывается от момента "рождения" объекта. Что такое "попал под наблюдение"? если он в этот момент "родился", то просто время для него в этот момент равно 0. Если он уже жил до этого (с первой недели), то он был жив во все моменты от рождения - восполните данные в соответствующие моменты времени. Аналогично с цензорированием, просто там вместо момента времени задается диапазон.

в пакете есть helper function Surv(), посмотрите описание. Она позволяет все задавать

Анна
Завсегдатай
Сообщения: 386
Зарегистрирован: 07 фев 2004, 14:31
Репутация: 7
Откуда: Лозанна
Контактная информация:

Re: форматирование данных для surivival analysis

Сообщение Анна » 09 дек 2014, 01:31

Выше я привела формат как раз с использованием описания функции surv и я бы не задавала вопроса, если бы было очевидно, что делать с типом данных generalized type 1 censored (ака staggered entry).
Если наблюдения (например, телеметрия) сделана для животных, пойманных в разное время, а эксперимент начался в какой-то фиксированный более ранний момент, то неясно, нужно ли кодировать момент до поимки, но с начала эксперимента, иным образом (например, вводить код 99 для такого состояния по сравнению с состояниями 0 и 1 для статусов жив и умер)
Вы не могли бы привести конкретный пример кодирования такого случая (модифицировав например, мой пример) и именно с time-dependent covariate?
Хелп, также как и большое число сайтов и форумов, я уже пересмотрела и если бы "задачка так просто решалась армянское радио этого не спрашивало"

[ Сообщение с мобильного устройства ]

Анна
Завсегдатай
Сообщения: 386
Зарегистрирован: 07 фев 2004, 14:31
Репутация: 7
Откуда: Лозанна
Контактная информация:

Re: форматирование данных для surivival analysis

Сообщение Анна » 09 дек 2014, 01:37

И вот, кстати, детально описание случаев при которых эксперимент начинается в разное время для разных субъектов (стр.4 и 5)
http://www.cceb.med.upenn.edu/pages/cou ... cation.pdf

[ Сообщение с мобильного устройства ]

gamm
Гуру
Сообщения: 4067
Зарегистрирован: 15 окт 2010, 08:33
Репутация: 1062
Ваше звание: программист
Откуда: Казань

Re: форматирование данных для surivival analysis

Сообщение gamm » 09 дек 2014, 06:00

Анна писал(а):Выше я привела формат как раз с использованием описания функции surv
вы не ответили на вопрос, какую задачу вы решаете - из перечисления терминов угадать это нельзя, неизвестно, имеют ли они к ней отношение. Нужна постановка задачи.

P.S. для зависимости от времени в coxph() есть сплайны и функция tt() тыц

Анна
Завсегдатай
Сообщения: 386
Зарегистрирован: 07 фев 2004, 14:31
Репутация: 7
Откуда: Лозанна
Контактная информация:

Re: форматирование данных для surivival analysis

Сообщение Анна » 09 дек 2014, 12:20

Например, данные телеметрии (как я описала выше) - что непонятно в описании? поимка животных != дате начала эксперимента.
Вот пример с визуализацией http://www.unc.edu/courses/2010spring/e ... 3/fig1.png

gamm
Гуру
Сообщения: 4067
Зарегистрирован: 15 окт 2010, 08:33
Репутация: 1062
Ваше звание: программист
Откуда: Казань

Re: форматирование данных для surivival analysis

Сообщение gamm » 09 дек 2014, 14:01

del

Ответить

Вернуться в «R»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость