gamm писал(а):
поскольку философского камня в природе нет, то ищите статью в приличном журнале с аналогичной задачей (не обязательно про птичек, можно про рыбок, например у
Зуура).
да, для вашей задачи статья должна содержать слова типа poisson regression model, longitudal count data, correlated count data, и т.д.
Когда выше я описывала примерный алгоритм, конечно, я и не надеялась попасть точно - это было скорее отображение понимания, что именно я ищу. То есть -
что должен быть такой стандартный подход к таким задачам.
Боюсь, что статьи в журналах мне не помогут в нем разобраться, поскольку, следуя современной моде экономить на пространстве текста (за счет, предполагаю, зачастую подсовывания вместо реальной науки - научной лажи, которую просто нельзя распознать) - понять что и как именно автор делал - не представляется возможным. Для меня ли, как новичка в этой сфере знаний, или и вообще. Кроме самых общих наводок, вот да - что нужна некая "regression model,", некое "longitudal count data" и т.д.
Мне - не понять, как ЭТО применить в моем случае из статьи.
Я ищу сейчас - пусть простого и стандартного, но описанного более-менее четкого алгоритма действий.
Можете ли вы мне помочь с этим?
И к слову. Просто.. чтобы показать, что я опять выступаю не только в привычной для меня здесь роли "незнайки", над которым проще насмеяться и услать изучать все азы, но и человека, задающего "странные, неудобные" вопросы, которые "не принято" задавать. А принято - разбираться самому, или же - делать вид, что разобрался и гнать лажу в науке.
Наткнулась сейчас на интересный обзор в книге Новиков Д.А., Новочадов В.В. Статистические методы в медико-биологическом эксперименте (типовые случаи), 2005. Привожу его целиком. Его печальные выводы - иллюстрируют в целом ситуацию, кстати и с отсутствием интереса к созданию отдельного подраздела на форуме ))
Также примечательно, что и автор обзора критически отзывается о моде вместо детальных описаний методов ссылаться на на "стандартные протоколы, которые на деле в этой области знаний нередко отсутствуют". Возможно, он имел в виду именно краткий стиль написания современных статей.
Авторами настоящей работы были исследованы 225 диссерта-
ций (22 докторских и 203 – кандидатских), успешно защищенных в
различных диссертационных советах за последние годы и без
замечаний аттестованных ВАК РФ. Исследования охватывали
большинство медицинских и биологических наук (16 специально-
стей из перечня), и в качестве основной методологии содержали
экспериментальное исследование как инструмент получения новых
знаний и установления новых закономерностей в соответствующей
отрасли знаний.
Главной особенностью работ медико-биологического профиля
является практически 100%-ная декларация статистической обра-
ботки экспериментальных данных (221 работа). Лишь четыре
диссертации не содержали сколько-нибудь приемлемых указаний
на статистические методы, а являлись практически описательными
полуколичественными работами без убедительного анализа дан-
ных, полученных в параллельных исследованиях номинально
сравниваемых групп.
Анализируемые диссертационные работы распределились сле-
дующим образом на пять неравнозначных групп.
1. Работы с декларированным, но некорректно примененным
набором простейших статистических методов («неправильно
обсчитанные»). Эти работы не были многочисленными и состави-
ли 28 из 225, или 12,4%.
2. Диссертации, содержащие правильно примененные про-
стейшие статистические методы, но не содержащие необходимого
набора экспериментальных групп/состояний («неправильно спла-
нированные»). К сожалению, в этой группе оказалось 75 работ
(33,3%), в том числе 6 докторских диссертаций. Никакая статисти-
ка не поможет в формировании научно обоснованных положений
при отсутствии адекватно подобранных условий эксперимента,
подбора групп и измеряемых параметров (см. выше раздел 2).
3. Диссертации, в которых рутинные статистические исследо-
вания соответствуют простой схеме попарно сравниваемых групп
(состояний) и т.п. – см. второй раздел выше. Это группа была
максимально представительной – 84 работы, или 37,3%. Именно
подобная практика в настоящее время составляет «золотой стан-
дарт» техники обработки экспериментальных данных при выпол-
нении диссертационных работ по медицине и биологии.
4. Диссертации, в которых присутствует расширенный стати-
стический анализ выборок, на основании которого не подтвержда-
ются предварительные качественные (прогнозируемые заранее)
выводы, а строятся самостоятельные выводы. Таких работ оказа-
лось 35 (15,6%), они выгодно отличались более продвинутым
математическим аппаратом и содержали обычно более глубокие
положения и результаты. Преимущественно, подобные работы
соответствовали специальностям, близким к цитологии, биохимии,
генетике, молекулярной биологии.
5. Работы, содержащие сложные продвинутые математические
построения с прицелом на создание или реальную разработку
математических моделей. Таких работ оказалось всего три (все –
докторские), или 1,3%. Арсенал применяемых в таких работах
методов выходит далеко за рамки настоящей книги.
Таким образом, при анализе результатов применения стати-
стических методов в экспериментальной биологии и медицине, на
примере диссертационных работ по медико-биологическим специ-
альностям вырисовываются два интересных момента.
Во-первых, только чуть более половины (52,5%) всех диссер-
таций выполнялось с применением статистических методах, адек-
ватных задачам, характеру выбранных параметров и схеме экспе-
римента. Типичной ошибкой в этом случае являлось недостаточно
корректное планирование эксперимента, выводящее статистиче-
ский анализ за рамки достаточности для получения научно обосно-
ванных выводов и положений.
Во-вторых, среди работ с адекватным набором методик пре-
обладали диссертации, выполненные с явно минимальным набо-
ром статистических процедур. Возникает закономерный вопрос:
является ли это данью традициям соответствующих научных школ
или недостаточностью информированностью о возможностях
статистического анализа? Складывалось также впечатление, что в
части работ целеполагание и задачи были явно заужены именно в
результате исходной ущербности статистического аппарата у
исследователя. Если это так, то незнание современных статистиче-
ских методов становится проблемой, оказывающей влияние на
научную сторону исследований, что уж вовсе недопустимо.
Конечно, авторы отдают себе отчет в том, что выполнение
диссертационных работ вовсе не исчерпывает интересы отечест-
венных исследований в области экспериментальной биологии и
медицины, но по математическому аппарату, на наш взгляд –
вполне отражает их спектр. Оно, к тому же, достаточно открыто
анализу, в отличие, например, от столь модных теперь коротких
сообщений со ссылками на стандартный протокол, который на
деле в этой области знаний нередко отсутствует.
Помимо неутешительных выводов, анализ диссертационных
работ по экспериментальной биологии и медицине позволил выде-
лить типовые (для рассматриваемой предметной области) задачи
анализа данных.
1. Описание данных используется в подавляющем большинст-
ве работ. Даже в части работ, не использующих статистические
методы, в иллюстративных целях применялись некоторые произ-
водные показатели – среднее, дисперсия и т.д. Краткое рассмотре-
ние описательной статистики, то есть описания результатов
эксперимента с помощью различных агрегированных показателей
и графиков, приведено в разделе 6.1 ниже.
2. Анализ сходства/различий объектов в рамках схемы экспе-
римента, описанной в разделе 2, встречается примерно в половине
работ. Соответствующие статистические методы подробно рас-
сматриваются в разделе 6.2 настоящей работы.
3. Анализ зависимостей – установление наличия/отсутствия
зависимостей между различными характеристиками объектов, а
также нахождение этих зависимостей – используется примерно в
20-30% работ. Соответствующие статистические методы описаны
в разделе 6.3 настоящей работы.
4. Задачи, требующие использования «продвинутых» стати-
стических методов (в первую очередь – многомерного анализа
[2, 32, 40]). К задачам данного класса (обработки «сложных» дан-
ных) можно отнести задачи выявления существенных признаков,
задачи классификации, прогнозирования и т.д. (см. краткое описа-
ние подобных задач, встречающихся не более чем в 10% статей и
диссертационных работ, в разделах 6.4 и 6.5 ниже).
Завершив анализ использования статистических методов в
статьях и диссертационных исследованиях по медицине и экспе-
риментальной биологии, и выделив типовые задачи, перейдем к
формализации последних.