Это данные измерений загрязнения воздуха. Они закодированы в виде пятисимвольных последовательностей. Внутри строк закодированные значения разделены пробелами. Вначале каждой строки идёт номер поста, потом - день месяца (месяц и год хранятся отдельно в заголовке файла), затем - время отбора проб воздуха (08ШШШ). Потом в строке следуют содержания разных загрязнителей. В самом конце строки идёт два закодированных значения о метеоусловиях(+0700 и 12010). В каждой строке количество записей различается.
Я думаю - следует каждую пятисисмольную последовательность разобрать по маске и вытянуть оттуда собственно значения величин. Но как реализовать запись значений в конкретные столбцы конечного дата-фрейма?
Код: Выделить всё
07017 08ШШШ 01002 02009 04002 05007 08001 10001 19002 +0700 12010 ::
07013 13ШШШ 08002 10001 19002 :: +1100 12090 ::
07017 20ШШШ 01004 02029 04004 05008 08002 10003 19004 +1260 00000 ::
07025 01ШШШ 02027 05014 08002 10002 19003 :: +0600 18033 ::
07027 08ШШШ 01002 02004 04004 05010 08002 10002 19004 +0080 18018 ::
07023 13ШШШ 08001 10001 19003 :: +0870 20040 ::
07011 08ШШШ 22015 :: ::
07011 20ШШШ 22010 :: ::
07021 08ШШШ 22006 :: ::
06015 01ШШШ 02010 05003 08000 10000 19001 :: +0780 18060 ::
06017 07ШШШ 01002 02014 04004 05007 08000 10000 19002 +0770 18010 ::
06013 13ШШШ 08000 10000 19003 :: +1820 18090 ::