К основному содержанию

Пространственная статистика

Пространственная статистика — один из самых сложных и одновременно интересных предметов математического цикла на кафедре. Известно, что география начинается тогда, когда возникает фактор пространственного положения. Либо оно оказывает влияние на характеристики наблюдаемых в нём явлений, либо само местоположение становится исследуемой характеристикой. Например, известно, что температура воздуха меняется в зависимости от местоположения, при этом есть факторы, которые влияют на интенсивность этих изменений; стоимость жилья по-разному реагирует на увеличение жилой площади в центре города и на его окраинах; а птицы часто стремятся строить гнезда так, чтобы избегать близкого соседства с другими семействами.
Каждый из перечисленных примеров — это случайный процесс в пространстве и времени. Он организуется по своим законам, но эту организацию можно описать формально, используя аппарат математической статистики. Именно это и позволяет сделать пространственная статистика — раздел математической статистики, посвященный двумерным и многомерным случайным величинам. Строго говоря, пространственная статистика не привязана именно к географическому пространству. Она находит широкое применение в биологии, медицине, химии, физике и прочих науках, главным образом естественных. Но в нашем курсе мы интересуемся именно географическими приложениями.
Курс состоит из трех разделов. Первый раздел — геостатистика — посвящен исследованию случайных полей в пространстве, их автокорреляционных свойств и подходов к интерполяции, которые позволяют учитывать эти свойства. Например, мы смотрим как правильно интерполировать температуры с учетом трендов, связанных с континентальностью и высотностью. Во втором разделе рассматриваются явления пространственной зависимости и пространственной гетерогенности. Пространственная зависимость обнаруживает себя тогда, когда характеристики объектов оказываются связаны с характеристиками рядом расположенных объектов. Например, сложно представить себе дешевое жилье в дорогом квартале. Пространственная гетерогенность работает по-иному, она проявляется в том, что в разных местоположениях вклад факторов среды в формирование исследуемого показателя неодинаков. Например, где-то природные пожары больше связаны с температурным режимом, а где-то с продолжительностью и частотой засух. Статистическое моделирование случайных процессов с подобными свойствами приводит к необходимости использования регрессионных моделей особого вида — пространственной и географически взвешенной регрессии. Наконец, третий раздел — точечные процессы — связан с исследованием местоположения как случайной переменной. С помощью моделей таких процессов можно описывать системы расселения, местоположение абонентов сотовой сети и другие точечные паттерны.

Практическая часть курса реализуется в виде практикума на языке R и является логическим продолжением курса «Программирование и анализ данных». Также этот курс отличается от других дисциплин магистратуры довольно глубоким погружением в математический аппарат используемых методов, без понимания которого невозможно их осмысленное применение.