Модель прогноза заторов льда на реке Кичменьга в Вологодской области
Модель прогноза заторов льда на реке Кичменьга в Вологодской области
Аннотация
Заторы, возникающие в период весеннего вскрытия ото льда рек европейской территории России, являются опасными гидрологическими явлениями. Резкий рост уровня воды выше створа перемычки, сформированной в русле крупнообломочным льдом, вызывает затопление территории и может повлечь за собой значительный материальный ущерб. Изменения климата влияют на гидрологический режим водотоков и способствуют изменению частоты и характеристик ледовых заторов. Разработка моделей прогноза заторов льда при вскрытии речных русел является актуальной задачей современной инженерной гидрологии, непосредственно связанной с обеспечением водной безопасности населения и отраслей экономики. Целью исследований стала разработка экспресс-модели прогноза эпизодического образования ледового затора на р. Кичменьга (Вологодская область) между д. Кузьмино и Куфтино. Материал исследований представлен сведениями о гидрологическом режиме реки Кичменьга за 1937–2021 гг. Массив данных разделен обучающую и валидационную выборки. В качестве двухфакторной вероятностной модели прогноза использовался бинарный логит, предикторами служили характерные уровни воды в период замерзания и вскрытия речного русла. Оценки коэффициентов, входящих в модель, получены методом максимального правдоподобия. Выполнена проверка статистического качества полученного уравнения. Временная валидация модели произведена по обучающей и контрольной выборкам с использованием матриц ошибок. Прогноз образования ледового затора может быть выполнен на дату начала весенних ледовых явлений.
1. Введение
Для большинства рек России, текущих с юга на север, характерно возникновение весенних заторов льда, являющихся опасными гидрологическими явлениями. В зависимости от интенсивности подъема уровня воды и степени хозяйственного освоения поймы ледовая перемычка, возникающая в период вскрытия, может привести к стихийному затоплению территорий и стать причиной возникновения чрезвычайной ситуации . Заторные наводнения наносят значительный экономический ущерб. На территории Российской Федерации за период 1991–2023 гг. произошло более 140 заторных наводнений с зафиксированным материальным ущербом, при этом общее число наводнений, вызванных весенними заторами льда в речных руслах, может быть в 2,5 раза выше .
Изменения климата влияют на гидрологический режим водотоков, внутригодовое перераспределение стока способствует изменению частоты и характеристик ледовых заторов, что особенно выражено на северных реках , . Разработка моделей прогноза заторов льда при вскрытии речных русел является актуальной задачей современной инженерной гидрологии, непосредственно связанной с обеспечением водной безопасности населения и отраслей экономики.
Из-за сложности и многофакторности процесса образования затора универсальной модели прогноза, применяемой для различных водотоков, не существует. Модели разрабатываются для конкретного русла и речного участка. Прогнозные математические модели для незарегулированных участков рек включают в качестве предикторов факторы заторообразования, к которым относятся морфометрические особенности русла и гидрометеорологические условия. Для зарегулированных русел добавляются антропогенные факторы.
К морфометрическим особенностям русла относят элементы рельефа, оказывающие влияние на направление течения и скоростной режим потока, при которых происходит затруднение его транспортирующей способности: рукава, острова, перекаты и плесы, пороги, излучины и т.д. Связь частоты заторов с морфометрией заторных участков р. Мистассини (Канада, провинция Квебек) была получена в исследовании по данным наблюдений за 40 лет. В работе влияние морфометрии русла на частоту образования заторов было изучено для рек бассейна Северной Двины.
Гидрометеорологическими факторами, способствующими возникновению затора, являются факторы, характерные для периода замерзания реки, ледостава и периода вскрытия. К числу факторов периода формирования ледостава относятся высокие уровни воды, зашугованность русла, чередование замерзания и вскрытия. В период ледостава учитываются толщина льда (максимальная и перед вскрытием), высота снега на льду. В период вскрытия реки влияние оказывают интенсивность паводка, расход и уровень воды и т.д. Метеорологические факторы также рассматриваются для каждой из фаз ледового режима и оцениваются суммой положительных или отрицательных температур за определенный интервал времени.
При построении математических моделей прогноза в большинстве случаев используют классический эмпирический пороговый анализ, а также статистические методы, включая логистическую регрессию и дискриминантный анализ . Для крупных и средних рек, на которых происходит ежегодное образование заторов, способных повлечь материальный ущерб, разработан и успешно применяется целый ряд моделей прогноза максимальных заторных уровней и заторных подъемов воды . Для средних и малых рек России с эпизодическим возникновением заторов моделей прогноза значительно меньше. Это связано, как правило, с небольшим размером материального ущерба, возникающего при заторном наводнении с редкой повторяемостью.
Целью исследований стала разработка экспресс-модели прогноза эпизодического образования ледового затора на р. Кичменьга (Вологодская область) между д. Кузьмино и Куфтино.
По площади водосбора (2330 км2) р. Кичменьга относится к средним рекам. Она вытекает из Кичменских болот и впадает в р. Юг (приток р. Северной Двины). При длине водотока 208 км для русла характерны извилистость, наличие перекатов и небольшие глубины. Дно сложено крупнообломочными (галечными) грунтами, с включением небольших валунов. Тип питания реки относится к смешанному, с преобладанием снегового. Водный режим типичен для восточноевропейских рек. Устойчивый ледостав длится с середины ноября, вскрытие начинается в середине апреля. Заторы образуются эпизодически на участке длиной 10 км, расположенном в 15 км от устья. В центре участка вблизи д. Захарово находится гидрологический пост. Отметка нуля графика поста 100,75 м, при уровнях воды 450 см над нулем графика узкая пойма затапливается. Частота заторов не превышает 40%, рассматриваемый речной участок имеет низкий индекс потенциального ущерба от заторных наводнений.
Впервые вероятностная модель прогноза образования затора для незарегулированного участка реки Кичменьга была получена в исследовании по данным наблюдений за 1960–2015 гг. В модель вошли гидрологические факторы, характеризующие ледостав и вскрытие реки. Для прогноза использовался градиент роста расхода:
где Q2 — расход на дату подвижек льда D2; Q1 расход на дату максимальной толщины льда D1.
При превышении градиентом критического значения затор льда должен образоваться. Общая предсказательная способность модели составила 84%. К сожалению, ограниченный ряд наблюдений за толщиной льда не позволил выполнить детальную верификацию модели.
2. Методы и принципы исследования
Материал исследований представлен дополненными сведениями о гидрологическом режиме реки Кичменьга за 1937–2021 гг. по данным поста у д. Захарово, приведенным в гидрологических ежегодниках и Государственном водном кадастре.
В отличие от наблюдений за толщиной льда, ряд наблюдений за уровнями воды и ледовыми явлениями на реке включал 84 года. С учетом приведения расчетов к гидрологическому году и пропусков в наблюдениях для анализа использовался ряд наблюдений за 82 года.
Массив данных был разделен на две выборки: обучающую (70% наблюдений) и валидационную (30% наблюдений). Соотношение объемов выборок являлось классическим для машинных методов обучения.
В качестве прогнозного уравнения использовалась уравнение бинарной логистической регрессии, включающей в качестве предикторов характерные уровни воды в период замерзания и вскрытия речного русла:
где pi — вероятность образования затора в i-том году; H1i – уровень воды над 0 графика поста в начале ледостава, см; H2i — уровень воды над 0 графика поста на дату, предшествующую началу весенних ледовых явлений, см.
Оценка коэффициентов модели и сопутствующие расчеты выполнены в программном обеспечении GRETL.
Временная валидация модели производилась как для обучающей, так и для валидационной выборки. Поскольку классификация являлась бинарной (затор будет / затора не будет) возможны правильные, ложноположительные и ложноотрицательные результаты. Для оценки прогнозных качеств модели был вычислен ряд метрик.
Общая точность:
где i — год в ряду наблюдений, i=1..57 для обучающей выборки; i=1..25 для валидационной выборки; ПЗi — предсказан затор, который был фактически; ПНЗi — предсказано отсутствие затора, которое было фактически; ЛЗi — предсказан затор, которого не было фактически; ЛНЗi —не предсказан затор, который был фактически.
Чувствительность, или способность прогнозировать возникновение затора:
Специфичность, или способность прогнозировать отсутствие затора:
3. Результаты и их обсуждение
Использование временного ряда для построения модели прогноза накладывало ограничения на тестовый набор данных. В обучающую выборку включены расположенные в хронологическом порядке значения переменных за 1938–1996 гг. (57 лет), в валидационную выборку включены более поздние значения переменных с 1997 по 2021 гг. (25 лет), также расположенные в хронологическом порядке. Описательная статистика обучающей и валидационной выборки приведена в таблице 1.
Таблица 1 - Описательная статистика выборок
Обучающая выборка | Валидационная выборка | |||
X1, см | X2, см | X1, см | X2, см | |
Среднее | 161,74 | 175,40 | 159,44 | 158,88 |
Стандартная ошибка | 3,92 | 4,82 | 6,34 | 4,21 |
Медиана | 164 | 167 | 157 | 155 |
Мода | 148 | 160 | 122 | 155 |
Стандартное отклонение | 29,63 | 36,35 | 31,68 | 21,05 |
Дисперсия выборки | 877,70 | 1321,57 | 1003,34 | 443,19 |
Эксцесс | -0,27 | 6,51 | -0,94 | 10,62 |
Асимметричность | 0,47 | 2,45 | 0,28 | 2,74 |
Интервал | 123 | 174 | 104 | 111 |
Минимум | 115 | 136 | 114 | 132 |
Максимум | 238 | 310 | 218 | 243 |
Счет | 57 | 57 | 25 | 25 |
Минимальные значения уровня воды в обучающей и валидационной выборках практически не отличались. Максимальное значение уровня воды в начале ледостава в обучающей выборке было выше на 9%, максимальное значение уровня воды на дату, предшествующую началу весенних ледовых явлений, в обучающей выборке было выше на 27%.
За период наблюдений 1938-1996 гг. на рассматриваемом участке произошло 17 заторов, за период наблюдений 1997–2021 гг. произошло 10 заторов льда. Коэффициент заторности, представляющий собой отношение числа лет с заторами к общему числу лет наблюдений, для каждой из выборок составил 30% и 40% соответственно. Частота возникновения заторов увеличилась, что может быть связано с климатическими изменениями, и согласуется с выводами, приведенными в исследовании , для рек бассейна Малой Северной Двины.
Оценки коэффициентов, входящих в модель (2), были получены методом максимального правдоподобия. В результате расчетов прогнозная модель для определения вероятности затора на р. Кичменьга между д. Кузьмино и Куфтино имела вид:
Стандартные ошибки модели рассчитывались на основе Гессиана. Значение R-квадрат Макфаддена равно 0,57, значение исправленного R-квадрат составило 0,48.
Доверительные интервалы для коэффициентов при факторах, вычисленные для вероятности 95%, составили: для Х1 [0,044, 0,171], для Х2 [0,015, 0,075]. Все коэффициенты в модели значимы на 1% уровне, что свидетельствовало о значимом влиянии факторов на исследуемый процесс. Знаки у коэффициентов в модели (3) положительные, т.е. с ростом значений предикторов вероятность образования заторов увеличивается. Это не противоречит физической логике образования ледовых заторов и условиям, препятствующим разрушению льда .
Для оценки предельных эффектов были вычислены угловые коэффициенты у каждого из факторов. Увеличение уровня воды на дату ледостава на 1 см при прочих равных условиях увеличивает вероятность возникновения затора на 1,1%, увеличение уровня воды на дату, предшествующую началу ледовых явлений, увеличивает вероятность образования затора на 0,4%. Условия замерзания в данном случае имеют больший предельный эффект.
Матрица ошибок для обучающей выборки представлена в Таблице 2. Здесь обозначение «0» означает отсутствие затора, обозначение «1» означает возникновение затора. Первый столбец соответствует факту, первая стока соответствует прогнозу.
Таблица 2 - Матрица ошибок обучающей выборки
| 0 затора не будет | 1 затор будет |
0 затора не будет | 38 | 2 |
1 затор будет | 2 | 15 |
По главной диагонали матрицы расположены правильно предсказанные случаи: в 38 случаях модель правильно предсказала отсутствие затора, в 15 случаях модель правильно предсказала возникновение затора. Метрики точности для обучающей выборки достаточно высокие: общая точность 93%, чувствительность 88%, специфичность 95%.
Матрица ошибок для валидационной выборки представлена в Таблице
Таблица 3 - Матрица ошибок валидационной выборки
| 0 затора не будет | 1 затор будет |
0 затора не будет | 14 | 1 |
1 затор будет | 3 | 7 |
Метрики точности для валидационной выборки были следующие: общая точность 84%, чувствительность 70%, специфичность 93%.
Если оценивать предсказательную способность модели по всем имеющимся данным, то метрики точности составят: общая точность 90%, чувствительность 81%, специфичность 94%.
Разработанная модель имеет ряд преимуществ. В бинарной логистической модели (3) общая точность прогноза достаточно высокая и превосходит точность модели, основанной на градиенте роста расхода (1). Другим преимуществом предложенной модели является использование в качестве предикторов уровней воды, измеряемых на гидрологическом посту ежедневно, в то время как данные ледовой съемки, необходимые для применения модели (1), приводятся только на 5, 15, 20 и 25 числа каждого месяца. Для прогноза достаточно знать уровень воды на дату начала ледостава и уровень воды за сутки до начала весенних ледовых явлений. Заблаговременности прогноза будет на день меньше, чем разность по времени между датой начала весенних ледовых явлений и датой ледохода, что больше, чем у модели (1) и составляет по данным наблюдений от 2 дней до месяца.
Для выполнения прогноза достаточно подставить в уравнение (3) значения глубин и округлить результат до целого числа. Если ответом будет «1» затор льда прогнозируется, если ответом будет «0» затор не прогнозируется.
Поскольку затор льда является опасным гидрологическим явлением, то наиболее важной метрикой точности является чувствительность прогнозной модели. Разработанная модель хорошо предсказывает отсутствие заторов, и хуже справляется с предсказанием образования заторов. Наиболее выражено снижение чувствительности модели на данных за 1997–2021 год. Именно в этот период стали отчетливо проявляться температурные аномалии, связанные с изменением климата. Для повышения чувствительности модели возможно включить в качестве дополнительного предиктора сумму положительных или отрицательных температур, что является направлением дальнейших исследований.
4. Заключение
В результате проведенных исследований получена модель прогноза эпизодических заторов льда, возникающих на реке Кичменьга (Вологодская область) между д. Кузьмино и Куфтино.
В качестве прогнозного уравнения использовалась модель бинарной логистической регрессии, включающая в качестве предикторов характерные уровни воды в период замерзания и вскрытия речного русла. Значения предикторов для выполнения прогноза измеряются на гидрологическом посту ежедневно.
Общая точность прогноза достаточно высокая и превосходит точность прогнозов, получаемых по модели, основанной на градиенте роста расхода. Анализ метрик точности показал превышение специфичности над чувствительностью.
Для повышения чувствительности модели возможно включить в качестве дополнительного предиктора сумму положительных или отрицательных температур, что является направлением дальнейших исследований.
