2023. — Т 15. — № 6 - перейти к содержанию номера...

Постоянный адрес этой страницы - https://esj.today/55nzvn623.html

Полный текст статьи в формате PDF (объем файла: 1.2 Мбайт)


Ссылка для цитирования этой статьи:

Тараканов, Д. А. Восстановление пропущенных значений в данных гидрометеорологических наблюдений с использованием машинного обучения (на примере реки Белая, Республика Башкортостан) / Д. А. Тараканов // Вестник Евразийской науки. — 2023. — Т 15. — № 6. — URL: https://esj.today/PDF/55NZVN623.pdf (дата обращения: 24.06.2024).


Восстановление пропущенных значений в данных гидрометеорологических наблюдений с использованием машинного обучения (на примере реки Белая, Республика Башкортостан)

Тараканов Денис Анатольевич
ФГБОУ ВО «Уфимский университет науки и технологий», Уфа, Россия
Ассистент кафедры «Безопасности производства и промышленной экологии»
Аспирант 3 года обучения
E-mail: tarakanov021098@gmail.com
ORCID: https://orcid.org/0000-0003-0253-8624
РИНЦ: https://elibrary.ru/author_profile.asp?id=1153499
SCOPUS: https://www.scopus.com/authid/detail.url?authorId=57218675021

Аннотация. Поскольку решение проблемы с пропущенными данными имеет ключевое значение при исследованиях, связанных с пространственно-климатическими и гидрологическими изменениями, выявлением и оценкой трендов и закономерностей, в данной работе исследуется возможность использования машинного обучения, как инструмента для восстановления пропущенных значений во временных рядах данных гидрометеорологических наблюдений. Предложен алгоритм заполнения пропусков, предполагающий три этапа. На первом этапе определяются непрерывные наборы данных на смежных постах (временные ряды данных на постах наблюдений, расположенных вблизи с исходным постом наблюдения, не имеющие пропусков) с высокой корреляционной взаимосвязью. Второй этап заключается в формировании обучающего и тестируемого наборов данных: обучающий набор данных представляет собой все имеющиеся значения исходного ряда наблюдений и соответствующие им значения смежных постов наблюдения; тестируемый набор данных состоит из всех имеющихся пропущенных значений и соответствующих им значений со смежных постов. На третьем этапе осуществляется выбор подходящих методов машинного обучения и метрик для оценки точности и эффективности разработанных моделей восстановления пропусков. Используя предложенный подход, получены наиболее оптимальные модели, позволяющие с высокой точностью восстановить пропущенные значения: для временных рядов расхода воды такими моделями являются множественная линейная регрессия и многослойный персептрон; для уровня воды — многослойный персептрон; для количества осадков — многослойный персептрон; для температуры воздуха — множественная линейная регрессия. Следующим этапом работы является исследование возможности улучшения результатов работы рассмотренных моделей путем использования инструментов для определения оптимальных гиперпараметров.

Ключевые слова: восстановление пропусков; восстановление пропущенных значений; гидрологические данные; климатические данные; машинное обучение; река Белая

 

Скачать

Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.

ISSN 2588-0101 (Online)

Уважаемые читатели! Комментарии к статьям принимаются на русском и английском языках.
Комментарии проходят премодерацию, и появляются на сайте после проверки редактором.
Комментарии, не имеющие отношения к тематике статьи, не публикуются.

Добавить комментарий