Машинное обучение для прогнозирования динамики качества воздуха в городских условиях | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 4 января, печатный экземпляр отправим 8 января.

Опубликовать статью в журнале

Автор:

Рубрика: Информационные технологии

Опубликовано в Молодой учёный №45 (544) ноябрь 2024 г.

Дата публикации: 04.11.2024

Статья просмотрена: 17 раз

Библиографическое описание:

Горшкова, А. П. Машинное обучение для прогнозирования динамики качества воздуха в городских условиях / А. П. Горшкова. — Текст : непосредственный // Молодой ученый. — 2024. — № 45 (544). — С. 18-21. — URL: https://moluch.ru/archive/544/118953/ (дата обращения: 23.12.2024).



В данной работе представлен метод прогнозирования качества воздуха в городских условиях с применением машинного обучения на глобальных данных о качестве воздуха. Модель на основе алгоритма случайного леса предсказывает концентрации PM2.5.

Ключевые слова: качество воздуха, случайный лес, MSE, здоровье населения, оценка модели, уровень загрязнения, город.

Исследование проводилось на основе глобального набора данных о качестве воздуха, который содержит ежедневные замеры концентраций различных загрязняющих веществ для многочисленных городов и стран по всему миру [1]. В качестве целевой переменной для модели была выбрана концентрация частиц PM2.5, так как именно она является ключевым показателем загрязненности воздуха и имеет непосредственное влияние на здоровье населения. В качестве признаков модели использовались временные и климатические факторы, такие как год, месяц, день, температура и влажность, поскольку они оказывают значительное влияние на уровень загрязнения воздуха.

Данные были разделены на обучающую и тестовую выборки для построения и оценки модели. Для предсказания концентрации PM2.5 была использована модель случайного леса, которая показала высокий уровень точности. Оценка модели, включающая метрики средней квадратичной ошибки (MSE) и коэффициента детерминации (R²), продемонстрировала приемлемые значения, подтверждающие способность модели адекватно прогнозировать концентрации PM2.5. В таблице 1 представлен пример данных, использованных для обучения модели и выполнения прогнозов.

Таблица 1

Глобальный набор данных о качестве воздуха [1]

City

Country

Date

PM2.5

PM10

Bangkok

Thailand

2023–03–19

86.57

25.19

Istanbul

Turkey

2023–02–16

50.63

97.39

Rio de Janeiro

Brazil

2023–11–13

130.21

57.22

Berlin

Germany

2023–02–03

67.43

96.79

Bangkok

Thailand

2023–06–13

16.34

28.8

Рейтинг стран по прогнозируемому качеству воздуха

Рис. 1. Рейтинг стран по прогнозируемому качеству воздуха

Рейтинг городов по прогнозируемому качеству воздуха

Рис. 2. Рейтинг городов по прогнозируемому качеству воздуха

Прогнозируемое качество воздуха на разные промежутки времени

Рис. 3. Прогнозируемое качество воздуха на разные промежутки времени

Результаты

  1. Рейтинг стран и городов : Модель была использована для предсказания уровня PM2.5 в различных странах и городах. На основе этих прогнозов был построен рейтинг, показывающий топ-5 стран и городов с наилучшим качеством воздуха (т. е. наименьшее значение PM2.5). Рейтинг представлен на графиках (Рисунки 1 и 2), где видны страны (например, Франция, Южная Корея, Великобритания) и города (например, Париж, Сеул, Лондон), характеризующиеся относительно низким уровнем загрязнения PM2.5.
  2. Прогноз на будущее : Также был выполнен прогноз динамики PM2.5 на 30 дней вперед (Рисунок 3). На графике видно колебание уровней PM2.5, причем наиболее низкие значения ожидаются через две недели после начала прогноза, после чего уровень загрязнения постепенно возрастает. Такой подход позволяет городам и государствам заранее оценить возможные изменения в качестве воздуха и принимать проактивные меры по снижению загрязнения в периоды, когда ожидается его рост, обеспечивая тем самым защиту здоровья населения.

Заключение

Результаты исследования показывают, что использование методов машинного обучения на основе глобальных данных о качестве воздуха представляет собой эффективный инструмент для прогнозирования уровня загрязнения воздуха в городских условиях. Модель, построенная с применением алгоритма случайного леса, позволяет не только предсказывать концентрацию загрязняющих веществ, таких как PM2.5, но и выявлять страны и города с лучшими показателями качества воздуха. Такой подход дает возможность прогнозировать изменения уровня загрязненности в будущем, что особенно полезно для долгосрочного планирования и принятия мер. Прогнозирование позволяет городским властям и правительствам своевременно разрабатывать и внедрять стратегии по улучшению качества воздуха, тем самым снижая потенциальное воздействие загрязнения на здоровье населения и улучшая экологическую ситуацию в мегаполисах.

Литература:

1. Global Air Quality Dataset. — Текст: электронный // kaggle: [сайт]. — URL: https://www.kaggle.com/datasets/waqi786/global-air-quality-dataset (дата обращения: 02.11.2024).

Основные термины (генерируются автоматически): качество воздуха, MSE, случайный лес, город, здоровье населения, оценка модели, прогнозируемое качество воздуха, уровень загрязнения, глобальный набор данных, машинное обучение.


Похожие статьи

Прогнозирование частоты вызовов скорой помощи на основе интеллектуального анализа данных

В работе предлагается использование классификационных моделей для прогнозирования количества вызовов скорой помощи в зависимости от климатических условий, состояния магнитосферы и степени загрязненности воздуха. Вывод моделей сделан с помощью софтуер...

Система мониторинга транспортного парка как способ совершенствования энергоэффективности на предприятии

В статье раскрыта методика проведения анализа при определении место энергоэффективности в деятельности компании. На основании проведенного анализа предложен метод, оптимизирующий энергопотребление.

Разработка и исследование мультиагентных моделей

Построена мультиагентная модель торгового центра «Континент». Исследование и построение модели выполнено с использованием инструментального средства AnyLogic 8 PLE. Проведен ряд экспериментов с моделью: 1) Исследована плотность пешеходного потока при...

Предпроектный анализ процесса распределения горячей воды для мониторинга потерь горячей воды

В статье авторы приводят результаты предпроектных исследований бизнес-процессов компании по распределению горячей воды с целью разработки информационно-аналитической системы.

Концепция BIM-технологии при проектировании автомобильных дорог

В статье авторами проводится анализ технологии информационного моделирования и оценка эффективности использования.

Возможности применения нейросетевого прогнозирования для определения пропускной способности аэропорта «Домодедово»

В данной статье проведен анализ возможностей применения нейросетевого подхода для определения пропускной способности секторов ОВД на примере аэропорта «Домодедово». Рассмотренная методика позволяет прогнозировать краткосрочную пропускную способность ...

Использование ГИС-технологий в изучении эколого-ландшафтных систем земледелия Шатковского района Нижегородской области

В статье рассмотрены современные проблемы деградации сельскохозяйственных земель, а так же особенности их изучения с помощью географических информационных систем. Предложена схема алгоритма растра регрессионной модели, которая позволит повысить эффек...

Методические основы определения потенциала загрязнения атмосферы по методу Э. Ю. Безуглой в г. Москве

В статье авторы определяют коэффициент потенциала загрязнения атмосферы города Москвы в динамике с 2016 года по 2020 год.

Прогноз дальности видимости в аэропорту Манас с применением методов глубокого обучения

В настоящей работе исследуются различные архитектуры глубоких нейронных сетей для прогнозирования временного ряда горизонтальной дальности видимости в аэропорту Манас.

Гидравлический расчет коллектора по Рациональному методу (США)

В статье описывается последовательность выполнения расчета расходов дождевого стока для сети дождевой канализации с использованием Рационального метода. Основными величинами для определения расхода в Рациональном методе являются коэффициент стока, ин...

Похожие статьи

Прогнозирование частоты вызовов скорой помощи на основе интеллектуального анализа данных

В работе предлагается использование классификационных моделей для прогнозирования количества вызовов скорой помощи в зависимости от климатических условий, состояния магнитосферы и степени загрязненности воздуха. Вывод моделей сделан с помощью софтуер...

Система мониторинга транспортного парка как способ совершенствования энергоэффективности на предприятии

В статье раскрыта методика проведения анализа при определении место энергоэффективности в деятельности компании. На основании проведенного анализа предложен метод, оптимизирующий энергопотребление.

Разработка и исследование мультиагентных моделей

Построена мультиагентная модель торгового центра «Континент». Исследование и построение модели выполнено с использованием инструментального средства AnyLogic 8 PLE. Проведен ряд экспериментов с моделью: 1) Исследована плотность пешеходного потока при...

Предпроектный анализ процесса распределения горячей воды для мониторинга потерь горячей воды

В статье авторы приводят результаты предпроектных исследований бизнес-процессов компании по распределению горячей воды с целью разработки информационно-аналитической системы.

Концепция BIM-технологии при проектировании автомобильных дорог

В статье авторами проводится анализ технологии информационного моделирования и оценка эффективности использования.

Возможности применения нейросетевого прогнозирования для определения пропускной способности аэропорта «Домодедово»

В данной статье проведен анализ возможностей применения нейросетевого подхода для определения пропускной способности секторов ОВД на примере аэропорта «Домодедово». Рассмотренная методика позволяет прогнозировать краткосрочную пропускную способность ...

Использование ГИС-технологий в изучении эколого-ландшафтных систем земледелия Шатковского района Нижегородской области

В статье рассмотрены современные проблемы деградации сельскохозяйственных земель, а так же особенности их изучения с помощью географических информационных систем. Предложена схема алгоритма растра регрессионной модели, которая позволит повысить эффек...

Методические основы определения потенциала загрязнения атмосферы по методу Э. Ю. Безуглой в г. Москве

В статье авторы определяют коэффициент потенциала загрязнения атмосферы города Москвы в динамике с 2016 года по 2020 год.

Прогноз дальности видимости в аэропорту Манас с применением методов глубокого обучения

В настоящей работе исследуются различные архитектуры глубоких нейронных сетей для прогнозирования временного ряда горизонтальной дальности видимости в аэропорту Манас.

Гидравлический расчет коллектора по Рациональному методу (США)

В статье описывается последовательность выполнения расчета расходов дождевого стока для сети дождевой канализации с использованием Рационального метода. Основными величинами для определения расхода в Рациональном методе являются коэффициент стока, ин...

Задать вопрос