| Home | E-Submission | Sitemap | Contact Us |  
top_img

The Korean text of this paper can be translated into multiple languages on the website of http://jksee.or.kr through Google Translator.

J Korean Soc Environ Eng > Volume 47(9); 2025 > Article
경상북도의 대기오염물질 배출량과 대기질의 연관성 분석 (2017-2021)

Abstract

A variety of policies have been suggested and implemented for air quality control in Korea. However, high ambient concentrations of PM10 and PM2.5 exceeding regulation levels have been frequently reported. In this study, the air quality in Gyeongsangbuk-do including 10 cities (si) and 12 counties (gun) was analyzed using data from the national air pollution monitoring network and from the clean air policy support system (CAPSS) from 2017 to 2021. The national air pollution monitoring network data showed that the concentrations of CO, NO2, SO2, PM10, and PM2.5 decreased gradually and the concentration of O3 maintained constantly during 5 years. The data from the CAPSS indicated that the main sources of CO, NOx, SOx, VOCs, and NH3, were the biomass combustion, road/non-road mobile sources, industrial activities, organic solvents usage, and agriculture, respectively. In addition, the main sources of total suspended particulate (TSP), PM10, and PM2.5 were fugitive dust and biomass combustion. It was found that no significant linear relationship between the air quality concentrations data and CAPSS data due to the different characteristics of the two data groups. Moreover, machine learning models were established using the national air pollution monitoring network data, CAPSS data, meteorological data, and socio-economic indices to predict the concentrations of PM10 and PM2.5. It was revealed that the concentrations of PM10 and PM2.5 were significantly affected by the emissions of CO and PM2.5 (CAPSS) and electricity, gas, steam, and air conditioning supply, respectively.

요약

국내에서는 대기오염물질 저감을 위한 다양한 정책을 시행하고 있으나, 2021년을 기준으로 오존과 미세먼지(PM10, PM2.5)는 환경기준을 초과한 사례가 확인되어 지속적인 모니터링 및 관련 연구가 필요하다. 본 연구에서는 경상북도를 대상 지역으로 도시대기측정망에서 수집된 대기질 자료와 대기정책지원시스템(CAPSS)에서 제공하는 배출량 자료 간의 관계를 분석하였다. 경상북도의 대기오염물질 2021년 연평균 농도는 2017년 대비 대부분 항목이 감소하였으나, 오존은 일정한 추세를 보였다. 경상북도 대기오염물질의 2021년 배출량은 2017년 대비 NH3가 증가하였으며 나머지 항목은 대부분 감소하였다. 각 오염물질의 주요 배출원은 CO가 생물성 연소, NOx가 도로 및 비도로이동오염원, SOx가 산업 활동, VOCs가 유기용제 사용과 생물성 연소, NH3가 농업, 입자상 오염물질은 모두 비산먼지와 생물성 연소로 확인되었다. 수집된 대기질 자료와 배출량 자료에 사회경제지표를 추가하여 Pearson 상관관계를 통해 선형적 상관관계를 분석하였는데, 대기질과 배출량 간에는 대부분 0.5이하의 낮은 상관관계를 보였으며, 대기질과 사회경제지표는 대부분 중간정도의 상관관계, 배출량과 사회경제지표는 대부분 높은 상관관계를 가졌다. 기상 자료를 추가하여 대기질, 배출량, 기상, 사회경제지표를 활용하여 PM10과 PM2.5 연평균 농도를 예측하는 머신러닝 모델을 구축하였고, 이를 통해 관계성을 확인하였는데, PM10은 CO 및 PM2.5 배출량, PM2.5는 전기, 가스, 증기 및 공기 조절 공급업(EGSAC)이 주요 영향 변수로 나타났다. 본 연구는 경상북도의 대기질과 대기오염물질 배출량의 현황을 분석하고 대기질, 배출량, 기상, 사회경제지표 간의 상관성을 검토함으로써 향후 연구의 방향 설정 및 확장을 위한 기반을 마련하였다. 한편, 통계 자료의 한계, 데이터 간의 시공간 불일치 등에 의한 해석의 한계를 극복하기 위하여 변수 개발 및 추가 등을 통해 보다 신뢰성 있는 결과를 얻을 수 있을 것으로 판단된다.

1. 서 론

대기오염은 SOx, NOx 등의 가스상 오염물질과 입자상 오염물질로 인해 발생하며, State of Global Air 2024 보고서에 따르면 대기오염은 고혈압에 이어 세계적으로 두 번째로 큰 사망 위험 요소이며, 2021년에 대기오염으로 인해 전세계적으로 약 810만명이 사망하였다[1]. SOx, NOx, VOCs는 다양한 산업활동에 의해 발생되며[2-4], 암모니아(NH3)는 주로 농업 활동에 의해 발생된다[5]. 초미세먼지(PM2.5)는 NOx, SOx, VOCs, NH3 등의 전구물질이 대기 중에서 반응하여 생성되며, 오존(O3)은 NOx, VOCs 등이 자외선과 광화학 반응을 일으켜 생성되며 초미세먼지 및 오존은 주로 호흡기 및 심혈관 질환 등을 유발한다고 알려져 있다[1,6,7]. 대부분의 국가에서 이를 통합적으로 관리하고 있다.
미국에서는 EPA(Environmental Protection Agency)에서 Air quality system을 통해 각 주와 지방 정부와 협력하여 전국적으로 대기질을 모니터링하고 있다. 대기오염물질 배출량을 관리하기 위해 Clean air act를 시행하고 있으며, 이 법을 통해 National ambient air quality standards를 설정하여 각 오염물질에 대한 배출 한도를 규정하고 있다[8]. 일본에서는 2018년도 기준 1,875여 개의 대기질 모니터링 시설을 운영하여 대기질을 모니터링하고 있으며, 대기오염물질 배출량 감축을 위해 Air pollution control act를 시행하고 있으며, 이를 통해 배출 허용 기준을 설정하고, 산업, 교통 등 다양한 분야에서 배출량을 규제하고 있다[9]. 유럽연합의 EEA(European Environment Agency)는 유럽연합의 국가와 협력하여 Air quality monitoring network를 운영하고 있으며, EU ambient air quality directive를 통해 대기질 기준을 설정하여 이를 준수하도록 규제하고 있다[10]. 우리나라에서는 2025년도 기준 전국에 663개의 대기환경측정망을 운영하며 대기오염 상태를 실시간으로 측정하여 모니터링하고 있으며, 대기오염물질 배출량 감축을 위하여 대기 환경개선 종합계획을 10년마다 수립하여 시행하고 있다. 특히, 대기오염이 심각한 지역 등의 대기환경을 개선하기 위하여 종합적인 시책을 추진하고 있으며, 대기오염원을 체계적으로 광역적으로 관리함으로써 지역주민의 건강을 보호하고 쾌적한 생활환경을 조성함을 목적으로 하는 대기관리관역의 대기환경개선에 관한 특별법(대기관리권역법)이 2020년에 시행되었다. 대기관리권역은 수도권, 중부권, 동남권, 남부권으로 나누어 각 권역의 특성에 맞는 대기환경 개선 목표 및 맞춤형 대책을 포함한 대기환경관리 기본계획을 수립하여 관리하고 있다.
대기오염물질 농도 모니터링 데이터 분석 및 대기오염물질의 배출량 산정 연구를 통해 대기질을 개선하기 위한 연구가 국내외에서 꾸준히 진행되고 있다. 중국의 경우, 투입산출모형인 Hypothetical Extraction Method를 활용하여 부문 및 지역별로 구체화된 주요 대기오염물질 배출의 흐름을 분석한 연구를 진행하였으며[11], 인구가 밀집된 광동성, 양쯔강 유역 대기질 개선을 위해 대기오염물질 배출량에 대해 체계적으로 검토하였다[12]. 미국에서는 Generalized additive models를 이용하여 애틀랜타, 뉴욕, 캘리포니아의 대기오염물질 농도, 배출량, 기상 간의 연관성을 분석하는 연구가 있으며[13], 독일에서는 STIRPAT(STochastic Impacts by Regression on Population, Affluence and Technology) model을 활용하여 인구, 개인 차량 수 등 사회경제지표의 변화가 대기오염에 미치는 영향에 대해 연구한 바 있다[14]. 국내에서는 배출량의 현황 분석 및 3차원 화학수송 모델링 시스템을 사용하여 국가 배출 및 대기질 평가 시스템(NEAS)에 기반한 국가 대기오염물질 배출량의 불확실성을 검토하는 연구가 진행된 바 있으며[15], 배출량 데이터와 지표면, 항공기, 위성에서 관측한 대기질 자료를 활용하여 국내의 주요 대기오염물질의 분포에 대해 연구하였다[16].
대기질 관리가 대기오염물질의 배출량 규제를 통해 이루어지고 있는데, 각 지역의 배출량과 대기오염물질의 농도의 관계성에 대한 분석을 위해 대기질 모델의 시뮬레이션 결과를 활용한 연구가 활발히 보고되고 있으나, 대부분의 연구들이 전국 범위로 연구가 진행되거나, 오염도가 심한 수도권 및 서해안을 중심으로 연구가 진행되어[17-21], 상대적으로 경상북도에 대한 연구는 부족하다. 복잡한 데이터 전처리 작업과 계산 시간이 많이 필요한 수치해석모델에 비해 머신러닝 모델은 실행이 비교적 쉽고 시간이 적게 소모된다[22]. 머신러닝 모델을 활용하여 대기질과 이에 영향을 미치는 다양한 지표들 간의 관계를 분석한 연구가 보고되고 있으나[22-24], 국내 연구는 거의 보고되지 않았다.
본 연구에는 경상북도의 대기환경 및 대기오염물질 배출량 현황을 파악하고 이들의 관계성을 분석하였다. 오염의 원인을 보다 구조적으로 이해하기 위하여 배출량의 보조 자료로서 대기오염과 관련된 사회경제지표 및 기상 자료를 추가하여 PM10 및 PM2.5 농도를 예측하는 머신러닝 모델을 생성하였다. 생성된 모델 중 예측 성능이 가장 높은 모델을 선정하여 SHAP 기법을 통해 미세먼지 농도 예측에서 배출량, 사회경제지표, 기상 자료가 미치는 영향을 확인하였다. 본 연구는 경상북도의 대기질 및 배출량에 대한 전체적인 경향성과 특이성을 확인하는 것에 중점을 두었으며, 본 연구의 결과는 향후 연구 방향 설정 및 확장의 기초 자료로서 활용 가능할 것으로 생각된다.

2. 연구방법

2.1. 대기질 데이터

대기환경측정망은 설치 목적에 따라 구분되며, 본 연구에서는 도시 지역의 평균 대기질을 파악하여 환경기준 달성 여부를 판정하기 위한 목적으로 설치된 도시대기측정망 자료를 활용하였다. 도시대기측정망은 주로 대상 지역의 기상여건을 고려하여 그 지역의 대표치를 얻을 수 있다고 판단되는 장소에 설치되며 해당 지역의 산업 및 주 풍향을 고려할 때 공업지역으로부터의 영향을 가장 많이 받는 인구밀집지역의 주거지역 또는 상업지역 등의 장소를 선정하여 설치된다. 도시대기측정망은 2025년 기준 전국에 529개 측정소가 설치・운영되고 있으며, 경상북도에는 47개 측정소가 운영되고 있다. 경상북도의 각 지자체별로는 포항시 11개, 구미시 5개, 경주시 4개, 경산시, 김천시 3개, 봉화군, 영덕군, 영주시, 의성군 2개, 나머지 13개 지자체에 1개의 측정소가 설치되어 운영 중이다. 대기환경 자료는 한국환경공단 에어코리아(https://www.airkorea.or.kr)에서 다운로드 받아 이용하였다. 대기환경 자료를 이용해 이산화황(SO2), 이산화질소(NO2), 일산화탄소(CO), 오존(O3), 미세먼지(PM10), 초미세먼지(PM2.5)에 대해 해당 기간동안 대기오염물질들의 농도 경향을 분석하였다.

2.2. 배출량 데이터

국내 국가미세먼지정보센터에서 대기정책지원시스템(Clean Air Policy Support System, CAPSS)을 구축하여 1년 단위로 대기오염물질 배출량을 산정하고 있다. CAPSS는 대기오염물질을 배출목록에 근거한 배출 정보 종합시스템으로, 기초자료 수집과 체계적인 관리를 통해 대기환경 정책 수행에 필요한 배출량 통계 정보를 산정하여 제공하는 시스템이다. CAPSS의 분류체계는 13개의 배출원대분류(에너지산업 연소, 비산업 연소, 제조업 연소, 생산공정, 에너지수송 및 저장, 유기용제 사용, 도로이동오염원, 비도로이동오염원, 폐기물 처리, 농업, 비산먼지, 생물성 연소, 기타 면오염원)로 구성되었다. 배출원 분류체계에 따라 9개의 오염물질(일산화탄소(CO), 질소산화물(NOx), 황산화물(SOx), 총부유입자(TSP), 미세먼지(PM10), 초미세먼지(PM2.5), 휘발성유기화합물(volatile organic compounds, VOCs), 암모니아(NH3), 블랙카본(Black carbon, BC))을 대상으로 하고 있다. 본 연구에서는 2017년부터 2021년까지의 대기오염물질 배출량(CAPSS) 자료를 환경부 국가미세먼지정보센터(https://www.air.go.kr)에서 다운로드 받아 이용하였다. 이를 통해 8개 대기오염물질(CO, NOx, SOx, TSP, PM10, PM2.5, VOCs, NH3)에 대해 국내 대기오염물질 현황을 연도별, 지자체별, 배출원별로 분석하였다.

2.3. 대기오염물질 배출량 및 사회경제적 특성과 대기질 간의 관계성 분석

경상북도의 대기오염물질 배출량, 기상, 사회경제적 특성과 대기질 간의 관계를 확인하기 위하여 머신러닝 모델을 활용하였다. 2017년부터 2021년까지의 시군 단위 자료를 사용하였으며, 입력 변수는 배출량 데이터, 기상 자료, 사회경제지표를 사용하였다. 출력 변수는 도시대기측정망에서 측정된 PM10 및 PM2.5 농도를 선택하였다. 배출량 데이터는 각 지역의 면적으로 나누어 단위 면적당 대기오염물질(CO, NOx, SOx, TSP, PM10, PM2.5, VOCs, NH3)의 연간 총 배출량을 사용하였으며, 기상 자료는 기상자료개방포털의 종관기상관측(ASOS)과 방재기상관측(AWS) 자료의 연 단위 자료 중 평균 최고 기온, 평균 최저 기온, 평균 기온, 평균 풍속, 강수량 합을 사용하였다. 사회경제지표는 국가통계포털의 인구수, 한국표준산업분류에 따른 19개 산업대분류 별 종사자수, 자동차주행거리(사업용, 비사업용), 지역내총생산(GRDP; Gross Regional Domestic Product)을 선택하였다. 산업대분류는 농업, 임업 및 어업(Agriculture, forestry and fishing; AFF), 광업(Mining and quarrying; MQ), 제조업(Manufacturing; MFG), 전기, 가스, 증기 및 공기 조절 공급업(Electricity, gas, steam and air conditioning supply; EGSAC), 수도, 하수 및 폐기물 처리, 원료 재생업(Water supply: sewage, waste management, materials recovery; WMR), 건설업(Construction; CON), 도매 및 소매업(Wholesale and retail trade; WRT), 운수 및 창고업(Transportation and storage, TS), 숙박 및 음식점업(Accommodation and food service activities; AFS), 정보통신업(Information and communication; IC), 금융 및 보험업(Financial and insurance activities; FIA), 부동산업(Real estate activities; REA), 전문, 과학 및 기술서비스업(Professional, scientific and technical activities; PST), 사업시설관리, 지원 및 임대서비스업(Business facilities management and business support services; rental and leasing activities; BSR), 공공행정, 국방 및 사회보장행정(Public administration and defence; compulsory social security; PAD), 교육 서비스업(Education; EDU), 보건업 및 사회복지서비스업(Human health and social work activities; HSW), 예술, 스포츠 및 여가 관련 서비스업(Arts, sports and recreation related services; ASR), 협회 및 단체, 수리 및 기타개인서비스업(Membership organizations, repair and other personal services; MRP)으로 구분되어 있다.
수집된 기간의 자료 중 측정망 데이터가 없는 경우 해당 년도의 데이터를 삭제하였으며, min-max scaler[25]를 통해 데이터를 0과 1 사이의 값으로 변환하여 입력자료로 사용하였다. 사용된 모델은 Elastic Net Regression(ElasticNet) [26], K-Nearest Neighbor(KNN) [27], Random Forest(RF) [28], Gradient Boosting Regressor(GBR) [29], XGBoost(XGB) [30], LightGBM(LGBM) [31], Categorical Boosting(CatBoost) [32], Artificial Neural Network(ANN) [33]의 8개 모델이다. 학습 및 테스트 데이터는 8:2로 분할하였으며, 모델의 하이퍼파라미터 최적화는 Bayesian Optimization 기법[34]을 사용하였다. 하이퍼파라미터 최적화 범위 및 최적화된 값은 Table 1에 나타내었다. 각 모델의 성능 평가는 R2와 Root Mean Square Error(RMSE)[35]의 성능 지표를 이용하였으며, R2는 1에 가까울수록, RMSE는 0에 가까울수록 모델의 예측 성능이 높은 것으로 판단하였다. 또한, SHAP(SHapley Additive exPlanations) method[36]를 사용하여 각 입력 변수가 출력 변수에 미치는 영향을 분석하였다. 데이터 전처리 및 머신러닝 모델 구현은 Python 3.12 환경에서 수행하였으며, 주요 Python 라이브러리로 Scikit-learn, XGBoost, LightGBM, CatBoost, Optuna를 활용하였다.

3. 결과 및 고찰

3.1. 대기질 현황 분석

국내 지역의 평균 대기질을 파악하기 위하여 전국 도시대기측정망의 2017년과 2021년의 연평균 농도현황을 Table 2에 나타내었다. 전국 평균농도는 오존을 제외한 대기오염물질의 농도가 지속적으로 감소하는 추세를 보였는데, 2021년 연평균농도는 2017년 대비 CO는 12.3%, NO2는 24.2%, SO2는 27.9%, PM10은 18.9%, PM2.5는 27.7% 감소하였으나, 오존은 6.2%가 증가하였다. 경상북도의 대기오염물질 평균 농도는 전국 평균 농도와 유사한 수준으로 확인되었으며, 오존의 농도는 2017년에는 0.033ppm, 2021년은 0.032ppm으로 거의 유사한 수준을 보였으며, PM10의 경우, 2017년은 PM10의 연평균농도는 2017년 40.3µg/m3, 2021년 33.6µg/m3으로 감소하는 추세를 보였으며, PM2.5의 연평균농도는 2017년 23.2µg/m3에서 2021년 16.6µg/m3로 감소하였으나, 대기환경기준을 만족하지 않았다.
Fig. 2에 경상북도의 도시대기측정망에서 수집된 대기오염 현황을 나타내었는데, 도시대기측정망에서 시간 단위로 수집되는 데이터를 종합 분석하여 월평균 농도(파란색 실선) 및 표준편차(파란색 영역)로 표시하였다. 또한, 대기관리권역법에 따라 대기오염이 심각하다고 판단되는 대기관리권역 중 동남권에 해당하는 경상북도 6개 지자체 (구미시, 칠곡군, 경산시, 영천시, 포항시, 경주시)에 대한 대기오염 현황을 추가적으로 나타내었다. 기준치를 초과하는 항목의 경우, 기준치와의 비교를 위해 PM10, PM2.5는 대기환경기준의 연간 평균치와 24시간 평균치를 각각 빨간색 실선 및 빨간색 점선을 표시하였고, 오존은 대기환경기준의 8시간 평균치를 빨간색 점선으로 표시하였다.
NO2, CO, PM10, PM2.5는 연료 사용량이 적은 여름철에 농도가 낮고 가을, 겨울철에 증가하는 경향을 보이며, 군 단위 지자체들보다 교통량과 산업활동이 많은 시 단위 지자체에서는 상대적으로 농도가 높게 확인되었다. 오존은 봄, 여름철에 증가하는 경향을 보였으며, NO2와 같은 전구물질의 광분해와 광화학 반응에 의해 발생되어 일사량이 높은 봄, 여름철에 높은 농도가 측정되었다[37]. SO2 또한 여름철에 농도가 낮고 겨울철에 증가하는 경향을 보였으나, 다른 항목에 비해 변동 폭이 크지 않았으며, 이는 여름철보다 겨울철의 농도 감소 추이가 커져서 계절 차이가 줄어든 것으로 보고되었다[38]. 또한, 경상북도의 월별 SO2 변화가 6개 지자체의 그것보다 상대적으로 컸는데, 이는 영주시와 봉화군의 SO2 평균 농도가 다른 지역에 비해 크기 때문이다. 영주시와 봉화군의 SO2 평균 농도가 높게 나타난 것은 해당 지역에 측정소가 1개소로 운영되고 있어 해당 지역의 SO2 고농도에 대한 원인 분석이 어려우며, 해당 지역의 대기질에 대한 원인을 분석하기 위하여 측정망 지점을 추가하여 보다 많은 대기질 데이터의 확보가 필요하다고 판단된다.
2021년 환경기준 만족 수준을 살펴보면, 경상북도 및 6개 도시 모두 가스상 오염물질인 SO2, NO2, CO의 경우, 환경기준을 초과한 사례가 확인되지 않았으나, 오존, PM10, PM2.5의 경우 환경기준을 초과한 사례가 다수 확인되었다. 오존의 기준은 8hr 평균 0.06ppm 이하인데, 6개 도시에서는 5일정도 초과되었으나, 상대적으로 인구가 적은 지역에서 오존의 초과일수가 높게 확인되었다(상주시 61일, 울릉군 36일, 예천군 27일). 주로 4~6월에 기준치를 초과한 일수가 집중되어 있으며, 오존의 농도가 높다고 알려진 해안가 지역뿐만 아니라 내륙 지역에서도 오존 농도가 높은 것을 확인하였다. 오존은 일반적으로 NO2, VOCs에 의해 발생되는데, 인구수가 높은 도시 지역의 경우 NO에 의해 오존이 분해되기도 하여 오존의 농도가 낮아질 수도 있다. 그러나 도시 지역에서 발생한 NO2 및 VOCs가 인구수가 낮은 지역으로 이동할 경우 오존 농도를 낮출 수 있는 NO가 부족하여 오존의 농도가 높게 측정될 수도 있음이 보고되었다[39,40]. PM10과 PM2.5는 황사, 해염 등의 자연적 발생원과 사업장 연소, 자동차 연료 연소, 생물성 연소 등의 인위적 발생원이 있으며, 화석 연료 및 바이오매스 기반 연료의 연소, SO2, NOx, NH3, VOCs 등의 전구물질들의 반응을 통해 2차 에어로졸이 생성된다. PM10은 주로 자동차 연소 및 모래 먼지가 주요 발생원이며, PM2.5는 2차 에어로졸 배출원이 주요 오염원으로 알려져 있다[41,42]. PM10의 기준은 24hr 평균 100µg/m3 이하이며, 3~5월에 기준치를 초과하는 일수가 많았는데, 시군별로 살펴보면 22개 시군에서 3~9일 수준의 초과일수가 확인되었다. 황사는 2021년 3~5월에 13일 발생하였으며, PM10 기준치 초과 일수와 황사 발생 일수가 일부 일치하는 것으로 확인되었다. PM2.5는 PM10과 비교하여 환경기준을 초과하는 일수가 많았는데, 주로 11~3월에 기준치를 초과하였다. PM2.5의 기준은 24hr 평균 35µg/m3 이하인데, 상주시 43일, 영주시 39일, 문경시 33일을 초과하였으며, 6개의 도시에서는 구미시, 칠곡군, 경산시에서 26~29일이 초과되었으며, 영천시와 경주시 포항시는 15~19일이 초과된 것으로 확인되었다. PM10과 PM2.5의 고농도 사례 기간이 다른 것은 두 물질의 주요 발생원에 차이가 있기 때문으로 판단된다. 국내에서는 오존 및 미세먼지 농도를 저감하기 위하여 오염물질 대량배출 사업장 총량관리제, 노후 경유차 조기 폐차와 같은 다양한 정책을 시행하고 있으나 관련 연구를 통해 보다 실효적인 방안 마련이 필요하다.

3.2. 대기오염물질 배출량 현황 분석

Fig. 3에 5년 간(2017년~2021년) 전국의 8개 대기오염물질 배출량 추이 변화를 나타내었는데, 전국의 대기오염물질 배출량은 NH3를 제외하고 전반적으로 감소하는 추세를 보이고 있다. 2021년의 배출량은 2017년 대비 CO 16.8%, NOx 27.0%, SOx 42.3%, PM10 10.2%, PM2.5 14.4% 감소하였으며, TSP, VOCs는 둘 다 변화율 3% 정도로 낮은 감소추세를 보였다. NH3는 다른 오염물질들과 달리 0.5% 정도 증가하였다. 경상북도의 배출량 또한 전국과 마찬가지로 NH3를 제외하면 전반적으로 감소하는 추세를 보이고 있다. 2017년 대비 2021년의 배출량은 CO 9.9%, NOx 25.1%, SOx 32.5%, PM10 7.1%, PM2.5 10.9% 감소하였으며, TSP와 VOCs는 약 1% 감소하여 그 변화폭이 적었다. 앞서 서술한 바와 같이 NH3는 4.5% 정도 증가하였다.
Fig. 4에 2021년 배출량을 기준으로 배출되는 오염물질들에 대한 각 광역시/도 지자체의 기여율을 산정하여 나타내었다. 광역시/도별로 CO, NOx, TSP, PM10, PM2.5의 배출량은 경기도에서 가장 많은 비중을 차지하고 있으며, 오염물질별로 다소 차이는 있으나 경상북도, 전라남도, 충청남도가 그 뒤를 이었다. VOCs 역시 경기도에서 가장 많이 배출되었으며, 전라남도, 경상남도, 울산광역시 순으로 확인되었다. SOx는 충청남도, 울산광역시, 전라남도, 경상남도 순으로 배출량이 많으며, 대부분의 지역에서 17년 대비 큰 폭으로 감소하는 추세를 보였다. NH3는 충청남도, 경기도, 전라남도에서 많은 비중을 차지하였다. 8개 오염물질에 대해 경상북도의 배출량은 10% 내외를 차지하고 있으며, 가스상 오염물질인 CO, NOx, SOx의 배출량은 감소하는 추세를 보이며, NH3, VOCs의 배출량은 매년 일정 수준을 유지하였다. 최근 5년간 입자상 오염물질 중 TSP의 배출량은 매년 일정 수준을 유지하는 경향을 확인하였다. PM10과 PM2.5는 5년간 감소하는 추세를 보이며, 각각 2017년 대비 2021년의 배출량이 7%, 11% 정도 감소하였다.
Fig. 5에 2021년 대기오염물질 배출량 기준 경상북도의 각 시군별 기여율을 산정하여 나타내었다. NOx, SOx, TSP, VOCs, PM10, PM2.5의 배출량은 포항시가 가장 높은 비율을 차지하고 있으며, 다음으로 구미시의 비율이 높고 오염물질마다 차이는 있으나 상주시, 경주시, 김천시, 안동시가 그 뒤를 이었다. CO의 경우도 포항시에서 가장 많이 배출되었으며, 안동시, 상주시 순으로 배출량이 많았다. NH3는 대부분이 농업으로 인해서 배출되어 다른 대기오염물질과는 달리 영주시, 상주시, 경주시 순으로 높은 배출 기여율을 보였다. 배출량이 가장 많은 포항시, 구미시의 대기질(대기측정망 자료)은 다른 지역에 비해 좋지 않은 편이나, 배출량이 상대적으로 적은 다른 시군의 대기질을 고려하면 그 차이가 크지는 않은 것으로 확인되었다. PM2.5의 경우 포항시가 경상북도 배출량의 26.5%를 차지하고 있으나, 연평균 농도는 16.67µg/m3으로 오히려 배출 기여도가 낮은 영주시(21.31µg/m3), 상주시(20.72µg/m3), 성주군(20.16µg/m3),칠곡군(20.45µg/m3)등의 지역에서 PM2.5의 농도가 상대적으로 높았다. SOx는 포항시가 경상북도 배출량의 64.2%를 차지하고 있으나, 모든 시군이 SO2의 연평균 농도가 0.002~0.005ppm 수준으로 유사하였다. NOx는 포항시의 배출 기여도가 35.4%이며, NO2의 연평균 농도는 0.013ppm으로 나타나 구미시(0.015ppm), 문경시(0.013ppm), 영천시(0.013ppm), 칠곡군(0.016ppm), 성주군(0.013ppm)으로 상대적으로 배출 기여도가 낮은 지역보다 농도가 낮거나 비슷한 수준을 보였다. PM10의 경우 경상북도 배출량의 18.5%를 포항시가 배출하고 있으며 연평균 농도는 37.97µg/m3로 상대적으로 배출량이 적은 구미시(38.79µg/m3), 영주시(37.54µg/m3), 칠곡군(39.80µg/m3)과 비슷한 수준을 보였다. 현 단계에서 상대적으로 배출량이 적은 지역이 배출량이 많은 지역보다 대기질이 나쁜 것에 대한 정확한 원인 규명은 어려웠으며, 결과적으로 현재 수집된 데이터 수준으로는 대기질과 배출량 간의 높은 연관성이 확인되지 않았다. 이러한 한계를 극복하기 위한 시공간적으로 더욱 세분화된 데이터 수집 및 관련 연구가 필요할 것으로 판단된다.
경상북도 8개 대기오염물질의 배출량 산정 배출원을 살펴보면, CO의 경우 생물성 연소(58.88%)와 도로(13.07%) 및 비도로이동오염원(15.85%)이 주요 배출원이며, NOx는 도로(39.78%) 및 비도로이동오염원(16.26%), 생산공정(16.26%)에 의해 발생한다. SOx는 산업 활동(생산공정 59.92%, 제조업연소 25.27%)에 의해 발생되며, VOCs는 유기용제 사용(38.93%)과 생물성 연소(37.99%)에서 주로 배출되었으며, NH3는 농업(94.49%)에서 대부분이 발생하였다. TSP는 비산먼지(72.41%), 생물성 연소(13.88%)이 주요 배출원이며, PM10은 비산먼지(56.13%), 생물성 연소(13.88%), PM2.5는 생물성 연소(35.21%), 비산먼지(23.13%), 생산공정(17.34%), 비도로이동오염원(11.99%)에 의해 발생되었다. 가스상 오염물질의 배출원을 자세히 살펴보면, CO는 주로 농업잔재물 소각(46.43%), 레저용 선박(10.95%), 목재난로 및 보일러(9.93%)에서 발생하였으며, NOx는 도로이동오염원 중 경유 화물차(61.49%)와 제철제강산업(15.37%), RV(8.33%), SOx의 배출량은 제철제강업(50.24%)과 가구 및 기타제품 제조업(21.27%), 석회 생산 공정(8.39%)에서 발생한다. VOCs의 배출량은 농업 잔재물 소각(33.87%), 건축 및 건물 도장(10.31%), 가정 및 상업용 유기용제 사용(8.35%)에 의해 발생하며, NH3은 주로 가축의 분뇨 관리 과정(88.24%)에서 배출된다. 입자상 오염물질(TSP, PM10, PM2.5)은 주로 도로재비산먼지, 농업잔재물 소각에 의해 배출된다. 자세히 살펴보면, TSP가 도로재비산먼지(34.76%), 농업잔재물 소각(11.67%), 축산활동(10.07%), PM10이 도로재비산먼지(17.67%), 농업잔재물 소각(15.14%), 제철제강업(6.77%), PM2.5가 농업잔재물 소각(28.92%), 도로재비산먼지(9.69%)에 의해 주로 배출되었다. 2000-2018년 미국, 캐나다, 유럽 등의 정부에서 발표한 자료 및 전세계의 배출량을 정리한 연구에 따르면, 전세계적으로 미세먼지는 비산먼지와 가정용 연소, 산업 공정에서 많이 발생했다고 보고하였다[29]. 그러나 국내의 경우 85.7%(2023년 기준)의 가구에서 도시가스를 사용하고 있기 때문에 가정용 연소가 주요 미세먼지 발생원이 아닌 것으로 판단된다. 연소과정에서 주로 발생하는 SO2, NO2는 에너지 산업 및 산업 활동에서 많이 발생하는 것으로 알려져 있는데, 경상북도에는 화석연료를 이용하는 화력발전소가 없기 때문에 그 비중이 낮은 것으로 고려되었다. 또한, 전세계적으로 VOCs의 배출은 유기용제 사용, 비산 배출, 도로이동오염원에서 발생하였으며, NH3는 대부분이 농업에서 발생된다고 보고하였는데[5, 43], 이는 본 연구에서 경상북도의 VOCs 배출이 주로 유기용제 사용, NH3 배출이 대부분 농업에서 발생한다는 결과와 일치한다.

3.3. 대기오염물질 배출량 및 사회경제적 특성과 대기질 간의 관계성 분석

앞서 살펴본 바와 같이 산정된 배출량과 측정된 대기질 간의 연관성이 낮아 선행연구에서 대기질에 영향을 주는 지역의 사회경제지표를 추가 고려하여[14] 관계성을 분석하였다. 경상북도 대기오염물질의 배출량, 대기질, 지역의 사회경제지표와의 선형 관계를 확인하기 위해 Pearson 상관관계를 도출하여 다음 Fig. 6에 나타내었다. Pearson 상관계수는 1~0.7 범위에서는 높은 상관관계, 0.7~0.3는 보통의 상관관계, 0.3~0.1는 낮은 상관관계를 나타낸다[44]. Fig. 6(a)에서 나타낸 바와 같이 대부분의 경우 배출량과 대기질 데이터 간의 상관계수의 값이 대부분 0.5이하의 값으로 선형적 상관성이 높지 않은 것이 확인되었다. 일부 항목에서 상대적으로 높은 선형적 상관관계를 보였는데, 배출량의 TSP와 대기질의 NO2, PM10은 0.6 이상의 상관계수를 나타났으며, 배출량의 PM10과 대기질의 NO2, PM10이 각각 0.54, 0.59로 비교적 높은 양의 상관관계를 나타내었다. 특이한 점은 대기질의 오존은 배출량의 모든 항목과 낮은 음의 상관관계를 보였는데, 국내에서 발생된 NOx, VOC 등의 전구물질에 의해 생성되는 내부 발생원과 오존과 그 전구물질의 장거리 이동으로 유입된 외부 발생원이 국내의 오존 농도에 영향을 미쳐[45-47], 다른 물질들과 다른 경향을 보인 것으로 판단된다. Fig. 6(b)에서는 배출량과 사회경제지표 간의 상관관계를 분석하였으며, 배출량과 사회경제지표는 대부분 높은 상관관계를 나타내었다. 그러나 광업(MQ), 농업, 임업 및 어업(AFF), 전기, 가스, 증기, 공기 조절 공급업(EGSAC)의 지표는 해당 산업이 여러 대기오염물질을 배출할 수 있으나 본 연구에서는 낮거나 혹은 음의 상관관계를 나타내었다. 특히, NH3의 경우, 주로 농업분야에서 배출되는데 농업, 임업 및 어업(AFF)과의 상관성이 0.03으로 매우 낮은 수준을 보였다. Fig. 6(c)에는 측정된 대기질과 사회경제지표의 상관관계를 나타내었는데, 대부분 중간 정도의 상관관계를 보였으며, 여기에서도 농업, 임업 및 어업(AFF)과 전기, 가스, 증기, 공기 조절 공급업(EGSAC)은 모든 대기오염물질들과 낮거나 음의 상관관계를 나타내었다. 오존은 대부분의 요소에서 낮거나 음의 상관관계를 보였는데, 광업(MQ)과는 상관계수가 0.5로 상대적으로 매우 높은 음의 상관관계를 확인하였다. 결과적으로 현재 수집된 정보로는 각 항목 간의 상관관계에 대한 정확한 분석은 어려우나 많은 사회경제지표와 유의미한 상관성이 있는 것으로 확인되었다.
Pearson 상관관계를 확인한 결과 대기질과 배출량 사이의 상관성이 높게 나타나지 않아 최근 그 적용이 확대되고 있는 머신러닝 모델을 이용하여 측정망 자료, CAPSS의 배출량, 기상 자료, 사회경제지표 사이의 상관성 연구를 추가적으로 진행하였다. 본 연구에서 대상 대기오염물질은 미세먼지(PM10, PM2.5) 농도로 한정하였다. 상관성 분석을 위해 ElasticNet, KNN, RF, GBR, XGB, LGBM, CatBoost, ANN 등의 머신러닝 모델을 적용하여 학습 및 테스트를 진행하였다. 입력 변수로는 단위 면적당 배출량 데이터와 기상 자료, 사회경제지표를 사용하였으며, 출력 변수로는 미세먼지(PM10, PM2.5) 농도를 선택하였다. 이를 통해 미세먼지 농도 예측이 가능한 머신러닝 모델의 개발이 가능하나, 본 연구에서는 측정망 자료, 배출량 자료, 기상 자료, 사회경제지표 사이의 상관성 분석을 주 목적으로 하였다. PM10과 PM2.5는 앞서 언급한 바와 같이 주요 발생 매커니즘이 다르기 때문에 농도에 대한 경향성 및 분포의 형태가 다르게 나타날 것으로 생각되어 각 물질별로 예측 성능이 높은 모델을 선정하여 분석하였다. 높은 예측 성능을 보인 모델의 예측 값과 실제 값을 비교한 결과를 Fig. 7에 나타내었다. PM10 예측의 경우 성능은 RF가 R2 0.481, RMSE 4.603로 가장 높았으며, PM2.5 예측에서는 CatBoost가 R2 0.696, RMSE 1.892로 가장 높았다.
충분한 예측 성능을 보여준 머신러닝 모델인 RF와 CatBoost를 선택하여 측정망 자료, 배출량 자료, 기상 자료, 사회경제지표 사이의 상관성 분석을 위해 SHAP method를 적용하였다. Fig. 8에 각각 PM10과 PM2.5 예측에서 최고 성능 모델의 SHAP value 점 그래프와 평균 SHAP value를 함께 나타내었다. PM10 농도 예측은 단위 면적당 CO 배출량과 PM2.5 배출량이 각각 평균 SHAP value 2.6303, 2.5034로 다른 변수에 비해 기여도가 높게 나타났는데, 이는 CO의 배출원인 도로이동오염원과 PM10의 배출원인 도로재비산먼지가 밀접한 관계를 가지고 있으며, PM2.5의 경우 PM10에 포함되어 있기 때문으로 판단된다. 그 다음으로 단위 면적당 PM10 배출량(1.5067), 단위 면적당 NOx 배출량(1.2098), 보건업 및 사회복지서비스업(HSW; 1.0505), 전기, 가스, 증기 및 공기 조절 공급업(EGSAC; 1.0197) 순으로 기여도가 높았다. NOx 배출량은 해당 물질의 배출원(도로이동오염원)과 PM10 배출원인 도로재비산먼지가 밀접한 관계를 가지고 있기 때문으로 판단되며, 보건업 및 사회복지서비스업(HSW), 전기, 가스, 증기 및 공기 조절 공급업(EGSAC)은 각각 산업이 활발한 지역이 인간활동 또한 활발하여 PM10이 많이 발생될 것으로 추정된다. PM2.5 농도 예측의 경우 전기, 가스, 증기 및 공기 조절 공급업(EGSAC; 0.4734)이 가장 기여도가 높았다. 이러한 결과는 해당 산업의 연소 과정에서 발생하는 PM2.5의 전구물질과 관련이 있을 것으로 판단되는데, 앞서 수행한 Pearson 상관관계 분석에서 나타난 낮은 선형적 상관관계와는 다른 결과를 보인다. 그 다음으로는 단위 면적당 TSP 배출량(0.2952), 단위 면적당 NH3 배출량(0.2108), 도매 및 소매업(WRT; 0.2062) 순으로 PM2.5 예측에 기여를 하였다. TSP의 경우 PM2.5를 포함하고 있는 데이터이기 때문에 기여도가 높게 나타났을 것으로 생각되며, NH3는 PM2.5의 전구물질로 작용하기 때문으로 생각된다. 도매 및 소매업(WRT; 0.2062)은 해당 산업이 활발하여 인간활동 또한 활발하기 때문으로 판단된다. 불완전한 데이터 사용 등의 이유로 머신러닝 모델 결과의 해석이 어려우나, 보다 관련성 높은 사회경제지표와 기상 조건의 개발 및 도입과 환경 조건 등에 대한 변수 추가 등을 통해 배출량 결과가 대기질에 대한 보다 영향력 있는 상관성을 파악할 수 있을 것으로 판단된다.
본 연구에서는 대기질, 배출량, 기상, 사회경제지표의 관계성을 확인하기 위하여 Pearson 상관관계 분석 및 머신러닝 기법을 활용했는데, 제공되는 배출량 데이터는 시군별, 세부 분류별로 1년에 1개의 데이터 만을 제공하고 있어, 시간 해상도를 일치시키기 위해 나머지 데이터를 1년 단위로 수집하여 비교 연구하였다. 이로 인하여 결과 분석이 실제 상황을 충분히 고려한 것은 아닐 것으로 판단되었다. 또한, 측정소 위치가 해당 지역의 대기질을 대표적으로 나타낼 수 있는 위치에 있지 않을 가능성과 측정소 위치, 배출량 산정 위치, 기상대 위치 간의 공간적 불일치로 인하여 결과 해석에 한계가 있을 것으로 판단된다. 이러한 데이터 간의 공간적 불일치는 역거리 가중법[48], 지리 가중 회귀[49] 등의 공간 보간법으로 해결이 가능하나, 배출량 데이터가 대부분 면 단위로 수집되고 있어 공간 보간법을 이용하더라도 자료 해석에 한계가 있을 수 있다. 추가적으로 기후 및 기상 특성에 영향을 받는 측정망 데이터와 달리 배출량은 이러한 영향을 받지 않아 상대적으로 관계성이 낮게 나타날 수 있을 것으로 판단된다. 또한, 배출량은 다양한 통계자료를 통해 산정되게 되는데, 점오염원으로 분류되는 대규모 산업 현장에서 배출되는 대기환경물질의 배출량은 bottom-up으로 산정되어 비교적 정확하나 많은 부분이 면오염원으로 top-down방식으로 산정되고 있어 배출량에 대한 불확실성 내제되어 있다[15,50,51]. 배출량 데이터와 사회경제 데이터와 같은 통계자료를 이용하여 실측자료인 대기질 데이터를 예측하는 과정에서 불확실성을 내제하고 있다. 그러므로 배출량과 사회경제 항목들에 대한 실제 값에 가까운 데이터를 활용한다면 더욱 신뢰성이 높은 결과를 얻을 것으로 판단되며, 추후 측정망의 지역 대표성 확보와 데이터 간의 공간 보간에 대한 추가적인 연구가 필요할 것으로 보인다.

4. 결론

본 연구는 경상북도의 대기질과 대기오염물질 배출량의 현황을 분석하고 대기질, 배출량, 기상, 사회경제지표 간의 상관성을 검토함으로써 향후 연구의 방향 설정 및 확장을 위한 기반을 마련하고자 하였다. 대기질의 경우, 2017년부터 2021년까지 오존을 제외한 대기오염물질들은 지속적으로 감소 추세를 보였으며, 오존, PM10, PM2.5은 대기환경기준을 초과하는 사례가 확인되었다. 배출량의 경우, 최근 5년간 전국적으로 감소하는 추세를 보였으며, 경상북도에서는 CO, NOx, SOx의 배출량이 줄어드는 반면, NH3, VOCs는 일정 수준을 유지하였다. CO, NO의 경우, 도로 및 비도로이동오염원, NH3는 주로 농업, SOx는 산업공정, 입자성 오염물질은 비산먼지와 생물성 연소가 주요 배출원으로 확인되었다. 경상북도의 대기오염물질 배출량과 측정망 데이터를 통한 대기질 간의 Pearson 상관분석 결과, 전체적으로는 선형적 상관성이 낮았으며, 일부 항목들에서만 다소 높은 상관성이 확인되었다(TSP(배출량)-NO2(대기질):0.66, TSP(배출량)-PM10(대기질): 0.61, PM10(배출량)-NO2(대기질):0.59, PM10(배출량)-PM10(대기질): 0.54). 배출량과 사회경제 데이터는 대체로 높은 상관관계를 보였는데, 대기질과 사회경제 데이터의 상관관계는 대부분 중간 정도의 상관관계를 보였다. 농업, 임업 및 어업(AFF), 전기, 가스, 증기 및 공기 조절 공급업(EGSAC)은 모든 배출량, 대기질 항목과의 낮은 상관관계를 나타냈었다. 머신러닝 모델을 활용한 PM10 및 PM2.5 농도 예측 결과, PM10의 경우 CO 및 PM10 배출량이 가장 영향력 있는 지표로 확인되었는데, 이는 CO와 PM10의 배출원이 밀접한 관련이 있으며, PM2.5가 PM10에 포함되어 있기 때문으로 판단하였다. PM2.5 예측에서는 전기, 가스, 증기 및 공기 조절 공급업(EGSAC)이 주요 영향 지표로 나타났다. 이는 해당 산업에서 발생하는 PM2.5의 전구물질과 관련된 것으로 판단된다. 본 연구에서 활용한 배출량 및 사회경제 데이터는 통계 자료의 한계로 불확실성이 존재하며, 데이터 간의 시간적, 공간적 차이에 의해 결과 도출 및 해석에 어려움이 있다. 이러한 한계를 극복하기 위하여 실제 관측값에 근접한 자료 확보와 측정소 위치의 대표성 검증, 측정소 위치와 배출량 산정 위치, 기상대 위치 간의 공간적 일치성 확보가 필요할 것으로 보인다.

Notes

Acknowledgement

본 논문은 국립금오공과대학교 대학 연구과제비(2024~2026)와 2025년도 경상북도 지역혁신중심 대학지원체계(RISE)-특화산업 Scale-up의 지원을 받아 수행된 결과입니다.

Declaration of Competing Interest

The authors declare that they have no known competing financial interests or personal relationships that could have appeared to influence the work reported in this paper.

Fig. 1.
Locations of air quality monitoring stations in Gyeongsangbuk-do.
KSEE-2025-47-9-611f1.jpg
Fig. 2.
Average air pollution concentrations from 2017 to 2021: a) Gyeongsangbuk-do, b) Air control zones in Gyeongsangbukdo( Gumi-si, Chilgok-gun, Gyeongsan-si, Yeongcheon-si, Pohang-si, Gyeongju-si).
KSEE-2025-47-9-611f2.jpg
Fig. 3.
National trends in air pollutant emissions (2017-2021).
KSEE-2025-47-9-611f3.jpg
Fig. 4.
Contribution of air pollutant emissions by metropolitan/province in 2021.
KSEE-2025-47-9-611f4.jpg
Fig. 5.
Contributions by percentage of air pollutant emissions by city and county in Gyeongsangbuk-do, 2021.
KSEE-2025-47-9-611f5.jpg
Fig. 6.
Pearson correlation coefficient analysis a) Air quality vs Emissions, b) Emissions vs Socioeconomic indicators, c) Air quality vs Socioeconomic indicators (*: p<0.05). (AFF: Agriculture, forestry and fishing, MQ: Mining and quarrying, MFG: Manufacturing, EGSAC: Electricity, gas, steam and air conditioning supply, WMR: Water supply; sewage, waste management, materials recovery, CON: Construction, WRT: Wholesale and retail trade, TS: Transportation and storage, AFS: Accommodation and food service activities, IC: Information and communication FIA: Financial and insurance activities, REA: Real estate activities, PST: Professional, scientific and technical activities, BSR: Business facilities management and business support services; rental and leasing activities, PAD: Public administration and defence; compulsory social security, EDU: Education, HSW: Human health and social work activities, ASR: Arts, sports and recreation related services, MRP: Membership organizations, repair and other personal services)
KSEE-2025-47-9-611f6.jpg
Fig. 7.
Comparison of observed and estimated values for a) PM10 using Random Forest and b) PM2.5 using Catboost
KSEE-2025-47-9-611f7.jpg
Fig. 8.
SHAP value analysis for a) PM10 using Random Forest and b) PM2.5 using CatBoost.
KSEE-2025-47-9-611f8.jpg
Table 1.
Optimized hyperparameter values in the applied ML models.
Model Hyperparameter Range Selected
PM10 PM2.5
ElasticNet alpha (1e-4, 1.0) 0.000100223 0.000100051
l1_ratio (0.0, 1.0) 0.997730421 0.588025048
KNN n_neighbors (3, 20) 3 3
weights ['uniform', 'distance'] 'distance' 'distance'
RF n_estimators (100, 1000) 103 118
max_depth (3, 20) 9 15
min_samples_split (2, 10) 2 2
GBR n_estimators (100, 1000) 773 545
max_depth (3, 10) 10 10
learning_rate (0.01, 0.3) 0.298558287 0.299018908
XGB n_estimators (100, 1000) 890 524
max_depth (3, 20) 20 16
learning_rate (0.01, 0.3) 0.281565777 0.255508045
LGBM n_estimators (100, 1000) 999 1000
max_depth (3, 20) 3 6
learning_rate (0.01, 0.3) 0.299908940 0.299609325
CatBoost learning_rate (0.01, 0.3) 0.299752917 0.096549168
depth (4, 10) 10 10
iterations (100, 1000) 999 701
ANN hidden_layer_sizes [(64,), (128,), (64, 64), (128, 64), (128, 128)] (128, 64) (128, 128)
activation ['relu', 'tanh'] 'relu' 'relu'
alpha (1e-5, 1e-2) 0.000384808 0.008611841
learning_rate_init (1e-4, 1e-2) 0.005790329 0.002829531
Table 2.
Annual average air pollutant concentrations by region in 2017 and 2021.
SO2 (ppm)
NO2 (ppm)
CO (ppm)
O3 (ppm)
PM10 (µg/m3)
PM2.5 (µg/m3)
year 2017 2021 2017 2021 2017 2021 2017 2021 2017 2021 2017 2021
Seoul 0.0046 0.0031 0.030 0.024 0.52 0.46 0.025 0.028 43.8 38.3 24.6 19.8
Busan 0.0049 0.0028 0.020 0.015 0.35 0.33 0.032 0.033 43.6 31.8 25.6 15.4
Daegu 0.0033 0.0020 0.020 0.015 0.44 0.39 0.029 0.030 42.5 34.4 23.0 17.3
Incheon 0.0056 0.0033 0.024 0.021 0.55 0.49 0.026 0.032 45.9 39.2 25.2 20.5
Gwangju 0.0026 0.0029 0.019 0.014 0.43 0.48 0.030 0.033 40.4 33.6 24.1 18.1
Daejeon 0.0029 0.0031 0.018 0.017 0.44 0.47 0.029 0.029 45.4 36.0 21.1 16.4
Ulsan 0.0058 0.0033 0.022 0.017 0.55 0.41 0.031 0.033 42.8 30.0 24.8 15.2
Sejong 0.0032 0.0034 0.020 0.016 0.54 0.48 0.030 0.031 46.7 38.8 22.5 18.1
Gyeonggi 0.0046 0.0030 0.027 0.019 0.51 0.45 0.025 0.029 51.3 41.9 26.8 20.7
Gangwon 0.0030 0.0024 0.016 0.009 0.48 0.42 0.029 0.030 44.2 31.0 25.7 14.8
Chungbuk 0.0034 0.0024 0.019 0.014 0.52 0.45 0.028 0.029 44.0 37.1 26.9 19.7
Chungnam 0.0033 0.0038 0.016 0.012 0.47 0.42 0.030 0.036 43.9 41.4 23.0 21.1
Jeonbuk 0.0040 0.0027 0.015 0.011 0.52 0.36 0.034 0.033 48.5 37.9 28.6 19.2
Jeonnam 0.0053 0.0029 0.014 0.009 0.48 0.41 0.032 0.034 35.7 32.0 20.5 14.8
Gyeongbuk 0.0045 0.0032 0.015 0.011 0.54 0.39 0.033 0.032 40.3 33.6 23.2 16.6
Gyeongnam 0.0045 0.0031 0.019 0.014 0.46 0.41 0.034 0.033 42.9 29.9 22.8 15.3
Jeju 0.0021 0.0014 0.011 0.007 0.28 0.27 0.041 0.043 37.3 32.1 21.7 13.6
Average 0.0040 0.0029 0.019 0.014 0.48 0.42 0.030 0.032 43.5 35.2 24.1 17.4
Std 0.0011 0.0006 0.005 0.004 0.073 0.058 0.004 0.004 3.8 3.9 2.2 2.4

References

1. (SOGA) SoGA. State of Global Air 2024. In: 2024

2. Li B, Ho SSH, Li X, Liya G, Chen A, Hu L, Yang Y, Chen D, Lin A, Fang X. A comprehensive review on anthropogenic volatile organic compounds (VOCs) emission estimates in China: Comparison and outlook. Environment International. 2021;156:106710. https://doi.org/10.1016/j.envint.2021.106710
crossref
3. Kesgin U. Genetic algorithm and artificial neural network for engine optimisation of efficiency and NOx emission. Fuel. 2004;83:885–895. https://doi.org/10.1016/j.fuel.2003.10.025
crossref
4. Deng J, Wang X, Wei Z, Wang L, Wang C, Chen Z. A review of NOx and SOx emission reduction technologies for marine diesel engines and the potential evaluation of liquefied natural gas fuelled vessels. Science of The Total Environment. 2021;766:144319. https://doi.org/10.1016/j.scitotenv.2020.144319
crossref
5. Wyer KE, Kelleghan DB, Blanes-Vidal V, Schauberger G, Curran TP. Ammonia emissions from agriculture and their contribution to fine particulate matter: A review of implications for human health. Journal of Environmental Management. 2022;323:116285. https://doi.org/10.1016/j.jenvman.2022.116285
crossref
6. Lu F, Xu D, Cheng Y, Dong S, Guo C, Jiang X, Zheng X. Systematic review and meta-analysis of the adverse health effects of ambient PM2.5 and PM10 pollution in the Chinese population. Environmental Research. 2015;136:196–204. https://doi.org/10.1016/j.envres.2014.06.029
crossref
7. Nuvolone D, Petri D, Voller F. The effects of ozone on human health. Environmental Science and Pollution Research. 2018;25:8074–8088. https://doi.org/10.1007/s11356-017-9239-3
crossref
8. Kuklinska K, Wolska L, Namiesnik J. Air quality policy in the US and the EU–a review. Atmospheric Pollution Research. 2015;6:129–137. https://doi.org/10.5094/APR.2015.015
crossref
9. Ito A, Wakamatsu S, Morikawa T, Kobayashi S. 30 years of air quality trends in Japan. Atmosphere. 2021;12:1072. https://doi.org/10.3390/atmos12081072
crossref
10. Beloconi A, Vounatsou P. Revised EU and WHO air quality thresholds: Where does Europe stand? Atmospheric Environment. 2023;314:120110. https://doi.org/10.1016/j.atmosenv.2023.120110
crossref
11. Wang Y, Lai N, Mao G, Zuo J, Crittenden J, Jin Y, Moreno-Cruz J. Air pollutant emissions from economic sectors in China:A linkage analysis. Ecological Indicators. 2017;77:250–260. https://doi.org/10.1016/j.ecolind.2017.02.016
crossref
12. Bian Y, Huang Z, Ou J, Zhong Z, Xu Y, Zhang Z, Xiao X, Ye X, Wu Y, Yin X, Li C, Chen L, Shao M, Zheng J. Evolution of anthropogenic air pollutant emissions in Guangdong Province, China, from 2006 to 2015. Atmospheric Chemistry and Physics. 2019;19:11701–11719. https://doi.org/10.5194/acp-19-11701-2019
crossref
13. Gao Z, Mei EJ, He X, Hopke PK, Ebelt S, Rich DQ, Russell AG. Multicity accountability and uncertainty assessment of the impacts of regulations on air quality in Atlanta, New York City, and Southern California. Atmospheric Environment. 2025;342:120947. https://doi.org/10.1016/j.atmosenv.2024.120947
crossref
14. Lohwasser J, Bolognesi T, Schaffer A. Impacts of population, affluence and urbanization on local air pollution and land transformation – A regional STIRPAT analysis for German districts. Ecological Economics. 2025;227:108416. https://doi.org/10.1016/j.ecolecon.2024.108416
crossref
15. Choi SW, Cho H, Hong Y, Jo HJ, Park M, Lee HJ, C YJ, Shin HH, Lee D, Shin E, Baek W, Park SK, Kin E, Kim HC, Song SJ, Park Y, Kim J, Baek J, Kim J, Yoo C. Analysis of the National Air Pollutant Emissions Inventory (CAPSS 2018) Data and Assessment of Emissions Based on Air Quality Modeling in the Republic of Korea. Asian Journal of Atmospheric Environment. 2022;16:2022084. https://doi.org/10.5572/ajae.2022.084
crossref
16. Oak YJ, Jacob DJ, Pendergrass DC, et al. Air quality trends and regimes in South Korea inferred from 2015–2023 surface and satellite observations. Atmos. Chem. Phys. 2025;25:3233–3252. https://doi.org/10.5194/acp-25-3233-2025
crossref
17. Kim J, Lee G, Jun J, Seo BK, Choi Y. Quantification of SO2 and CO2 emission rates from coal-fired power plants in the Korean peninsula via airborne measurements. Science of The Total Environment. 2025;978:179430. https://doi.org/10.1016/j.scitotenv.2025.179430
crossref
18. Kim J, Park J, Hu H, Crippa M, Guizzardi D, Chatani S, Kurokawa J, Morikawa T, Yeo S, Jin H, Woo JH. Long-term historical trends in air pollutant emissions in South Korea (2000-2018). Asian Journal of Atmospheric Environment. 2023;17:12. https://doi.org/10.1007/s44273-023-00013-w
crossref
19. Kumar N, Johnson J, Yarwood G, Woo JH, Kim JH, Kim Y, Park RJ, Jeong JI, Kang S, Chun S, Knipping E. Contributions of domestic sources to PM2. 5 in South Korea. Atmospheric Environment. 2022;287:119273. https://doi.org/10.1016/j.atmosenv.2022.119273
crossref
20. Oak YJ, Jacob DJ, Pendergrass DC, Dang R, Colombi NK, Chong H, Lee S, Kuk SK, Kim J. Air quality trends and regimes in South Korea inferred from 2015–2023 surface and satellite observations. Atmospheric Chemistry and Physics. 2025;25:3233–3252. https://doi.org/10.5194/acp-25-3233-2025
crossref
21. Yeo MJ, Kim YP. Long-term trends and affecting factors in the concentrations of criteria air pollutants in South Korea. Journal of Environmental Management. 2022;317:115458. https://doi.org/10.1016/j.jenvman.2022.115458
crossref
22. Ma J, Ding Y, Cheng JC, Jiang R, Tan Y, Gan VJL, Wan Z. Identification of high impact factors of air quality on a national scale using big data and machine learning techniques. Journal of Cleaner Production. 2020;244:118955. https://doi.org/10.1016/j.jclepro.2019.118955
crossref
23. Zhou W, Xu W, Wang Q, Li Y, Lei L, Yang Y, Zhang Z, Fu P, Wang Z, Sun Y. Machine learning elucidates the impact of short-term emission changes on air pollution in Beijing. Atmospheric Environment. 2022;283:119192. https://doi.org/10.1016/j.atmosenv.2022.119192
crossref
24. Fabregat A, Vernet A, Vernet M, Vázquez L, Ferré JA. Using Machine Learning to estimate the impact of different modes of transport and traffic restriction strategies on urban air quality. Urban Climate. 2022;45:101284. https://doi.org/10.1016/j.uclim.2022.101284
crossref
25. Yang Z, Wang J. A new air quality monitoring and early warning system:Air quality assessment and air pollutant concentration prediction. Environmental Research. 2017;158:105–117. https://doi.org/10.1016/j.envres.2017.06.002
crossref
26. Zou H, Hastie T. Regularization and variable selection via the elastic net. Journal of the Royal Statistical Society Series B:Statistical Methodology. 2005;67:301–320. https://doi.org/10.1111/j.1467-9868.2005.00527.x
crossref
27. Fix E. Discriminatory analysis: nonparametric discrimination, consistency properties. USAF school of Aviation Medicine: 1951

28. Breiman L. Random forests. Machine learning. 2001;45:5–32. https://doi.org/10.1023/A:1010933404324
crossref
29. Friedman JH. Greedy function approximation: a gradient boosting machine. Annals of statistics. 2001;1189–1232. https://doi.org/10.1214/aos/1013203451
crossref
30. Chen T, Guestrin C. Xgboost: A scalable tree boosting system. In: Proceedings of the 22nd acm sigkdd international conference on knowledge discovery and data mining. 2016;785-794. https://doi.org/10.1145/2939672.2939785
crossref
31. Ke G, Meng Q, Finley T, Wang T, Chen W, Ma W, Ye Q, Liu TY. Lightgbm: A highly efficient gradient boosting decision tree. Advances in neural information processing systems. 2017. 30:

32. Prokhorenkova L, Gusev G, Vorobev A, Dorogush AV, Gulin A. CatBoost: unbiased boosting with categorical features. Advances in neural information processing systems. 2018;31:

33. McCulloch WS, Pitts W. A logical calculus of the ideas immanent in nervous activity. The bulletin of mathematical biophysics. 1943;5:115–133. https://doi.org/10.1007/BF02478259
crossref
34. Akiba T, Sano S, Yanase T, Ohta T, Koyama M. Optuna: A next-generation hyperparameter optimization framework. In: Proceedings of the 25th ACM SIGKDD international conference on knowledge discovery & data mining. 2019;2623-2631. https://doi.org/10.1145/3292500
crossref
35. Chicco D, Warrens MJ, Jurman G. The coefficient of determination R-squared is more informative than SMAPE, MAE, MAPE, MSE and RMSE in regression analysis evaluation. Peerj computer science. 2021;7:e623. https://doi.org/10.7717/peerj-cs.623
crossref
36. Li Z. Extracting spatial effects from machine learning model using local interpretation method: An example of SHAP and XGBoost. Computers, Environment and Urban Systems. 2022;96:101845. https://doi.org/10.1016/j.compenvurbsys.2022.101845
crossref
37. Kim SJ, Lee HY, Lee SJ, Choi SD. Passive air sampling of VOCs, O3, NO2, and SO2 in the large industrial city of Ulsan, South Korea:spatial–temporal variations, source identification, and ozone formation potential. Environmental Science and Pollution Research. 2023;30:125478–125491. https://doi.org/10.1007/s11356-023-31109-z
crossref
38. Yeo MJ, Kim YP. Long-term Trend of Sulfur Dioxide Concentration by District in Korea. Journal of Korean Society for Atmospheric Environment. 2020;36:742–756. https://doi.org/10.5572/KOSAE.2020.36.6.742
crossref
39. Yeo MJ, Kim YP. Long-term trends of surface ozone in Korea. Journal of Cleaner Production. 2021;294:125352. https://doi.org/10.1016/j.jclepro.2020.125352
crossref
40. Kim Y, Park S, Choi H, Im J. Comprehensive 24-hour ground-level ozone monitoring: Leveraging machine learning for full-coverage estimation in East Asia. Journal of Hazardous Materials. 2025;488:137369. https://doi.org/10.1016/j.jhazmat.2025.137369
crossref
41. Ojha N, Soni M, Kumar M, Gunthe SS, Chen Y, Ansari TU. Mechanisms and pathways for coordinated control of fine particulate matter and ozone. Current pollution reports. 2022;8:594–604. https://doi.org/10.1007/s40726-022-00229-4
crossref
42. Ryou Hg, Heo J, Kim S-Y. Source apportionment of PM10 and PM2.5 air pollution, and possible impacts of study characteristics in South Korea. Environmental pollution. 2018;240:963–972. https://doi.org/10.1016/j.envpol.2018.03.066
crossref
43. Crippa M, Guizzardi D, Butler T, Keating T, Wu R, Kaminski J, Kuenen J, Kurokawa J, Chatani S, Morikawa T, Pouliot G, Racine J, Moran MD, Klimont Z, Manseau PM, Mashayekhi R, Henderson BH, Smith SJ, Suchyta H, Muntean M, Solazzo E, Banja M, Schaaf E, Pagani F, Woo JH, Kim J, Monforti-Ferrario F, Pisoni E, Zhang J, Niemi D, Sassi M, Ansari T, Foley K. The HTAP_v3 emission mosaic:merging regional and global monthly emissions (2000–2018) to support air quality modelling and policies. Earth system science data. 2023;15:2667–2694. https://doi.org/10.5194/essd-15-2667-2023
crossref
44. Ratner B. The correlation coefficient: Its values range between+ 1/− 1, or do they? Journal of targeting, measurement and analysis for marketing. 2009;17:139–142. https://doi.org/10.1057/jt.2009
crossref
45. Choi KC, Lee JJ, Bae CH, Kim CH, Kim S, Chang LS, Ban SJ, Kim J, Woo JH. Assessment of transboundary ozone contribution toward South Korea using multiple source–receptor modeling techniques. Atmospheric environment. 2014;92:118–129. https://doi.org/10.1016/j.atmosenv.2014.03.055
crossref
46. Lee HM, Park RJ. Factors determining the seasonal variation of ozone air quality in South Korea: Regional background versus domestic emission contributions. Environmental Pollution. 2022;308:119645. https://doi.org/10.1016/j.envpol.2022.119645
crossref
47. Colombi NK, Jacob DJ, Yang LH, Zhai S, Shah V, Grange SK, Yantosca RM, Kim S, Liao H. Why is ozone in South Korea and the Seoul metropolitan area so high and increasing? Atmospheric Chemistry and Physics. 2023;23:4031–4044. https://doi.org/10.5194/acp-23-4031-2023
crossref
48. Shepard D. A two-dimensional interpolation function for irregularly-spaced data. In: Proceedings of the 1968 23rd ACM national conference. 1968; pp. 517-524. https://doi.org/10.1145/800186.810616
crossref
49. Fotheringham AS, Brunsdon C, Charlton M. Geographically weighted regression. The Sage handbook of spatial analysis. 2009;1:243–254.
crossref
50. Cifuentes F, González CM, Trejos EM, López LD, Sandoval FJ, Cuellar OA, Mangones SC, Rojas NY, Aristizábal BH. Comparison of top-down and bottom-up road transport emissions through high-resolution air quality modeling in a city of complex orography. Atmosphere. 2021;12:1372. https://doi.org/10.3390/atmos12111372
crossref
51. Sartini L, Antonelli M, Pisoni E, Thunis P. From emissions to source allocation: Synergies and trade-offs between top-down and bottom-up information. Atmospheric Environment: X. 2020;7:100088. https://doi.org/10.1016/j.aeaoa.2020.100088
crossref
Editorial Office
464 Cheongpa-ro, #726, Jung-gu, Seoul 04510, Republic of Korea
TEL : +82-2-383-9653   FAX : +82-2-383-9654   E-mail : ksee@kosenv.or.kr
About |  Browse Articles |  Current Issue |  For Authors and Reviewers
Copyright © Korean Society of Environmental Engineers.                 Developed in M2PI