Nâng cao độ chính xác trong việc phát hiện các khu vực có mưa ở miền Trung Việt Nam bằng phương pháp học máy

Các tác giả

  • Nguyen Hung An (Tác giả đại diện) Khoa Vô tuyến Điện tử, Học viện Kỹ thuật Quân sự
  • Vu Duy Dong Khoa Vô tuyến Điện tử, Học viện Kỹ thuật Quân sự

DOI:

https://doi.org/10.54939/1859-1043.j.mst.107.2025.105-113

Từ khóa:

Phân loại lượng mưa; Học máy; LightGBM; Random Forest; Himawari-8; ERA-5.

Tóm tắt

Nghiên cứu này ứng dụng các phương pháp học máy, bao gồm Light Gradient Boosting Machine (LGBM), XGBoost (XGB), và Random Forest (RF), kết hợp với dữ liệu đa nguồn dữ liệu vệ tinh Himawari-8, dữ liệu quan trắc mưa từ trạm đo mưa, và dữ liệu phụ trợ bao gồm tái phân tích ERA-5 và mô hình độ cao số ASTER (DEM), nhằm nâng cao độ chính xác trong phân loại mưa tại khu vực miền Trung Việt Nam. Các sản phẩm hiện có trong khu vực, bao gồm IMERG Final Run, IMERG Early, GSMaP_MVK_Gauge, PERSIANN_CCS, FY-4A và ảnh rađa, được sử dụng để đánh giá hiệu quả của phương pháp phân loại được đề xuất. Kết quả cho thấy mô hình phân loại mưa đề xuất sử dụng phương pháp LGBM vượt trội hơn so với các phương pháp khác. Kết quả cho thấy, sản phẩm phân loại mưa đề xuất đạt giá trị cao nhất đối theo các chỉ số đánh giá bao gồm: Xác suất phát hiện (POD), Chỉ số thành công (CSI), Chỉ số đe dọa công bằng (ETS) và Chỉ số kỹ năng Heidke (HSS). So với sản phẩm tham chiếu có hiệu suất cao nhất (GSMaP_MVK_Gauge), sản phẩm phân loại mưa đề xuất cho thấy mức cải thiện đáng kể khi tăng 20.0% về CSI, 16,67% về ETS, 38,89% về POD và 13,04% về HSS. Những kết quả này cho thấy tiềm năng của các mô hình học máy, đặc biệt là LGBM, trong việc nâng cao độ chính xác phát hiện mưa tại các khu vực có địa hình phức tạp, biến động khí hậu lớn và điều kiện thời tiết khắc nghiệt, qua đó cung cấp cơ sở quan trọng để cải thiện các hệ thống dự báo thời tiết.

Tài liệu tham khảo

[1]. F. Ouallouche, M. Lazri, and S. Ameur, “Improvement of rainfall estimation from MSG data using Random Forests classification and regression”, Atmos Res, vol. 211, pp. 62–72, (2018), doi: 10.1016/J.ATMOSRES.2018.05.001.

[2]. X. Liu, H. Duan, W. Huang, R. Guo, and B. Duan, “Classified Early Warning and Forecast of Severe Convective Weather Based on LightGBM Algorithm”, Atmospheric and Climate Sciences, vol. 11, pp. 284–301, (2021), doi: 10.4236/acs.2021.112017.

[3]. V. Dong, A. Nguyen, N. Phat, N. Thanh, N. Huyen, “Improving precipitation estimation accuracy for the Central Vietnam region using the XGBoost model with multi-source data”, TNU Journal of Science and Technology, vol. 229, pp. 69–77, (2024), doi: 10.34238/tnu-jst.11346.

[4]. D. Lavers, A. Simmons, F. Vamborg, and M. Rodwell, “An evaluation of ERA5 precipitation for climate monitoring”, Quarterly Journal of the Royal Meteorological Society, vol. 148, (2022), doi: 10.1002/qj.4351.

[5]. A. Mohammadi et al., “A Multi-Sensor Comparative Analysis on the Suitability of Generated DEM from Sentinel-1 SAR Interferometry Using Statistical and Hydrological Models”, Sensors, vol. 20, p. 7214, (2020), doi: 10.3390/s20247214.

[6]. L. Xuegang et al., “Comparative evaluation of GPM IMERG V07 early, late and final run products compared to IMERG V06 in Sichuan Province, China”, Theor Appl Climatol, vol. 156, (2025), doi: 10.1007/s00704-025-05569-x.

[7]. C. Zhou, L. Zhou, J. Du, J. Yue, and T. Ao, “Accuracy evaluation and comparison of GSMaP series for retrieving precipitation on the eastern edge of the Qinghai-Tibet Plateau”, J Hydrol Reg Stud, vol. 56, p. 102017, (2024), doi: 10.1016/j.ejrh.2024.102017.

[8]. Z. Wang, H. Chai, C. Zhu, H. Ma, N. Zheng, and P. Chen, “Reconstruction of High-Resolution Precipitable Water Vapor of FY-4A Based on GNSS and Remote Sensing Data”, (2025), doi: 10.2139/ssrn.5243923.

[9]. P. Nguyen et al., “The PERSIANN family of global satellite precipitation data: a review and evaluation of products”, Hydrol Earth Syst Sci, vol. 22, pp. 5801–5816, (2018), doi: 10.5194/hess-22-5801-2018.

[10]. C. Gianoglio, S. Zani, M. Colli, and D. Caviglia, “Rainfall Classification in Genoa: Machine Learning vs. Adaptive Statistical Models Using Satellite Microwave Links”, IEEE Access, vol. PP, p. 1, (2024), doi: 10.1109/ACCESS.2024.3458407.

[11]. S. Kolios, N. Hatzianastassiou, C. J. Lolis, and A. Bartzokas, “Accuracy Assessment of a Satellite-Based Rain Estimation Algorithm Using a Network of Meteorological Stations over Epirus Region, Greece”, Atmosphere (Basel), vol. 13, no. 8, (2022), doi: 10.3390/atmos13081286.

[12]. H. Hirose, S. Shige, M. Yamamoto, and A. Higuchi, “High Temporal Rainfall Estimations from Himawari-8 Multiband Observations Using the Random-Forest Machine-Learning Method”, Journal of the Meteorological Society of Japan. Ser. II, vol. 97, (2019), doi: 10.2151/jmsj.2019-040.

Tải xuống

Đã Xuất bản

28-11-2025

Cách trích dẫn

[1]
A. Hung Nguyen và D. Vu Duy, “Nâng cao độ chính xác trong việc phát hiện các khu vực có mưa ở miền Trung Việt Nam bằng phương pháp học máy”, JMST, vol 107, số p.h 107, tr 105–113, tháng 11 2025.

Số

Chuyên mục

Công nghệ thông tin & Cơ sở toán học cho tin học