2025-07-06-재난문자 API 활용 데이터 파이프라인 미니 프로젝트
[Projects] 재난문자 API 활용 실시간 알림 시스템 구축
지구 온난화와 도시화가 가속화되면서, ‘열섬 현상’(Urban Heat Island)은 서울시를 비롯한 대도시의 주요 환경 문제로 부상하고 있다. 나는는 Microsoft Data School 과정에서 팀원들과 함께 서울시의 열섬 현상을 데이터 기반으로 분석하고, 그 원인을 심층적으로 탐색하는 프로젝트에 참여했다. 이 프로젝트의 궁극적인 목표는 열섬 강도(UHII: Urban Heat Island Intensity)를 예측하고, 이를 통해 도시 정책 수립에 기여할 수 있는 시뮬레이션의 기반을 다지는 것이다.
팀 내에서 나의 주요 역할은 다양한 공공 데이터의 수집 및 전처리, 그리고 탐색적 데이터 분석(EDA)을 통한 핵심 인사이트 도출이었다. 특히, Azure Databricks 환경에서 PySpark를 활용하여 방대한 데이터를 정제하고 분석 가능한 형태로 가공하는 데 집중했다.
이 프로젝트의 핵심 목표는 다음과 같았습니다.
팀 내에서 저는 주로 데이터 전처리와 EDA분석을 담당했습니다. 이 프로젝트는 Databricks를 핵심 분석 환경으로, Power BI와 Flask를 시각화 및 서비스 제공에 활용했습니다.
저희 프로젝트는 크게 웹 UI, Flask 웹 서버, 그리고 데이터 & 예측 인프라 로 구성되었습니다.
저희 프로젝트는 2020년부터 2024년까지의 여름철(6,7,8월) 서울시 전역 데이터를 기반으로 했습니다. 총 70,230개의 데이터를 다루었으며, 다양한 공공 데이터 포털 및 API를 통해 데이터를 수집했습니다.
주요 데이터 소스 :
수집된 데이터는 Azure Databricks 환경에서 Pyspark를 활용하여 전처리 되었습니다. 이 과정에서 누락값처리, 이상치 제거, 데이터 타입 변환, 그리고 다양한 피처 엔지니어링이 수행되었습니다.
[Projects] 재난문자 API 활용 실시간 알림 시스템 구축
1. 서론 : 왜 Azure Stream Analytics인가 ?
Azure Event Hubs: 대규모 실시간 데이터 스트리밍의 핵심 허브
### [MicroSoft Data School] Azure Functions : 서버리스 기반의 효율적인데이터 수집 및 파이프라인 트리거
1. 프로젝트 개요 : 데이터로 이해하는 서울시 열섬 현상 지구 온난화와 도시화가 가속화되면서, ‘열섬 현상’(Urban Heat Island)은 서울시를 비롯한 대도시의 주요 환경 문제로 부상하고 있다. 나는는 Microsoft Data School 과정에서 팀원들과 함께 서울...
Power BI란?
111
#블로그
1. 목표 Azure에서 가상 머신을 생성하고, WordPress를 설치하여 간단한 웹사이트를 띄우는 실습을 진행
##1. 실습 개요