목차 전체
1
비만 유발요인 추정을 위한 빅데이터 머신러닝 모델 개발
요약
목차
01 연구개요
1. 연구배경 및 목적 18
1-1. 연구배경 18
1-2. 연구목적 21
2. 연구내용 및 방법 22
2-1. 연구내용 22
2-2. 연구의 범위 및 방법론 22
2-3. 연구 추진체계 및 절차 23
02 관련 동향 검토 26
1. 국내 연구 동향 26
2. 국외 연구 동향 27
3. 서울시 비만 예방사업 동향 28
4. 대시민 설문조사 및 분석 32
5. 시사점 35
03 서울시 통합 데이터 수집 및 가공 38
1. 서울시 비만 유발요인 통합 데이터 수집 38
1-1. 데이터 수집 범위 38
1-2. 데이터 수집 내용 및 방법 39
2. 서울시 비만 유발요인 통합 데이터 전처리 45
2-1. 개인적 요인의 통합 데 이터 전처리 45
2-2. 물리적 환경 요인 통합 데이터 전처리 48
3. 서울시 비만 유발요인 통합 데이터 기본통계 50
3-1. 지역사회건강조사 변수 간 상관관계 50
3-2. 개인적 요인 통합 데이터 기본통계 51
3-3. 물리적 환경 요인 통합 데이터 기본통계 57
4. 서울시 비만 유발요인 민간 데이터 기본통계 60
4-1. 신용카드 매출데이터 60
04 머신러닝기반 서울시 비만 유발요인 추정 모델링 64
1. 머신러닝/공간기반의 서울시 비만 유발요인 추정 모델링 64
1-1. 서울시 비만 유발 요인 분석 변수 선정 66
1-2. 머신러닝기반 서울시 자치구별 비만 예측 모형 개발 71
1-3. 머신러닝기반의 서울시 비만유발 개인요인 분석 모델 성능 74
1-4. SHAP 알고리즘을 활용한 신뢰도 있는 모형 해석 77
1-5. GWLASSO (Geographically Weighted LASSO) 모델 80
2. 머신러닝기반의 서울시 비만 유발요인 추정 결과 85
2-1. 자치구별 비만유발 개인요인 상위 5개 85
2-2. 자치구별 비만유발 개인소비 요인(카드데이터) 상위 5개 87
2-3. 자치구별 비만유발 통합요인 상위 5개 88
2-4. GWLASSO 모델 분석 결과 90
3. 머신러닝기반 서울시 비만유발요인 시각화 프로토타입 96
3-1. 자치구별 공원 현황 96
3-2. 공시지가 및 보건예산액 98
3-3. SHAP변수 중요도 100
4. GIS기반 서울시 비만유발요인 시각화 프로토타입 102
05 결론 및 정책제언 106
1. 결론 106
2. 정책제언 108
참고문헌 111
부록 114
1. 서울시 자치구별 비만 예방사업 114
2. 대시민 설문조사 결과 130
Abstract 136
표 목차
[표 2-1] 서울시 자치구별 비만 예방사업 30
[표 2-2] 적용대상별 서울시 자치구별 비만 예방사업 구분 31
[표 3-1] 수집된 통합 데이터 내용 38
[표 3-2] 지역사회 건강조사 제공자료 39
[표 3-3] 지역사회건강조사 자료요청 절차 40
[표 3-4] 지역사회건강조사 제공자료 41
[표 3-5] 데이터 제공 방식 43
[표 3-6] 데이터 수집 내용 44
[표 3-7] 직업분류 응답코드 축소 상세 46
[표 3-8] 연도별 응답 코드 통일 작업 내용 47
[표 3-9] 물리적 환경 요인 파생변수 49
[표 3-10] 카드매출데이터 대,중,소분류 60
[표 3-11] 카드매출데이터 데이터형태 62
[표 4-1] ③ 비해당 응답에 따른 항목 정의 67
[표 4-2] 다중공선성 VIF 수치를 고려한 변수 선택 68
[표 4-3] 회귀분석의 p-value를 고려한 변수 선택 69
[표 4-4] 최종 선택 변수 70
[표 4-5] 연도별 데이터 건수 71
[표 4-6] 머신러닝 분류모델 설명 72
[표 4-7] 2019년 자치구별 교차검증 분류성능평가지표의 평균과 표준편차 74
[표 4-8] 2019년 자치구별 평가세트 예측 결과 분류성능평가지표 76
[표 4-9] 주변 요인에 대한 GWLASSO 분석 결과 84
[표 4-10] 자치구별 상위 5개 비만유발 개인요인 변수 85
[표 4-11] 자치구별 상위 5개 비만유발 개인소비 요인 변수 87
[표 4-12] 자치구별 상위 5개 비만유발 통합요인 변수 88
[표 5-1] 자치구별 맞춤형 비만예방 사업(안) 108
[표 부-1] 2019년 강남구 보건소 비만예방 사업 프로그램 인지 여부 114
[표 부-2] 2019년 강동구 보건소 비만예방 사업 프로그램 인지 여부 115
[표 부-3] 2019년 강북구 보건소 비만예방 사업 프로그램 인지 여부 116
[표 부-4] 2019년 강서구 보건소 비만예방 사업 프로그램 인지 여부 116
[표 부-5] 2019년 관악구 보건소 비만예방 사업 프로그램 인지 여부 117
[표 부-6] 2019년 광진구 보건소 비만예방 사업 프로그램 인지 여부 118
[표 부-7] 2019년 구로구 보건소 비만예방 사업 프로그램 인지 여부 119
[표 부-8] 2019년 금천구 보건소 비만예방 사업 프로그램 인지 여부 120
[표 부-9] 2019년 노원구 보건소 비만예방 사업 프로그램 인지 여부 120
[표 부-10] 2019년 도봉구 보건소 비만예방 사업 프로그램 인지 여부 121
[표 부-11] 2019년 동대문구 보건소 비만예방 사업 프로그램 인지 여부 121
[표 부-12] 2019년 동작구 보건소 비만예방 사업 프로그램 인지 여부 122
[표 부-13] 2019년 마포구 보건소 비만예방 사업 프로그램 인지 여부 122
[표 부-14] 서대문구 보건소 비만예방 사업 프로그램 인지 여부 123
[표 부-15] 서초구 보건소 비만예방 사업 프로그램 인지 여부 124
[표 부-16] 성동구 보건소 비만예방 사업 프로그램 인지 여부 124
[표 부-17] 2019년 성북구 보건소 비만예방 사업 프로그램 인지 여부 125
[표 부-18] 2019년 송파구 보건소 비만예방 사업 프로그램 인지 여부 125
[표 부-19] 2019년 양천구 보건소 비만예방 사업 프로그램 인지 여부 126
[표 부-20] 2019년 영등포구 보건소 비만예방 사업 프로그램 인지 여부 127
[표 부-21] 2019년 용산구 보건소 비만예방 사업 프로그램 인지 여부 128
[표 부-22] 2019년 은평구 보건소 비만예방 사업 프로그램 인지 여부 128
[표 부-23] 2019년 종로구 보건소 비만예방 사업 프로그램 인지 여부 129
[표 부-24] 2019년 중구 보건소 비만예방 사업 프로그램 인지 여부 129
[표 부-25] 2019년 중량구 보건소 비만예방 사업 프로그램 인지 여부 129
그림 목차
[그림 1-1] 세계 성인 비만 유병률의 변화 (BMI 30kg/㎡ 이상, 2006년 및 2016년) 18
[그림 1-2] 대한민국 비만 유발병률 변화 (BMI 25kg/㎡ 이상, 2007년~2019년) 19
[그림 1-3] 성?연령별 비만에 대한 항목별 사회경제적 비용 20
[그림 1-4] 거주지역 및 비만수준별 의료비 (건강보험 총진료비, 비급여제외) 지출규모 20
[그림 1-5] 빅데이터 머신러닝 기반 서울시 비만요인 관리 방안 체계 구축 프로세스 21
[그림 1-6] 연구 추진체계 구성 및 업무분장 23
[그림 1-7] 연구추진 절차 23
[그림 2-1] 서울시 자치구별 비만 사업 개수 및 시민인지 비율(%) 28
[그림 2-2] 서울시 자치구별 비만예방 사업 도식화 31
[그림 2-3] 비대면 비만관리 사업 중요항목 설문조사 결과 33
[그림 2-4] 비대면 비만관리 사업 중요항목 설문조사 결과 34
[그림 2-5] 비대면 비만관리 사업 중요항목 설문조사 결과 34
[그림 3-1] 자료 에디팅 과정 40
[그림 3-2] 표본선정 과정 41
[그림 3-3] 지역사회건강조사 내용 42
[그림 3-4] 서울 열린데이터 광장 Open API 이용방법 44
[그림 3-5] 데이터 전처리 과정 45
[그림 3-6] 지역사회건강조사 변수 간 상관관계 50
[그림 3-7] 연도별 자치구별 비만율 격차 51
[그림 3-8] 2017-2019년 자치구별 성별에 따른 비만율 52
[그림 3-9] 2017-2019년 자치구별 연령대에 따른 비만율 53
[그림 3-10] 2017-2019년 자치구별 본인 인지체형에 따른 비만율 55
[그림 3-11] 2017-2019년 자치구별 고혈압진단경험여부에 따른 비만율 56
[그림 3-12] 2017-2019년 자치구별에 따른 연도별 따릉이 대여소 수 57
[그림 3-13] 2017-2019년 자치구에 따른 연도별 따릉이 이용 건수 57
[그림 3-14] 2019 자치구별 비만율 대비 따릉이 이용건수 58
[그림 3-15] 2019 자치구별 1인당 총 공원 면적 58
[그림 3-16] 2017-2019년 자치구별 연도별 공시지가 59
[그림 3-17] 2017-2019년 자치구별 연도별 보건예산액 59
[그림 4-1] 머신러닝/공간기반의 서울시 비만 유발요인 추정 모델링 (전체) 64
[그림 4-2] 변수 선정 과정 66
[그림 4-3] 지역사회건강조사 데이터 연도별 자치구별로 예측 모델 생성 71
[그림 4-4] 서울시 비만 유발요인 추정 모델링 (전체) 72
[그림 4-5] SHAP 알고리즘 77
[그림 4-6] SHAP Summary plot (2019년 강남구) 78
[그림 4-7] SHAP dependence plot (2019년 강남구-본인인지체형, 성별) 79
[그림 4-8] GWLASSO 분석 81
[그림 4-9] GWLASSO 모형 개발 FLOW 81
[그림 4-10] GWLASSO 분석 결과 예시 (서울 공공자전거 이용율) 83
[그림 4-11] 서울시 자치구별 공원 면적 대비 비만율 공간상관성 90
[그림 4-12] 서울시 자치구별 공시지가 대비 비만율 공간상관성 91
[그림 4-13] 서울시 자치구별 보건에산액 대비 비만율 공간상관성 92
[그림 4-14] 서울시 자치구별 버스관련 변수 비만율 공간상관성 93
[그림 4-15] 서울시 자치구별 출근시간 버스 이용율 대비 비만율 공간상관성 94
[그림 4-16] - 서울시 자치구별 자전거 이용율 대비 비만율 공간상관성 95
[그림 4-17] 자치구별 공원 현황 96
[그림 4-18] 연도별 공시지가 및 보건 예산액 98
[그림 4-19] 자치구별 공시지가 및 보건 예산액 98
[그림 4-20] SHAP 변수 중요도 대시보드 100
[그림 4-21] 1인당 생활 공원 면적 변수의 공간 분석 결과 102
[그림 4-22] 서울시 자치구별 보건예산액 (Interactive) 103
[그림 부-1] 서울시 비만예방 사업의 중요항목 설문조사 결과 130
[그림 부-2] 서비스 접근성 세부항목 중요도 비율 131
[그림 부-3] 서비스 편의성 세부항목 중요도 비율 132
[그림 부-4] 서비스 효과성 세부항목 중요도 비율 132
[그림 부-5] 서비스 효과성 세부항목 중요도 비율 133
[그림 부-6] 서비스 효과성 세부항목 중요도 비율 133
[그림 부-7] 비만예방 사업 홍보 방안 선호도 조사결과 134
[그림 부-8] 비대면 비만관리 사업 중요항목 설문조사 결과 135