본문 바로가기
데이터 [Data]

파워비아이(Power BI)를 활용한 '중대재해 재해자 수' 파레토 분석

by 냉철하마 2022. 8. 31.

<들어가기 전 요약>

1) 8월 29일부터 8월 31일까지 '엑셀을 활용한 데이터분석 & 파워비아이' 특강을 수강하고 있음.

2) 7월 29일부터 9월 1일까지 '비재무 데이터를 활용한 신용평가모델 리서치(넘블)'에 참여하는 중.

3) 파워비아이 특강에서 '파레토 분석'을 실습해 보았으며, 신용평가모델 리서치 마지막 테마로 '산업재해와 체불사업주'가 제시됨

4) 데이터 분석을 진행해야 하는 넘블 리서치를 위해, Power BI의 파레토 분석 결과를 적용하면 어떨까 하여 시도

 

사진출처 - Discord Numble 서버

1. 분석 배경

저는 위와 같이 두 프로젝트의 마무리에 놓여 있던 상황이었습니다. 신용평가모델 리서치 자체는 Python 툴을 활용하는 것이 원칙이지만, 그래도 이왕 파워비아이 배운거, 이를 활용하여 시각화하면 분석과 결론을 모두 도출해볼 수 있을 것이라는 기대 하에 파워비아이를 활용해보기로 했습니다.

 

특히 파워비아이 특강 중에는 파레토 분석 연습을 많이 진행했습니다. '파레토 분석은 가능한 많은 행동 과정이 주의를 끌기 위해 경쟁할 때 유용한 형식적 기법'으로, 사고를 자극하고 생각을 정리하는 데 도움이 되는 기법입니다. 영업관리나 공정관리 등의 예제 데이터를 활용하여 실습을 진행했고, 넘블 리서치의 이번 테마인 산업재해와도 잘 맞을 것 같아서 그대로 적용해 보기로 했습니다.

 

참고로 리서치 과제는 체불사업주 내용을 포함해야 하므로 이대로 제출하진 않겠지만, 산업재해의 경우 아래 내용을 중심으로 과제 작성을 이어갈 계획입니다.

 

 

2. 데이터 수집 및 가공 - 산업재해 : https://www.moel.go.kr/info/publict/publictDataList.do?searchSeq=330&searchMasterSeq=12 (고용노동부 공표)

 

내일을 위한 고용노동부 - 고용노동부가 밝은 미래를 열어드립니다

<!-- 사전정보 공표목록 --> 사전정보 공표목록 고용노동부가 보유중인 각종 행정정보를 열람하실 수 있습니다. 산재예방/산재보상 > 산업재해 발생건수 등 공표

www.moel.go.kr

넘블 리서치는 강의가 제공되는 수업은 아니지만, 가이드라인과 Q&A를 활용할 수 있는 '자발적 학습' 과정입니다. 신용평가모델 리서치 중 마지막 주차 과제로 산업재해와 체불사업주 데이터 Source 좌표가 제공되었는데요, 이번 글에서 저는 산업재해 데이터를 활용하여 분석을 진행해 보기로 했습니다. 위 링크의 글 중 가장 최신이라고 할 수 있는 '2021년 산업재해 발생건수 등 공표'를 다운로드하여, 안에 있는 데이터를 Power BI로 추출했습니다.

 

공고_21년 산업재해 발생건수 등 공표(홈페이지).pdf
0.96MB

저는 그 중에서도, 1번 항목인 '중대재해 발생 사업장' 테이블의 데이터를 수집했습니다. Table001부터 004까지, 2020년부터 2017년까지의 실제 데이터만 해도 500건이 넘었기에 분석을 수행하기에 무리가 없다고 판단했기 때문입니다. '쿼리 추가 - 쿼리를 새 항목으로 추가'하여 네 개의 테이블을 하나로 만들었고, 2019년 데이터를 수집하다가 발생한 null 행은 제거하고, 규모가 '50인 이상' vs '50인이상', '1,000인 이상' vs '1,000인이상' 등 동일한 의미지만 다르게 분류된 데이터도 수정해 주었습니다.

 

 

3. 데이터 분석 및 시각화

사진 출처 - Microsoft Power BI Desktop

이번에 활용할 목적 변수(종속변수)는 '중대재해 재해자수'입니다. 우선, ‘중대재해’는 산업안전보건법 시행규칙 제2조제1항의 ①사망자 1명 이상 ② 3개월 이상 부상자 동시 2명 이상 ③부상자 또는 직업성질병자 동시 10명 이상 발생한 재해를 뜻합니다. 표에서 재해자 수와 중대재해 재해자 수를 별도로 다뤘기에, 이번에는 '중대재해 재해자 수' 데이터에 더 집중해 보기로 했습니다.

 

설명변수는 업종, 규모, 지역 각각을 활용하기로 했습니다. 파레토 분석을 활용하기로 한 만큼, 여러 변수를 하나의 그래프로 모으는 것보다 개별 그래프로 따로 작성하는 것이 더 낫다고 판단했기 때문입니다. 즉, 업종/기업규모/지역 각각에 따라 '중대재해재해자수' 분포가 어떻게 되는지 확인하려는 것입니다.

 

엑셀과는 다르게 파워비아이에서 누계비율을 구하기 위해서는 누계비율을 위한 측정값을 작성하거나, 긴 함수코드를 작성하는 식으로 작성하게 됩니다. 저는 이번 특강에서 배운 긴 함수코드를 사용해, 누계비율 데이터를 설명변수 별로 각자 만들어 그래프에 넣을 수 있었습니다. 이같은 과정을 거쳐 나온 결과는 아래와 같습니다.

 

 

4. 결과 해석

※ 아래 내용들은 해석을 위해 제 개인적인 의견이 다수 섞여있다는 점 주의 바랍니다.

사진 1. 업종별 중대재해 재해자수

업종별 분석 결과는 위와 같습니다. 업종을 간소화하는 과정을 거치지 않았기에 많은 제조업들이 각자의 항목으로 존재하는 점을 먼저 보실 수 있습니다.

그럼에도 불구하고 가장 크게 눈에 띄는 것은, 2017~2020년 동안 4년간 전체 중대재해 재해자 수 중에 60% 이상이 건설업에서 발생했다는 점이라 할 수 있겠습니다. 업계 특성상 재해 위험이 높은 점을 어느 정도는 감안해야 하겠지만, 앞서 언급했듯 '중대재해'는 사망자 발생 / 장기 부상 2명 이상 발생 / 동시 10명 이상 부상·질병 등 그 피해가 크기 때문에 재해위험에 가장 크게 신경써야 한다는 점을 볼 수 있습니다.

신용평가에 이를 반영할 때 건설업계 전체에 안 좋게 반영하는 것은 무리겠지만, 재해위험이 클 뿐더러 최근 중대재해처벌법 시행과 산업재해에 예민할 수밖에 없는 여론을 고려한다면 이를 마냥 무시할 수도 없을 것이라 생각합니다. 

 

사진 2. 규모별 / 지역별 중대재해 재해자수

규모별 분석 결과, 생각 이상으로 50인 미만 규모 사업장의 중대재해 재해자 수 비율이 엄청 높은 것으로 나타났습니다. 전체의 82%를 50인 미만 소규모 사업장이 차지하고 있으며, 300인 미만으로 갈 경우 무려 95%에 달하는 수치가 나타났습니다. 위 자료로만 봐도 소규모 사업장이 안전에 있어 사각지대에 놓이고 있는 게 아닌가 하는 걱정이 들 정도였으며, 안전환경 체계를 구축하는 것에 아낌없는 지원이 필요하지 않나 싶습니다.

이를 신용평가모델에 적용할 때는 소규모 사업장에겐 사고 발생 시 신용에 패널티를 주기보다, 안전환경 체계를 잘 구축한 사업장에게 신용에 로열티를 주는 게 더 낫지 않을까 하는 생각이 들었습니다.

 

지역별 분석 결과, 광역자치단체 기준 경기도에서 발생하는 중대재해 재해자 수가 28%를 차지했습니다. 인구수가 많은 걸 감안하면 비율이 그렇게 높지 않다고 볼 수도 있으나, 서울에서 재해자 수가 상대적으로 적은 것을 감안하면 마냥 인구수에 비례한 문제는 아닌 것으로 보입니다. 거기에 서울/경기에 경남/경북까지 합산했을 때 전체 중대재해 재해자 수 중 과반이 넘는 것으로 보아 수도권은 물론 영남권에서도 중대재해가 발생하지 않도록 각별히 신경써야 할 것으로 보였습니다. 이는 기업 뿐만이 아닌 지자체나 정부에서도 각별히 신경을 써야 하지 않나 하는 생각이 들었고요.

업종과 마찬가지로 특정 지역에 있다고 신용평가에 안 좋게 적용하는 것은 바람직하지 않아보이나, 반복적으로 재해가 발생할 경우 이에 반영하도록 하여 기업과 지자체의 안전체계 구축에 기여할 수도 있지 않을까 하는 생각이 들기도 했습니다.

 

※ 관련기사 1 - 50인 미만 소규모 사업장들, 중대재해법 대응 속도낸다 (파이낸셜뉴스, 2022. 06. 07.)

https://www.fnnews.com/news/202206071803392002

 

50인 미만 소규모 사업장들, 중대재해법 대응 속도낸다

50인 이하 사업장에도 중대재해처벌법 적용 시일이 다가오면서 안전환경 체계 구축에 비상이 걸렸다. 올해 1월 27일부터 시행 중인 중대재해법은 50인 이상 사업장·50억 이상 건설현장을 대상으

www.fnnews.com

※ 관련기사 2 - 대구경북 산재사망 사건 70%, 중대재해처벌법 적용 피해 (뉴스민, 2022. 07. 01.)

https://www.newsmin.co.kr/news/74886/

 

대구경북 산재사망 사건 70%, 중대재해처벌법 적용 피해

중대재해처벌법 시행 이후 대구·경북 산업현장 사망 사건 중 약 30%만 중대재해처벌법 적용이 검토 중인 것으로 나타났다. 나머지 사건은 5인 미만 사업장이라 중대재해처벌법 적용 대상이 아니

www.newsmin.co.kr

 

5. 정리 및 요약

- 업종, 사업장 규모, 광역자치단체별로 중대재해 재해자 수 발생 차이는 있었지만, 궁극적으로 중대재해가 발생하지 않도록 기업과 지자체·정부가 힘을 기울여야 할 필요가 있다고 생각합니다.

- 코딩을 최소화하고도 데이터 분석을 진행할 수 있으며, 파워비아이(Power BI) 만으로도 데이터 수집부터 시각화까지 꽤나 유용하게 활용할 수 있다는 것을 확인할 수 있었습니다.

- 신용평가모델에 이를 적용할 때는 매우 신중하고 조심스럽게 접근해야 할 것입니다. 중대재해처벌법이나 대한민국 여론에 힘입어 섣불리 신용평가에 반영했다가는, 자칫 애꿎은 기업의 브랜드와 이미지에 직격탄을 입을 우려가 다분하기 때문입니다.

 

 

 

댓글