본문 바로가기
데이터 [Data]/Machine Learning

[DACON] '신용카드 사용자 연체 예측' 경진대회

by 냉철하마 2022. 5. 31.

1. 프로젝트 개요

 - 주제 : '신용카드 사용자 연체 예측'

 - 배경 : 신용카드 신청자가 제출한 개인정보와 데이터를 활용해 신용 점수를 산정, 이 신용 점수를 활용해 신청자의 향후 채무 불이행과 신용카드 대급 연체 가능성을 예측

 - 주제 선정 사유 : 개인 신상정보를 가지고 신용카드 사용자의 신용도를 어떻게 예측할 수 있는지 호기심이 생겨서 선정

 - 사용기술

    1) NumPy, Pandas를 활용한 데이터 전처리

    2) Scikit-learn과 CatBoost 부스팅 모델을 통한 데이터 모델링

    3) Matplotlib, seaborn을 활용한 분포, 히스토그램, 상자그림 시각화

 - 맡은 역할 : 팀장, 데이터 전처리, 발표자료 제작 등

 - 결과 : 인공지능 기술로 개인 신상정보 데이터를 분석하여 연체 예측 확률을 산출함

 

 - 프로젝트 기간 : 2022. 3. 31. ~ 2022. 5. 12.

 - 프로젝트 구성 : 3인 1조

 

2. 데이터 변수

 - 변수 설명 : https://dacon.io/competitions/official/235713/data

 

신용카드 사용자 연체 예측 AI 경진대회 - DACON

좋아요는 1분 내에 한 번만 클릭 할 수 있습니다.

dacon.io

 - 훈련 데이터 train.csv

    1) train 데이터 : 신용카드 사용자들의 개인 신상정보

    2) credit 열 포함

    3) train.shape : (26457, 20) = 26,457행 20열

 

 - 테스트 데이터 test.csv

    1) test 데이터 : 신용카드 사용자들의 개인 신상정보

    2) credit 열 미포함

    3) train.shape : (10000, 19) = 10,000행 19열

 

3. 참고자료

 - Team SsulleBal | Catboost https://dacon.io/competitions/official/235713/codeshare/2746

 - 신용카드 사용자 연체 예측_EDA https://dacon.io/competitions/official/235713/codeshare/3119

 - Basic_EDA https://dacon.io/competitions/official/235713/codeshare/2519

 

4. 발표자료

 

5. DACON 제출 결과

댓글