Page cover

데이터 프로파일링

[CASE 1] 심장병 보유 가능성 예측

데이터 프로파일링은 데이터 세트의 내용을 요약하고, 이를 통해 데이터의 특성을 이해하며, 데이터 품질 문제를 식별하기 위한 과정입니다. 이를 통해 데이터의 일관성, 정확성, 완전성을 평가할 수 있으며, 데이터 분석 또는 모델링 작업 전에 데이터 준비의 중요한 단계를 구성합니다. 프로파일링 결과는 데이터의 분포, 빈도, 누락 값 등을 제공하여 데이터에 대한 보다 깊은 통찰력을 얻을 수 있도록 합니다.

kASTLE에서 프로파일링을 통해 데이터의 형태, 결측 수, 평균값과 같은 결과들을 도출 해낼 수 있으며, 데이터 전처리 과정에서 거쳐야할 과정

  1. kASTLE 프로파일

    파일 데이터 중 kASTLE 프로파일(기초 통계 및 샘플)
  • kASTLE 프로파일 누른후 새로고침을 클릭

  • csv파일에서 kASTLE로 데이터 파일이 적용되었는지 확인 가능

  1. yData 프로파일

yData 프로파일
  • yData 프로파일 누른후 새로고침을 클릭

  • 각 항목별 데이터 확인 가능

  1. Sweetviz 프로파일

Sweetviz 프로파일
  • Sweetviz 프로파일 누른후 새로고침을 클릭

  • 각 항목별 데이터 확인 가능

Last updated