데이터 전처리

[CASE 1] 심장병 보유 가능성 예측

kASTLE 데이터 전처리에서는 노드를 이용해 데이터를 이동시켜 전처리 과정을 거칩니다.

  1. 컬럼 인코딩

컬럼 인코딩 데이터 설정
  • 파일 데이터 노드와 컬럼 인코딩 노드를 연결

  • 컬럼 인코딩 노드를 클릭 후 설정 시작 버튼을 누르면 사진과 같은 화면으로 설정됨

  1. 데이터 처리방식 설정 및 설정 적용

데이터 처리 과정
  • 컬럼 인코딩 데이터 처리 설정으로 처리 방법을 결정함

  • 처리방식 아래데이터 처리를 원하는 셀에 마우스 포인트를 올리고 데이터 처리할 방식을 결정

  • 심장병 보유 가능성 Case Study 처리 방식으로는 ont hot encoding을 설정하였음

  • 설정 적용 버튼을 누른 후 작업 시행

  1. 데이터 처리 이후 적용 확인

데이터 처리후 kASTLE 프로파일 데이터
  • 데이터 프로파일링 과정 처럼 kASTLE 데이터를 확인하면 데이터 전처리 과정이 되었는지 확인 가능함

  • yData, Sweetviz 프로파일링도 확인 가능

Last updated