척척 학사
[KT에이블스쿨] 미니프로젝트 3차 리뷰 본문
안녕하세요! "나는야맹구"입니다.
이번 4일동안, 미니프로젝트 3차를 진행했는데요.. 확실히 1,2차에 비해 난이도가 훨씬 올라간게 보였습니다..ㅠ . 3차 과정 한번 보시죠.
이번에 받은 데이터는 여러개의 클래스값을 가지고 있는 다중 분류 문제였는데요. 여기에 칼럼도 500여개가 넘는 수를 갖고 있어서, 칼럼 수를 줄이는게 목표였습니다. 확실히 전 프로젝트와 다른건 데이터의 크기였어요. 무려 500개가 넘는 칼럼.. 이거를 어케 다 쓰냐구요~. 그래서 지난 강의에서 배운 머신러닝 기법을 사용해서 칼럼 수 일부만 가져오는 프로젝트를 진행했답니다.
성능은 그대로 유지하면서도 변수 개수를 어떻게 줄이지?
- 두 범주 나누기
- a,b,c,d,e,f라는 클래스를 -> g/h로 범주를 줄이고, 랜덤포레스트를 돌려, 변수 중요도를 살펴보았습니다.
- 각 6개 범주별로 변수 중요도 확인해보기
- 방법은 랜덤포레스트
- feature.importances
- 앞으로 변수를 줄여야할 때 위 방법을 사용하면 될 것 같습니다
- 방법은 랜덤포레스트
- 위에서 확인한 중요한 변수와 중요하지 않은 변수 상위 5개를 정해 이들을 대상으로 EDA를 진행했습니다.
- 각 변수 그룹 별 중요도도 파악해보았습니다.
- 마지막으로 위같은 과정을 파이프라인 함수를 만들어, TEST데이터를 넣어 실험해보기도했습니다.
- 파이프라인 만드는게 최종 마무리하는 거라, 약간 버벅이긴 했지만 팀원들 도움 받아가면서 해냈습니다!!
이후에도 같은팀원들과 추가적으로 이틀 더 프로젝트를 더 진행했는데요.. 시간이 지날수록, 점차 제가 총괄역할을 하고 있더라구요..?(처음에 팀장 아무도 안한다해서 룰렛을 돌려 정해졌습니다..)
저는 과거에는 팀장 역할보다는 팀원으로써 최선을 다하자는 거에 더 목표를 두고 있었는데,
최근 미니프로젝트를 진행하면서, 팀원일 때 점점 나태해지고,, 누가 뭘 했는지 잘 모르는 제 자신을 보게 되었습니다.. 첫날에 역할 분배와 PPT에 어떤 내용이 들어가야할지 등의 틀을 만드는 작업들을 진행했습니다.
팀장을 하면, 그만큼 책임감이 뒤따르는 자리라 어깨가 가볍지만은 않지만
맡은 역할에 최선을 다해 팀을 이끌어 가보고자 했습니다.
제 전공이 여기서 뭔가 도움이 되는 느낌~
그럼 이상 미니프로젝트 3차를 마무리하겠습니당~
'[5기] KT에이블스쿨 > [5기] 프로젝트 후기' 카테고리의 다른 글
[KT에이블스쿨] 시행착오 기록, 5차 미니프로젝트의 연장선, Object Tracking, Yolov8, 웹서비스 구현 (4) | 2024.04.30 |
---|---|
[KT에이블스쿨] 미니프로젝트 4,5차 리뷰 (0) | 2024.04.30 |
[KT에이블스쿨] 미니프로젝트 2차 리뷰 (2) | 2024.03.25 |
[KT에이블스쿨] 미니프로젝트 1차 리뷰 (0) | 2024.03.18 |