Notice
Recent Posts
Recent Comments
Link
«   2024/10   »
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31
Tags
more
Archives
Today
Total
관리 메뉴

척척 학사

[KT에이블스쿨] 미니프로젝트 3차 리뷰 본문

[5기] KT에이블스쿨/[5기] 프로젝트 후기

[KT에이블스쿨] 미니프로젝트 3차 리뷰

나는야맹구 2024. 4. 12. 10:40

안녕하세요! "나는야맹구"입니다.

이번 4일동안, 미니프로젝트 3차를 진행했는데요.. 확실히 1,2차에 비해 난이도가 훨씬 올라간게 보였습니다..ㅠ . 3차 과정 한번 보시죠.

이번에 받은 데이터는 여러개의 클래스값을 가지고 있는 다중 분류 문제였는데요. 여기에 칼럼도 500여개가 넘는 수를 갖고 있어서, 칼럼 수를 줄이는게 목표였습니다. 확실히 전 프로젝트와 다른건 데이터의 크기였어요. 무려 500개가 넘는 칼럼.. 이거를 어케 다 쓰냐구요~. 그래서 지난 강의에서 배운 머신러닝 기법을 사용해서 칼럼 수 일부만 가져오는 프로젝트를 진행했답니다. 

 

성능은 그대로 유지하면서도 변수 개수를 어떻게 줄이지?
  • 두 범주 나누기
    • a,b,c,d,e,f라는 클래스를 -> g/h로 범주를 줄이고, 랜덤포레스트를 돌려, 변수 중요도를 살펴보았습니다. 
  • 각 6개 범주별로 변수 중요도 확인해보기
    • 방법은 랜덤포레스트
      • feature.importances
    • 앞으로 변수를 줄여야할 때 위 방법을 사용하면 될 것 같습니다
  • 위에서 확인한 중요한 변수와 중요하지 않은 변수 상위 5개를 정해 이들을 대상으로 EDA를 진행했습니다. 
  • 각 변수 그룹 별 중요도도 파악해보았습니다.
  • 마지막으로 위같은 과정을 파이프라인 함수를 만들어, TEST데이터를 넣어 실험해보기도했습니다.
    • 파이프라인 만드는게 최종 마무리하는 거라, 약간 버벅이긴 했지만 팀원들 도움 받아가면서 해냈습니다!!

 

이후에도 같은팀원들과 추가적으로 이틀 더 프로젝트를 더 진행했는데요.. 시간이 지날수록, 점차 제가 총괄역할을 하고 있더라구요..?(처음에 팀장 아무도 안한다해서 룰렛을 돌려 정해졌습니다..)

저는 과거에는 팀장 역할보다는 팀원으로써 최선을 다하자는 거에 더 목표를 두고 있었는데,
최근 미니프로젝트를 진행하면서, 팀원일 때 점점 나태해지고,, 누가 뭘 했는지 잘 모르는 제 자신을 보게 되었습니다.. 첫날에 역할 분배와 PPT에 어떤 내용이 들어가야할지 등의 틀을 만드는 작업들을 진행했습니다. 

총괄 제가 할게용~

팀장을 하면, 그만큼 책임감이 뒤따르는 자리라 어깨가 가볍지만은 않지만
맡은 역할에 최선을 다해 팀을 이끌어 가보고자 했습니다. 

제 전공이 여기서 뭔가 도움이 되는 느낌~

매니저님이 칭찬해주셔서,, 좋았다,,ㅎ

그럼 이상 미니프로젝트 3차를 마무리하겠습니당~