코드잇 스프린트/스프린터 라이프

스프린트 회고 8~9주차(24.09.09 ~ 24.09.22)

JOHAWK 2024. 9. 29. 22:13

클러스터링, PCA

이제부터 나도 이론으로만 배웠지 실제로 잘 쓰지 않았던 분석 기법을 배우고 실습했다.

특히, PCA의 개념은 선형대수학을 배워야 완벽히 이해할 수 있는데 이 이론을 하루 이틀만에 다 배우려고하니 수강생들도 힘들고 강사님도 힘드셨던 것 같다. 나도 이전에 배웠던 자료들을 꺼내보며 그 개념을 다시 떠올렸다.

 

이론은 이전에 배운 기억이 있으니 따라가기 벅차지 않았지만 실습은 다른 얘기였다. 특히 클러스터링에서 DBSCAN을 하는데 예시로 받은 데이터에서 DBSCAN을 구현하기 어려웠다. 강사님은 이상치를 탐지하기 위해 DBSCAN을 사용했고 결과를 보여주셨지만 나는 전처리를 다르게 해서 그런지 DBSCAN의 하이퍼 파라미터를 바꿔도 이상치를 탐지하는 용도로 사용하기 어려웠다.

 

그리고 이제 실습 미션을 할 때 EDA는 기본적으로 하고 들어간다. 처음에는 EDA만 한다고 하루종일을 보냈는데 이제 하드 스킬도 조금씩 쌓이고 이전에 했던 코드들이 남아있으니 속도는 빨라진 거 같다.

 

관심 분야 트렌드 탐색 및 문제 찾기

저번 주차에 채용 공고를 통해 관심이 있는 분야를 찾았다면, 이번 주차에는 관심 있는 분야를 바탕으로 강사님이 비슷한 분야를 희망하는 사람들을 그룹핑하고, 희망 분야의 트렌드와 문제가 될 만한 사안이 무엇이 있는지 찾는 것이었다. 나는 NLP, LLM을 가장 많이 활용할 수 있는 분야이자 내가 관심이 있던 게임으로 배정되어 게임 내 욕설 필터링, 유저이탈분석, 게임BM 등 매일 매일 게임 업계 트렌드와 문제는 무엇이 있을까 열심히 탐색했다. 트렌드를 찾는 것은 어렵지 않았지만 거기서 문제를 뽑아내는 것은 어려웠다. 그래서 결국 내가 구독했던 유튜브들을 참고해 문제를 탐색했다.