코드잇 스프린트/스프린터 라이프

스프린트 회고 4주차(24.08.12~24.08.18)

JOHAWK 2024. 8. 19. 14:58


분석 실습(엑셀)

4주차는 지금까지 배운 기초 통계를 활용해 건강검진 데이터를 살펴보고 가설을 세운 다음 엑셀로 가설 검정을 했다.

 

처음에는 엑셀로 분석만 하면 되는 간단한 과제인 줄 알고 사람들이 잘 쓰지 않을 것 같은 간 관련 수치(AST, ALT, 감마지티피, 트리글리세라이드)와 관련 있을 것 같은 인구통계학적 요인을 찾는 분석을 하겠다는 계획을 세우고 팀원들과 논의한 사항을 강사님께 제출했다.

 

그런데 돌아온 강사님의 대답은 '완전 다른 방향으로 진행되고 있다'였다.

단순히 분석을 하는 게 아니라 실제 업무에서 하는 것처럼 시장조사에 대한 리서치를 해오라는 것이었다.

 

이 때 느꼈다. 여기는 단순히 공부를 하는 곳이 아니라 취업을 위한 부트캠프라는 것을...

 

어떻게 하면 내가 선정한 데이터들을 계속 활용할 수 있는 주제를 뽑을 수 있을까?

고민하고 또 고민했다.

그러는 사이 시간은 빠르게 흘러갔다.

'특정 회사의 실무자가 되는 페르소나를 착용한다'는 팀원들의 주제 탐색 방법에 힌트를 얻어 '건강증진개발원 직원으로 기존에 없던 새로운 질병 관련 위험요인 지표를 개발하자'라는 컨셉을 잡고 조사를 진행했다.

 

많은 질환 중 지방간에 대한 지표를 만들어야 하는 이유를 찾기 위해 구글 트렌드도 가고, 연관 검색어도 탐색해봤다. 구글 트렌드에서 지방간이 다른 질환들에 비해 인기가 없어 절망하기도 했지만 실제 환자 대비 유병률에서 지방간이 압도적으로 높아 거기에 포인트를 두고 지방간 위험 지표를 만들어야 하는 논리를 전개할 수 있었다.

 

분석 리서치를 제출했지만, 나는 아직 부족하다 느낀 점이 많았다. 기승전결에서 '결'이 모자르다고 생각했고, 구글 검색 트렌드나 네이버 데이터랩에서 검색어 분석을 할 때에도 단순히 '지방간', '빈혈' 등의 키워드만 썼다. 그런데 그런 검색어 분석을 할 때는 실제 사람들이 쓸 것 같은 검색어를 사용해야한다고 말씀하셨다. 정규 수업시간이 끝나고도 계속 시장 조사와 관련해 보강 조사를 진행하고 2차 제출 기회가 있을 때를 노리고 있었다.

그런데 다음 날, 강사님께서 우수 사례로 내가 제출한 리서치를 보여주었다. 내가 그렇게 못한 것은 아니구나라는 생각에 다행이다와 함께 살짝 감격스러웠다.

 

이를 바탕으로 엑셀로 데이터 분석까지 쭉쭉 진행했다. 매번 SPSS나 파이썬으로 하던 걸 엑셀로 하려니 불편한 점도 많았고 성별 코드를 빼놓고 회귀분석을 돌리는 실수도 했었지만 4회의 다중회귀분석(종속변수가 4개라서 4번 함)을 마무리했고 나름 재미있는 결과도 얻었다.

 

근데 문제는 보고서를 만드는 일이었다.

내가 분석을 하면서 만든 PPT는 거의 20장이었는데 보고서는 PPT 10장으로 만들어야했다.

아이고야, 어디서부터 뭘 뺄까 고민을 했는데 너무 아까웠다.

일단 와이프가 예전부터 권유한대로 글씨 크기부터 작게 만들었다. 그랬더니 회귀분석 결과들을 한 슬라이드에 우겨넣을 수 있었다.

그리고 이전에 강사님이 올려주신 프로젝트 예시 자료를 참고하여 이미지는 빼고 내용은 핵심만 전달할 수 있게 최대한 줄이고 줄였다.

그렇게 하니 10장으로 줄일 수 있었다.

 

이번에 분석 실습을 하면서 느낀 점은 연구할 때 선행연구를 조사하는 것과 실무에서 시장조사를 하는 것은 전혀 다르다는 것이다.

연구실 생활을 했던 나는 깊이 있는 논문들보다 비정형적인 현실을 탐구하기 위해 돌아다니는 것이 더 어려웠다.

그래도 실제로 이렇게 해서 결과물을 만들어 놓으니 재미있었다.

나중에 팀원들과 함께 할 프로젝트가 기대된다.


분석 실습 결과물은 여기에 있어요!

지방간을 예측하는 인구통계학적 요인 살펴보기 (tistory.com)

 

지방간을 예측하는 인구통계학적 요인 살펴보기

코드잇 스프린트 데이터분석가 트랙 2기의 분석 실습으로 진행된 '엑셀로 일반건강검진데이터 분석하기'의 결과물입니다. 지방간을 예측할 수 있는 인구통계학적 요인을 다중회귀분석을 통해

johawk.tistory.com