자격증 공부

제9회 빅데이터분석기사 실기 100점 합격 후기 (Python)

준코메 2024. 12. 23. 20:44

 

 
올 한 해는 정말 열심히 살았던 것 같습니다. 1월부터 컴활 1급, 3월부터 ADsP, SQLD를 준비하여 모두 합격했고, 6월부터는 경북대학교에서 국비교육 과정을 들으면서 정보처리기사, 빅데이터분석기사까지 5개의 자격증을 취득했습니다. 대학생때 따뒀던 사회조사분석사 2급까지 합하면 제 인생에서 총 6개의 자격증을 취득했네요. (운전 면허 까지 하면 7개?)
 
그 중에서도 실기 시험을 100점 받은 빅데이터분석기사 준비 과정을 남겨볼까 합니다.
 

1. 필기 시험 준비

저는 통계학과를 졸업했기 때문에 기초통계학 지식이 아직 머릿속에 남아있었고, ADsP를 준비하면서 비슷한 내용들을 공부했었기에 빅분기 필기를 준비하는게 다소 수월했습니다. 준비기간은 1달 반 정도 잡았으며 벼락치기 하지 않고 문제들을 많이 풀어보며 천천히 준비했습니다.

(출처) 데이터에듀 2024 빅데이터 분석기사 필기

 
교재는 데이터에듀의 2024 빅데이터 분석기사 필기 책으로 공부했는데요, 제가 이 책을 고른 이유는 문제 수가 가장 많았기 때문입니다. 아무리 개념 공부를 많이 해도 문제를 많이 풀지 않으면 의미가 없거든요.
 

(출처) 데이터자격검정 홈페이지

 
빅분기 필기는 총 4과목으로 구성되어 있습니다. 1, 4과목은 암기가 많이 필요하고 2, 3과목은 개념 이해가 많이 필요합니다. 빅분기는 과목도 많고 내용도 많아서 책도 상당히 두껍고, 읽어야 할 내용도 엄청 많기 때문에 모든 내용을 완벽하게 이해하고 넘어가려고 해서는 안됩니다. 개념은 처음 1회독 할 때 속독으로 한 번만 보시고 예상 문제와 기출 문제들을 다회독 하시면서 개념을 찾아보는 방식으로 공부하시면 됩니다.
 
또한, 2, 3과목은 비전공자분들이 공부하시기에는 통계와 머신러닝 관련 내용을 많이 다루고 있어 힘드실 수 있습니다. 책에 적혀있는 설명을 읽어도 무슨 말인지 모르겠는 경우가 많고, 문제를 봐도 외계어가 적혀있어 답답한 경우가 많으실 겁니다. 그럴때는 Copilot을 활용하여 공부하시는 것을 추천드립니다. 예를 들어
 
Q. 다음 중 데이터 전처리 시 변수의 개수를 줄이는 차원축소를 위해 사용될 수 있는 방법으로 적절하지 않은 것은?
1. 선형 판별분석
2. CNN (정답)
3. 특이값 분해
4. 서포트 벡터 머신
 
이 문제에 대한 책의 해설은 아래와 같습니다.
A. CNN은 변수의 개수를 줄이는 차원축소에 사용되지 않는다.
 
우리가 원하는 해설은 이런게 아닌데 말이죠... 답이 2번이니까 당연히 차원축소에 사용되지 않을건데 왜 사용되지 않는지에 대한 설명이 하나도 없습니다. 이러한 답답함을 우리의 Copilot이 해소시켜 줄 겁니다.

 
Copilot의 답변을 통해 몇 가지 중요한 사실들을 확인할 수 있습니다.
- 차원축소는 데이터의 변수를 줄이는 것
- 선형 판별분석은 데이터를 몇 개의 중요한 축으로 변환해 차원을 줄이는 방법
- CNN은 이미지 인식 및 처리에 사용되는 신경망 구조
- 특이값 분해는 데이터를 몇 개의 중요한 성분으로 줄여 차원축소에 사용
- SVM은 커널 트릭을 사용하여 차원축소도 가능
 
여기서 모든 내용들을 알 필요는 없습니다. CNN이 이미지 처리에 주로 사용되기 때문에 차원축소와 관련이 없다는 사실을 캐치하시고 다음 문제로 빠르게 넘어가시면 됩니다.
 

2. 실기 시험 준비

빅데이터분석기사 실기는 파이썬과 R 총 2가지 환경을 지원합니다. 저는 대학생때는 R을 더 많이 사용했지만 국비교육 과정을 들으면서 파이썬을 계속 사용하여 더 익숙해졌기에 파이썬으로 시험을 쳤습니다. 준비기간은 1달 정도 잡았습니다.

(출처) 데이터에듀 2024 빅데이터 분석기사 필기

 
교재는 필기 준비를 했던 데이터에듀의 2024 빅데이터 분석기사 실기 책으로 공부했습니다. 이 책을 선택한 이유는 빅분기 실기 환경과 유사한 연습환경을 제공해주기 때문입니다.

(출처) 데이터에듀 코드러닝

 
또한 예상문제, 모의고사, 기출문제의 경우 자신이 제출한 답안의 채점 결과까지 알려주기 때문에 더 효과적으로 공부 할 수 있었습니다.
 

(출처) 데이터자격검정 홈페이지

 
빅분기 실기는 작업형1 3문제 (각 10점), 작업형2 1문제 (40점), 작업형3 2문제 (각 15점) 총 6문제로 구성되어 있습니다. 작업형1의 경우 Pandas 활용능력을 요구하는 문제들이 나옵니다. 주어진 데이터프레임을 문제에서 요구하는 방식대로 가공하여 기술통계량을 계산하거나 특정 값을 추출하는 것을 요구합니다. 작업형2의 경우 Scikit-learn 패키지를 활용하여 주어진 데이터를 통해 머신러닝 모델을 구축하고 테스트 데이터로 예측값을 도출하는 것을 요구합니다. 작업형3의 경우 Scipy와 Statsmodels 패키지를 활용하여 가설검정이나 통계분석을 수행하는 것을 요구합니다.
 
작업형1의 경우 판다스를 많이 사용해보셨다면 어렵지 않게 풀 수 있을 것으로 생각되지만, 최근 작업형1의 난이도를 올리고 있는 추세라 판다스의 다양한 메서드와 속성에 대한 공부가 필요하다고 생각합니다.
 
작업형2의 경우 문제 유형이 거의 정해져 있어 원-핫 인코딩 후 하이퍼 파라미터 튜닝 없이 RandomForest만 돌리는 풀이만 달달 외워도 어렵지 않게 30점 이상을 가져갈 수 있을 것으로 생각됩니다.
 
작업형3의 경우 비전공자분들 이라면 가장 공부하기 어려운 부분이라고 생각됩니다. 주관식이 빠지고 작업형3이 새로 생긴지도 그렇게 오래되지 않아서 기출 유형도 다양하지 않은 상황이라 자주 등장했던 다중 회귀와 로지스틱 회귀 정도만 문제 풀이 위주로 유형을 공부하신 다음, 추가적으로는 T-검정, 상관분석, 분산분석 정도만 공부하셔도 충분히 합격하실 수 있을 것으로 생각됩니다.
 

3. 마무리

이렇게 이번 빅데이터분석기사 자격증 취득을 끝으로 저의 2024년 한 해가 잘 마무리 된 것 같습니다.
내년 초에 빨리 취업이 됐으면 좋겠네요.
이 글을 읽고 빅데이터분석기사를 준비하시는 분들이 모두 합격하셨으면 좋겠습니다!!