여기에 소개되는 프로그램들을 보면 SAS, R, SPSS, STATA, Eviews, MATLAB 등등 이런 것들이 있는데 사회과학 분야에서는 SAS, STATA가 많이 사용된다고 한다. 내가 대학에 다닐 때에는 SPSS만 사용했었는데 SAS와 SPSS의 차이가 뭘까. 이에 대해 엔하위키에서 이렇게 설명하고 있다.
SAS는 기본적으로 SAS식 언어를 이용한 프로그래밍을 바탕으로 하는데 비해 SPSS는 마우스를 이용한 GUI 인터페이스 위주로 되어있기 때문에 갈수록 SAS보다는 SPSS가 인기있는 실정이며, 그에 따라 대학에서도 SPSS를 더 많이 가르치고 있다. 하지만 데이터의 양이 매우 많을 경우에는 SPSS보다 SAS가 훨씬 효율적이며, SAS도 GUI식 인터페이스를 동시에 지원하는 방향으로 업데이트 되고있기 때문에 꼭 SPSS가 좋다고만 할 수는 없다. 또한, SAS는 프로그래밍을 바탕으로 하기 때문에 통계분석 과정을 이해하고 연습하기 위해서는 SAS가 훨씬 더 좋다. SPSS에서는 한번 분석을 시행하고 옵션이나 사후분석 등을 바꿔서 다시 분석하려면 분석 명령을 마우스로 찾아가야 하지만 SAS는 이전에 프로그래밍한 프로시저에서 조건만 바꿔주고 다시 시행하면 된다. 그래도 결과창은 별개로 나오기 때문에.물론 SAS식 언어를 다 안다면 수월하게 할 수 있다
(출처: 엔하위키미러 SAS 항목)
통계학을 공부했다라고 말할 정도가 되려면 최소한 SAS, SPSS 이 두 프로그램을 다룰 줄 알아야 된다는 얘기다. 그럼 실무에서도 똑같을까. 사람인을 통해서 살펴 본 바에 의하면 빅데이터를 활용한 데이터마이닝을 위해 SQL 상급 활용능력을 요구하는 곳도 있고, MapReduce, R이라는 프로그램 사용경험을 묻는 곳도 있다. SPSS와 SAS도 여러 군데에서 물어본다. Google analytics를 물어보는 곳도 있다.
그럼 조사는 끝났으니 방향을 잡아보자.
1. 통계학 이론서 공부, ~6월
2. SPSS 훑어보기 ~6월
3. SAS 훑어보기 ~8월
이 두 프로그램을 훑어보고 나서 둘 중에 하나를 깊게 팔 건지, 다른 프로그램을 훑어볼 건지, 사례연구에 뛰어들건지를 결정해야겠다. 다른 통계 프로그램들은 점차 접하면 될 거 같다. 한 두가지 프로그램에 정통한 것이 여러 분야를 얕게 아는 것보다 더 나은 선택이라고 본다.
댓글 없음:
댓글 쓰기