통제집단합성법(직역하면 합성통제법?)에 대한 자세한 설명은 다음을 참고하면 된다.
<추가 예정>
이러한 SCM을 STATA에서 돌리기 위해서는 다음의 순서를 따른다.
1. synth 패키지 설치
ssc install synth, all
//cannot write 오류가 뜰 경우에는 경로지정 혹은 변경이 필요
cd C:\Program Files\Stata17
//그래도 안되면 바탕화면에 폴더를 만들고 경로 지정
2. 연구에 사용할 데이터 불러오기
따로 설명하지 않겠다.
3. SCM을 위한 명령어 입력
//Basic code
synth 종속변수 예측변수1 예측변수2 예측변수3, trunit(관심대상) trperiod(기준년도) xperiod(시작년도(델타년도)종료년도) resulsperiod(시작년도(델타년도)종료년도) fig
//예시
synth gdp income iq asset, trunit(4) trperiod(2050) xperiod(2030(1)2070) resultsperiod(2040(1)2060) fig
예를 들어 2050년에 외계인과 대한민국만이 접촉을 하게 됐다고 하자. 다른 국가들은 아직 외계인을 만나지 못했으므로, 외계인은 한국의 GDP에 영향을 미쳤을 것이다. 이 영향력을 측정하고자 한다.
이때 종속변수는 GDP가 될 것이고, 예측변수는 GDP에 영향을 준다고 판단되는 모든 것이다. 하지만 여기서는 쉽게 설명하기 위해 소득, IQ, 자산만을 예측변수라고 하자.
trunit에는 연구의 대상을 적어준다. 위의 4는 한국의 ID이다. 이는 데이터를 어떻게 정리하느냐에 따라 달라질 수 있다. 국가 코드가 kor 이라면 4대신 kor을 적는 식이다.
trperiod는 사건이 일어난 년도를 의미한다. 위의 예시에서는 외계인과의 만남이 일어난 2050년에 관심이 있다. 따라서 2050을 적어준다. 이것 역시 데이터를 정리하기에 따라서 다르게 적을 수 있다. 예를 들어 기간을 1~10으로 정리했고 5 시점에서 사건이 일어났다면 5를 적는 식이다.
xperiod는 분석에 사용할 기간을 의미하며, resultsperiod는 결과로 표시될 기간을 의미한다. 즉 아래 예시에서는 2030~2070년의 데이터를 1년 단위로 분석하고, 2040~2060년까지의 결과를 1년 단위로 보여준다.
마지막으로 fig는 결과를 그래프로 그려주는 명령어이다.
그런데 사람은 항상 귀찮음을 느낀다. 따라서 아래와 같이 입력할 수도 있다.
//Simple code
synth 종속변수 예측변수1 예측변수2 예측변수3, trunit(관심대상) trperiod(기준년도) fig
//예시
synth gdp income iq asset, trunit(4) trperiod(2050) fig
xperiod와 resultsperiod를 제외하고 입력하게 되면, 가진 데이터 기간을 모두 활용하여 분석하게 된다. 만약 데이터를 2000년부터 3000년까지의 데이터를 5년 간격으로 수집했다고 치자. 이때 위 코드를 입력하면 1000년간의 데이터를 수집한 기간 간격(5년)마다 자동적으로 분석해준다.
여기서 문제는 어떤 년도의 데이터는 합성대조군을 만드는데 적절하지 않을 수 있다는 것이다. 예를 들어 2049년에 모종의 이유로 대한민국의 소득이 크게 감소했다고 하자. 그러면 이로 인해 합성대조군이 이상한 값을 가질 수 있다. 또한 모종의 이유로 IQ는 2046년, 2048년에만 유의미한 영향력을 GDP에 대해 갖는다고 하자. 그러면 아래의 코드를 사용하는 것이 적절하다.
//code
synth 종속변수 예측변수1(시작년도(델타년도)종료년도) 예측변수2(년도) 예측변수2(년도) 예측변수3, trunit(관심대상) trperiod(기준년도) fig
//예시
synth gdp income(2030(1)2048) iq(2046) iq(2048) asset, trunit(4) trperiod(2050) xperiod(2030(1)2070) resultsperiod(2040(1)2060) fig
4. 결과
'NASAN's Study > 통계방법론과 프로그램' 카테고리의 다른 글
변수의 내생성(Endogeneity) (1) | 2023.11.27 |
---|---|
t통계량(t-statistic)과 t검정(t-test) (0) | 2023.11.27 |
도구변수(IV; Instrument Variable) 분석하기 in STATA (0) | 2023.11.11 |
탐색적요인분석(EFA; Exploratory Factor Analysis) (1) | 2023.11.04 |
요인분석(Factor Analysis) (1) | 2023.10.28 |