Dr.부동산
[계량분석론] 0324 예습복습 - 계량경제학이란? 본문
------ 복습 ------
1. 계량경제학이란?
서론
함수관계 (또는 인과 관계)를 추론하거나, 함수관계의 현실타당 성 여부 확인
확인된 함수관계에 근거하여 경제 예측 (미래 예측)
가설: 함수관계를 수학적 혹은 서술적으로 단순화 시킨 것
속설, 가설 , 검정, 이론화
1930년대 Econometrica 가 계량 경제학의 기원
새로운 경제 논리 내지 이론을 개발하거나 이미 개발된 각종 경제 이론 및 가설의 현실 타당성을 인정할 수 있는지 여부를 적절한 통계분석기법을 활용하여 검증하는 경제학의 한 분야이 며, 현실타당성이 확인된 함수관계를 이용하여 각종 경제현상의 구조를 분석하거나 예측을 수행한다. 분만 아니라 각종 정책을 입안하거나 특정 정책 효과를 평가 (PAM: policy analysis and management)
1. 경제이론 개발의 기본 과정
A. 가정 -> 가설 -> 통계적 검정 -> 가설체택 혹은 기각 -> 이론화
B. 도식화한 개념
2. 계량 분석 절차
경제 이론: 생산함수
수리모형의 설정: Y=AKαLβ
계량 모형 설정 : log Y = Log A + α Log K + β Log L + ξ
자료의 수집, 기술적 통계, 모형의 추정과 검정
활용
C. 계량 경제학 계보
제 1장 주요 통계분석 과정
제 1절 계량분석모형과 인과관계
- Randomized Controlled Experiment
- Randomized
- Control group
- Treatment group
- 트리트먼트의 효과 검증
제 2절 자료 수집 방법과 자료의 유형
1. 표본추출법
SRS: 모집단 포괄성, 동일한 추출확률: 모집단의 각 구성 원이 표본으로 추출될 확률이 동일
systematic sampling(계통 추출): 1번 11번 21번, 공식 적 용
grouping 후 SRS
Cluster sampling (군집 표본추출): 전국의 아파트를 임의로 그룹핑 한 후, 그 중에서 추출, 그룹간 동질성
Stratified sampling (층화 표본추출): 지역별, 주택 유형별 그룹핑 후 추출, 그룹간 이질성
Non random sampling
Quota sampling: 층화 표본 추출을 정교하게, 다기준 적 용, 주택금융수요조사, 대표성
할당 표본추출(Quota): 부도 연구
할당 표본 추출: 주택금융수요조사
2005년 인구주택 총 조사 자료를 근거로 가구수를 산정한 후 2008년 도시별 주민등록세대 증가율을 반영하여 보정함
상대적으로 가구 수가 적은 도시는 분석 가능한 최소 표본 수를 확보하기 위해 최소 50가구 이상이 추출되도록 할당함
본 설문 응답자가 2,000가구가 될 때까지 부스터 샘플링
2. 자료의 유형
Experimental data
Observational Data: Revealed vs. Stated Preference(Survey)
Survey(Qualitative:중요도) vs. Econometrics(Quantitative), 데이터의 수,
방법론
-수량적 자료: 연속적, 이산적 자료,
-Discretize: 현실은 모두 이산, 측정 오차, 0.5명(part timer)
확률밀도함수(PDF)가 상이, MLE, 가정(assumption)
-이산 확률밀도함수 1 , log 1 = 0, 미분 불가
-연속 확률밀도함수: 1 근처가 좋고 멀어지면 별로임, ∞, -∞
범주적 자료: 중형, 대형
-시계열 자료
-횡단면, pooled data: 주택금융 수요 조사
-패널(panel): 노동패널, 모기지 이행이력
제 3 절 기술적 통계량(descriptive stat)
Descriptive vs. Inferential stat: 계수추정과 가설검정
자료의 정리 및 요약: 이상치 발견 (예, 아파트 지분이 300평)
요약된 자료의 도표적 표현 (주로 시계열)
최소값, 평균, 최대값, 표준편차
상관분석
시계열 패턴
트렌드: 시간의 함수
사이클: 1년 이상 주기, 이동평균, 10년 주기설, 키친(40개월) 파
동, 쥬글러(10년) 파동, 콘트라체프(50년) 파동,
버블: permanent vs temporary factor: yt – 사이클t
Seasonal variation: 1년 이내 주기, 미국 블랙 프라이데이 상가매출
White noise: mean reverting vs. Unit Root (단위근), 시계열의 안정성
자기상관
제 4절 통계이론 대수의 법칙 중심극한정리
t test
T테스트 개념 및 SPSS활용법(링크)
F test
제 5 절 추정 및 검정
점 추정과 구간추정: 신뢰 구간 회귀분석과 MLE
회귀분석과 시계열
가설설정: 영가설, 대립가설
계수추정
가설검정: ~활성화 방안: 검정이 없다. 논문이 아니다.
단순가설(equality)과 복합가설(inequality, range): 평균 소비성향 은 영보다 크고 1보다는 작다. 평균키는 170이상이다.
단측검정과 양측검정
T test and F test
분산분석(ANOVA): 마케팅, 집단간 차이 분석, 집단이 주어짐,
“가설: 서로 다르다”
- 두 집단 차이 비교인 Difference in Mean을 세 집단 이상에 확대 적용
- 집단의 분산을 이용, 혹은 공간 속에서의 거리 분석(비모수 방
식)
군집분석과 판별분석: 집단을 구별함
- 군집분석: 종속변수가 없음. 거리 중시
- 판별분석: 판별식, 로짓과 유사, 모수적(정규분포 가정), 상관관계 중시
제 2장 단순 선형 회귀분석
단순: 이변량
선형: 1차 함수 관계
제 2장의 구성
회귀분석이란
회귀분석과 상관분석
모형의 설정: 선형, 로그선형
추정 및 검정
제 1절 회귀분석이란
회귀분석이란, 두 변수 (또는 둘 이상의 변수) 간의 상호 관계의 본질 을 파악하는 연구에 관한 통계적 기법.
기술적 통계량을 넘어 인과 관계에 대한 탐색 선형 회귀분석: 미분 계수
상관관계와 인과 관계: 선행연구와 이론적 근거
- 절대소득 가설 검정 (타당성 평가): 케인즈, 절대소비, constant 한계 소비성향
- Prediction, Forecasting, 적용 및 예측
제 2절 상관분석이란
선형상관
이변량
왜 직각으로 X 축과 Y 축이 만날까?
베이시스, change of basis, y=x vs. Y=x2 and Q=x2 . Y=Q
Fisher, 상관계수의 분포 발견
상관계수는 x, y 라는 두 정규 분포의 결합확률 분포를 갖는 확률변수
트랜스폼
t test와 동일, ρ = r (표본 상관계수)
Z 범위가 결정되면, Zr 범위가 결정되고, r 의 범위가 결정됨 (one to one matching), 이것을 이미 가설에서 주어진 ρ 와 비교
-0.17에서 수직으로 수선을 그었을 때, 만나는 두 점 (a,b) 사이의 거리가 신뢰 구간임.
와이 축의 -.2가 신뢰 구간 속에 들어가는가 여부가 테스트임, 로우=-.2
개수가 n= 400일 때 신뢰 구간의 간격이 가장 좁음. ρ = .2
동일한 조건이라면 신뢰구간이 좁을수록 신뢰할 수 있음.
제 3절 회귀 모형의 설정
선형 모형
- 수학적으로 간단
- 선형화 (테일러 익스팬션)
- 컴퓨터와 비선형
- 계량은 평균 (시장 평균)
Trembling hand, 에러 텀
저울 위의 파리, 종속변수 혹은 독립변수
독립변수
로그 리니어, 이차함수, 교란항 및 계수의 문제, misspecification
α, β 를 안다고 가정하고 논의를 진행한다.
Y와 Yhat 또는 E[Y|X] 비교
Quantile regression: infant birth weight
Quantile 별로 α, β 가 서로 다름, 즉 절편과 슬로프가 서로 다름
Random coefficient model: 사람마다 α, β 가 서로 다름
OLS는 식 (2)처럼 잔차의 제곱합을 최소화하지만 분위회귀분석은
식 (3)처럼 가중된 절대 편차의 합을 최소화하도록 조건부 분위함수를 추정한다.
(2)
여기서 u는 관측치 i에서의 종속변수를의미한다. 또한 xj.i는 i번째관측치 i에서의 j번째 독립변수를, bi는 모형의 j번째 회귀계수 추정치를 뜻한다. 반면 식 (3)처럼 분위회귀분석에서는 절대편차의 가중합을 최소화한다.
(3)
여기서 번째 관측치에 대한 잔차가 순양수(strictly positive)라면, 가중치 hi는 hi=2q로 정의되고, 0이거나 음수라면 hi=2-2q로 정의된다. 0과 1사 이의 값을 갖는 q는 분위(Quantile)다(0< q <1). 분위회귀계수의 표준오차는 Gould(1992, 1997)가 제안한 부트스트래핑(bootstrapping) 방법에 의해 구한다.
---예습----
제 4절 회귀모형의 추정
모회귀선이란 주어진 X값에 대해서 평균적으로 기대할 수 있는 Y값으로 정의되므로 회귀분석에서 적합도를 판정하는 기준은 주어진 X값에 대응하는 Y의 평균치인 회귀선과 실제 Y값과의 차이를 나타내는 수직거리, 즉, 오차항의 값의 크기가 되어야 할 것이다. 따라서 수평거리 (YC)를 최소로 하는 방법은 결국 X를 Y에 회귀분석하는 결과를 초래할 뿐이다. 한편, 직교거리 (YB)를 최소로하는 이른바 othogonal regression은 직교 거리의 절대치를 극소화하는 등의 방법론을 요구하는데, 이는 따로 찾아보길 바란다.
최소자승법: Least square method
역행렬 존재 조건: 판별식, 베타의 분모
ad - bc ≠ 0. 식 ad - bc 를 역행렬이 존재여부를 판단하는 판별식 D라고 합니다. Determinant
α, β 상관계수
동분산: a11=a22=a33
계열 상관: a12~=0, a12~=0, need 상관계수 함수 modeling 추정 파라미터의 수 w/o model: n(n-1)/2
Best Linear Unbiased Estimator
우도함수:
공간속에 패라미터 set 과 y 들이 혼재
파라미터 셋: a1, a2, a3...
확률밀도함수: 식 (2.44), 주어진 파라미터 α, β, σ2 에 y를 넣으면 확률이 나옴
다만 pdf인 식 (2.44) 엔 y 가 들어 있지 않다.
우도함수: a가 a set 중 a1일 확률, a2일 확률(가능성)... given X=x1, a가 a set 중 a1일 확률, a2일 확률(우도)... given X=x2, 확률이 아님: 왜냐하면 density (연속 확률변수 pdf), 합이 1이 못됨
y들이 이미 나왔다. 식 (2.44)에 y를 집어 넣음.
MLE: 이 y들이 나올 가능성(우도)이 가장 높은 α, β, σ2 을 찾아 냄.
파라미터가 미분에 이용되는 변수가 됨
α,β,∈R, σ2 >0조건하에서알파햇,베타햇,시그마스퀘어 햇 탐색
Probability is used when describing a function of the outcome given a fixed parameter value.
Likelihood is used when describing a function of a parameter given an outcome. For example, if a coin is flipped 10 times and it has landed heads-up 10 times, what is the likelihood that the coin is fair (half and half, p=.5)?
남성만 있는 회사(결과), 여성 지원자의 입사 확률과 남성지원자 의 입사 우도
The Monty Hall problem is a probability puzzle, loosely based on the American television game show Let's Make a Deal and named after its original host, Monty Hall.
Suppose you're on a game show, and you're given the choice of three doors: Behind one door is a car; behind the others, goats. You pick a door, say No. 1, and the host, who knows what's behind the doors, opens another door, say No. 3, which has a goat. He then says to you, "Do you want to pick door No. 2?" Is it to your advantage to switch your choice?
Player's pick has a 1/3 chance on the car and 2/3 chance on a goat. As each one has 1/3 chance on the car, the combined chance of door 2 and door 3 hiding the car is 2/3.
With the usual assumptions, after the host deliberately opened a door to intentionally show a goat, but without any further information, the player's pick still retains its 1/3 chance, likewise the other two doors still retain their combined 2/3 chance:
- 조건부확률:1/2, 3번도어에차가없다는조건하에서2번도어뒤 에 차가 있을 조건부 확률
- 우도: 2/3, 3번 도어에 차가 없고, 본인이 1번을 선택했다는 결과 하에서 2번 도어 뒤에 차가 있을 우도,
제 5 절 실증분석: 엥겔계수
Δ logE/ Δ logI=e: 엥겔, <cancel:dt/dt> Y=log(X), 로그 미분 dy/dx는, dX/X, which is 1/X
'부동산금융투자 > 부동산계량분석론' 카테고리의 다른 글
[계량분석론] 0417 설정오류, 자료의 제유형 (0) | 2019.04.17 |
---|---|
[계량분석론] 0410 이분산, 계량더미와 로짓 (0) | 2019.04.10 |
[ UTSA 학과장 강의 ] 서브프라임 모기지 (0) | 2019.01.25 |
13주차 - 가설검정, 예측 (0) | 2018.11.28 |
11주차 - 중간발표 (0) | 2018.11.26 |