Dr.부동산

9주차 / 표본추출 본문

부동산금융투자/부동산조사방법론

9주차 / 표본추출

anony mous 2018. 11. 18. 09:30

1교시 

표본추출의 의의 

조사대상을 정했다. 

표본을 조사하면 만족도가 나온다. 이것들을 통계량으로 부른다. 평균 5정도가 나왔어도 문제 있을꺼야 이런 식으로 추론을 하던지 5.5정도로 보면서 만족도가 높을 것으로 가설을 세울 수도 있다. 


표본조사는 왜하나? 

이런 형태가 되면 조사대상 자체가 오염되는 경우가 생긴다. 이런 측면에서 표본조사를 쓰는 경우가 꽤 있겠다. 

전수조사 ? 몇년에 한번씩 하는 조사. 추계를 내고, 갑자기 느는 경우를 파악하기도 한다. 반도체기업 등

표본은 워낙 편차가 커서 표본을 잘못 뽑을 가능성이 있을때 전수조사를 생각해볼 수 있다. 사람들은 전수조사를 하면 무조껀 정확하다고 생각할 수 있다. 그러나 답을 할때 오류가 생길 수 도 있는 것이다. 측정이나 기록 오차가 작을 수록 전수조사가 의미가 있다. 이런 측면을 이야기 하는 것(비표본추출오차가 작은 경우)임. 


표본추출오차 

모집단이 있는데 표본을 뽑을때 모집단과 표본이 다를때 생기는 오차, 전화로만 조사했더니 윗부분만 조사가 되는 경우. 표본이 잘 못 되었을때 생기는 경우다. 편차가 너무 클때 이런 측면에서 뽑는 방법을 개선하면 된다. 


비표본추출오차  

샘플링이 아닌경우 무응답이나 부적합한 응답이 문제가 된다. 비표본 추출조사에서는 표본 조사가 더 정확할 것도 없다는 논리. 즉, 조사랑 자체가 표본조사가 작다. 표본조사가 굳이 더 떨어진다고 말할수도 없는 것이 된다. 


표본 추출 설계과정 

모집단 정의 - 단계별 참고


목표모집단의 정의

목표모집단 

자동차구매율 조사는 누구에게 조사하면 되나? 구매자. 구매자는 어떻게 찾나? 자동차 사본적이 있는 사람. 이렇게 조사를 할 수 있다. 원래 차가지고 있는 사람에게만 묻게되면 새로 차를 사려는 사람은 조사가 안될 수 있다. 면허증 파악으로도 쉽지 않다. 

목표 모집단의 경우 고르는 부분에 대해 많은 생각을 해야 한다. 옛날에는 집에 차를 가지고 있으면 가구단위별로 조사를 했는데, 요새는 개인별 조사를 해야 한다. 정확하게 상황을 고려해야 하는 이유이다. 어떤 것을 정했냐에 따라 결과가 다르게 나타날 수 있다. 

샘플링을 뽑아서 조사하는 경우는 많지 않을 수 있으나, 샘플링을 조사할때 성격을 볼 경우가 많다. 자녀가 있는 경우 몇살인가?에 대해서 하나하나 다 조사를 할 수 있다. 정해야 하는 것임. 

정의의 차원들 

샘플을 뽑을때 정리하는 차원이 있다.  샘플을 뽑는다는 것은 샘플링 유닛, 응답을 받는 사람들은 샘플링 엘레먼트라고 할 수 있다. 샘플을 뽑는 단위가 어느정도인지 파악해야한다. 또 각각의 영향을 받는 부분이 덩어리가 큰 단위(조직,단지)일 경우 누구에게 조사를 받을 수 있는지도 생각 해봐야 한다. 개인단위일 수도 있고 조직일 수도 있다는 것을 잘 생각해야 한다. 한 유닛에서 한 엘레먼트만 보면 문제가 없다. 가끔은 욕심을 내기 깨문에 유닛과 엘레먼트가 커져서 애매해지게 된다. 

샘플은 조사를 하면 언제 조사했는지 꼭 써주어야 한다. 조사한 시기가 평소보다 이상했을 수도 있다. 


분석수준의 문제 예시

관리수준, 청결, 보안,안전,쾌적,주차,입지,시설 수준(서비스품질) -> 임차만족도(고객만족) -> 재계약의향/구전의향(고객충성도)-> 운영수입(경제가치)


표본 프레임의 결정 

표본프레임 표본추출틀 - 모집단이 들어가야 할 명부, 식별할수 있는 지침들을 샘플링 프레임이라 한다. 목표 모집단과 프레임이 동일하면 문제가 없는데, 다르면 샘플링 프레임에러가 생긴다. 잡지의 편집분석 방향을 조사하는데, 

한국내 모든 기업(모집단,B) > 상장기업 명부(프레임,A) : Subset : incomplete, error

정기 구독자 명부(모집단, B) < 1년 이상 구독자들 이외의 경우(프레임,A) : Superset : incomplete, no error 

한국내 모든가구(모집단,B) ( 전화번호부(프레임,A) : intersection incomplete. error

   

표본프레임오차와 해결방법들 - 


비확률적 표본 추출방법

편의 표본추출 - 조사할때 가까운 사람을 동원. 편해서 뽑는데, 뽑히는 과정에서 셀렉션 바이어스가 늘 존재하고 대표성이 있다고 하는데 의문이 생긴다. 

판단 표본추출 - 이문제는 전문가가 잘 알아. 박사님과 석사는 다를 수 있다. 판단은 하지만 꼭 100%일 수는 없다. 조사자가 편해서 그 샘플링 전부가 

눈덩이 표본추출 - 미술품 조사할때 알음알음 소개받아서 조사. 희소한 샘플의 경우 이런 방법을 쓴다.  

할당표본 추출 - 일단 구성비를 맞추고 조사는 쿼터를 놓고 편의나 판단등 추출을 사용하는 등 2단계로 조사하는 방안. 


확률적 표본 추출 

단순무작위 - 모든 구성요소를 알고 있고, 선택될 확률이 일정할때, 확률적 표본추출의 논리를 이용. 

예시) 100명에서 10명뽑으면, 난수표를 입력하여 두자리 숫자만 활용하여 표본을 추출.

장단점 - 전국을 이렇게 뽑게 되면, 지리적으로 조사하러 다니기 힘들어진다. 그리고 정확성도 떨어진다.( 평균적인 가구형태를 조사해야 하는데 조사시 워낙 다양한 형태가 나올 수 있어서 정확도가 떨어진다.)

 개선방얀 - 층화, 군집표본 추출


층화표본추출 - 모집을 몇개의 층으로 나눈다. 우리나라가 가구가 있으면 연령별으로 나눠서 구성비를 조금더 정확하게 볼 수 있다.

층화변수 - 모집단을 나누는 변수. 층화변수를 가지고 샘플링 하는 것과, 전체를 단순무작위 추출할때의 샘플링을 비교할 수 있다. 층화변수는 어떤것을 써야 하나? 관심변수가 관련이 있는 것. 측정이 용이한 것. 조사 대상이 무엇인가에 따라서 층으로 나눌 수 있다. 모집단을 층안의 구성요소간에는 동질적이어야 한다는 조건에 따라 20대와 30대를 2-30대로 묶지 않고 나눈다. 좀더 정확성이 높아질 것으로 봄.

유형 : 각층의 사이즈에 비례해서 표본추출하면 비례적, 아니면 비비례적.


군집표본추출 - 각각의 군집이 모집단을 반영해야 한다. 확률적 표본방법으로 군집을 조사. 가구실태조사. 군간의 별 차이가 없을꺼라 생각되면, 가구들의 목록을 주거 실태를 반영하고 모집단을 반영할 것이라는 기대를 할 수 있다. 군집에 대해서 무시무시한 가정을 한 것이지만 타당한지는 알아봐야 한다. 

특징 : 군집은 이질성을 인정하고, 군집들은 모두 동질적이라고 가정. 선정 군집에서만 표본을 추출한다. 군집은 몇번에 거쳐서 쪼개면서 다른 표본 추출방법을 결합해서 써볼 수 있다. 

형태 : 동네에서 많이 쓴다. 지역표본추출. 


체계적 표본추출 : 공장의 불량확률 조사. 창고를 간다. 오늘 생산된것 확인. 박스당 샘플링. 순서대로만 되어 있다면 동일 간격으로 선택하여 표본 추출이 가능하다. 표본간격 k. 공간이용조사를 할때 10명당 1명 들어오는 순서대로 그사람만 추적하여 표본 조사를 하는 경우와 비슷. 전화번호부 단순표본추출등.  

특징 : 관심특성과 관련이 있을때 표본이 정확해 질 수도 있지만, 주기적인 형태를 가진다면 대표성이 감소될 수 있다. (항공기 비행기 표는 매주 화요일 가장 적게 팔리는데 매주 화요일만 조사하면 문제)


확률적 표본 추출의 사례 

단순무작위 추출 - 포도알에 번호를 매기고 무자위로 뽑자 (포도밭의 표본)

층화표본 추출 - 포도 나무별로 할당위치에 할당 비율만큼 뽑자. (포도나무 할당 지역의 표본)

군집표본 추출 - 포도송이를 군집으로 만들고 포도송이에서 번호를 매겨서 뽑자. (포도송이의 표본)


표본크기의 결정 

의사결정을 위해 사용하지만.. 쉽지 않음. 

모집단의 변동성 - 표본을 조금 늘려봐?

분석방법 - 룰을 고려해야 함. 나중에 얼마나 쪼개서 분석

예시)통조림 회사에서 16온스 용량의 꽁치 통조림 생산시 실제 무게가 그런지 조사할때. 표본을 통해 얻은 모집단 평균 무게의 추정값이 모집단의 참값고 차이가 나는 정도가 0.2온스 이상은 되지 않았다면 생각, 구간 추정을 했을때 모수를 포함할 가능성이 99%신뢰 수준을 가지길 바라고, 지금까지 경험상 16온스 통조림의 표준편차를 알고 있을 경우. 이러한 요구 조건을 충족시키는 표본의 크기는? 99%신뢰도는? 

예시2) 정규 분포를 이루며 표준편차가 400인 모집단에서 표본 평균이 600이고 모집단의 평균을 추정하기 위한 90%의 신뢰구간을 계산할 경우. 표본크기가 4이고 90%신뢰구간의 경우?

예시3) 하위집단 분석의 예씨 

연령별 중개사무소 선택 기준 예, 집값을 주가처럼. 아파트 통계가 부추긴.. 

[단독] 집값을 주가처럼…‘아파트값 주간통계’가 투기 부추긴다

못 믿을 부동산지표 ① 집값 주간 변동률 감정원 주간동향, 실거래가와 비교 서울 10번 오르고 8번 떨어졌는데 주간지수는 2번만 하락 표시 ‘상반’ 표본수 7400개로 전국 집값 발표 신뢰 못 주고 시장 혼란만 부추겨


추가적 고려요인 : 접촉표본 크기 = 얻고자하는 표본 크기 / 적합률 * 완성률 


구간추정 

- 포인트에서 포인트로 추정하는 경우는 별로 없고, 구간안에 모집단의 값이 들어가 있을 것이라고 생각하는 것이 구간추정이다. 들어가 있는 폭을 신뢰 구간이라고 한다. 이 구간안에 들어가 있을 가능성은 신뢰수준이다. 똑같은 표본을 100개쯤 뽑으면 90번쯤은 들어가 있거나 99번 쯤 들어가 있을 확률이 2.57이라면 구간추정을 수학적으로 한다. 신뢰 구간을 |x-u| 쫄대값 안에 어느정도인지 파악 그럼 표본을 결정하는 크기를 알아 낼 수 있다.


일정 / 아래 과정 중에 하나 참여하면 출석으로 인정함. 


<학술제 및 세미나 일정 > 

케빈정 윤리센터 세미나 11월 6일 화요일 오후 1시-4시 (103호)

피데스 부동산개발센터 사례발표 : 11월 6일 오후 4시-6시 (103호)

부대원 명사초청 강연 11월 7일 수 저녁 7시 (103호)

학부학술제 11월 8일 목요일 오후 3시-5시 (103호) 

일반대학원 학술제 11월 7일 수 저녁 7시 (301호)



2교시 

시장분석 개요 

*시험 측정, 표본은 꼭 외워야 한다. 종류별로 있고 고려할 것들도 있음. 

대표적인 부동산 조사들 
- 지역, 동네에 대한 부동산 분석. 지역경제분석. 
- 시장분석이라함은 인천지역의 아파트 시장, 상품의 유형별로분석 등.
- 시장성 분석은 팔리는 정도, 그게 시장에 나가면 얼마나 잘 팔릴까 보는 분석 
시장성 분석을 하려면, 동네의 아파트 시장이 어떤지 알아야 한다. 더 상위로 간다면 경제분석까지 해야 한다. 어찌 되었든 매크로, 마이크로 이코노모 분석.
- 타당성 분석, 100% 다 팔릴 것인지 믿을만 한지 못한지 분석.

거시환경분석
- 맥락을 파악한다. 정해진 차원에서 동네가 어떻게 될지.

지역경제분석
- 왜하나? 대부분의 부동산 수요는 파생이다. 바로 분석하지 않고 사회, 경제가 좋아지면 당연히 필요로 하는 것이 집이다. 이러다보니까 지역이 어떻게 바뀌는지 영향을 준다. 
1단계 - 지역분석을 하려면 지역의 범위를 설정해야 한다. 인구, 가구가 어떤지 분석하려면 시군구 행정단위를 본다고 하면, 이런 것들을 정해봐야 한다. 마산창원은 한 군데로 봐야 한다. 생활권 연계
2단계 - 경제적 측면이 중요하니까 어떤 상황인지 본다. 회사들이 잘되야 경제적으로 성장. 일하는 사람의 숫자가 늘어나야 오피스 수요도 늘고, 집도 장만하고, 소매도 잘 될 것이라는 것. 
3단계 - 앞으로 예측을 위해서는 이동네 산업이 어떤지, 경제가 어떤지 파악. 
예시) 지역경제 영향 - 산업단지
100자평 0 페이스북 0 트위터 더보기 입력 : 2009.03.02 02:49

지역경제분석 - Economic Base Analysis 
- 경제가 어떨때 좋은가? 어떤 지역에서 수출을 잘하면, 경제가 어떻다고 하는 것  Export base theory. 베푸는 지역은 성장. 베이직 부분, 논베이직 부분(서비스섹터)으로 나눔. 베이직, 수출 산업이 증가하면 지역경제는 성장한다. 

지역경제가 잘되려면 베이직 부분이 중요하다. 
베이직은 어디서 찾나? 
1단계 - 입지상수를 분석한다. 전국의 모든 종사자가 있는데 특정 산업의 비율이 있다. 그리고 그 동네의 종사자 중에 특정 산업 종사자의 비율이 있는데 이 둘을 비교한다. 신기용? 교수님 도시 용역에 이런 것이 많다. 
2단계 - 한국 경제가 잘 될 것 같은가? 수출이 잘될려면 뭐가 있어야 하나? 시장이 어떻게 되는지 알려면 수요가 있을지 파악해야 함.고기능고가폰 잘 팔리나? 경쟁력도 파악해야 한다. 지역을 파악하려면 산업에 대한 전망도 굉장히 중요하다. 
3단계 - 베이직 산업이 동네에 어떻게 영향을 미치는지 보려면, 인구의 어떤 영향을 주는지, 고용에 영향을 주는 매커니즘은 어떻게 되는지 파악해야 함. 고용승수, 인구승수. 
지금 상황이 안정된 사항이라면, 베이직 부문 고용자의 숫자 대비 전체의 숫자는 약 2.71배의 고용효과를 만들어낼 것이라는 가정. 그리고, 베이직 부문의 고용자 숫자분에 전체지역인구수 비율은 4.84배일 것이라는 가정. 
4단계 - 베이직 부문의 전망, 전체 고용에 어떤 영향을 주는지의 승수 파악. 베이직 부문의 고용변화에 대한 인구 증가 예측. 

입지 상수만 가지고 하기에 불편할때. 베이직,논베이직 구분이 어려울때, 지역내의 잘 나가는 기업들을 베이직 부분이라고 가정하기도 함. 

정제된 LQ활용방법 
- 2.24에서 1.0은 빼야 하는 이유 
- 회사 고용된 모든 사람이 외부수출에 관련되지 않았을 수 있으므로 비율을 수정함. 

지역경제분석
- 입지상수만 가지고 할 수 없으니까, 또 핵심기업의 큰회사들 동향도 같이 고려 해볼 수 있다. 성장전망, 계획등등. 그 동네에 가면 지자체의 경우 성장을 어떻게 도모할 지 고려.
- LQ_i는 추가적으로 오피스 빌딩의 권역별로 들어가있는 업종의 수가 있는데, 어떤 업종은 금융이고 어떤 업종은 다른 산업등등인데 그 비율을 지역별로 분석가능. 지수의 한계가 있는데, 지금도 이미 충분히 높은데 더 높아질 수 있을까? 높은 것들을 계속 맞춰갈 수 있나. 현재보다 더 높여가야 한다는 것? 어떨 때는 바이블처럼 쓰이기도 하지만, 계속 성장 시키는 것이 맞을지 생각 해볼 수 있다. 
지역, 권역별 테넌트 볼때나 빌딩별로 업종의 구성비를 볼 수도 있다. 빌딩에 산업구성의 특화가 가격에 유효한 결과를 미치게 될 것인지 생각해볼 수 있다. 

부동산시장조사의 주요단계
- 시장분석의 주요 내용
1단계 - 분석대상 부동산의 정의 및 분석 
2단계 - 시장권역의 설정 
3단계 - 수요분석
4단계 - 공급
5단계 - 시장 잠재력평가  / 시장이 잠재력이 부족해도 경쟁력이 좋으면 잘 팔릴 수 있다.
6단계- 
7단계-

대상부동산 분석
왜 처음에 우리물건 먼저보나? 내가 다루고 있는 것이 무엇(예를들어 편의점)인가에 따라 수요, 공급등 모든것이 달라지기 때문. 집을 지을때도 몇세대로 지을 것인지, 평형 구성이 몇평인지 등. 가치가 더 있다고 느껴지고 등등. 
대상 부동산의 부지, 건축물 등 물리적 특성 파악. 똑같은 건축물이라도 레벨을 먼저 보는 것이 낫다. 그래야 빠지는 변수가 없다. 중구난방으로 잘 나온거 골라보는 것보단 낫다. 쇼핑센터에 점포가 고객을 못데려오면 어떤 일이 생기나? 점포가 어떤입지에 있고 하는 수준보다 쇼핑센터 전체 수준에서 전체적으로 잘 되고 있는지 파악할 필요성도 있다. 쇼핑센터 안에서도 내부 입지가 존재하므로 레벨 수준으로 쪼개서 본다. 아파트도 단지별로 보고, 동,호 수준으로 본다. 
어매니티의 형태가 어우러져서 가치를 만든다. 분석을 할 때는 이런 어우러진 것을 하나씩 긁어서 따로따로 보겠다는