Dr.부동산
9주차 / 표본추출 본문
1교시
표본추출의 의의
조사대상을 정했다.
표본을 조사하면 만족도가 나온다. 이것들을 통계량으로 부른다. 평균 5정도가 나왔어도 문제 있을꺼야 이런 식으로 추론을 하던지 5.5정도로 보면서 만족도가 높을 것으로 가설을 세울 수도 있다.
표본조사는 왜하나?
이런 형태가 되면 조사대상 자체가 오염되는 경우가 생긴다. 이런 측면에서 표본조사를 쓰는 경우가 꽤 있겠다.
전수조사 ? 몇년에 한번씩 하는 조사. 추계를 내고, 갑자기 느는 경우를 파악하기도 한다. 반도체기업 등
표본은 워낙 편차가 커서 표본을 잘못 뽑을 가능성이 있을때 전수조사를 생각해볼 수 있다. 사람들은 전수조사를 하면 무조껀 정확하다고 생각할 수 있다. 그러나 답을 할때 오류가 생길 수 도 있는 것이다. 측정이나 기록 오차가 작을 수록 전수조사가 의미가 있다. 이런 측면을 이야기 하는 것(비표본추출오차가 작은 경우)임.
표본추출오차
모집단이 있는데 표본을 뽑을때 모집단과 표본이 다를때 생기는 오차, 전화로만 조사했더니 윗부분만 조사가 되는 경우. 표본이 잘 못 되었을때 생기는 경우다. 편차가 너무 클때 이런 측면에서 뽑는 방법을 개선하면 된다.
비표본추출오차
샘플링이 아닌경우 무응답이나 부적합한 응답이 문제가 된다. 비표본 추출조사에서는 표본 조사가 더 정확할 것도 없다는 논리. 즉, 조사랑 자체가 표본조사가 작다. 표본조사가 굳이 더 떨어진다고 말할수도 없는 것이 된다.
표본 추출 설계과정
모집단 정의 - 단계별 참고
목표모집단의 정의
목표모집단
자동차구매율 조사는 누구에게 조사하면 되나? 구매자. 구매자는 어떻게 찾나? 자동차 사본적이 있는 사람. 이렇게 조사를 할 수 있다. 원래 차가지고 있는 사람에게만 묻게되면 새로 차를 사려는 사람은 조사가 안될 수 있다. 면허증 파악으로도 쉽지 않다.
목표 모집단의 경우 고르는 부분에 대해 많은 생각을 해야 한다. 옛날에는 집에 차를 가지고 있으면 가구단위별로 조사를 했는데, 요새는 개인별 조사를 해야 한다. 정확하게 상황을 고려해야 하는 이유이다. 어떤 것을 정했냐에 따라 결과가 다르게 나타날 수 있다.
샘플링을 뽑아서 조사하는 경우는 많지 않을 수 있으나, 샘플링을 조사할때 성격을 볼 경우가 많다. 자녀가 있는 경우 몇살인가?에 대해서 하나하나 다 조사를 할 수 있다. 정해야 하는 것임.
정의의 차원들
샘플을 뽑을때 정리하는 차원이 있다. 샘플을 뽑는다는 것은 샘플링 유닛, 응답을 받는 사람들은 샘플링 엘레먼트라고 할 수 있다. 샘플을 뽑는 단위가 어느정도인지 파악해야한다. 또 각각의 영향을 받는 부분이 덩어리가 큰 단위(조직,단지)일 경우 누구에게 조사를 받을 수 있는지도 생각 해봐야 한다. 개인단위일 수도 있고 조직일 수도 있다는 것을 잘 생각해야 한다. 한 유닛에서 한 엘레먼트만 보면 문제가 없다. 가끔은 욕심을 내기 깨문에 유닛과 엘레먼트가 커져서 애매해지게 된다.
샘플은 조사를 하면 언제 조사했는지 꼭 써주어야 한다. 조사한 시기가 평소보다 이상했을 수도 있다.
분석수준의 문제 예시
관리수준, 청결, 보안,안전,쾌적,주차,입지,시설 수준(서비스품질) -> 임차만족도(고객만족) -> 재계약의향/구전의향(고객충성도)-> 운영수입(경제가치)
표본 프레임의 결정
표본프레임 표본추출틀 - 모집단이 들어가야 할 명부, 식별할수 있는 지침들을 샘플링 프레임이라 한다. 목표 모집단과 프레임이 동일하면 문제가 없는데, 다르면 샘플링 프레임에러가 생긴다. 잡지의 편집분석 방향을 조사하는데,
한국내 모든 기업(모집단,B) > 상장기업 명부(프레임,A) : Subset : incomplete, error
정기 구독자 명부(모집단, B) < 1년 이상 구독자들 이외의 경우(프레임,A) : Superset : incomplete, no error
한국내 모든가구(모집단,B) ( 전화번호부(프레임,A) : intersection incomplete. error
표본프레임오차와 해결방법들 -
비확률적 표본 추출방법
편의 표본추출 - 조사할때 가까운 사람을 동원. 편해서 뽑는데, 뽑히는 과정에서 셀렉션 바이어스가 늘 존재하고 대표성이 있다고 하는데 의문이 생긴다.
판단 표본추출 - 이문제는 전문가가 잘 알아. 박사님과 석사는 다를 수 있다. 판단은 하지만 꼭 100%일 수는 없다. 조사자가 편해서 그 샘플링 전부가
눈덩이 표본추출 - 미술품 조사할때 알음알음 소개받아서 조사. 희소한 샘플의 경우 이런 방법을 쓴다.
할당표본 추출 - 일단 구성비를 맞추고 조사는 쿼터를 놓고 편의나 판단등 추출을 사용하는 등 2단계로 조사하는 방안.
확률적 표본 추출
단순무작위 - 모든 구성요소를 알고 있고, 선택될 확률이 일정할때, 확률적 표본추출의 논리를 이용.
예시) 100명에서 10명뽑으면, 난수표를 입력하여 두자리 숫자만 활용하여 표본을 추출.
장단점 - 전국을 이렇게 뽑게 되면, 지리적으로 조사하러 다니기 힘들어진다. 그리고 정확성도 떨어진다.( 평균적인 가구형태를 조사해야 하는데 조사시 워낙 다양한 형태가 나올 수 있어서 정확도가 떨어진다.)
개선방얀 - 층화, 군집표본 추출
층화표본추출 - 모집을 몇개의 층으로 나눈다. 우리나라가 가구가 있으면 연령별으로 나눠서 구성비를 조금더 정확하게 볼 수 있다.
층화변수 - 모집단을 나누는 변수. 층화변수를 가지고 샘플링 하는 것과, 전체를 단순무작위 추출할때의 샘플링을 비교할 수 있다. 층화변수는 어떤것을 써야 하나? 관심변수가 관련이 있는 것. 측정이 용이한 것. 조사 대상이 무엇인가에 따라서 층으로 나눌 수 있다. 모집단을 층안의 구성요소간에는 동질적이어야 한다는 조건에 따라 20대와 30대를 2-30대로 묶지 않고 나눈다. 좀더 정확성이 높아질 것으로 봄.
유형 : 각층의 사이즈에 비례해서 표본추출하면 비례적, 아니면 비비례적.
군집표본추출 - 각각의 군집이 모집단을 반영해야 한다. 확률적 표본방법으로 군집을 조사. 가구실태조사. 군간의 별 차이가 없을꺼라 생각되면, 가구들의 목록을 주거 실태를 반영하고 모집단을 반영할 것이라는 기대를 할 수 있다. 군집에 대해서 무시무시한 가정을 한 것이지만 타당한지는 알아봐야 한다.
특징 : 군집은 이질성을 인정하고, 군집들은 모두 동질적이라고 가정. 선정 군집에서만 표본을 추출한다. 군집은 몇번에 거쳐서 쪼개면서 다른 표본 추출방법을 결합해서 써볼 수 있다.
형태 : 동네에서 많이 쓴다. 지역표본추출.
체계적 표본추출 : 공장의 불량확률 조사. 창고를 간다. 오늘 생산된것 확인. 박스당 샘플링. 순서대로만 되어 있다면 동일 간격으로 선택하여 표본 추출이 가능하다. 표본간격 k. 공간이용조사를 할때 10명당 1명 들어오는 순서대로 그사람만 추적하여 표본 조사를 하는 경우와 비슷. 전화번호부 단순표본추출등.
특징 : 관심특성과 관련이 있을때 표본이 정확해 질 수도 있지만, 주기적인 형태를 가진다면 대표성이 감소될 수 있다. (항공기 비행기 표는 매주 화요일 가장 적게 팔리는데 매주 화요일만 조사하면 문제)
확률적 표본 추출의 사례
단순무작위 추출 - 포도알에 번호를 매기고 무자위로 뽑자 (포도밭의 표본)
층화표본 추출 - 포도 나무별로 할당위치에 할당 비율만큼 뽑자. (포도나무 할당 지역의 표본)
군집표본 추출 - 포도송이를 군집으로 만들고 포도송이에서 번호를 매겨서 뽑자. (포도송이의 표본)
표본크기의 결정
의사결정을 위해 사용하지만.. 쉽지 않음.
모집단의 변동성 - 표본을 조금 늘려봐?
분석방법 - 룰을 고려해야 함. 나중에 얼마나 쪼개서 분석
예시)통조림 회사에서 16온스 용량의 꽁치 통조림 생산시 실제 무게가 그런지 조사할때. 표본을 통해 얻은 모집단 평균 무게의 추정값이 모집단의 참값고 차이가 나는 정도가 0.2온스 이상은 되지 않았다면 생각, 구간 추정을 했을때 모수를 포함할 가능성이 99%신뢰 수준을 가지길 바라고, 지금까지 경험상 16온스 통조림의 표준편차를 알고 있을 경우. 이러한 요구 조건을 충족시키는 표본의 크기는? 99%신뢰도는?
예시2) 정규 분포를 이루며 표준편차가 400인 모집단에서 표본 평균이 600이고 모집단의 평균을 추정하기 위한 90%의 신뢰구간을 계산할 경우. 표본크기가 4이고 90%신뢰구간의 경우?
예시3) 하위집단 분석의 예씨
연령별 중개사무소 선택 기준 예, 집값을 주가처럼. 아파트 통계가 부추긴..
[단독] 집값을 주가처럼…‘아파트값 주간통계’가 투기 부추긴다
못 믿을 부동산지표 ① 집값 주간 변동률 감정원 주간동향, 실거래가와 비교 서울 10번 오르고 8번 떨어졌는데 주간지수는 2번만 하락 표시 ‘상반’ 표본수 7400개로 전국 집값 발표 신뢰 못 주고 시장 혼란만 부추겨
추가적 고려요인 : 접촉표본 크기 = 얻고자하는 표본 크기 / 적합률 * 완성률
구간추정
- 포인트에서 포인트로 추정하는 경우는 별로 없고, 구간안에 모집단의 값이 들어가 있을 것이라고 생각하는 것이 구간추정이다. 들어가 있는 폭을 신뢰 구간이라고 한다. 이 구간안에 들어가 있을 가능성은 신뢰수준이다. 똑같은 표본을 100개쯤 뽑으면 90번쯤은 들어가 있거나 99번 쯤 들어가 있을 확률이 2.57이라면 구간추정을 수학적으로 한다. 신뢰 구간을 |x-u| 쫄대값 안에 어느정도인지 파악 그럼 표본을 결정하는 크기를 알아 낼 수 있다.
일정 / 아래 과정 중에 하나 참여하면 출석으로 인정함.
<학술제 및 세미나 일정 >
케빈정 윤리센터 세미나 11월 6일 화요일 오후 1시-4시 (103호)
피데스 부동산개발센터 사례발표 : 11월 6일 오후 4시-6시 (103호)
부대원 명사초청 강연 11월 7일 수 저녁 7시 (103호)
학부학술제 11월 8일 목요일 오후 3시-5시 (103호)
일반대학원 학술제 11월 7일 수 저녁 7시 (301호)
100자평 0 페이스북 0 트위터 더보기 입력 : 2009.03.02 02:49
'부동산금융투자 > 부동산조사방법론' 카테고리의 다른 글
[부동산조사방법론] 11주차 / 소매용부동산시장분석 (0) | 2018.11.18 |
---|---|
[부동산조사방법론] 10주차 / 세미나 (0) | 2018.11.18 |
[부동산조사방법론] 8주차 / 설문지의 의의 (0) | 2018.11.18 |
[부동산조사방법론] 7주차 / 측정 (0) | 2018.11.18 |
[부동산조사방법론] 6주차 / 일차자료 (0) | 2018.11.18 |