Dr.부동산
3주차 - 교과서 수업 1장 확률 개념의 소개 본문
논문 : 서울시 뉴타운 개발이 주변지역 주택가격에 미치는 영향 분석
랜드마크가 영향을 미치는 ? 본연구는 다음과 같이 구성된다.
공간적 범위는 잠실, 시간적 범위는 발표가 났을때, 착공했을때, 완공했을때, 공실이 많을때로 나눔. 연구의 목적도 패널로 가야한다. 2007년부터 실거래가가 있으니, 데이타를 끄집어 낸다. 단지 내에서 동일하지 않은데 동일하다고 봐야 하는 것. 비슷하게 나오면 다 같다로 보는것. 선행연구 - 헤도닉, 랜드마크에 관련된 선행연구를 분석해주시면 됩니다. 자료는 평당아파트가격, 기술적으로 GIS버퍼링을 썼다는 것을 강조. 경관적 특성을 고려, 조합설립 여부 등
선행연구 고찰 - 사람들이 투자수요일때와 투기 수요일때 다름. 투자 수요를 잡아야 하는데, 잡으려고 하면 투자 수요가 어느정도 되는지 측정해야 함. 선행연구 주제 센텀, 공원 등 용산 공원이 생기면 어떻게 될지 등을 파악할 수 있음.
미시경제를 좀 읽고 넣어주면 좋겠다. 보시면서 연구의 목적은 어떻게 쓰면 되겠다 잡으면 된다. 대상 이렇게 쓰면 되겠다. 연구동기, 연구주제, 연구방법 모르셔도 여기 무엇이있는지 알 수 있다. 도입하면 된다.
제일 쉬운것이 모기지 디폴트같은 것이다. 차이가 무엇이냐면 새로운 데이타..
계량은 경제학에서 한다. 통계학과 수학의 도움을 받는다.
AAA계량 경제학. 학부에서 똑같이 하는데 어려워 하지는 않는다.
엑셀에서도 랜덤 넘버를 발생시킨다. 균일 분포.. 확률변수는 각각의 결과가 나타난 합은 1이 되어야 한다. 요즘 관심있는 확률 변수는 무엇이 있습니까?
관심있는 랜덤규칙은 무엇이 있나? 몬테카를로를 돌리는데 그것이 의사결정시 1또는 0이 될때 어떻게 해야 하는지 확률 / 아시아 외환위기 같은 것은 검증하려면 모델이 중요하다. 정확한 모델은 비싸게 팔린다. 확정지을 수 없기 때문에, 확률이 돈에 영향을 미치는 경우가 있다. 메르스등은 확률이 적으나 크리티컬 하다. 광우병 같은것을 랜덤 확률이 낮지만 중요한 이유는?
중요한 것은 확률과 확률에 대응하는 것이다. 우리가 확률에 관심을 있는 이유는 우리의 돈. Asset의 가격. 호황기에는 100원, 불황기 50원이면, Asset은 두 가격 x 확률이다. 확률이 돈에 영향을 미치는 사람에게는 매우 중요하다.
부동산 시장이 호황이냐 불황이냐, 우리가 관심있는 것은 지금까지 이야기 한것은 확률 변수이고, 이 것들을 더 잘 이해하기위해 독립 변수를 찾는 것이다. 확률 변수를 더 잘 예측하기 위해 연구하고 찾는 것을 조건, 독립변수라고 한다. 확률변수의 평균이 있다.
북한이 핵을 쏘아 올린다는 것을 아무도 예측안했다. 블랙스완, 레저 0이벤트. 유럽사람들은 백조가 하얗다고 생각했다. 수학과 통계를 구분하는 기준은 통계에는 0.00000000000001은 그냥 없다고 치는 게 있다는 것이다.
시그마프레스 계량경제학 - 이병락 옮김
문제 : 0장 확률 개념의 소개
1. 확률변수와 그 변수값과의 차이 / 예
2. 통제된 실험과 비통제된 실험의 차이 / 실험적 자료와 비실험적 자료의 차이
3. 실험상의 표본추출변동, 확률변수의 개념
4. 이산적확률변수와 연속적 확률변수의 차이
5. 이산적 확률변수의 확률함수에 대한 특성 / 예
6. 이산적 확률변수, 사건의 확률 계산
7. 이산적 확률변수가 값2를 취할 확률은 0.3이다.
8. 연속적확률변수의 확률밀도함수와 이산적확률변수의 확률함수와의 차이
9. 확률밀도함수가 주어진 경우 연속적 확률변수의 확률 계산
10. 단일 및 이중 합산기호를 사용 식.
11. 확률변수의 평균, 기대값의 개념
12. 이산적 확률변수의 분산 정의 / 분산이 증대될때 확률변수의 값
13. 2개의 이산적 확률변수에 대한 결합 확률함수 / 결합사건의 확률계산, 개별 확률변수의 한계확률함수 값
14. 이산적 확률변수의 값과 결합확률함수 / 이산적 확률변수의 조건부 확률함수 값
15. 2개 확률변수의 통계적 독립성 설명 / 조건 / 예
16. 2개의 확률변수간의 공분산 및 상관 정의 / 결합확률함수가 주어진 경우의 값
17. 확률변수 가중합계의 평균 및 분산.
1번. 확률변수, 시간을 늘리고 줄이는 것이 컨디션이 된다. 비가 온다는 조건 등, 아침에 일어나서 택시를 탈 것인가 하는 것? 확률 변수는 출근하는 교통수단이다. 어떤 컨디션에 따라 확률이 변하기도 한다.
2번. 미래에 발생하는 어떤 알 수 없는 이벤트 확률 변수이고, 아웃컴과 아웃컴에 해당하는 것이 있어야 한다. 우리 애가 대학에 들어가는 확률도 확률 변수이다. 확률 변수에 영향을 미치는 요소는 종속변수.
3번. 표본 추출은 전체를 다 쓸수 없어서 일부만 가지고 결과를 가짐. 빅데이터는 전수조사를 한다. 학부에서는 시니어교수님은 데이터 하나하나를 고심해서 골라라고 하는데, 주니어 교수님은 컴퓨터가 계산하게 하라고 한다. 고민하라고 하면 고민하면 된다. 표본에 집착하는 것이 예전의 계량이다.
4~7번. 이산적인 것은 끊어져 있다는 것이다. 각각의 확률을 구해야 한다. 거기에 맞춰서 예약을 해야 한다. 0.5명은 이산적인 것이다. 생각을 해보시면 된다. 이산과 연속은 코딩하는데 차이가 크다. 주사위나 동전은 이산적인 것이다. 이산은 각각에 값을 주어야 하는데, 연속하는 순간 1이나 무한대로 뻗어버린다. 정의 자체가 이산적일때와 연속적일때는 아웃컴의 범위가 달라진다. 주가도 코스피가 1000-2000일 확률이라는 범위를 주게 된다. 수학과 통계의 차이다. 원칙적으로 연속적인 확률변수는 없다. 0.01%까지밖에 없고, 수학적으로 말하는 연속적인 측정이 불가능하다. 연속적이어야만 미분이 되기 때문. 평균을 구해야하고 평균이 바로 가격이다. 이벤트 x 이벤트 를 모두 더하는 적분 형태로 구해야 한다. 이산적인 경우 무한에 가까운 아웃컴이 있고 어떤 확률 변수는 무한대로 가버린다. 평균이 존재하지 않는다는 말의 의미는 평균이 무한대라는 것이다. 이산적과 연속적이 있을때 움직임을 가지고 파악한다.
8번. 합이 1이 되도록 만드는 것을 확률 밀도 함수라고 한다. Value at Lisk. 함수는 x가 정해질때 y가 나오는 모든 것이 함수다. 종가함수. 이자율 기간구조 모형. 채권을 보면 만기 3년짜리 4% 상품. 만기별로 수익률이 나오게 된다. 날짜를 넣으면 수익률이 나온다. 축약 모형. 날짜를 넣으면 결과가 나오는 사주?도 모형인가.. 확률 밀도함수를 적분하면 1이 된다. 또는 평균을 구했을때 원하는 범위 안에 있으면 잘 만든 것이다.
9번. 증권회사 리서치팀에 확률을 만들어보았을때, 내가 생각하는 것은 100이고 결과가 나온것은 90일때 확률변수에 따라 영향을 미치기 때문에 확률변수를 부정적으로 볼때는 낮게 나온다. 주관적으로 만들어진 것이 쓸만하냐 안그러냐.
10. 합산기호는 ∑ 이다.
11. 평균 기대값의 존재 범위, 표준편차. 존재할 수 있는 범위가 크면 위험이 크다. 리스크가 나쁜것인가? 분산이 0인것은 리스크가 없다. 오늘도 0, 내일도 0, 모레도 0인 것은 변화가 없다.
12. 확률 변수가 평균을 중심으로 변할 수 있는 범위를 분산으로 본다. 수학적으로 분산은 엑셀로 한다. 이해 할 것은 평균, 가격이 퍼지는 범위가 분산. 분산이 낮을 수록 위험이 적게 된다.
13. 헤도닉은 확률 변수가 2개가 넘어가면 2개 이상./ 결합확률함수. 삼성회사채, LG회사채가 있을때 둘중 하나 부도가나면 ? 두개를 연결해보는 것이다. 첫번째 누가 부도나고 두번째 누가 부도나는 확률. 회사들을 다 고려할때 확률. 포퓰러라는 함수가 있다. 기간 구조 모형에서도 쓰는데, 30년짜리 장기 채권의 리스크를 보면, 1년짜리, 2년짜리 쪼개 놓는 것이다. 단기 리스크의 해결. 30년짜리 리스크는 한번 터지면 30년은 간다. 서브프라임은 10년 갔으니까 10년짜리 리스크. 리스크가 터질때 기간에 따라 다르다. 채권의 리스크는 30개의 리스크를 다 봐주어야한다. 각각 다른 이벤트들이 있기 때문.
14. 더 잘 예측하기 위해서는 조건이 필요하다. 지하철을 내릴때 세종대와 건대가 있는데 경험적으로 남학생이 많이 가는 곳을 따라갔다. 조건. 예를 들어 내가 산 주식이 바이오인데 특허를 받았다. 이런것도 조건.
15. 독립성과 상관성. 독립적이라는 것은 내가 관심을 가지고 있는 확률 변수를 예측하는데 그것과 아무 연관이 없다. 삼성전자 주식을 살때와 아프리카의 이슈와 상관이 없다는 것과 같은 것. 같은 학교에 다니는 동기가 취업하는 것과 내가 하는 것은 상관이 조금 있다. 상관에는 공통적인 요인이 있다. 미국에 리츠나 부동산 펀드, 예를 들어 63빌딩을 관리할때 1년 냉난방비는 얼마인가? 유가에 따라 비용이 달라진다. 기온이 떨어지면 난방비, 기온이 오르면 냉방비. 날씨에 따라 영향을 미친다. 헷지를 할 수 있다. 비가오면 막걸리를 마신다는 것은 상관성이 없다. 상관은 원웨이가 아니다. 서로 해야 하는 것이 상관이다.사귀는 관계가 되었을때 상관성이 있는 것이다.
16. 확률변수에서 교수가 학생회장과 술을 마실때, 내가 일어났을때 학생회장이 일어났을 확률과, 학생회장이 일어났을때 내가 일어나는 확률이 다르다. 필요한 것을 예측해야 할때 기대값을 형성한다.
17.가중합계. 주식에 채권도 있다.포트폴리오 구성. 구조화 금융, 금융공학. 어머니소득+아버지소득 = 가계소득이 된다. 두분의 소득은 각각 다른데, 가계소득은 하나값이 나온다. 분산투자의 분산과 분산이 한자가 같은가?
0.1 실험. 결과 확률변수
통제된 실험. 몰라도 되는 할 수 있으면 좋다.정운호 더페이스샵, 네이처리퍼블릭 대표의 마카오 거액 도박 혐의 확률 변수. 돈을 잃는게 즐겁다?
자료는 받는 구하든. 크롤링으로 긁어오든 데이타를 구해야한다.
근거를 댈 수 있으면 논문이 되는데, 근거를 못대면 논문이 될 수 없다.
0.2.1 이산적 확률 변수의 확률 분포
채권에 관해서 수익률을 보면, 궁금한 것은 가격인데, 수익률과 가격이 1대1로 대응하고 있다. 금융에서도 인포메이션을 알면, 하나만 알면 X가 들어가면 Y가 튀어나오는 것.
공정한 경우, 동전을 던지면 0.5, 0.5 확률이 나온다. 이것이 확률밀도함수값. 평균을 구할때 하나만 보면 된다. 뒷면, 앞면을 0과 1로 하는 것은 계산의 편의 때문이다. 앞면이 1이므로 0.5를 곱하면 앞면이 나올 확률은 50%다.
예0.1 P'(1-P)1-X
0.2.2 연속적 확률
방정식과 항등식은 구분해야 한다. 항등식은 언제나 맞아야 하고, 방정식은 어떤 조건이 필요하다.
CAP RATE = IRR - GROUTH RATE + E
캡레이트 = 돈을 빌려오는 캐피탈 마켓에서 결정이 됨. - 지역에서 건물에 대한 임대 수요에 따라 다름
방정식은 특정한 조건에서 등식이 성립하는 것을 의미한다.
적분. 주가가 1100~2100일때의 확률을 적분하면 된다.
0.2 몬테카를로 시뮬레이션.
임의의 0과 1사이의 무작위 숫자가 발생한다. 이게 어떻게 -무한대에서 +무한대가 되나? 확률 100%가 되어야 하니까, 만나는 점이 생긴다. 역함수를 구하면 값이 튀어나온다. 이 방식이 훨신 쉽다.
수학은 완전히 정확한데 통계학은 안그렇다. 기계학습도 샘플링을 하게 되는데, 0~1까지 나오는데 1~31까지 나오도록 하려면 어떻게 하면 되는가? 표준화라는 말을 많이 한다. 나올 가능성은 완전히 같아야 한다. 맵핑이라고 한다. X에 어떤 값을 넣을때 되는가 ? F(X) = 30X+1
0.5는 반드시 0.4 앞에 있고.. 안전하게
0.3 1개의 확률변수를 포함하는 기댓값
0.3.1 합산법칙.
오퍼레이터. 어떤 연산자의 개념을 설명해주는 것이다. 이것을 설명해주는 이유는, 이것을 어떻게 나누면 되는지.. 평균에 N을 곱하면 총합이 된다.
4.써메이션 같은 경우에는 두개를 더하는 값이 교환법칙, 결합법칙이 된다는 것6..
5.a캐시, b주식
6. 가중평균
7. 동일 가중 평균.
0.3.2 확률 변수의 평균.
계량을 할때는 공간의 대한 이해가 중요하다. 계량은 공간이 중요한 건데, 사는 집을 공간상에 표현을 해보는 것
계량은 평균에 관한 것이다. 경매는 평균값이 아니라 최대값이 튀어나온 것이기는 한다. 논리적으로는 경매값 알기는 어렵다. 평균보다 다른 것들을 추정하고 싶을때, Max에 관한 것은 코딩을 해야 한다.
의미는 반복적으로 계속 했을때 나오는 값을 평균이라고 부른다. 관심은 모집단 전수인데.. 여러번 뽑을때와 한 법 뽑을때 차이가 거의 없다는 것.. 급식업체들은 고등학생들의 평균 키가 궁금하다. Our Home이 CJ를 몰아내고 자기네들이 밥을 먹여 주면, 키가 클 것이라는 것을 증명해내는 것..
평균 구하는 방식을 가중평균으로, 동일가중 또는 다른 가중일 수도 이싿. 수익률은 포트폴리오의 수익률. 미니 오퍼레이터는 계산이 쉽다. a채권과 b채권 듀레이션을 구하면..
문제풀이
예0.4 /// 0에서 1인 어떤 경우에 이것을 a와 b사이에 매핑을 할경우. 어떻게 하면 0이 a가 되고 1은 b가 되는가 ? F(x)= (b-a)x + a
0.3.3 확률변수 함수의 기대.
x의 평균의 자승과 x자승의 평균 값은 다르다. g(x)를 밸류펑션일때. 로이, 캠레이트. 캠레이트가 확률 변수이다. g x는 오피스의 벨류펑션. 마켓 캠레이트를 비교해 보았다. x1, x2 각각으로 볼 수 있다. 채권, 주식에서 3년물, 10년물 등으로 볼 수 있다. 상태변수가 된다. 포트폴리오의 수익률은 개별 에셋의 수익률의 합이다. 라고 볼 수 있다.
1. c가 상수일때.
2. 에셋을 c개 샀을때
3. a=캐시, 변하지 않는 에셋
0.3.4 분산.
분산 값을 주고 x를 계산하라거나 한다.
var은 변해야 하니까. a는 변하지 않으니까 지우고 시작해도 된다. 1/n이면 1/n2이 되므로 분산효과가 생긴다. 확률 변수 추론.
n무한대로 가게되면, n2 무한대
표0.2
벨류의 리스크나 테일의 경우 꼬랑지만 보는 경우도 있다.
수익률이 0일 수도 있고, 마이너스이거나, 플러스일때인데.
조건부, 캠레이트가 5%라고 하면, 나중에 20%가 되는 것?
예0.6 상관된 두 확률변수를 비교.
0.4.2 조건부 확률 밀도함수
우리나라 축구팀이 이기는 확률. 메시가 골을 넣는 확률. 상관이 없는 것은 독립적인 것. 상관이 있을려면 common factor. 면접관이 모두 남자일 경우 여성일때의 합격률 등. 합격하기 어려워 질까?
수식 (0.4.2) 조건을 집어 넣었을때 뻥튀기 되었다. 꼬리 5%만 보겠다는 조건을 준다면 더 잘 예측할 수 있게 된다. 독립성. 상관된것을 보아야만 잘 될 수 있다.
0.4.3 독립적 확률변수.
0.5 공분산과 상관.
공분산과 상관계수가 중요하다. 독립변수와 종속변수가 어떤 관계를 가지고 있는지가 중요하다. 데이터를 지우면 지우는 조건이 바로 상관관계이다. 수학적인 상관관계. 이론적으로 관계가 있는 것을 넣는다면, 넣을때 이론적으로 근거가 있는 것을 넣어주어야만 됨.
시계열에서 데이터값이 없을때, inflation을 growth레이트에 넣는다.
CAP RATE = IRR - GROUTH RATE + E
이론적 근거가 있어도 공분산 및 상관이 없으면 날라가 버린다. 소득이 주택에 대한 수요에 영향을 미치는 이유. 수요와 소득이 상관이 없다. 데이터를 수집하는 과정이 잘못되서 아무 관계 없는 숫자가 들어가는 경우가 생긴다. 데이터.. 6000세대의 아파트를 받았는데, 가격에 미치는 영향으로 봤는데, 방수와 평형이 완전 동일 평형이면, x 변수가 전혀 변동을 하지 않아서 아무것도 안나오는 경우도 있다. 평수와 방수가 중요했었는데, 데이터를 뽑는 과정이 잘못되면 그데이타는 버려진다. 예전에는 동일평형이라도 방수가 많은게 좋았는데, 지금은 거실이 넓은 것으로 변해간다. 컴퓨터가 평수와 방수를 알 수는 없다. 주의해서 변수를 넣어 주어야 한다.
어린아이 키 자라는 속도와 중국 경제 성장률의 관계에 대한 이론적 근거가 있나?
주택 연금을 선택하는 사람을 보면, 의료비가 30-40만원이면 선택을 하지만, 의료비가 1000만원 이상 내는 사람은 주택연금을 선호하지 않는다. 본인이 느낄때 큰 금액의 의료비를 내야 하는 경우 주택을 팔면 안된다고 생각한다.
수식(0.5.1) x대신 y를 넣으면, 공분산? 분산과 공분산 다르다. y가 x/2일때 이것은 분산 된다. 분산의 1/2.
분산과 공분산의 관계, y를 x의 함수로 표현하거나 할때.
헷지. x와 y관계에 대해서 잘 파악해봐야 한다.
수식(0.5.3) cov 코베리언스. 평균 0으로 잡고 빼버리면 된다.
상관계수
파지티브. sector analysis에서 많이 쓰는 것. 자리를 움직여서 축을 직각으로 만들때 가장 효율적이라고 본다. 아래그림과 같이 축이 직각이 아닐때를 말한다. 이 축을 어떻게 움직이느냐에 따라서 달라진다. 계량에서 기계학습이나 요인분석은 잘 안쓰는데 그 요인을 모른다. 공학과 부동산 계량은 이런 면에서 다르다. 집값을 설명..
수식(0.5.4)
중간고사는 코쉬슈할츠를 한다. 이런 것은 외워야 한다.
수식 (0.5.5~9)
상관관계과 연립될 경우. 자승에 2를 붙이는데, var[x]는 표현들을 관심있게 보면 된다.
표준 정규 분포로 생각하고 다 생각하면 된다. x, y만 일단 보고 파악.
0.6 정규분포.
0-1의 숫자들을 분포 끌어낸다. 몬테카를로를 쓴다. 수학적으로 안되지만, 분포가 나올 수 있으면 쓸수 있다. 소위 표준 정규 분포라는 것은 지수함수를 썼다는것이 의의가 있다. 계산을 못하거나 늦게하게 된다면 쓸모가 없다. 그래서 정확하지는 않지만 빨리 나오기 때문에 쓴다. 이것들을 더하거나 빼면 다른 분포도 만들어 낼 수 있다.
수식 :
x는 시그마제곱x제트+베타가 되는 값.
이것만 잘 이용해서 z를 아는 것이 중요.
적분과 미분이 아주 간단하고 쉽다. 정규 분포가 아닌 것을 다 다룰 수 있다.
소위 30년짜리 채권의 모형은 이런 것이 z가 30가지가 존재한다. 단순한 표준 정규분포만으로도 금융 변수들을 구분해 낼 수 있다. 패러미트릭?. 정규 분포가 아니라는 근거가 없고 선행연구가 정규분포 여부를 모른다.
때로 토빗이라는 것을 쓰는데, 0이 많이 나올 때가 있다. 예를 들어 LTD를 가지고 하는데, 돈 한푼도 안들여서 집 산사람들 많다? 이런것. 신문기사처럼 돈없이 산다고 하면 정규 분포를 안쓰고 토빗이라는 것을 쓴다.
토빗 tobit :
'부동산금융투자 > 부동산계량분석론' 카테고리의 다른 글
10주차 - 수업 (0) | 2018.11.26 |
---|---|
9주차 - 수업 (0) | 2018.11.26 |
8주차 - 논문 자료 발표 / 수업 (0) | 2018.11.26 |
5주차 - 자료발표 (0) | 2018.11.26 |
4주차 - 통계/시험범위 (0) | 2018.11.26 |