Dr.부동산

[통계학] 앤더슨 통계학 - 1장 본문

독학,외부강의/통계학

[통계학] 앤더슨 통계학 - 1장

anony mous 2019. 1. 20. 15:43

- 내용 - 

1장/ 기술통계학

2장 / 기술통계량

3장 / 확률

이산확률분포

연속확률분포

표본과 표본분포

구간추정

가설검정

평균비교, 실험설계, 분산분석

비율을 포함한 비교 및 독립성 검정

단순선형회귀

다중회귀분석

통계적 품질관리

--------


통계는 숫자이외에도 다양하다. 

통계학은 자료를 수집, 분석, 표현, 해석하는 예술이자 과학이다. 

경영, 경제분야에서 의사결정을 돕는다. 


- 1장에서 배울 것 - 

자료에 대한 정의

자료집합의 개념

변수와 관측값 등 용어

정량적자료와 범주형자료의 차이

횡단면자료와 시계열자료의 사용

설문조사, 실험연구 등 자료수집 방법

기술통계 작성법 통계적 추론에 필요한 자료 이용

엑셀 통계분석, 데이터마이닝

통계실행에서의 윤리적 가이드라인


1장 자료와 통계학 


1. 응용학문

회계학, 재무학, 마케팅, 생산관리, 경제학, 정보시스템


2. 자료

2-1. 용어와 개념

자료: 표현과 해석을 위해 수집, 분석하고 요약되는 사실과 숫자

자료집합 : 특정 연구를 위해 수집되는 모든 자료들

원소 : 자료가 수집되는 대상. ex.나라이름

변수 : 원소들에서 관심의 대상이 되는 구체적인 특성. ex. 1인당 GDP

관측값 : 특정한 원소에 대해 측정된 값.


2-2. 측정단위

뜻 : 자료에 포함된 정보의 크기를 결정, 적절한 자료요약과 통계분석 방법을 말해줌.

정보량에 따라 명목척도, 순서척도, 구간척도, 비율척도 순으로 측정단위를 설정.

- 명목척도 : 원소의 특성을 나타내는데 이름이나 기호를 사용. ex. member, obsever 

- 순서척도 : 명목자료의 특성을 가지고 있고, 자료의 순서가 의미있는 경우. ex. F~ A

- 구간척도 : 순서자료의 특징을 가지며, 값들의 차이를 고정된 측정단위로 표현할 수 있는 경우. ex. 550~600점

- 비율척도 : 순서특성이 있으며, 두 값의 비율이 의미가 있을 때. ex. 0 ~ $15 ~ $30 (2배)


2-3 범주형 자료와 정량적 자료

- 범주형자료 : 숫자는 구분하는 의미만 있을 뿐, 사칙연산은 안됨. 원소의 특징은 이름이나, 기호사용. 문자나 숫자를 주로 표현

- 정량적자료 : 구간, 비율 측정단위를 사용, 측정값이 연속적이지 않으며 이산적 측정값이 연속적.

- 범주형은 통계분석이 다소 제한적인 반면, 정량적 변수는 사칙연산이 가능하고 의미있는 결과를 도출.


2-4. 횡단면 자료와 시계열 자료 = 패널데이터

- 횡단면 자료 : 동일한 시점 또는 거의 비슷한 시점에 수집된 자료. 

- 시계열 자료 : 여러시점에 걸쳐 수집된 자료. 


3. 자료의 출처 

-현존하는 자료

-관측연구

-실험 : 실험이 관리 가능한 상태에서 행해지는가? 

-시간과 비용 : 정보수집에 소요되는 비용과 기간을 파악해야 한다.

-자료수집오류 : 부주의하게 수집된 자료를 이용한 잘못되 정보를 얻는다. 


4. 기술통계학

뜻 : 표나 그래프, 숫자로 요약된 자료. 


5. 통계적 추론 

모집단 : 특정 연구대상이 되는 집합

표본 : 작은 부분의 집합

센서스 : 모집단에 대해 모든 자료를 모으는 조사

표본조사 : 표본 자료를 모으는 것

통계적추론 : 모집단의 특성에 대해 추정하고 가설검정하기 위해 표본자료 활용


6. 엑셀활용 통계분석

자료입력, 함수 및 수식입력, 도구사용, 편집


7. 데이터마이닝 

데이터웨어하우징 : 자료를 수집하고 저장하고 관리하는 일

데이터 마이닝 : 데이터 웨어하우스의 있는 자료를 통해 정보를 캐서 유용한 정보를 만드는 과정. (자동으로 예측정보를 추출)


8. 통계분석을 위한 윤리적 가이드라인

전문성 - 원하는 결과가 나오기까지 어려번 검정을 실시하여 원하는 통계량만 발표하는 문제.