HAZEL

[Basic Statistics : CH 3. 확률과 통계] 확률과 의사결정, 확률변수의 기대값과 분산 본문

DATA ANALYSIS/Math

[Basic Statistics : CH 3. 확률과 통계] 확률과 의사결정, 확률변수의 기대값과 분산

Rmsid01 2020. 11. 8. 00:47

CH3. 확률과 통계

01 . 확률과 의사결정 

001. 통계의 목적

- 통계의 목적 : 모수를 추정

- 추정의 이유 : 모집단을 대상으로 하는 조사가 불가능하거나, 시간과 비용 등의 물리적 한계 때문

 

002. 확률

1. 확률이란

- 확률 : 어떤 사건이 실제로 일어날 것인지 혹은 일어났는지에 대한 지식 혹은 믿음을 표현하는 방법 ( 0~1사이 )

- P(A) : A가 발생할 확률 = n번 실행해서 사건 A가 발생할 경우

- 즉, 전체(표본공간) 경우의 수에서 사건 A의 경우의 수를 의미한다.

2. 확률이 가지는 조건

- 확률은 0과 1사이를 가짐

- 시행횟수(i) 라고 했을 때, 모든 사건을 다 더해준다고 가정하면, 그 사건이 나오는 확률은 100% 즉 , 1이다.

003. 확률의 덧셈법칙 

- 서로 다른 사건 A, B 함께 발생하는 경우. A의 확률과 B의 확률을 더한 후, A와 B가 동시에 발생하는 사건(교집합)을 빼줌

- 단, 배반 사건의 경우 ( 배반사건이란, A,B의 교집합이 없을 경우 ) 그냥 A의 확률과 B의 확률을 더해주면 됨.

004.  확률의 곱셈법칙

- 만약, A가 발생할 때, B가 발생할 경우.

 

005. 확률 변수와 확률 함수

1. 확률 변수

: 확률적인 과정에 따라 값이 결정되는 변수를 나타냄. 특정 확률로 발생하는 각각의 결과를 수치적 값으로 표현하는 변수

 

2. 확률 함수

- 확률 변수가 취하는 모든 실수들의 집합을 상태공간이라 하며, 그 공간에서 나올 수 있는 가능성은 특정 확률로 주어짐.

 

- 확률 함수의 종류

  a. 이산 확률 변수 ( discrete random variable ) 

      : 수집된 데이터의 확률 변수 중, 셀 수 있는 특정한 값들로 구성되거나 일정한 범위로 나타나는 확률변수

      - 정수와 같이 명확한 값을 변수의 값으로 함

      - 확률변수가 가질 수 있는 값의 수가 한정되어 그 수를 셀수 있는 변수

        ex, 동전 던져서 나오는 확률, 윷놀이에서 '모'가 나올 확률

 

  b. 연속 확률 변수 ( continuous random variable ) : 연속형이거나 무하한 경우와 같이 셀 수 없는 확률 변수

      - 변수값이 정수처럼 명확하지 못함

      - 확률변수가 연속량으로 표기되어 변수값의 개수를 셀 수 없는 변수

왼) 이산확률변수 분포 오)연속확률변수 분포


02. 표본의 확률변수의 기대값과 분산

001. 기대값

- 기대값이란 , 사건에서 발생하는 해당 값과그 사건이 발생할 확률을 곱해서 모두 더한 값

 

왼) 확률을 모두 더한 값은 = 1  오) 사건 발생 값과 확률을 곱하여 다 더한 것이 기댓값

002. 기대값의 성질

003. 확률변수의 분산

- 확률변수의 분산 : 기대값의 특성을 나타내는 값 ( 확률변수들이 기대값으로부터 벗어나는 정도 )

 

004. 분산의 성질

** 공분산(Covariance : Cov ) : 두개 또는 그 이상의 랜덤 변수에 대한 의존성을 의미함. 

   즉, x가 증가 혹은 감소했을 때, y 도 그러한 경향을 보이는 가 를 수치화 한 것. 

   = X와 Y를 곱한 값의 평균에서 각각 X와 Y의 평균을 곱한 것을 뺀 것을 의미한다.

 

 

005. 확률변수의 표준 편차

- 확률변수의 표준편차 = 분산의 제곱근

 


공부 교재 : 제대로 시작하는 기초통계학 

사회조사분석사

https://www.youtube.com/watch?v=jGOqkljySu8&list=PLsri7w6p16vuDN55ZGHVYnitXs2R1Wz6q