일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- leetcode
- t분포
- HackerRank
- NLP
- inner join
- CASE
- 서브쿼리
- 설명의무
- torch
- MySQL
- 표준편차
- SQL코테
- nlp논문
- 논문리뷰
- Window Function
- 짝수
- GRU
- 그룹바이
- 자연어 논문
- LSTM
- 자연어 논문 리뷰
- update
- Statistics
- sigmoid
- 코딩테스트
- sql
- 자연어처리
- 카이제곱분포
- airflow
- SQL 날짜 데이터
- Today
- Total
HAZEL
[Basic Statistics : CH 3. 확률과 통계] 확률과 의사결정, 확률변수의 기대값과 분산 본문
[Basic Statistics : CH 3. 확률과 통계] 확률과 의사결정, 확률변수의 기대값과 분산
Rmsid01 2020. 11. 8. 00:47CH3. 확률과 통계
01 . 확률과 의사결정
001. 통계의 목적
- 통계의 목적 : 모수를 추정
- 추정의 이유 : 모집단을 대상으로 하는 조사가 불가능하거나, 시간과 비용 등의 물리적 한계 때문
002. 확률
1. 확률이란
- 확률 : 어떤 사건이 실제로 일어날 것인지 혹은 일어났는지에 대한 지식 혹은 믿음을 표현하는 방법 ( 0~1사이 )
- P(A) : A가 발생할 확률 = n번 실행해서 사건 A가 발생할 경우
- 즉, 전체(표본공간) 경우의 수에서 사건 A의 경우의 수를 의미한다.
2. 확률이 가지는 조건
- 확률은 0과 1사이를 가짐
- 시행횟수(i) 라고 했을 때, 모든 사건을 다 더해준다고 가정하면, 그 사건이 나오는 확률은 100% 즉 , 1이다.
003. 확률의 덧셈법칙
- 서로 다른 사건 A, B 함께 발생하는 경우. A의 확률과 B의 확률을 더한 후, A와 B가 동시에 발생하는 사건(교집합)을 빼줌
- 단, 배반 사건의 경우 ( 배반사건이란, A,B의 교집합이 없을 경우 ) 그냥 A의 확률과 B의 확률을 더해주면 됨.
004. 확률의 곱셈법칙
- 만약, A가 발생할 때, B가 발생할 경우.
005. 확률 변수와 확률 함수
1. 확률 변수
: 확률적인 과정에 따라 값이 결정되는 변수를 나타냄. 특정 확률로 발생하는 각각의 결과를 수치적 값으로 표현하는 변수
2. 확률 함수
- 확률 변수가 취하는 모든 실수들의 집합을 상태공간이라 하며, 그 공간에서 나올 수 있는 가능성은 특정 확률로 주어짐.
- 확률 함수의 종류
a. 이산 확률 변수 ( discrete random variable )
: 수집된 데이터의 확률 변수 중, 셀 수 있는 특정한 값들로 구성되거나 일정한 범위로 나타나는 확률변수
- 정수와 같이 명확한 값을 변수의 값으로 함
- 확률변수가 가질 수 있는 값의 수가 한정되어 그 수를 셀수 있는 변수
ex, 동전 던져서 나오는 확률, 윷놀이에서 '모'가 나올 확률
b. 연속 확률 변수 ( continuous random variable ) : 연속형이거나 무하한 경우와 같이 셀 수 없는 확률 변수
- 변수값이 정수처럼 명확하지 못함
- 확률변수가 연속량으로 표기되어 변수값의 개수를 셀 수 없는 변수
02. 표본의 확률변수의 기대값과 분산
001. 기대값
- 기대값이란 , 사건에서 발생하는 해당 값과그 사건이 발생할 확률을 곱해서 모두 더한 값
002. 기대값의 성질
003. 확률변수의 분산
- 확률변수의 분산 : 기대값의 특성을 나타내는 값 ( 확률변수들이 기대값으로부터 벗어나는 정도 )
004. 분산의 성질
** 공분산(Covariance : Cov ) : 두개 또는 그 이상의 랜덤 변수에 대한 의존성을 의미함.
즉, x가 증가 혹은 감소했을 때, y 도 그러한 경향을 보이는 가 를 수치화 한 것.
= X와 Y를 곱한 값의 평균에서 각각 X와 Y의 평균을 곱한 것을 뺀 것을 의미한다.
005. 확률변수의 표준 편차
- 확률변수의 표준편차 = 분산의 제곱근
공부 교재 : 제대로 시작하는 기초통계학
사회조사분석사
https://www.youtube.com/watch?v=jGOqkljySu8&list=PLsri7w6p16vuDN55ZGHVYnitXs2R1Wz6q
'DATA ANALYSIS > Math' 카테고리의 다른 글
[Basic Statistics : CH 5. 추정] 점추정과 구간추정 , 모평균의 구간 추정, 모집단 비율 및 분산의 구간추정 (0) | 2020.12.01 |
---|---|
[Basic Statistics : CH 4. 확률분포] 확률분포, 이항분포, 포아송분포 (0) | 2020.11.10 |
[Basic Statistics : CH 2. 데이터와 통계량] 데이터의 수집(척도), 데이터의 표현방법, 기초 통계량 (0) | 2020.11.06 |
[Basic Statistics : CH 1. 모집단과 표본] 모집단과 표본 추출 , 표본의 분포 (0) | 2020.06.21 |
[Python_Statistics : 1절 기초통계] 용어정리, 실험, 확률 변수와 확률 분포(이산형 확률변수) (0) | 2020.05.28 |