일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- 코딩테스트
- MySQL
- SQL코테
- GRU
- 자연어 논문
- airflow
- 그룹바이
- LSTM
- HackerRank
- Statistics
- NLP
- 카이제곱분포
- torch
- t분포
- nlp논문
- sigmoid
- inner join
- 자연어 논문 리뷰
- SQL 날짜 데이터
- CASE
- 표준편차
- 논문리뷰
- 서브쿼리
- 짝수
- Window Function
- sql
- 자연어처리
- update
- 설명의무
- leetcode
- Today
- Total
목록DATA ANALYSIS (78)
HAZEL

CH7. 두 모집단 간의 추론 - 실제로는 한개의 집단을 비교하는게 아니라, 두 모집단 간을 추론하는 경우가 많이 생긴다. 01 . 두 모집단의 평균 차이에 대한 가설 검정 ( 대응 표본 ) 001. 대응 표본 ( paired sample ) : 사전 사후 검사에 많이 사용함 : 두 모집단으로부터 표본을 각각 추출하는데, 표본을 구성하는 인자가 짝을 지여서 연관되는 것을 의미 : 모집단 사전 사후 검사 A , B 는 다른 모집단이지만, 표본이 연관이 있다. ( 사실은 같은 사람 .. ) 002. 표본 통계량과 표준 오차 003. 가설 검정 02. 두 모집단의 평균 차이에 대한 가설 검정 ( 독립 표본 ) 001. 독립 표본의 모수와 통계량 002. 왜 표본의 분산을 고려해야하는 가? - 표본 a / 표본..

CH6. 가설검정 ( Hypothesis Testing ) 01 . 가설검정과 유의수준 001. 가설 - 주어진 사실 혹은 조사하고자 하는 사실이 어떠하다는 주장이나 추측 ' 모수는 어떠할 것이다 ! ' 1. 귀무가설 ( null hypothesis ) [ 귀무 : 원점으로 돌아가다. 일반적으로 믿는 사실 ] = 영가설 = H0 : 조사를 할 필요가 없는, 연구를 할 필요가 없는 가설 : 귀무가설이 아니라는 충분한 증거를 데이터로부터 보임으로써 대립가설을 입증. : 귀무가설 하에서 통계량의 분포를 아는 것이 검정의 핵심 2. 대립가설 ( anti - hypothesis ) = H1 : 귀무가설(영가설)에 대립하는 가설 , 연구를 위한 가설 , 입증하여 주장하고자하는 가설 002. 검정 ( TESTING ..

CH5. 추정 01 . 점추정과 구간추정 001. 점추정 ( point estimation ) - 점추정 : 모수를 특정한 수치로 표현하는 것 ex, 30분 - 하나의 값으로 표현하는 것이기 때문에, 틀릴 확률이 多 - 추정량을 통해 모수를 추정 002. 추정치와 추정량 1. 추정치 ( estimate ) : 모수를 추정하기 위해 선택된 표본을 대상으로 구체적으로 도출된 통계량 2. 추정량 ( estimator ) : 표본에서 관찰된 값으로 추정치를 계산하기 위한 도출 함수 003. 바람직한 점 추정량 조건 1. 평균 오차제곱 : 평균 오차 제곱이 최솟값이어야 한다. - 오차 ( 평균 - 측정치 )의 평균이 최소가 되어야 하는 것 = 평균에 가깝다 와 같은 의미 2. 불편성 : 추정량이 모수와 같아야 한..

CH4. 확률분포 01 . 확률분포 001. 확률분포 - 확률분포( Probability Distribution ) : 발생할 사건에 대해 확률을 나열한 것 > 과거의 데이터가 많다면, 의사결정을 하는데 유리하다. > 확률 분포도(그래프)와 확률 분포 표(표) 002. 균등분포( Uniform distribution ) - 주사위 던지기의 예와 같이 과거의 경험이 미래를 예측하는데 어떤 영향도 미치지 않으며, 나타날 가능성이 모두 동일한 분포 1. 이산균등분포 ( discrete uniform distribution) : 이산 확률분포 중 확률 함수가 정의된 모든 곳에서 그 값이 일정한 분포를 의미함 ex, 주사위 던지기 2. 연속 균등 분포 : 시간의 흐름과 같이 구분할 수 없는 것 003. 정규분포 ..

CH3. 확률과 통계 01 . 확률과 의사결정 001. 통계의 목적 - 통계의 목적 : 모수를 추정 - 추정의 이유 : 모집단을 대상으로 하는 조사가 불가능하거나, 시간과 비용 등의 물리적 한계 때문 002. 확률 1. 확률이란 - 확률 : 어떤 사건이 실제로 일어날 것인지 혹은 일어났는지에 대한 지식 혹은 믿음을 표현하는 방법 ( 0~1사이 ) - P(A) : A가 발생할 확률 = n번 실행해서 사건 A가 발생할 경우 - 즉, 전체(표본공간) 경우의 수에서 사건 A의 경우의 수를 의미한다. 2. 확률이 가지는 조건 - 확률은 0과 1사이를 가짐 - 시행횟수(i) 라고 했을 때, 모든 사건을 다 더해준다고 가정하면, 그 사건이 나오는 확률은 100% 즉 , 1이다. 003. 확률의 덧셈법칙 - 서로 다른..

CH2. 데이터와 통계량 01 . 데이터의 수집 001. 용어 - 변수 : 어떠한 대응관계로 변화하는 수, 혹은 함수관계로 대응하며 주어진 범위 안에서 변화하는 수 -> 변수는 데이터로 구성되고, 데이터를 근거로 변수의 특성을 파악 - 데이터 : 조사의 목적에 맞는 변수를 기반으로, 표본으로부터 수집된 자료 002. 척도 [ 적절한 데이터를 구성하기 위한 기준 ] 1. 범주형 척도 : 명목척도, 서열척도 : 하나하나 구분이 되어있는것 - 명목 척도 : 이름이나 명칭을 숫자를 부여하지만 수치에 의미가 없음 ex, 남 1 / 여 0 -> 남자와 1 / 여자와 0 은 서로 관계가 없음 - 서열 척도 ( 순서 척도 ) : 명목척도의 특징을 가지고 있으면서, 순서를 가짐 ex, 1등 2등 ,, 2. 연속형 척도 ..

CH1. 모집단과 표본 01 . 모집단과 표본 추출 001. 모집단과 표본 - 모집단 : 통계분석 방법을 적용할 관심 대상의 전체 집합 - 표본 : 과학적인 절차를 적용하여 모집단을 대표할 수 있는 일부를 추출하여 직접적인 조사 대상이 된 모집단의 일부 출처: 통계청 002. 모수와 통계량 - 모수 : 모집단을 분석하여 얻어지는 결과 수치 ( 통계적 수치 ) ex, 모평균 , 모분산 , 모표준편차, 모비율 - 통계량 : 표본을 분석하여 얻어지는 결과 수치 ex, 표본평균, 표본분산, 표본표준편차, 표본비율 003. 표본추출의 방법 1. 확률적 표본추출 방법 : 모집단에서 표본이 될 확률이 모두 동일한것. 표본추출의 방법은 동일한 확률 하에서 표본을 구성 2. 비확률적 표본추출 방법 : 확률과는 상관없이 ..

1절. 기초 통계 1.1 용어 정리 - 모집단과 표본 1.2. 실험 - 실험 : 특정 목적 하에서 실험 대상에게 처리를 가한 후에 그 결과를 관측해 자료를 수집하는 방법 - 측정 : 추출된 원소들이나 실험 단위로부터 주어진 목적에 적합하도록 관측해 자료를 얻는 것. - 표본 공간어떤 실험할 때 나타날 수 있는 모든 결과들의 집합 - 사건 : 표본공간에 있는 몇 개의 원소들로 이루어진 부분 집합 - 확률 : 특정 사건이 일어날 가능성의 척도 P(E) = n(E) / n(Ω) - 확률변수 : 식 1.3. 확률 변수와 확률 분포 - 이산형 확률 변수 : 0 이 아닌 확률 값을 갖는 실수 값이 셀 수 있는 경우의 의미 ex , 이항 분포, 분포, 포아송 분포 - 연속형 확률 변수 : 가능한 값이 실수의 어느 특..