일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- SQL 날짜 데이터
- 그룹바이
- Statistics
- 자연어처리
- leetcode
- sql
- 표준편차
- 설명의무
- airflow
- nlp논문
- LSTM
- inner join
- SQL코테
- 자연어 논문 리뷰
- 카이제곱분포
- Window Function
- torch
- update
- 코딩테스트
- 자연어 논문
- 논문리뷰
- MySQL
- 서브쿼리
- NLP
- CASE
- sigmoid
- GRU
- 짝수
- t분포
- HackerRank
- Today
- Total
목록분류 전체보기 (108)
HAZEL
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/bmobdn/btqP6nYA72Z/2svJzuUuu8JdMhgQ2McvJk/img.png)
3장. 파이토치 3-1. 딥러닝 시작하기 전에 부품 요약 최소 권장 CPU 코어 개수보다 단일 클럭이 높아야 한다. i5 i7 RAM 메모리는 많을 수록 좋다 16GB 64GB GPU 메모리가 클수록 좋다. 하지만 메로리가 크면 비싸다. GTX 1060Ti RTX 2080Ti 파워서플라이 비싸고 검증된 브랜드를 선택하기 GPU개당 500W - 쿨링 중요하다. - - 3-2. 파이토치 설치하기 0 ] 아나콘다를 설치한 후, 파이썬 버전을 확인하기 1 ] 파이토치 홈페이지에 들어가기 -> 설치 버튼(install)을 누르기. https://pytorch.org/ PyTorch An open source deep learning platform that provides a seamless path from r..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/wTbB5/btqQmPBWHpD/Klhy95tepXC9fkcuAJof11/img.png)
2장. 기초수학 2-1. 확률 변수와 확률 분포 2.1.1. 확률 변수 001. 랜덤 변수와 확률 - 랜덤 변수 : 랜덤 하게 발생하는 어떤 사건을 정의함 - 괄호 안의 확률 변수가 특정 값을 가질 때 확률 값을 반환하는 함수 - 확률 변수 x가 값 x가 나올 확률 값 p - 이 때, 확률 p는 0에서 1 사이의 값이 될 수 있다. - 확률 변수 x가 가질 수 있는 N개의 값에 대한 확률을 모두 더하면 1이 된다. 002. 이산확률 변수와 이산 확률 분포 - 이산 확률 분포 : 불연속적인 랜덤 변수를 다루는 것 - 확률 질량 함수 : 불연속적인 이산 확률 변수에 대한 확률 함수 EX, 베르누이 분포, 멀티 눌리 분포 - 베르누이 분포 : 0과 1 두 개의 값만 가질 수 있다. -> 이항분포 : 확률 분포..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/bHRugr/btqPYjINTMP/Zk1ZA8jHGOVkKRWOW0k45k/img.png)
빅데이터 분석기사 1-2. 데이터 분석 계획 [ 1 ] 분석 방안 수립 1. 분석 로드맵 설정 1) 분석 로드맵 개념 : 단계별로 추진하고자 하는 목표를 정확히 정의하고 선/후행 단계를 고려해 단계별 추진내용을 정렬한다. 2) 분석로드맵 단계 : [ 데이터 분석 체계 도입 -> 데이터 분석 유효성 검증 -> 데이터 분석 확산 및 고도화 ] 로 이루어짐 2. 분석 문제 정의 1) 분석 문제의 의미 - 과제 : 처리해야할 문제 - 분석 : 과제와 관련된 현상이나 원인 / 해결방안에 대한 자룔를 수집 및 분석하여 의사 결정에 활용하는 활동 - 하향식 접근방식 / 상향식 접근방식을 반복적으로 수행하면서 상호 보완하여 분석과제를 발굴 -> 분석과제 정의서 산출물을 작성 2) 하향식 접근 방식 ( Top Down ..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/YpY2e/btqPwlWunX6/BpwWq3GvlJefPCVqKiCjVk/img.png)
CH10. 회귀분석 01 . 단순 회귀분석 001. 단순회귀분석 ( Simple regression analysis ) : 원인과 결과 관계를 파악하는 것. : 하나의 변수가 다른 하나의 변수에 대해 미치는 영향을 파악하는 것 : 독립변수 X 가 종속변수 Y 에 미치는 영향을 회귀식 ( 회귀방정식 )을 이용하여 분석하는 방법 002. 독립변수와 종속변수 - 독립변수 ( dependent variable ) : X : 어떤 연구나 조사를 수행할 때, 변수에 일어나는 현상을 설명하거나 , 원인이 되어서 다른 변수에 영향을 주는 변수 - 종속 변수 ( independent variable ) : Y : 연구로 인해 설명이 되거나, 결과가 되는 것. : 다른 변수로 부터 영향을 받는 변수 003. 자연과학 & ..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/DLzqc/btqPDJ8I59q/ySxwQeUwAlbWzb0gg979E1/img.png)
CH9. 연관성 분석 01. 연관성 분석 001. 연관성 분석 ( association analysis ) : 어떤 조사 대상에서 수집된 자료를 척도를 기준으로 구분할 수 있는데, 이때 변수들 간에 어느 정도의 밀접한 관계가 있는지 판단하는 방법 : 자료의 척도를 기준으로 변수간의 연관성을 파악함 : 따라서, 척도에 따라서 연관성 분석이 달라지게 됨. -> 여러 가지 연관성 분석 방법이 존재. 002. 연관성 분석이 필요한 이유 : 연구 목적이 다양한 목적 ( 다차원 목적 ) 으로 고찰하게 됨. : 조사를 여러 변수에 대해서 진행하면 효율이 높아짐. 003. 척도 [ 적절한 데이터를 구성하기 위한 기준 ] 1. 범주형 척도 : 명목 척도, 서열 척도 : 하나하나 구분이 되어있는 것 - 명목 척도 : 이름..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/bBtfzG/btqPlc4TAuk/OWD2yymOsFEV17euyUHCt0/img.png)
그동안, 정리한 [ 기초 통계 ] 내용 보러 가기 더보기 2020/06/21 - [DATA/Statistics] - [Basic Statistics : CH 1. 모집단과 표본] 모집단과 표본 추출 , 표본의 분포 2020/11/06 - [DATA/Statistics] - [Basic Statistics : CH 2. 데이터와 통계량] 데이터의 수집(척도), 데이터의 표현방법, 기초 통계량 2020/11/08 - [DATA/Statistics] - [Basic Statistics : CH 3. 확률과 통계] 확률과 의사결정, 확률변수의 기대값과 분산 2020/11/10 - [DATA/Statistics] - [Basic Statistics : CH 4. 확률분포] 확률분포, 이항분포, 포아송분포 2020..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/31GBT/btqON748Vmd/58cP88LozsZ9jO7n4N731K/img.png)
CH7. 두 모집단 간의 추론 - 실제로는 한개의 집단을 비교하는게 아니라, 두 모집단 간을 추론하는 경우가 많이 생긴다. 01 . 두 모집단의 평균 차이에 대한 가설 검정 ( 대응 표본 ) 001. 대응 표본 ( paired sample ) : 사전 사후 검사에 많이 사용함 : 두 모집단으로부터 표본을 각각 추출하는데, 표본을 구성하는 인자가 짝을 지여서 연관되는 것을 의미 : 모집단 사전 사후 검사 A , B 는 다른 모집단이지만, 표본이 연관이 있다. ( 사실은 같은 사람 .. ) 002. 표본 통계량과 표준 오차 003. 가설 검정 02. 두 모집단의 평균 차이에 대한 가설 검정 ( 독립 표본 ) 001. 독립 표본의 모수와 통계량 002. 왜 표본의 분산을 고려해야하는 가? - 표본 a / 표본..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/U3ymQ/btqOSxn9A87/6WdylW3sRTDObxuwnZ0k2k/img.png)
CH6. 가설검정 ( Hypothesis Testing ) 01 . 가설검정과 유의수준 001. 가설 - 주어진 사실 혹은 조사하고자 하는 사실이 어떠하다는 주장이나 추측 ' 모수는 어떠할 것이다 ! ' 1. 귀무가설 ( null hypothesis ) [ 귀무 : 원점으로 돌아가다. 일반적으로 믿는 사실 ] = 영가설 = H0 : 조사를 할 필요가 없는, 연구를 할 필요가 없는 가설 : 귀무가설이 아니라는 충분한 증거를 데이터로부터 보임으로써 대립가설을 입증. : 귀무가설 하에서 통계량의 분포를 아는 것이 검정의 핵심 2. 대립가설 ( anti - hypothesis ) = H1 : 귀무가설(영가설)에 대립하는 가설 , 연구를 위한 가설 , 입증하여 주장하고자하는 가설 002. 검정 ( TESTING ..
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/byQMif/btqOFh7AstF/5chWDxliYwy8GuuzOEKnD1/img.png)
CH5. 추정 01 . 점추정과 구간추정 001. 점추정 ( point estimation ) - 점추정 : 모수를 특정한 수치로 표현하는 것 ex, 30분 - 하나의 값으로 표현하는 것이기 때문에, 틀릴 확률이 多 - 추정량을 통해 모수를 추정 002. 추정치와 추정량 1. 추정치 ( estimate ) : 모수를 추정하기 위해 선택된 표본을 대상으로 구체적으로 도출된 통계량 2. 추정량 ( estimator ) : 표본에서 관찰된 값으로 추정치를 계산하기 위한 도출 함수 003. 바람직한 점 추정량 조건 1. 평균 오차제곱 : 평균 오차 제곱이 최솟값이어야 한다. - 오차 ( 평균 - 측정치 )의 평균이 최소가 되어야 하는 것 = 평균에 가깝다 와 같은 의미 2. 불편성 : 추정량이 모수와 같아야 한..
※ 디자인 패턴 ※ - 서브 시스템 상세 구현에 대한 공식 - 생성 패턴 / 구조 패턴 / 행위패턴 01 . 생성 패턴 - 생성패턴 : 객체 생성에 대한 패턴, 캡슐화 / 유연성이 목표 1. 추상 팩토리 ( Facotry ) : 객체 생성 코드가 상위 클래스에 존재, 하위(구체화) 클래스가 받아씀 - 구체적인 클래스에 의존하지 않고 서로 연관되거나 의존적인 객체들의 조합을 만드는 인터페이스를 제공하는 패턴으로 이 패턴을 통해 생성된 클래스에는 사용자에게 인터페이스(API)를 제공하고, 구체적인 구현은 concrete product 클래스에서 이루어지는 특성을 갖는 패턴 2. 팩토리 메소드 ( method ) : 객체 생성코드를 하위 클래스에서 구체화하는 것. 상위 클래스는 인터페이스만 제공 - 상위클래스..