일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- Window Function
- airflow
- t분포
- inner join
- 자연어 논문 리뷰
- update
- 자연어처리
- LSTM
- torch
- 자연어 논문
- 카이제곱분포
- leetcode
- sigmoid
- 서브쿼리
- 코딩테스트
- CASE
- NLP
- 그룹바이
- GRU
- SQL 날짜 데이터
- sql
- 논문리뷰
- 설명의무
- HackerRank
- 짝수
- SQL코테
- Statistics
- nlp논문
- MySQL
- 표준편차
- Today
- Total
목록DATA ANALYSIS (78)
HAZEL
린분석 : 스타트업이 지향해야 하는 목표를 추적하기 위해서 알아야 하는 지표에 관한 내용 린분석을 읽고 정리한 내용입니다. CHAPTER 1. 우리는 모두 거짓말쟁이 직감은 영감을 준다. 직감은 중요하다. 단, 직감을 테스트할 필요는 있다. 직감이 실험이라면 데이터는 증거다. 제품이나 기능을 구현한 후에 효과를 측정하고 거기에서 교훈을 얻은 다음 더 좋은 제품을 구축할 수 있게 되었다. 경영학의 대가 피터 드러커는 “측정할 수 없는 것은 관리할 수 없다”라는 유명한 말을 남겼다. CHAPTER 2. 다양한 지표 분석의 본질은 사업에서 매우 중요한 지표를 추적하는 것이다. 좋은 지표란 어떤 것인가 좋은 지표의 특징 좋은 지표는 상대적이다.지난 주보다 전환율이 증가했다’ 가 ‘전환율이 2%이다’ 보다 더 좋..
세미나 주제 : 데이터 실험 문화의 핵심 : A/B 테스트 주최 : 월간 데이터리안 일시 : 2022.11.08 화 7시-9시 세미나 자료 ( 아래 이미지 출처 ) : https://www.datarian.io/blog/slide-webinar-nov 당근마켓 기술 블로그 직관만 믿고 까물었다가 망한 PM의 사연 알아두면 쓸데있는 잡다한 A/B테스트 이야기 1. 직관만 믿고 까물었다가 망한 PM의 사연 참고 : 당근마켓 기술 블로그 A/B 테스트 없이 '키워드 알림 등록 버튼을 변경하는 기획 진행 당근마켓 ( 중고거래 특성상 ) 원하는 매물을 찾기까지 유저가 많은 탐색을 하는 특성을 가지고 있으며, 일반 유저들이 글을 쓰기 때문에 제목 또한 불친절합니다. 그래서 검색관점에서 난이도가 높은 도메인입니다. ..
데이터를 다루기 위해, 여러 변수를 만지다 보면, groupby가 굉장히 유용하다는 것을 느낀다. 그래서, 기초부터 응용 버전까지 한 번에 정리하려고 한다. 0. Groupby 란, SQL groupby 명령어와 같은 느낌인데, 데이터를 split -> apply -> combine 하는 과정을 거쳐서 연산한다. 아래에서 다양한, 그룹바이 예시를 하기 위해서 데이터 프레임을 만들어 준다. 1. groupby를 하는 방법 : 기본적인 groupby 01. 한개 열을 기준으로 groupby : 집계 그룹바이는, 그룹 바이만 하면 안 되고, 집계 함수를 같이 써주어야 내가 원하는 데이터 프레임 형태가 된다. 묶어 주고 싶은 컬럼을 by = [' col ' ] 넣어주면 된다. by는 생략해도 된다. 아래 코드는..
- 문제 설명 ANIMAL_OUTS 테이블은 동물 보호소에서 입양 보낸 동물의 정보를 담은 테이블입니다. ANIMAL_OUTS 테이블 구조는 다음과 같으며, ANIMAL_ID, ANIMAL_TYPE, DATETIME, NAME, SEX_UPON_OUTCOME는 각각 동물의 아이디, 생물 종, 입양일, 이름, 성별 및 중성화 여부를 나타냅니다. NAMETYPENULLABLE ANIMAL_ID VARCHAR(N) FALSE ANIMAL_TYPE VARCHAR(N) FALSE DATETIME DATETIME FALSE NAME VARCHAR(N) TRUE SEX_UPON_OUTCOME VARCHAR(N) FALSE 보호소에서는 몇 시에 입양이 가장 활발하게 일어나는지 알아보려 합니다. 0시부터 23시까지, 각..
상황 아래 데이터와 같이, 데이터프레임의 각 값에는 딕셔너리로 들어가 있다. 딕셔너리 데이터 중, user_seq를 뽑아서 하나의 컬럼으로 만들고 싶다. 해결 과정 1. 데이터의 형태를 좀더 깊게 보니, 딕셔너리를 형태를 " " 로 감싸져있어서, 타입이 string 이었다. 2. 따라서, 이부분을 먼저 dict형태로 변경시켜줘어야 한다. : 변경하는 방법은 json 라이브러리를 불러와서, json.loads() 를 해주는 것이다. 그러면 아래와 같이, ' ' 는 사라지고, 타입이 dict 로 변하게 된다. 3. 이때, dict 여서, 단순히 아래와 같이 코드를 짜면, 에러가 발생하게 된다. data['af_user_seq'] 위와 같이, 분명이 딕셔너리 keys 에는 존재하는데, 없다고 뜬다.. 이 부분..
에러 코드 Traceback (most recent call last): File "/tmp/pycharm_project_578/main.py", line 115, in main() File "/tmp/pycharm_project_578/main.py", line 95, in main pv = user_action_df.select(col('metaData.responseTotalCount')) File "/usr/lib/spark/python/pyspark/sql/dataframe.py", line 1320, in select jdf = self._jdf.select(self._jcols(*cols)) File "/usr/lib/spark/python/lib/py4j-src.zip/py4j/java_g..
boostcourse 의 파이토치로 시작하는 딥러닝 기초 강의를 듣고 정리한 내용입니다. 더보기 https://www.boostcourse.org/opencourse 1. 활성화 함수란? : 입력된 데이터의 가중 합을 출력 신호로 변환하는 함수이다. Linear 한 layer를 쌓으면, linear한 연산만 가능한데, 활성화 함수를 통해 비선형 특성을 가할 수 있게 된다. 1. Sigmoid 1 ) Sigmoid 란? 시그모이드 함수의 반환값(y축)은 흔히 0에서 1까지의 범위를 가진다. 또는 -1부터 1까지의 범위를 가지기도 한다. sigmoid가 이진 분류에서 사용될 경우, 0 ~ 1 사이의 실수 값을 출력값으로 가진다. 따라서, 0.5를 기준으로 첫 번째 class와 두 번째 class를 나눈다. ..
boostcourse 의 파이토치로 시작하는 딥러닝 기초 강의를 듣고 정리한 내용입니다. 더보기 더보기 https://www.boostcourse.org/opencourse 1. 신경 세포(뉴런) : 여러 신호를 받아, 하나의 신호를 만들어 전달하는 역할. 출력을 내기전에 활성 함수(activation function)을 통해 비선형 특성을 가할 수 있다. 앞 단계에서는 linear한 연산만 가능한데, 활성화 함수를 통해 비선형 특성을 가할 수 있게 된다. : node는 단일 뉴런 연산 , edge는 뉴런의 연결성의 의미한다. : 활성화 함수의 특징은 선형 함수가 아닌 비선형 함수여야 한다는 것이다. 2. 얕은 신경망 ( Shallow Neural Network ) : input layer, hidden..
>> 문제 You did such a great job helping Julia with her last coding contest challenge that she wants you to work on this one, too! The total score of a hacker is the sum of their maximum scores for all of the challenges. Write a query to print the hacker_id, name, and total score of the hackers ordered by the descending score. If more than one hacker achieved the same total score, then sort the re..
>> 문제 Weather Observation Station 17 Query the Western Longitude (LONG_W)where the smallest Northern Latitude (LAT_N) in STATION is greater than 38.7780. Round your answer to decimal places. -> LONG_W 을 소수점 4자리까지 가져와라. 조건 1, LAT_N이 38.7780 보다 큰 것 조건 2 . 조건 1중에 가장 작은 LAT_N이다. Input Format The STATION table is described as follows: where LAT_N is the northern latitude and LONG_W is the western lon..