HAZEL

[ Pandas ] 데이터프레임 데이터의 '{}' 안에 있는 값 추출하기 본문

DATA ANALYSIS/Python with Data

[ Pandas ] 데이터프레임 데이터의 '{}' 안에 있는 값 추출하기

Rmsid01 2022. 5. 9. 13:45

 

 

상황

아래 데이터와 같이, 데이터프레임의 각 값에는 딕셔너리로 들어가 있다. 

딕셔너리 데이터 중, user_seq를 뽑아서 하나의 컬럼으로 만들고 싶다.

 

해결 과정

 

1. 데이터의 형태를 좀더 깊게 보니, 딕셔너리를 형태를 " " 로 감싸져있어서, 타입이 string 이었다.

 

2. 따라서, 이부분을 먼저 dict형태로 변경시켜줘어야 한다.

: 변경하는 방법은 json 라이브러리를 불러와서, json.loads() 를 해주는 것이다.

그러면 아래와 같이,  ' ' 는 사라지고, 타입이 dict 로 변하게 된다.

 

 

3. 이때, dict 여서, 단순히  아래와 같이 코드를 짜면, 에러가 발생하게 된다.

data['af_user_seq']

 

 

위와 같이, 분명이 딕셔너리 keys 에는 존재하는데, 없다고 뜬다.. 

이 부분을 해결하기 위해서 https://sanghaklee.tistory.com/62 여기 문서를 참고 했다.

 

결론, "get" 함수를 써주어라!

 

 

위와 같이, get 함수를 써주고,  추출해주고 싶은 key 이름을 넣어주면된다.