Insight to Ptofitc [python 실무] 파이썬 공백 기준 단어 분리 (split)

[python 실무] 파이썬 공백 기준 단어 분리 (split)

2022. 4. 2. 14:451. Data Analyst/1-1. Python

728x90
반응형

Goal: split을 이용해 문장을 공백 기준으로 단어 나누기

 

 

 

shortword라는 변수 안에 담긴 데이터.

 

상황: 여러 단어가 구분 없이 담겨있음

목표: 공백 기준으로 단어 구분해주기


re.split('A',B)

 

해결방법1

re.split('A', B)

A: 구분 기준

ex) 줄바꿈 기준으로 분리: '\n'

B: 구분할 것(텍스트)

ex) shortword(위의 예시)

 

 

 

분리가 되긴 했지만 지저분하게 분리되었다. 특히 ", .

이렇게 분리된 이유는

분리할 기준은 띄어쓰기 한 칸(공백): " "이고

공백과 공백사이까지 표현되었기 때문이다. 

 

즉, A(공백)B => A, B

A(공백)(공백)B => A, (공백)과(공백)사이(즉,''), B

 

 


위의 방법보다 훨씬 더 간단히 할 수 있는 방법이 있다.

 

 

.split()

해결방법2:

A.split()

A: 구분할 것(텍스트)

결과는 같음

728x90
반응형