본문 바로가기
프로그래밍 언어 & 데이터베이스/정규 표현식

정규 표현식 - 단어 경계, 문장 경계

by ♥︎해이나♥︎ 2023. 7. 5.
반응형

이번 포스팅에서는 단어 경계, 문장 경계를 나타내는 정규 표현식에 대해서 알아보도록 하겠다.

 

정규 표현식

 

단어 경계

아래와 같은 문장이 있고 is를 입력하면 알파벳 is가 사용된 부분이 모두 선택된다.

 

정규표현식 실습

 

이 때 띄어쓰기 조건을 추가로 사용하고 싶다면 \b, \B를 사용하면 된다.

 

\b : 단어의 경계인 위치

\B : 단어의 경계가 아닌 위치

 

ex) 위의 문장에서 is가 be동사로 쓰인 곳만 찾기 (앞 뒤로 띄어쓰기)

 

정규 표현식 실습

 

ex) 위의 문장에서 His만 찾기

 

정규 표현식 실습

 

ex) 위의 문장에서 island만 찾기

 

정규 표현식 실습

 

반응형

 

문장 경계

단어가 아닌 문장의 경계를 나타낼 때에는 캐럿(^)과 달러 기호($)를 사용한다.

 

^ : 문장의 시작점

$ : 문장의 끝 지점

 

캐럿(^)은 집합 안에서는 부정의 의미로 사용되는 메타 문자이지만, 집합 밖에서 쓰이면 경계의 의미를 갖는다는 것도 함께 알아두면 좋을 것 같다.

 

ex) 문장 경계를 표시하여 He is만 선택

 

정규 표현식 실습

 

추가로 알아두어야 할 점은 플래그 옵션 중에서 m의 추가 여부에 따라 결과값이 달라진다는 것이다. 플래그 옵션 m을 사용하면 줄바꿈이 된 지점 또한 문장의 경계로 인식한다. m을 사용하지 않으면 줄바꿈을 문장의 경계로 인식하지 않는다.

 

ex) 플래그 옵션 m을 사용하지 않았을 때 (줄바꿈된 He is를 선택하지 않음)

 

정규 표현식 실습

 

반응형

댓글