반응형
이번 포스팅에서는 단어 경계, 문장 경계를 나타내는 정규 표현식에 대해서 알아보도록 하겠다.
단어 경계
아래와 같은 문장이 있고 is를 입력하면 알파벳 is가 사용된 부분이 모두 선택된다.
이 때 띄어쓰기 조건을 추가로 사용하고 싶다면 \b, \B를 사용하면 된다.
\b : 단어의 경계인 위치
\B : 단어의 경계가 아닌 위치
ex) 위의 문장에서 is가 be동사로 쓰인 곳만 찾기 (앞 뒤로 띄어쓰기)
ex) 위의 문장에서 His만 찾기
ex) 위의 문장에서 island만 찾기
반응형
문장 경계
단어가 아닌 문장의 경계를 나타낼 때에는 캐럿(^)과 달러 기호($)를 사용한다.
^ : 문장의 시작점
$ : 문장의 끝 지점
캐럿(^)은 집합 안에서는 부정의 의미로 사용되는 메타 문자이지만, 집합 밖에서 쓰이면 경계의 의미를 갖는다는 것도 함께 알아두면 좋을 것 같다.
ex) 문장 경계를 표시하여 He is만 선택
추가로 알아두어야 할 점은 플래그 옵션 중에서 m의 추가 여부에 따라 결과값이 달라진다는 것이다. 플래그 옵션 m을 사용하면 줄바꿈이 된 지점 또한 문장의 경계로 인식한다. m을 사용하지 않으면 줄바꿈을 문장의 경계로 인식하지 않는다.
ex) 플래그 옵션 m을 사용하지 않았을 때 (줄바꿈된 He is를 선택하지 않음)
반응형
'프로그래밍 언어 & 데이터베이스 > 정규 표현식' 카테고리의 다른 글
정규 표현식 - 플래그란? 몇가지 플래그 옵션 소개 (0) | 2023.07.07 |
---|---|
정규 표현식 - 하위 표현식 (0) | 2023.07.06 |
정규 표현식 - 수량자 (0) | 2023.07.04 |
정규 표현식 - 이스케이핑 (0) | 2023.07.04 |
정규 표현식 - 문자 클래스, 메타 문자 (0) | 2023.07.04 |
댓글