본문 바로가기

Server

정규 표현식 문법 정리

집합

: 표현하고 싶은 문자를 대괄호([ ])에 넣어서 사용한다.

대괄호 안에 들어간 문자들은 or 연산이 적용되어 집합 안에 있는 문자 중 하나라도 매칭되면 선택된다.

 

 

문장에 있는 모든 숫자를 정규 표현식으로 나타내기

[0123456789]

 

알파벳 중 소문자만 찾기

[abcdefghijklmnopqrstuvwxyz]

 

알파벳 중 대문자만 찾기

[ABCDEFGHIJKLMNOPQRSTUVWXYZ]

 

하이픈

: 문자 사이의 범위를 나타낸다.

 

하이픈 예시)

  • 숫자: [0-9] 
  • 영어 소문자: [a-z] 
  • 영어 대문자: [A-Z] 
  • 한글(자음 모음 조합): [가-힣]

숫자와 대문자 영어 알파벳으로 된 부분들을 모두 선택하기

[0-9A-Z]

 

✔️ 하이픈을 사용해 범위를 지정할 때에는 반드시 아스키코드가 낮은 문자가 왼쪽에, 아스키코드가 높은 문자가 오른쪽에 위치하도록 해야 한다는 점 주의하기!! ✔️

 

캐럿(^)

: 집합 안의 특정 문자들을 제외하여 선택하고 싶을 때 사용한다.

 

문장에서 숫자를 제외한 모든 문자들을 선택하기

[^0-9]

 

 

문자 클래스

: 자주 사용하는 집합들을 좀 더 쉽게 사용할 수 있도록 한 일종의 예약어이다.

보통 백슬래시(\) 뒤에 특정 알파벳을 합쳐서 표기한다.

 

\d

\d는 모든 숫자를 나타내는 집합([0-9])의 예약어이다. 

 

 

\w

\w는 영어 대소문자, 숫자, 언더바(_)를 선택해 준다.

 

✔️<주의해야 할 점!!>✔️

- 언더바는 문자열의 구분자로 사용되기 때문에 함께 선택된다.

-\w는 한글을 포함하지 않는다.

-> 만약 검색하고자 하는 문자열에 한글이 포함된다면 집합 문법을 사용해 [\w가-힣] 형태로 사용해야 한다.

 

\s

: 공백을 나타낸다.

문자와 문자 사이를 구분 짓는 공백(스페이스 바, 탭, 줄바꿈)은 모두 선택된다.

 

 

반응형