본문 바로가기
IT/linux

정규 표현식 목록 / Regular expression sheet

by 어느해겨울 2021. 12. 29.

정규 표현식 목록


 

구문 의미/예제
.  임의의 한 문자를 나타냄
 알파벳, 숫자, (-,*)등의 특수문자를 나타냄
[]  비교할 문자의 집합을 나타냄. ex) [abc]는 a,b,c 중에 한 문자를 나타낸다.
*  앞에 지정된 문자는 집합이 0번 이상 반복됨을 의미
+  앞에 지정된 문자나 집합이 1번 이상 반복됨을 의미
?  앞에 지정된 문자는 집합이 없거나, 있을 수 있음
{}  앞에 지정된 문자나 집합의 출현 범위를 지정함
 .{1} : 임의의 문자가 한번 나와야 함
 .{1,10} : 임의의 문자가 최소 1번 최대 10번 나와야 함
 .{,10} : 임의의 문자가 최대 10번 나와야 함
 .{1,} : 임의의 문자가 최소 한 번은 나와야 함
*?, +?, {}?  해당 정규식이 가장 최소로 일치하는 구간을 찾는다.
 <a>1</a> and <a>2</a>를  찾을 경우
 <a>.*</a>는 <a>1</a> and <a>2</a> 전체를
 <a>.*?</a>는 <a>1</a><a>2</a>를 찾는다.
()  하위 표현식, 특정 표현식을 하나의 항목으로 처리함
 abc{2}은 abcc를 나타내지만 (abc){2}는 abcabc를 나타냄
|  OR 조건
 ((abc)|(abd)) 'abc' 나  'abd' 문자열을 가르킴
^  NOT 조건
 []내의 표현된 문자열을 제외하고 찾는다.
 [^0-9] 0에서부터 9사이의 숫자를 제외한 모든 문자
-  범위 지정
 []내에서 문자, 숫자의 범위를 지정한다.
 0-9, 0에서 9까지
 a-z, a,b,c...z까지의 문자
\  이스케이프 문자, 특수한 의미를 갖는 문자를 일반 문자로 표현하기 위해 사용
 . 을 \.로 표현하면 임의의 문자가 아닌 그냥 .을 나타낸다.
[\b]  백 스페이스
\f  페이지 넘김
\n  줄 바꿈
\r  캐리지 리턴
\t  탭
\v  수직 탭
\d  0-9까지의 숫자를 가르킴. [0-9]와 동일
\D  숫자를 제외한 문자하나를 가르킴 [^0-9]
\w  대소문자와 밑줄을 포함하는 영수자
 [a-zA-Z0-9_]와 동일
\W  영숫자나 밑줄이 아닌 모든 문자
 [^a-zA-Z0-9_]와 동일
\s  임의의 공백 문자
 [\f\n\r\t\v]와 동일
\S  공백 문자가 아닌 임의의 문자
 [^\f\n\r\t\v]와 동일
\b  단어의 시작이나, 마지막 경계를 가르킴
 단, 한글 단어는 제외

 

 

댓글