일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- FDS
- 네이버AItech
- NLP
- 백준
- DeepLearning
- github
- Matplotlib
- leetcode
- NaverAItech
- vscode
- PytorchLightning
- 프로그래머스
- Kubernetes
- torchserve
- Kaggle
- datascience
- autoencoder
- docker
- python
- 코딩테스트
- wandb
- pep8
- 알고리즘
- GIT
- GCP
- 완전탐색
- FastAPI
- GitHub Action
- rnn
- pytorch
- Today
- Total
목록개발/정규표현식 (3)
Sangmun
그루핑 기존 문서에서 설명하였던 메타 문자들만으로는 하나의 문자에만 반복 혹은 규칙을 적용할 수 있었는데 문자열을 그룹핑에서 메타 문자를 적용할 필요가 있을 때 사용하는 것이 그루핑이다. p = re.compile('(ABC)+') m = p.search('ABCABCABC OK?') print(m) print(m.group()) ABCABCABC 위의 예시처럼 (ABC)가 반복되는 구간을 찾을 수 있다. 또한 다음은 전화번호를 탐지하는 정규표현식 패턴인데 이중에서 이름만 뽑아내고 싶다면 아래와 같이 그루핑을 이용할 수 있다. p = re.compile(r"(\w+)\s+\d+[-]\d+[-]\d+") m = p.search("park 010-1234-1234") print(m.group(1)) park..
파이썬에서는 정규표현식을 지원하는 re(regular expression) 모듈이 있으며 기본 모듈임으로 따로 설치할 필요는 없다. 정규표현식을 지정해서 아래와 같이 컴파일을 해서 패턴을 지정해 준다. import re pattern = re.compile('ab*') 1. RE 모듈 기본 함수 문자열을 검색할 수 있는 함수는 아래와 같이 4개가 있다. match() : 문자열의 처음부터 정규식과 매치되는지 조사 search() : 문자열 전체를 검색하여 정규식과 매치되는지 조사 findall() : 정규식과 매치되는 모든 substring을 리스트로 리턴 finditer() : 정규식과 매치되는 모든 substring을 반복 가능한 객체로 리턴 * 예시 아래와 같은 알파벳 소문자가 0부터 ~ 무한대까지..
정규표현식에서의 메타 문자란 원래 의미로 사용되지 않고 특별한 의미로 사용되는 문자를 말한다. 정규표현식에서의 메타 문자는 아래와 같은 것들이 있다. . ^ $ * + ? { } [ ] \ | ( ) 문자 클래스 '[ ]' '[ ]'사이의 문자들과의 매치라는 의미를 가지며 [abc]라는 정규표현식이 있다면 'a,b,c' 중 한개의 문자와의 매치를 의미한다. 예시를 들어보면 아래와 같이 적용이 된다. "a"는 정규식과 일치하는 문자인 "a"가 있으므로 매치 "before"는 정규식과 일치하는 문자인 "b"가 있으므로 매치 "dude"는 정규식과 일치하는 문자인 a, b, c 중 어느 하나도 포함하고 있지 않으므로 매치되지 않음 '[ ]'안의 문자 사이에 하이픈을(-)을 사용하면 범위를 의미한다. 즉 [a-..