Регулярка — это описание того, как выглядит искомый текст. Самый простой шаблон — буквальный текст (литерал): он ищет сам себя.
Шаблон cat найдёт «cat» в строках «cat», «cats», «scatter» — везде, где встречается эта последовательность букв.
Регулярки решают две главные задачи: • поиск/проверка — есть ли в тексте совпадение с шаблоном; • замена — найти по шаблону и заменить на другое.
Большинство символов в шаблоне означают сами себя. Но некоторые символы — специальные (метасимволы), они имеют особый смысл:
. ^ $ * + ? ( ) [ ] { } \ |
Например, точка . означает «любой символ», а не саму точку. Чтобы искать буквальный спецсимвол, его экранируют обратным слешем:
\. — именно точка \? — именно знак вопроса \$ — именно доллар
Это первое ключевое правило: обычные символы ищут себя, метасимволы имеют особое значение, а экранирование \ возвращает метасимволу буквальный смысл.