Вход/Регистрация
Искусство программирования для Unix
вернуться

Реймонд Эрик Стивен

Шрифт:

3. Расширенные регулярные выражения. Запись, принятая в расширенной версии grep, egrep(1) для извлечения из файла строк, соответствующих заданному регулярному выражению. Регулярные выражения в Lex и редакторе Emacs весьма близки к egrep-разновидности.

Таблица 8.1. Примеры регулярных выражений

Регулярное выражение

Соответствующая строка

"х.у"

x, за которым следует любой символ с последующим у

"х\.у"

х, за которым следует точка с последующим у

"xz?y"

х, за которым следует не более одного символа z с последующим у, т.е. "ху" или "xzy", но не "xz" или "xdy"

"xz*y"

х, за которым следует любое количество символов z, за которыми сле-дуету,т.е. "ху" или "xzy" или "xzzzy",HOне "xz" или "xdy"

"xz+y"

X за которым следует один или несколько экземпляров символа z, за которыми следует у, т.е. "xzy" или "xzzy",HOHe "ху", "xz" или "xdy"

"stxyz]t"

s, за которым следует любой из символов х, у или z, за которым следует t, т.е. "sxt", "syt" или "szt",HOHe "st" или "sat"

"a[x0-9]b"

а, за которым следует либо х, либо символ в диапазоне 0 - 9, за которым следует Ь, то есть, "axb", "аОЪ" или "а4Ь",ноне "ab" или "aab"

»s[

A

xyz] t"

s, за которым следует любой символ, кроме х, у или z, за которым следует t, т.е. "sdt" или "set", но не "sxt", "syt" или "szt"

"S [

A

x0-9] t"

s, за которым следует любой символ, кроме х или символа в диапазоне 0 - 9, за которым следует t, т.е. "sit" или " smt", но не " sxt", " s 01" или "s4t"

х в начале строки, т.е. "xzy" или "хггу",ноне "yzy" или "уху"

"x$"

х в конце строки, т.е. "yzx" или "ух", но не "yxz" или " zxy"

4. Регулярные выражения языка Perl. Форма записи, принятая в regexp-функциях языков Perl и Python. Выражения этого типа являются более мощными по сравнению с egrep-вариантом.

После рассмотрения основных примеров в таблице 8.2 приведена сводка стандартных шаблонов для регулярных выражений. Следует отметить, что в таблицу не включен вариант выражений-масок, поэтому запись "для всех" означает только Зтипа: базовый, расширенный/Emacs и Perl/Python.

Стандарт POSIX для регулярных выражений вводит некоторые символьные диапазоны, такие как [[ilower;; ] ] и [ [ :digit: ] ]. Кроме того, отдельные специфические средства используют дополнительные символы-шаблоны, не описанные здесь. Однако для интерпретации большинства регулярных выражений приведенных примеров достаточно.

Таблица 8.2. Введение в операции с регулярными выражениями

Символ-шаблон

Поддерживается

Соответствующая строка

\

во всех

Начало евсаре-последовательности. Определяет, следует ли интерпретировать последующий знак как шаблон. Последующие буквы или цифры интерпретируются различными способами в зависимости от программы

во всех

Любой символ

во всех

Начало строки

$

во всех

Конец строки

[...]

во всех

Любой из символов, указанных в скобках

Г.. ]

во всех

Любые символы,

кроме указанных

в скобках

  • Читать дальше
  • 1
  • ...
  • 95
  • 96
  • 97
  • 98
  • 99
  • 100
  • 101
  • 102
  • 103
  • 104
  • 105
  • ...

Ебукер (ebooker) – онлайн-библиотека на русском языке. Книги доступны онлайн, без утомительной регистрации. Огромный выбор и удобный дизайн, позволяющий читать без проблем. Добавляйте сайт в закладки! Все произведения загружаются пользователями: если считаете, что ваши авторские права нарушены – используйте форму обратной связи.

Полезные ссылки

  • Моя полка

Контакты

  • chitat.ebooker@gmail.com

Подпишитесь на рассылку: