Язык программирования Perl, Шохирев Михаил Васильевич

Язык программирования Perl

на обложку

Шохирев Михаил Васильевич

Шрифт:

Дополнительные сведения о хэшах можно узнать из справочной документации, обратившись к разделу о типах данных:

perldoc perldata

Хэши - это, наверное, самая популярная структура данных при программировании на Perl. Без них не обходится ни одна серьезная программа, ведь их применение делает многие алгоритмы проще, а программу - понятнее. Материал этой лекции показывает, насколько удобно и просто пользоваться хэшами. Особенный интерес представляет возможность хранения в ассоциативных массивах ссылок на другие структуры данных: массивы, хэши, объекты, подпрограммы. Это позволяет создавать сложные динамические структуры данных, о чем будет сказано в лекции 11,

посвященной ссылкам.

Лекция 7. Текст, строки и символы

В этой лекции описываются средства работы с текстовой информацией, символьными и строковыми данными, которыми славится язык Perl, начиная с самых первых версий.

Цель лекции: получить углубленные знания о символьных и строковых данных в Perl и освоить специфические приемы работы с ними для успешного решения задач обработки текстовой информации.

Язык программирования Perl, в первую очередь, получил широкую известность как средство обработки текстовой информации - удобное, быстрое, мощное, гибкое. Ларри Уолл создал Perl, чтобы облегчить свою жизнь, когда ему, молодому системному администратору, пришлось заниматься обработкой больших объемов данных, преимущественно текстовых. Удобство работы с текстом заложено практически во всех языковых конструкциях: например, строковый контекст включает автоматическое преобразование чисел и ключей хэша к строкам. В систему программирования Perl встроены необходимые функции для работы с символьной информацией. Наверное, самое мощное средство работы с текстовой информацией - обработка регулярных выражений - эффективно реализована в ядре Perl. Дополнительные средства обработки текста реализованы в стандартных библиотеках. Еще больше функций и классов для работы с текстовыми данными можно найти в модулях из репозитория CPAN.

Текстовая информация хранится в Perl-программе в скалярных переменных. Поскольку Perl не накладывает искусственных ограничений на использование ресурсов компьютера, обычная практика в программах на Perl - считывание всего текста из файла вместе с разделителями строк в одну скалярную переменную, чтобы затем эффективно обработать его. Поэтому в Perl переменные, содержащие символьные данные, называют "строковыми" лишь для краткости, чтобы не говорить "скалярная переменная, содержащая строковое значение".

Уже известные из лекции 2 строковые литералы, заключаемые в апострофы и двойные кавычки, могут записываться в альтернативной форме:

'строка в апострофах' или q(строка в апострофах)

"строка в кавычках" или qq(строка в кавычках)

Подобно литеральному списку слов qw, упомянутому в лекции лекции 5, строковые литералы в этом формате могут ограничиваться разными скобками и практически любыми парными символами: , {}, [] , <>, //, \\, !! и так далее. Конечно, применение в качестве ограничителей строк таких символов, как &&, ||, %%, ##, '' или $$, допустимо, но не рекомендуется, поскольку может ввести в заблуждение читателя программы. Правила интерполяции действуют и на эту форму записи строковых литералов.

В Perl есть особенные строки, очень похожие на литералы: это строки, заключенные в обратные апострофы (back-quotes, backticks) ``, для которых также есть эквивалентная запись в виде qx. Особенность таких строк заключается в том, что их содержимое рассматривается как синхронный вызов внешней программы или команды операционной системы, которая выполняется во время работы Perl-программы. Фактически это операция выполнения программы. Результат выполнения указанной внешней программы становится значением конструкции qx. При этом в ней производится интерполяция. Так, например, в среде MS Windows или Linux с помощью команды dir можно получить список MP3-файлов и поместить

его в переменную:

$music_files = `dir *.mp3`; # или qx(dir \*.mp3)

Таким же образом можно легко воспользоваться услугами любой другой программы. Недаром Perl часто называют "склеивающим языком" (glue language): с помощью Perl-программы можно обращаться к имеющимся программам, получать результат их выполнения и обрабатывать его по усмотрению программиста. Так, упомянутый в лекции 1 прием использования программ-фильтров получил в Perl дальнейшее развитие. Другие примеры использования операции выполнения программы приведены в лекции 16.

Встречается еще один тип строковых литералов, называемых V-строки ("V-strings" - строки версий), хотя он считается устаревшим и может не поддерживаться в будущем.

v1.20.300.4000 # то же, что "\x{1}\x{14}\x{12c}\x{fa0}"

v9786 # "смайлик" ? (символ Unicode \x{263A})

v79.107.33 # строка 'Ok!'

79.107.33 # в литерале с несколькими точками можно без "v"

V-строки полезны для сравнения "номеров" версий с помощью операций строкового сравнения, например:

$version = v5.8.7;

print "Версия подходит\n" if $version ge v5.8.0;

V-строки иногда также применяются для записи сетевых адресов IPv4, например: v127.0.0.1.

Кроме escape-последовательностей, описанных в лекции 2, в Perl есть особые управляющие последовательности, предназначенные для преобразования символов в строковом литерале. Они приведены в таблице 7.1. С их помощью преобразуется либо один символ, следующий за escape-последовательностью, либо несколько символов до отменяющей последовательности.

Таблица 7.1. Преобразующие escape-последовательности

Управляющая последовательность	Мнемоника символа	Преобразование
\u	Upper case	преобразовать следующий символ к верхнему регистру
\l	Lower case	преобразовать следующий символ к нижнему регистру
\U	Upper case	преобразовать символы до \E к верхнему регистру
\L	Lower case	преобразовать символы до \E к нижнему регистру
\Q	Quote	отменить специальное значение символов вплоть до \E
\E	End	завершить действие \U или \L или \Q

Применение этих преобразующих escape-последовательностей можно проиллюстрировать такими примерами:

use locale; # для правильной обработки кириллицы

$name = 'мария'; # будем преобразовывать значение переменной

print "\u$name"; # будет выведено: Мария

print "\U$name\E"; # будет выведено: МАРИЯ

print "\Q$name\E"; # будет выведено: \м\а\р\и\я

Аналогичного результата можно достигнуть при использовании некоторых строковых функций, о которых пойдет речь далее в этой лекции.

1-20 21 22 23 24 25 26 27 28 29 30 31 32-82

В зоне особого внимания

Иванов Дмитрий

12. Девяностые

Фантастика:

попаданцы

альтернативная история

5.00

рейтинг книги

Вечный Данж. Трилогия

Матисов Павел

Фантастика:

фэнтези

юмористическая фантастика

6.77

рейтинг книги

Холодный ветер перемен

Иванов Дмитрий

7. Девяностые

Фантастика:

попаданцы

альтернативная история

6.80

рейтинг книги

Повелитель механического легиона. Том I

Лисицин Евгений

1. Повелитель механического легиона

Фантастика:

фэнтези

попаданцы

аниме

5.00

рейтинг книги

Целитель

Первухин Андрей Евгеньевич

1. Целитель

Фантастика:

фэнтези

попаданцы

5.00

рейтинг книги

Золушка вне правил

Шах Ольга

Любовные романы:

любовно-фантастические романы

6.83

рейтинг книги

авторы

Жанры

Деловая литература

Детективы

Детские

Документальная литература

Дом и Семья

Драматургия

Жанр не определен

Компьютеры и Интернет

Любовные романы

Научно-образовательная

Поэзия

Приключения

Проза

Прочее

Религия и эзотерика

Справочная литература

Старинная литература

Техника

Фантастика

Фольклор

Юмор

Язык программирования Perl

Шохирев Михаил Васильевич

Шрифт:

В зоне особого внимания

12. Девяностые

Фантастика:

попаданцы

альтернативная история

рейтинг книги

Вечный Данж. Трилогия

Фантастика:

фэнтези

юмористическая фантастика

рейтинг книги

Холодный ветер перемен

7. Девяностые

Фантастика:

попаданцы

альтернативная история

рейтинг книги

Повелитель механического легиона. Том I

1. Повелитель механического легиона

Фантастика:

фэнтези

попаданцы

аниме

рейтинг книги

Целитель

1. Целитель

Фантастика:

фэнтези

попаданцы

рейтинг книги

Золушка вне правил

Любовные романы:

любовно-фантастические романы

рейтинг книги

Свадьба по приказу, или Моя непокорная княжна

Любовные романы:

любовно-фантастические романы

рейтинг книги

Мифы и Легенды. Тетралогия

Мифы и Легенды

Фантастика:

фэнтези

рпг

альтернативная история

рейтинг книги

Газлайтер. Том 4

4. История Телепата

Фантастика:

попаданцы

альтернативная история

аниме

рейтинг книги