Если известно, что определенный файл содержит текст, то будет более удобно прочитать его с помощью классов StreamReader и
StreamWriter
. Это связано с тем, что эти классы работают на чуть более высоком уровне, и предназначены специально для чтения текста. Методы, которые они реализуют, способны автоматически определять, где находятся удобные точки для остановки чтения, основываясь на содержимом потока. В частности:
□ Эти классы реализуют методы для чтения или записи одной строки текста за раз (
StreamReader.ReadLine
и
StreamWriter.WriteLine
). В случае чтения, это значит, что поток будет автоматически определять, где находится следующий перевод каретки, и остановит чтение в этой точке.
В случае записи это означает, что поток будет автоматически добавлять комбинацию возврата каретки-перевода строки в записываемый текст.
□ При использовании классов
StreamReader
и
StreamWriter
не нужно беспокоиться об использованном в файле кодировании. Кодирование означает формат, который имел текст в содержащем его файле. Возможное кодирование включает ASCII (1 байт для каждого символа), или любой из форматов на основе Unicode, UTF7 и UTF8. Текстовые файлы в системах Windows 9х всегда являются ASCII, так как Windows 9х не поддерживает Unicode, и поэтому текстовые файлы могут теоретически содержать данные Unicode, UTF7 или UTF8 вместо данных ASCII. Соглашение состоит в том, что если файл имеет формат ASCII, значит он содержит текст. Если же любой из форматов Unicode, то он будет указан первыми двумя или тремя байтами файла, которые содержат определенную комбинацию значений для указания формата. Эти байты называются маркерами кода байтов. Когда файл открывается с помощью любого стандартного оконного приложения, такого как Notepad или WordPad, то не нужно беспокоиться об этом, так как эти приложения знакомы с различными методами кодирования и автоматически правильно считывают файл. Это также случай для класса
StreamReader
, который будет правильно считывать файл в любом из этих форматов, в то время как класс
StreamWriter
способен форматировать текст, который он записывает, с помощью любой запрошенной техники кодирования. С другой стороны, если требуется прочитать и вывести текстовый файл с помощью класса
FileStream
, придется все это выполнять самостоятельно.
Класс StreamReader
Класс
StreamReader
используется для чтения текстовых файлов. Создать
StreamReader
проще, чем экземпляр
FileStream
, так как некоторые из параметров
FileStream
не требуются. В частности, режим и тип доступа несущественны, поскольку с помощью
StreamReader
можно только читать. Также не существует непосредственного параметра для определения полномочий общего доступа. Но с другой стороны, существуют и новые параметры:
□ Необходимо определить, что делать с различными методами кодирования. Можно дать инструкцию
StreamReader
проверять маркеры кода байтов в файле, чтобы выяснить метод кодирования, или можно просто приказать
StreamReader
предполагать, что файл использует определенный метод кодирования.
□ Вместо предоставления имени файла для чтения, можно предоставить ссылку на другой поток.
Эта последняя возможность заслуживает дополнительного обсуждения, так как иллюстрирует еще одно преимущество обоснования модели чтения и записи данных вокруг концепции потоков. Поскольку
StreamReader
работает на относительно высоком уровне, может оказаться полезным в ситуации, когда имеется другой поток, который читает данные из некоторого другого источника, использовать средства, предоставляемые
StreamReader
для обработки этого потока, как если бы он содержал текст. Это можно сделать, передавая вывод из этого потока в
StreamReader
. Таким образом,
StreamReader
может использоваться для чтения и обработки данных из любого источника данных, а не только файлов. Это по сути ситуация, которая рассматривалась ранее в отношении класса
BinaryReader
.
Однако в этой книге мы будем использовать
StreamReader
только для прямого соединения с файлами.
В силу указанных возможностей
StreamReader
имеет большое число конструкторов. Помимо этого существует пара методов
FileInfo
, которые также возвращают ссылки на
StreamReader
:
OpenText
и
CreateText
. Здесь мы проиллюстрируем некоторые из конструкторов.
Простейший конструктор получает только имя файла. Этот
StreamReader
будет проверять маркеры кода байтов, чтобы определить кодирование:
StreamReader sr = new StreamReader(@"C:\My Documents\ReadMe.txt");
И наоборот, если желательно определить, предполагается ли кодирование UTF8:
StreamReader sr = new StreamReader(@"C:\My Documents\ReadMe.txt", Encoding.UTF8Encoding);
Мы определяем кодирование, используя одно из нескольких свойств класса,
System.Text.Encoding
. Этот класс является абстрактным базовым классом, из которого определяется ряд классов, которые реализуют методы, реально выполняющие кодирование текста. Каждое свойство возвращает экземпляр соответствующего класса. Здесь можно использовать следующие свойства:
□
ASCII
□
Unicode
□
UTF7
□
UTF8
□
BigEndianUnicode
Следующий пример показывает сцепление
StreamReader
с
FileStream
. Преимущество этого состоит в том, что можно явно определить, создавать ли файл и полномочия совместного доступа, что невозможно сделать, если напрямую соединять StreamReader с файлом:
FileStream fs =
new FileStream(@"C:\My Documents\ReadMe.txt", FileMode.Open,
FileAccess.Read, FileShare.None);
StreamReader sr = new StreamReader(fs);
Для этого примера мы уточняем., что
StreamReader
будет искать маркеры кода байтов, чтобы определись используемый метод кодирования, так он будет делать и в следующих примерах, где
StreamReader
получают из экземпляра
FileInfo
:
FileInfo MyFile = new FileInfo(@"C:\My Documents\ReadMe.txt");
StreamReader sr = MyFile.OpenText;
Также как с
FileStream
, необходимо всегда закрывать
StreamReader
после использования. Невыполнение этого приведет к файлу, остающемуся заблокированным для других процессов (если только для создания
StreamReader
не использовался
FileStream
со спецификацией
FileShare.ShareReadWrite
).
sr.Close;
Теперь мы перешли к проблеме создания экземпляра
StreamReader
. Так же, как с классом
FileStream
, мы просто указываем различные способы чтения данных и оставляем другие, менее часто используемые, методы
StreamReader
для документации MSDN.
Возможно, простейшим в использовании является метод
ReadLine
, который продолжает чтение, пока не доходит до конца строки. Он не включает комбинацию возврат каретки-перевода строки, которая отмечает конец строки в возвращаемой строке:
string NextLine = sr.ReadLine;
Альтернатива — захватить весь остаток файла (или строго говоря, остаток потока) в одной строке: