120 практических задач
Шрифт:
4. Компиляция и обучение: Модель компилируется с использованием оптимизатора Adam и функции потерь Sparse Categorical Crossentropy. Затем модель обучается на тренировочных данных.
5. Оценка и тестирование: После обучения модель оценивается на тестовых данных, и визуализируется точность на тренировочном и валидационном наборах данных.
Эта структура сети может быть расширена и усложнена в зависимости от задачи и доступных данных.
Построение модели
Создание последовательной
Для создания сложной сверточной нейронной сети (CNN) мы будем использовать последовательную модель `Sequential` из библиотеки Keras. Этот тип модели позволяет добавлять слои один за другим, что упрощает процесс построения и настройки сети.
Добавление сверточных слоев
Сверточные слои (Conv2D) являются основным элементом CNN. Они применяют фильтры к входному изображению, чтобы выделить различные признаки, такие как края, текстуры и другие важные детали. В нашем примере мы добавляем три сверточных слоя:
1. Первый сверточный слой:
```python
model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)))
```
– 32 фильтра: Каждый фильтр будет извлекать определенный признак из изображения.
– Размер фильтра 3x3: Это небольшой размер, который хорошо подходит для выделения мелких деталей.
– Функция активации ReLU: Rectified Linear Unit (ReLU) помогает сети обучаться нелинейным отношениям между признаками.
– input_shape=(32, 32, 3): Указываем форму входных данных (32x32 пикселя, 3 цветовых канала).
2. Второй сверточный слой:
```python
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
```
–64 фильтра: Увеличиваем количество фильтров, чтобы сеть могла извлекать более сложные признаки.
3. Третий сверточный слой:
```python
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
```
– Дополнительный сверточный слой для дальнейшего выделения признаков.
Добавление слоев подвыборки (Pooling)
Слои подвыборки (MaxPooling2D) уменьшают размерность выходных данных от сверточных слоев, что снижает вычислительную сложность и помогает избежать переобучения. Они выбирают максимальное значение из каждого подмассива данных, тем самым сохраняя наиболее значимые признаки.
1. Первый слой подвыборки:
```python
model.add(layers.MaxPooling2D((2, 2)))
```
– Размер пула 2x2: Снижение размерности выходных данных в два раза по каждой оси.
2. Второй слой подвыборки:
```python
model.add(layers.MaxPooling2D((2, 2)))
```
– Дополнительный слой подвыборки для дальнейшего уменьшения размерности данных.
Добавление полносвязных слоев (Fully Connected Layers)
После извлечения признаков из изображений с помощью сверточных и подвыборочных слоев, мы используем полносвязные слои (Dense) для классификации.
1. Приведение данных в одномерный вид:
```python
model.add(layers.Flatten)
```
– Преобразование многомерного выхода сверточных слоев в одномерный вектор.
2. Первый полносвязный слой:
```python
model.add(layers.Dense(64, activation='relu'))
```
– 64 нейрона: Обучение нелинейным комбинациям признаков.
3. Выходной полносвязный слой:
```python
model.add(layers.Dense(10))
```
– 10 нейронов: Каждый нейрон соответствует одному классу из 10 в наборе данных CIFAR-10.
Построенная таким образом сеть состоит из нескольких сверточных слоев для извлечения признаков, слоев подвыборки для уменьшения размерности данных и полносвязных слоев для классификации. Эта архитектура позволяет эффективно решать задачу классификации изображений, выделяя важные признаки и обучаясь на их основе.
5. Построение простой рекуррентной нейронной сети для анализа временных рядов
– Задача: Прогнозирование цен на акции.
Для построения простой рекуррентной нейронной сети (RNN) для анализа временных рядов и прогнозирования цен на акции можно использовать библиотеку TensorFlow и её высокоуровневый интерфейс Keras. В этом примере мы рассмотрим, как использовать LSTM (Long Short-Term Memory) слои, которые являются разновидностью RNN, чтобы построить модель для прогнозирования цен на акции.
Шаги:
1. Импорт библиотек и модулей.
2. Подготовка данных.
3. Построение модели RNN.
4. Компиляция и обучение модели.
5. Оценка и тестирование модели.
Пример кода:
```python
import numpy as np
import pandas as pd
import tensorflow as tf
from tensorflow.keras import layers, models
from sklearn.preprocessing import MinMaxScaler
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt
# Шаг 1: Импорт библиотек
import numpy as np
import pandas as pd
import tensorflow as tf
from tensorflow.keras import layers, models
from sklearn.preprocessing import MinMaxScaler
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt
# Шаг 2: Подготовка данных
# Загрузка данных. Предположим, что у нас есть CSV файл с историческими ценами на акции.
data = pd.read_csv('stock_prices.csv')
# Выбираем интересующие нас столбцы, например, 'Close'
prices = data['Close'].values.reshape(-1, 1)