Добавил:

dipro Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

МИРЭА - Российский технологический университет

Предмет:

Программирование на Python

Файл:

Васильев Ю. - Python для data science (Библиотека программиста) - 2023.pdf

Скачиваний:

Добавлен:

07.04.2024

Размер:

7.21 Mб

Скачать

☆

<<< < Предыдущая 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 7475 / 7675 76 > Следующая >>>

268 Глава 12. Машинное обучение для анализа данных

она, упадет или останется прежней. Выяснить это можно, изучив столбец priceRise в строке для следующего дня, который можно получить с помощью команды df['priceRise'].shift(-1). Отрицательный сдвиг смещает будущие значения назад во времени. На основе этого сдвига можно создать новый столбец со значением -1, если цена падает, 0, если цена остается прежней, и 1, если цена растет. Вот как это делается:

conditions = [

(df['priceRise'].shift(-1) > 0.01), (df['priceRise'].shift(-1)< -0.01)

]

choices = [1, -1]

df['Pred'] = np.select(conditions, choices, default=0)

Алгоритм, реализованный выше, исходит из следующих предположений:

1.Увеличение цены более чем на 1% по отношению к стоимости акции в следующий день расценивается как повышение (1).

2.Снижение цены более чем на 1% по отношению к стоимости акции в следующий день расценивается как падение (-1).

3.Остальные случаи расцениваются как стагнация (0).

Для реализации алгоритма мы задаем список conditions, который проверяет данные в соответствии с пунктами 1 и 2 , а также список choices со значениями 1 и -1 для обозначения роста или падения цены . Затем мы передаем эти два списка в функцию NumPy select() , которая создает массив, выбирая значения из choices на основе значений в conditions. Если ни одно из условий не выполняется, в соответствии с пунктом 3 по умолчанию используется значение 0. Сохраняем массив в новом столбце Pred датафрейма, который можно использовать в качестве выходных данных для обучения и тестирования модели. По сути, -1, 0 и 1 теперь являются классами, из которых модель будет делать выбор при классификации новых данных.

Обучение и оценка модели

Для обучения модели scikit-learn требуется представить входные и выходные данные в отдельных массивах NumPy. Создаем массивы из датафрейма df:

features = df[['priceRise','volumeRise','priceRise_idx','volumeRise_idx']].to_numpy() features = np.around(features, decimals=2)

target = df['Pred'].to_numpy()

Прогнозирование тенденций фондового рынка 269

Массив features теперь содержит четыре независимые переменные (входные данные), а массив target — одну зависимую переменную (выходные данные). Далее можно разделить данные на обучающий и тестовый наборы и обучить модель:

from sklearn.model_selection import train_test_split

rows_train, rows_test, y_train, y_test = train_test_split(features, target, test_size=0.2)

from sklearn.linear_model import LogisticRegression clf = LogisticRegression()

clf.fit(rows_train, y_train)

Так же как в примере с анализом тональности, приведенном в начале главы, мы используем функцию scikit-learn train_test_split() для разделения датасета по схеме 80/20, а для обучения модели используем классификатор LogisticRegression. Далее передаем тестовую часть датасета в метод классификатора score() для оценки его точности:

print(clf.score(rows_test, y_test))

Результат будет приблизительно таким:

0.6274509803921569

Он означает, что примерно в 62% случаев модель верно предсказала тенденции для акций Apple на следующий день. Разумеется, у вас может получиться другая цифра.

УПРАЖНЕНИЕ № 20: ЭКСПЕРИМЕНТИРУЕМ С РАЗЛИЧНЫМИ АКЦИЯМИ

И НОВЫМИ МЕТРИКАМИ

Продолжая наш пример, поэкспериментируйте с различными акциями и попробуйте использовать новые метрики, полученные из данных об акциях, в качестве дополнительных независимых переменных, чтобы повысить точность модели. Возможно, вам пригодятся метрики, выведенные в главе 10.

<<< < Предыдущая 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 7475 / 7675 76 > Следующая >>>

Соседние файлы в предмете Программирование на Python

#
07.04.20247.83 Mб1Elementary Mechanics Using Python- 2015.pdf
#
07.04.20246.11 Mб0Parvez Ahmed - The Ultimate Python Quiz Book - 2024.pdf
#
07.04.202411.31 Mб2primer_on_scientific_programming_with_python.pdf
#
07.04.202414.71 Mб5Python. Полное руководство [2022] Кольцов Д.М..pdf
#
07.04.202420.51 Mб2Бэрри П. - Изучаем программирование на Python (Мировой компьютерный бестселлер) - 2022.pdf
#
07.04.20247.21 Mб6Васильев Ю. - Python для data science (Библиотека программиста) - 2023.pdf
#
07.04.20248.59 Mб3Внутри CPython гид по интерпретатору Python.pdf
#
07.04.202414.76 Mб3Воган Ли - Python для хакеров (Библиотека программиста) - 2023.pdf
#
07.04.202412.74 Mб2Марченко А. Л. - Python, большая книга примеров - 2023.pdf
#
07.04.20242.73 Mб4Мокеев В.В. - WEB-аналитика на Python - 2020.pdf
#
07.04.20246.73 Mб4Практическое введение в основные библиотеки и фреймворки Python 2023.pdf