Аналитическое сравнение рекуррентных моделей в задаче прогнозирования динамики ценных бумаг

Меркулов, Павел Денисович

Аналитическое сравнение рекуррентных моделей в задаче прогнозирования динамики ценных бумаг

Автор: Меркулов Павел Денисович

Рубрика: Информационные технологии

Опубликовано в Молодой учёный №20 (519) май 2024 г.

Дата публикации: 15.05.2024 2024-05-15

Статья просмотрена: 14 раз

Скачать электронную версию

Скачать Часть 1 (pdf)

Библиографическое описание:

Меркулов, П. Д. Аналитическое сравнение рекуррентных моделей в задаче прогнозирования динамики ценных бумаг / П. Д. Меркулов. — Текст : непосредственный // Молодой ученый. — 2024. — № 20 (519). — С. 5-7. — URL: https://moluch.ru/archive/519/114160/ (дата обращения: 26.04.2025).

В данной статье рассматриваются подходы машинного обучения в задаче анализа и прогнозирования рынка ценных бумаг. В работе сравниваются такие аспекты, как количество занимаемой памяти, число параметров, а также величина затраченного на обучение модели времени. На основе результатов исследования сделано предложение по выбору наиболее подходящего метода с точки зрения предиктивной эффективности.

Ключевые слова :машинное обучение, глубокое обучение,рекуррентные сети, прогнозирование динамики ценных бумаг.

Привлекательность фондового рынка как объекта инвестиций остается неизменной, рынок ценных бумаг служит барометром состояния экономики, отражая результаты деятельности и перспективы компаний различных отраслей и секторов. Прогнозирование динамики фондовых рынков важно для трейдеров и инвесторов, поскольку помогает им принимать обоснованные решения о том, когда покупать, продавать или держать ценные бумаги. Прогнозируя движение цен, они могут потенциально максимизировать свою прибыль и минимизировать убытки. Интеграция методов машинного обучения в совокупности с методами технического анализа временных рядов может значительно повысить точность прогнозирования. В представленной статье проведен сравнительный анализ моделей машинного обучения для прогнозирования динамики фондового рынка.

По итогам анализа литературы по теме для решения поставленной задачи были выделены три типа рекуррентных сетей, а именно LSTM, GRU, CNN-LSTM.

В качестве изначального набора данных в работе используются показатели по акциям технологических компаний. Для составления обучающего набора данных используются закрывающие цены на акции. В процессе предобработки исходный набор дополняется за счет индикаторов технического анализа. Таким образом, целевым значением для модели прогнозирования является закрывающая цена акции, в то время как на вход подаются цена акции и значения технических индикаторов, взятых с временным лагом.

Гиперпараметры, замеры и результаты проведенных c моделями экспериментов были внесены в таблицу 1.

Таблица 1

Таблица сравнения моделей анализа и прогнозирования

Используемые модели
	GRU		LSTM	CNN-LSTM
Гиперпараметры
Входной слой		1x5	1x5	1x5
Размер выборки		16	16	16
Размер скрытого слоя		64	64	64
Замеры
Время		36 сек	45 сек	40 сек
Количество параметров		50433	133761	17229
Память		197.1 Кбайт	522.5 Кбайт	67.3 Кбайт
Результаты
MAE		5.827	6.545	2.919
RMSE		24.786	32.352	12.765
R2		0.947	0.912	0.987

Оценка результатов работы моделей проводилась с использованием метрик оценки, наиболее часто используемых для количественной оценки того, насколько хорошо модель соответствует набору данных, а именно RMSE, MAE и R-squared.

Рисунок 1 отображает результаты прогноза обученных моделей на тестовой выборке.

Рис. 1. Прогнозы моделей на тестовой выборке

Опираясь на полученные результаты, можно сделать вывод о том, что гибридная модель CNN-LSTM показала лучший результат на тестовой выборке данных. Это подтверждается большой сходимостью между предсказаниями модели и фактическими значениями, наблюдаемыми в тестовом наборе. Одним из факторов, который мог способствовать такому относительно хорошему исходу, является то, что слой свертки неплохо справляется с вычленением определенных паттернов временного ряда, а также, что архитектура LSTM сети и гиперпараметры достаточно комплексны, чтобы отразить все нелинейности и закономерности, присутствующие в данных.

Таким образом, в результате сравнительного анализа были выявлены различные сильные и слабые стороны представленных моделей для анализа и прогнозирования динамики ценных бумаг. Так, например, модель управляемого рекуррентного блока обучается быстрее остальных методов и теоретически может приблизиться к результатам при условии должной тонкой настройки. Но все же в качестве самого перспективного алгоритма прогнозирования ценных бумаг можно отметить гибридный подход обучения CNN-LSTM сети на данных, дополненных при помощи инструментов технического анализа, так как данный подход позволяет лучше передавать локальные тонкости временного ряда, обладает высоким потенциалом обобщения и занимает относительно мало памяти.

Так, в работе были рассмотрены способы того, как можно подойти к проблеме прогнозирования акций с помощью машинного обучения, рассматривая данные фондового рынка как временной ряд, а также использовании инструментов технического анализа для аугментации вектора входных значений моделей. Далее были проведены эксперименты на трех существующих алгоритмах, часто используемых для прогнозирования временных рядов: GRU, двунаправленной LSTM и гибридной CNN-LSTM. В работе использовались реальные биржевые данные для прогнозирования цен на акции. На основании представленных моделей был проведен сравнительный анализ эффективности и результативности прогнозов с использованием метрик ошибок RMSE, MAE и R2.

Однако эксперты из финансовой сферы и области искусственного интеллекта утверждают, что методы машинного обучения плохо работают в реальном мире для прогнозирования рынка. Даже если сотни переменных и движущих сил реального рынка будут квантованы, включены в данные и оптимизированы с помощью лучших доступных методов машинного обучения, модель все равно не сможет давать ценные прогнозы, когда они имеют значение. Тем не менее, эти недостатки — лишь кривые обучения в процессе разработки более надежных моделей прогнозирования цен на акции и более детального анализа возможностей существующих моделей.

Литература:

RNN approach to the financial forecast. — Текст: электронный //: [сайт]. — URL: https://iris.univr.it/retrieve/handle/11562/959057/66085/Recurrent (дата обращения: 08.03.2024).
Understanding LSTM Networks. — Текст: электронный //: [сайт]. — URL: https://colah.github.io/posts/2015–08-Understanding-LSTMs/ (дата обращения: 10.03.2024).
Implementation of LSTM and GRU on grouped time-series data to predict stock prices. — Текст: электронный //: [сайт]. — URL: https://journalofbigdata.springeropen.com/articles/10.1186/s40537–022–00597–0 (дата обращения: 11.03.2024).
Stock prediction using GRU. — Текст: электронный //: [сайт]. — URL: https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0262501 (дата обращения: 14.03.2024).

Основные термины (генерируются автоматически): CNN-LSTM, LSTM, машинное обучение, GRU, MAE, RMSE, прогнозирование динамики, технический анализ, модель, фондовый рынок.

Ключевые слова

машинное обучение, глубокое обучение, рекуррентные сети, прогнозирование динамики ценных бумаг

Аналитическое сравнение рекуррентных моделей в задаче прогнозирования динамики ценных бумаг

Библиографическое описание:

Ключевые слова

Похожие статьи

Методы классификации в решении задач нечеткого сравнения текстовых данных

Статистический анализ денежных потоков и стоимостных факторов в целях управления стоимостью корпорации

Системный подход к выбору моделей для предсказания разрушения деталей на основе статистических данных

Разработка модуля прогнозирования цен на товары для онлайн-платформы

Профилактика конфликтного поведения у подростков

Особенности управления финансовыми рисками в девелопменте

Математическое моделирование как инструмент развития социоэкономики

Модификация теории социального влияния Латане для компьютерных социальных сетей

Актуальные экономико-математические методы исследования современных экономических процессов

Исследование проблемы обеспечения конкурентоспособности предприятий в строительной отрасли

Похожие статьи

Методы классификации в решении задач нечеткого сравнения текстовых данных

Статистический анализ денежных потоков и стоимостных факторов в целях управления стоимостью корпорации

Системный подход к выбору моделей для предсказания разрушения деталей на основе статистических данных

Разработка модуля прогнозирования цен на товары для онлайн-платформы

Профилактика конфликтного поведения у подростков

Особенности управления финансовыми рисками в девелопменте

Математическое моделирование как инструмент развития социоэкономики

Модификация теории социального влияния Латане для компьютерных социальных сетей

Актуальные экономико-математические методы исследования современных экономических процессов

Исследование проблемы обеспечения конкурентоспособности предприятий в строительной отрасли

Ответим на ваш вопрос!