В данной статье рассматриваются подходы машинного обучения в задаче анализа и прогнозирования рынка ценных бумаг. В работе сравниваются такие аспекты, как количество занимаемой памяти, число параметров, а также величина затраченного на обучение модели времени. На основе результатов исследования сделано предложение по выбору наиболее подходящего метода с точки зрения предиктивной эффективности.
Ключевые слова :машинное обучение, глубокое обучение,рекуррентные сети, прогнозирование динамики ценных бумаг.
Привлекательность фондового рынка как объекта инвестиций остается неизменной, рынок ценных бумаг служит барометром состояния экономики, отражая результаты деятельности и перспективы компаний различных отраслей и секторов. Прогнозирование динамики фондовых рынков важно для трейдеров и инвесторов, поскольку помогает им принимать обоснованные решения о том, когда покупать, продавать или держать ценные бумаги. Прогнозируя движение цен, они могут потенциально максимизировать свою прибыль и минимизировать убытки. Интеграция методов машинного обучения в совокупности с методами технического анализа временных рядов может значительно повысить точность прогнозирования. В представленной статье проведен сравнительный анализ моделей машинного обучения для прогнозирования динамики фондового рынка.
По итогам анализа литературы по теме для решения поставленной задачи были выделены три типа рекуррентных сетей, а именно LSTM, GRU, CNN-LSTM.
В качестве изначального набора данных в работе используются показатели по акциям технологических компаний. Для составления обучающего набора данных используются закрывающие цены на акции. В процессе предобработки исходный набор дополняется за счет индикаторов технического анализа. Таким образом, целевым значением для модели прогнозирования является закрывающая цена акции, в то время как на вход подаются цена акции и значения технических индикаторов, взятых с временным лагом.
Гиперпараметры, замеры и результаты проведенных c моделями экспериментов были внесены в таблицу 1.
Таблица 1
Таблица сравнения моделей анализа и прогнозирования
Используемые модели |
||||
GRU |
LSTM |
CNN-LSTM |
||
Гиперпараметры |
||||
Входной слой |
1x5 |
1x5 |
1x5 |
|
Размер выборки |
16 |
16 |
16 |
|
Размер скрытого слоя |
64 |
64 |
64 |
|
Замеры |
||||
Время |
36 сек |
45 сек |
40 сек |
|
Количество параметров |
50433 |
133761 |
17229 |
|
Память |
197.1 Кбайт |
522.5 Кбайт |
67.3 Кбайт |
|
Результаты |
||||
MAE |
5.827 |
6.545 |
2.919 |
|
RMSE |
24.786 |
32.352 |
12.765 |
|
R2 |
0.947 |
0.912 |
0.987 |
|
Оценка результатов работы моделей проводилась с использованием метрик оценки, наиболее часто используемых для количественной оценки того, насколько хорошо модель соответствует набору данных, а именно RMSE, MAE и R-squared.
Рисунок 1 отображает результаты прогноза обученных моделей на тестовой выборке.
Рис. 1. Прогнозы моделей на тестовой выборке
Опираясь на полученные результаты, можно сделать вывод о том, что гибридная модель CNN-LSTM показала лучший результат на тестовой выборке данных. Это подтверждается большой сходимостью между предсказаниями модели и фактическими значениями, наблюдаемыми в тестовом наборе. Одним из факторов, который мог способствовать такому относительно хорошему исходу, является то, что слой свертки неплохо справляется с вычленением определенных паттернов временного ряда, а также, что архитектура LSTM сети и гиперпараметры достаточно комплексны, чтобы отразить все нелинейности и закономерности, присутствующие в данных.
Таким образом, в результате сравнительного анализа были выявлены различные сильные и слабые стороны представленных моделей для анализа и прогнозирования динамики ценных бумаг. Так, например, модель управляемого рекуррентного блока обучается быстрее остальных методов и теоретически может приблизиться к результатам при условии должной тонкой настройки. Но все же в качестве самого перспективного алгоритма прогнозирования ценных бумаг можно отметить гибридный подход обучения CNN-LSTM сети на данных, дополненных при помощи инструментов технического анализа, так как данный подход позволяет лучше передавать локальные тонкости временного ряда, обладает высоким потенциалом обобщения и занимает относительно мало памяти.
Так, в работе были рассмотрены способы того, как можно подойти к проблеме прогнозирования акций с помощью машинного обучения, рассматривая данные фондового рынка как временной ряд, а также использовании инструментов технического анализа для аугментации вектора входных значений моделей. Далее были проведены эксперименты на трех существующих алгоритмах, часто используемых для прогнозирования временных рядов: GRU, двунаправленной LSTM и гибридной CNN-LSTM. В работе использовались реальные биржевые данные для прогнозирования цен на акции. На основании представленных моделей был проведен сравнительный анализ эффективности и результативности прогнозов с использованием метрик ошибок RMSE, MAE и R2.
Однако эксперты из финансовой сферы и области искусственного интеллекта утверждают, что методы машинного обучения плохо работают в реальном мире для прогнозирования рынка. Даже если сотни переменных и движущих сил реального рынка будут квантованы, включены в данные и оптимизированы с помощью лучших доступных методов машинного обучения, модель все равно не сможет давать ценные прогнозы, когда они имеют значение. Тем не менее, эти недостатки — лишь кривые обучения в процессе разработки более надежных моделей прогнозирования цен на акции и более детального анализа возможностей существующих моделей.
Литература:
- RNN approach to the financial forecast. — Текст: электронный //: [сайт]. — URL: https://iris.univr.it/retrieve/handle/11562/959057/66085/Recurrent (дата обращения: 08.03.2024).
- Understanding LSTM Networks. — Текст: электронный //: [сайт]. — URL: https://colah.github.io/posts/2015–08-Understanding-LSTMs/ (дата обращения: 10.03.2024).
- Implementation of LSTM and GRU on grouped time-series data to predict stock prices. — Текст: электронный //: [сайт]. — URL: https://journalofbigdata.springeropen.com/articles/10.1186/s40537–022–00597–0 (дата обращения: 11.03.2024).
- Stock prediction using GRU. — Текст: электронный //: [сайт]. — URL: https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0262501 (дата обращения: 14.03.2024).