Аналитическое сравнение рекуррентных моделей в задаче прогнозирования динамики ценных бумаг | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 28 декабря, печатный экземпляр отправим 1 января.

Опубликовать статью в журнале

Автор:

Рубрика: Информационные технологии

Опубликовано в Молодой учёный №20 (519) май 2024 г.

Дата публикации: 15.05.2024

Статья просмотрена: 10 раз

Библиографическое описание:

Меркулов, П. Д. Аналитическое сравнение рекуррентных моделей в задаче прогнозирования динамики ценных бумаг / П. Д. Меркулов. — Текст : непосредственный // Молодой ученый. — 2024. — № 20 (519). — С. 5-7. — URL: https://moluch.ru/archive/519/114160/ (дата обращения: 18.12.2024).



В данной статье рассматриваются подходы машинного обучения в задаче анализа и прогнозирования рынка ценных бумаг. В работе сравниваются такие аспекты, как количество занимаемой памяти, число параметров, а также величина затраченного на обучение модели времени. На основе результатов исследования сделано предложение по выбору наиболее подходящего метода с точки зрения предиктивной эффективности.

Ключевые слова :машинное обучение, глубокое обучение,рекуррентные сети, прогнозирование динамики ценных бумаг.

Привлекательность фондового рынка как объекта инвестиций остается неизменной, рынок ценных бумаг служит барометром состояния экономики, отражая результаты деятельности и перспективы компаний различных отраслей и секторов. Прогнозирование динамики фондовых рынков важно для трейдеров и инвесторов, поскольку помогает им принимать обоснованные решения о том, когда покупать, продавать или держать ценные бумаги. Прогнозируя движение цен, они могут потенциально максимизировать свою прибыль и минимизировать убытки. Интеграция методов машинного обучения в совокупности с методами технического анализа временных рядов может значительно повысить точность прогнозирования. В представленной статье проведен сравнительный анализ моделей машинного обучения для прогнозирования динамики фондового рынка.

По итогам анализа литературы по теме для решения поставленной задачи были выделены три типа рекуррентных сетей, а именно LSTM, GRU, CNN-LSTM.

В качестве изначального набора данных в работе используются показатели по акциям технологических компаний. Для составления обучающего набора данных используются закрывающие цены на акции. В процессе предобработки исходный набор дополняется за счет индикаторов технического анализа. Таким образом, целевым значением для модели прогнозирования является закрывающая цена акции, в то время как на вход подаются цена акции и значения технических индикаторов, взятых с временным лагом.

Гиперпараметры, замеры и результаты проведенных c моделями экспериментов были внесены в таблицу 1.

Таблица 1

Таблица сравнения моделей анализа и прогнозирования

Используемые модели

GRU

LSTM

CNN-LSTM

Гиперпараметры

Входной слой

1x5

1x5

1x5

Размер выборки

16

16

16

Размер скрытого слоя

64

64

64

Замеры

Время

36 сек

45 сек

40 сек

Количество параметров

50433

133761

17229

Память

197.1 Кбайт

522.5 Кбайт

67.3 Кбайт

Результаты

MAE

5.827

6.545

2.919

RMSE

24.786

32.352

12.765

R2

0.947

0.912

0.987

Оценка результатов работы моделей проводилась с использованием метрик оценки, наиболее часто используемых для количественной оценки того, насколько хорошо модель соответствует набору данных, а именно RMSE, MAE и R-squared.

Рисунок 1 отображает результаты прогноза обученных моделей на тестовой выборке.

Прогнозы моделей на тестовой выборке

Рис. 1. Прогнозы моделей на тестовой выборке

Опираясь на полученные результаты, можно сделать вывод о том, что гибридная модель CNN-LSTM показала лучший результат на тестовой выборке данных. Это подтверждается большой сходимостью между предсказаниями модели и фактическими значениями, наблюдаемыми в тестовом наборе. Одним из факторов, который мог способствовать такому относительно хорошему исходу, является то, что слой свертки неплохо справляется с вычленением определенных паттернов временного ряда, а также, что архитектура LSTM сети и гиперпараметры достаточно комплексны, чтобы отразить все нелинейности и закономерности, присутствующие в данных.

Таким образом, в результате сравнительного анализа были выявлены различные сильные и слабые стороны представленных моделей для анализа и прогнозирования динамики ценных бумаг. Так, например, модель управляемого рекуррентного блока обучается быстрее остальных методов и теоретически может приблизиться к результатам при условии должной тонкой настройки. Но все же в качестве самого перспективного алгоритма прогнозирования ценных бумаг можно отметить гибридный подход обучения CNN-LSTM сети на данных, дополненных при помощи инструментов технического анализа, так как данный подход позволяет лучше передавать локальные тонкости временного ряда, обладает высоким потенциалом обобщения и занимает относительно мало памяти.

Так, в работе были рассмотрены способы того, как можно подойти к проблеме прогнозирования акций с помощью машинного обучения, рассматривая данные фондового рынка как временной ряд, а также использовании инструментов технического анализа для аугментации вектора входных значений моделей. Далее были проведены эксперименты на трех существующих алгоритмах, часто используемых для прогнозирования временных рядов: GRU, двунаправленной LSTM и гибридной CNN-LSTM. В работе использовались реальные биржевые данные для прогнозирования цен на акции. На основании представленных моделей был проведен сравнительный анализ эффективности и результативности прогнозов с использованием метрик ошибок RMSE, MAE и R2.

Однако эксперты из финансовой сферы и области искусственного интеллекта утверждают, что методы машинного обучения плохо работают в реальном мире для прогнозирования рынка. Даже если сотни переменных и движущих сил реального рынка будут квантованы, включены в данные и оптимизированы с помощью лучших доступных методов машинного обучения, модель все равно не сможет давать ценные прогнозы, когда они имеют значение. Тем не менее, эти недостатки — лишь кривые обучения в процессе разработки более надежных моделей прогнозирования цен на акции и более детального анализа возможностей существующих моделей.

Литература:

  1. RNN approach to the financial forecast. — Текст: электронный //: [сайт]. — URL: https://iris.univr.it/retrieve/handle/11562/959057/66085/Recurrent (дата обращения: 08.03.2024).
  2. Understanding LSTM Networks. — Текст: электронный //: [сайт]. — URL: https://colah.github.io/posts/2015–08-Understanding-LSTMs/ (дата обращения: 10.03.2024).
  3. Implementation of LSTM and GRU on grouped time-series data to predict stock prices. — Текст: электронный //: [сайт]. — URL: https://journalofbigdata.springeropen.com/articles/10.1186/s40537–022–00597–0 (дата обращения: 11.03.2024).
  4. Stock prediction using GRU. — Текст: электронный //: [сайт]. — URL: https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0262501 (дата обращения: 14.03.2024).
Основные термины (генерируются автоматически): CNN-LSTM, LSTM, машинное обучение, GRU, MAE, RMSE, прогнозирование динамики, технический анализ, модель, фондовый рынок.


Ключевые слова

машинное обучение, глубокое обучение, рекуррентные сети, прогнозирование динамики ценных бумаг

Похожие статьи

Методы классификации в решении задач нечеткого сравнения текстовых данных

В рамках данной статьи были рассмотрены методы машинного обучения для решения задачах нечеткого поиска совпадений в фрагментах текстовых данных в рамках предметной области работы с документами, содержащими перечни материально технических ресурсов. Вы...

Статистический анализ денежных потоков и стоимостных факторов в целях управления стоимостью корпорации

В статье предложена методика статистического анализа, рассматривающая корреляционную связь между распределением денежных потоков предприятия и величинами различных ставок дисконтирования. В зависимости от цели анализа и полученных выводов, описанный ...

Системный подход к выбору моделей для предсказания разрушения деталей на основе статистических данных

В статье описана методика работы с результатами испытаний деталей. С помощью методов машинного обучения удалось научиться предсказывать максимальное значение силы на растяжение, которую выдерживает деталь перед полным разрушением. Лучшую модель из ис...

Разработка модуля прогнозирования цен на товары для онлайн-платформы

В данной статье описывается разработка модуля машинного обучения для прогнозирования цен на товары на онлайн-платформе. Модуль использует алгоритмы машинного обучения, такие как случайные леса и деревья решений, для точного прогнозирования цен в зави...

Профилактика конфликтного поведения у подростков

Данная статья исследования состоит в предположении о том, что проведение тренинговых занятий способствует снижению уровня склонности подростков к конфликтному поведению и выбору ими оптимальных стратегий поведения в конфликтных ситуациях. Методами ис...

Особенности управления финансовыми рисками в девелопменте

В статье рассматривается вопрос влияния финансовых рисков для проектов в сфере девелопмента. Данная тема актуальна в период коронокризиса для строительных компаний. Приведены результаты опроса среди компаний из разных регионов Казахстана по влиянию р...

Математическое моделирование как инструмент развития социоэкономики

В статье рассматриваются возможности применения математического моделирования для решения задач социоэкономики. Анализируются основные этапы моделирования, а также особенности моделирования социально-экономических процессов. Рассматриваются примеры н...

Модификация теории социального влияния Латане для компьютерных социальных сетей

Данная статья посвящена проблемам анализа межличностных отношений в компьютерных социальных сетях. Речь идет об использовании теории динамического социального влияния Латане на основе различных характеристик (количественных и структурных), понятий, м...

Актуальные экономико-математические методы исследования современных экономических процессов

Экономико-математические методы применяются в исследованиях, в ходе которых изучаются объекты-заменители. В последнее время термин «моделирование» получил широкое распространение в маркетинге, поэтому название «экономико-математические методы исследо...

Исследование проблемы обеспечения конкурентоспособности предприятий в строительной отрасли

В рамках исследования рассмотрен вопрос обеспечения конкурентоспособности предприятий строительной отрасли в современных экономических условиях. К методам решения вопроса конкурентоспособности относят применение стратегий диверсификации, которые подр...

Похожие статьи

Методы классификации в решении задач нечеткого сравнения текстовых данных

В рамках данной статьи были рассмотрены методы машинного обучения для решения задачах нечеткого поиска совпадений в фрагментах текстовых данных в рамках предметной области работы с документами, содержащими перечни материально технических ресурсов. Вы...

Статистический анализ денежных потоков и стоимостных факторов в целях управления стоимостью корпорации

В статье предложена методика статистического анализа, рассматривающая корреляционную связь между распределением денежных потоков предприятия и величинами различных ставок дисконтирования. В зависимости от цели анализа и полученных выводов, описанный ...

Системный подход к выбору моделей для предсказания разрушения деталей на основе статистических данных

В статье описана методика работы с результатами испытаний деталей. С помощью методов машинного обучения удалось научиться предсказывать максимальное значение силы на растяжение, которую выдерживает деталь перед полным разрушением. Лучшую модель из ис...

Разработка модуля прогнозирования цен на товары для онлайн-платформы

В данной статье описывается разработка модуля машинного обучения для прогнозирования цен на товары на онлайн-платформе. Модуль использует алгоритмы машинного обучения, такие как случайные леса и деревья решений, для точного прогнозирования цен в зави...

Профилактика конфликтного поведения у подростков

Данная статья исследования состоит в предположении о том, что проведение тренинговых занятий способствует снижению уровня склонности подростков к конфликтному поведению и выбору ими оптимальных стратегий поведения в конфликтных ситуациях. Методами ис...

Особенности управления финансовыми рисками в девелопменте

В статье рассматривается вопрос влияния финансовых рисков для проектов в сфере девелопмента. Данная тема актуальна в период коронокризиса для строительных компаний. Приведены результаты опроса среди компаний из разных регионов Казахстана по влиянию р...

Математическое моделирование как инструмент развития социоэкономики

В статье рассматриваются возможности применения математического моделирования для решения задач социоэкономики. Анализируются основные этапы моделирования, а также особенности моделирования социально-экономических процессов. Рассматриваются примеры н...

Модификация теории социального влияния Латане для компьютерных социальных сетей

Данная статья посвящена проблемам анализа межличностных отношений в компьютерных социальных сетях. Речь идет об использовании теории динамического социального влияния Латане на основе различных характеристик (количественных и структурных), понятий, м...

Актуальные экономико-математические методы исследования современных экономических процессов

Экономико-математические методы применяются в исследованиях, в ходе которых изучаются объекты-заменители. В последнее время термин «моделирование» получил широкое распространение в маркетинге, поэтому название «экономико-математические методы исследо...

Исследование проблемы обеспечения конкурентоспособности предприятий в строительной отрасли

В рамках исследования рассмотрен вопрос обеспечения конкурентоспособности предприятий строительной отрасли в современных экономических условиях. К методам решения вопроса конкурентоспособности относят применение стратегий диверсификации, которые подр...

Задать вопрос