Биржевой зодиак: Какие алгоритмы и инструменты применяются для прогнозирования движения цен акций



    Сегодня мы поговорим об инструментах технического анализа, которые используют для предсказания поведения биржевых индексов. В наши задачи не входило собрать в одну кучу и подробно описать все технологические способы прогнозирования цен на фондовых рынках. По каждому из них можно найти достаточно подробную информацию в нашем блоге. Но небольшая шпаргалка была бы весьма полезна.

    По-настоящему эффективную биржевую стратегию можно создать, лишь используя большинство инструментов в комплексе. Тем более что сама стратегия подразумевает несколько этапов, включая сбор и обработку данных, построение алгоритма, отладку и проверку в реальном времени. И для каждого из них можно применять разные методы и математические модели.

    Математические модели предсказания цены


    Оборот алгоритмической торговли на крупных фондовых площадках сегодня достигает, по некоторым данным, 70%. При этом речь уже идет не просто о том, чтобы опередить конкурентов в совершении транзакции, но и суметь предсказать движение цены. Сделать это можно, к примеру, при помощи математической формулы, учитывающей скрытую ликвидность рынка при данной ликвидности заявок на покупку и продажу. «Истощение» очереди заявок на покупку или продажу может свидетельствовать о скором движении цены.

    Изменение возникает, когда на одном из уровней цены исчезают все заявки на покупку или продажу, и существует следующий уровень цен бид и аск.

    image

    В одном из наших предыдущих материалов мы рассматривали формулу, позволяющую высчитать вероятность того, что очередь заявок аск истощится ранее, чем очередь заявок бид.

    image

    Формула для расчета вероятности повышения цены выглядела так:

    image

    , где H — скрытая ликвидность рынка, то есть сделки, которые неизвестны широкой общественности (например, сделки крупных финансовых организаций, которые заключаются за пределами бирж).

    Сама процедура анализа выглядит следующим образом:

    • Для начала собранные данные разделяются по биржам, за один раз анализируется один торговый день.
    • Котировки значений бид и аск компонуются по децилям (). Для каждого такого набора вычисляется частота повышения цены.
    • Подсчитывается число появлений каждой величины.
    • Производится анализ соответствия модели с помощью метода наименьших квадратов.

    Нужно четко осознавать, что на фондовые индексы, помимо чисто экономических факторов, влияет масса посторонних вещей. Поэтому математическая модель для таких нелинейных, непредсказуемых рядов будет крайне сложно создать. Но использовать ее как основу для более сложных стратегий вполне возможно.

    Машинное обучение и Big Data


    Машинное обучение – самое, пожалуй, востребованное и многообещающее направление сложных финансовых расчетов. В нашем блоге ему, также как и, вообще, работе с большими данными, посвящена серия материалов (мы писали об этом, например, здесь и здесь).

    Сам процесс машинного обучения состоит из нескольких шагов: от выбора математических и программных инструментов, сбора входных данных, до выработки предсказаний и тестирования. Самый простой способ — это создание с помощью машинного обучения модели на основе исторических данных, ее тестирование и дальнейшее применение для генерирования прогнозов будущего движения цен.

    Проще всего понять работу этой модели на конкретном примере. Вот в этой статье довольно подробно, пошагово описывается успешный опыт применения стратегии машинного обучения.

    Модель подразумевает создание фреймворка, симулирующего торги, который должен максимально точно воссоздать поведение реального рынка. В него закладывается тренировочный набор данных, позволяющий системе обучаться на них. Затем создается или подбирается алгоритм, отвечающий за предсказание движения цен и организацию торгов. Можно интегрировать уже готовые алгоритмы. Например, скрытые Марковские Модели, искусственные нейронные сети, алгоритм бустинга, наивный байесовский классификатор, метод опорных векторов, дерева решений, дисперсионный анализ и множество других.

    Дальнейшие действия будут зависеть от используемого алгоритма (конкретные примеры можно посмотреть по ссылкам выше). Обычно за этим следует выбор, создание и оптимизация индикаторов, которые будут участвовать в прогнозе. Они, по большому счету, привязаны к повышению или понижению цены. На основе кривых изменения индикаторов можно создать формулу для более точного предсказания цены. Протестировать получившийся алгоритм можно на исторических данных.

    Еще один интересный подход к использованию машинного обучения для прогнозирования цен акций — это его применение к прогнозам финансовых аналитиков. Подобный механизм работает примерно так:
    На вход системы подаются мнения экспертов рынка акций (просто их мнение, которое необязательно оказывается верным), а затем на основе их прогнозов раз за разом делаются предсказания возможного движения цены. На каждой итерации вес эксперта, чье предсказание оказалось верно, повышается, а у тех, кто ошибся — наоборот снижается.

    image

    Такую технику взвешивания на основе экспертных мнений можно рассматривать в качестве гибридного подхода, комбинирующего в себе фундаментальный и технический анализ — эксперты делают прогнозы на основе фундаментального анализа, а алгоритм впоследствии использует их для генерирования собственных прогнозов с помощью методов технического анализа.

    Алгоритм адаптивной фильтрации


    Алгоритм адаптивной фильтрации широко применяется в радиоэлектронике в качестве системы цифровой обработки данных. Если не вдаваться в подробности, адаптивный фильтр – это самообучающаяся система, нацеленная на достижение максимального соответствия анализируемых данных на выходе реальному положению дел.

    image

    Блок-диаграмма адаптивного фильтра для предсказания сигналов

    Суть метода в том, что мы можем быстро и четко реагировать на изменения входных данных для получения точных прогнозов. На практике адаптивные алгоритмы реализуются двумя классическими методами — методом градиента и наименьших квадратов (LMS и RLS).

    В свое время LMS-фильтр успешно применялся для предсказания трафика в беспроводных сетях. Бразильским ученым пришла в голову идея опробовать этот алгоритм в биржевой торговле. Они создали модуль для предсказания движения цены одной из компаний. Для этого использовался адаптивный цифровой FIR-фильтр со 100 реальными коэффициентами. В качестве алгоритма адаптации был использован RLS с коэффициентом забывания 0,98. Симуляция производилась на платформе MATLAB.

    Испытания с различными параметрами показали, что применение адаптивного фильтра позволяет добиться прибыли в среднем 7% от вложенных средств.

    Генетические алгоритмы


    Еще один свежий тренд в области алгоритмической торговли – это генетические алгоритмы. Это поисковые алгоритмы, применяющиеся в системах, где точные взаимоотношения элементов неизвестны или вовсе отсутствуют.

    Как это работает: ставится задача, формализованная таким образом, чтобы на выходе возникло решение, закодированное в виде вектора генов («генотип»). Гены – это любые объекты, числа, биты. Далее случайным образом создается множество генотипов начальной «популяции», которые оцениваются с помощью специальной функции приспособленности. В итоге каждому генотипу присваивается значение «приспособленности» — именно оно определяет, насколько хорошо он решает задачу.

    В своем блоге мы писали о работе ученых из исламского университета Азад, в которой речь идет о прогнозировании поведения фондовых индексов через сочетание методов генетического алгоритма, нейронных сетей и data mining с использованием опорных векторов.

    При этом data mining отвечает за сбор информации и упорядочивание данных в модели классификации. Генетический алгоритм настраивает систему. Для того чтобы ее оптимизировать, каждый ген рассматривается в виде вектора, а соответствующий алгоритм оптимизации применяет к нему механизм промежуточной рекомбинации. Генерируются предсказания через метод опорных векторов (частный случая машинного обучения). Точность предсказаний для NASDAQ, сгенерированных системой, составила 74.4%.

    Анализ новостей


    Тем, что новости могут серьезно влиять на фондовый рынок, сегодня никого не удивишь. Примеры того, как то или иное событие (иногда фейковое) «обрушило» рынок появляются с завидной регулярностью — иногда создатели таких фейков затем испытывают проблемы с законом. Но немногие оказались способны превратить манипуляции экономическими новостями в настоящее искусство.

    image

    В 2015 году 62-летний шотландец Алан Крейг создал два поддельных твиттер-аккаунта аналитических компаний и разместил в них новости о проблемах торгующихся на бирже компаний. На графике показан рост цен одной из таких компаний после публикации фейковой новости и их падение после ее опровержения

    На рынке появляются системы анализа, использующие публикации в СМИ и социальных сетях для совершения транзакций. Ведутся работы по созданию систем, которые будут способны самостоятельно создавать статьи, основываясь на данных новостных лент, с их последующей выкладкой в сеть для провоцирования тех, кто не обладает полнотой информации, на покупку или продажу активов.

    Еще в 2013 году исследователи из бизнес-школы Уорика (Warwick Business School) опубликовали результаты эксперимента, в ходе которого в качестве инструмента для прогнозирования трендов фондового рынка использовался поисковик Google, и в частности, сервис Google Trends.

    Он позволяет работать с информацией о поисковых запросах, ранжированных по популярности. Исследователи предположили, что существует корреляция между увеличением числа поисковых запросов по тем или иным политическими и экономическими темам и значимыми событиями на фондовых рынках.

    Очевидно, что перед тем, как принять решение, люди пытаются через поисковик узнать как можно больше. Информация о поисковых запросах о темах, которые могут влиять на цены акций, может свидетельствовать о скором развороте рыночного тренда — раз уже простые люди, а не профессиональные аналитики, интересуются делами на бирже, то это верный признак того, что назревает разворот тренда.

    image

    Созданный в рамках эксперимента ученых симулятор инвестиционной игры показал впечатляющие результаты. Например, самым надежным для США оказалось слово «долг». Отслеживая рынки только по нему, ученые увеличили свой гипотетический портфель ценных бумаг на 326% за семь лет. При моделировании стандартной стратегии торгов, которая не учитывала частоту поисковых запросов, им удалось добиться прироста лишь в 16%.

    Другие материалы по теме онлайн-трейдинга в блоге ITinvest:


    Метки:
    ITinvest 41,55
    Компания
    Поделиться публикацией
    Комментарии 17
    • –1
      ссылка на «один из предыдущих материалов» с рассмотрением первой формулы битая (ведет на пользовательское соглашение с Хабрахабром)
      • –3
        проблема со ссылками даже чуть круче: из всех ссылок в статье открываются только страница на википедии про МНК, сайт компании ITinvest, https://geektimes.ru/company/itinvest/blog/272700/ и https://geektimes.ru/company/itinvest/blog/270026/. Все остальные ссылки (все, кроме предпоследней и предшествующей ей, ссылки на страницы ITinvest на Geektimes или Habrahabr) по клику на гиперссылку редиректятся на пользовательское соглашение.
        • +1
          Проблема со ссылками исключительно на вашем компьютере — все они открываются и ведут именно туда, куда и должны. Скорее всего, вы просто были новым пользователем на Хабре, поэтому вам показывали это соглашение
          • 0
            Да, сейчас все работает исправно. Действительно, непонятно, в чем было дело, почему-то помогло разлогиниться и залогиниться заново. Что ж, прошу прощения за напрасную тревогу, у меня наблюдалось воистину странное поведение этих ссылок, которое я описал выше, и с каким я сталкиваюсь впервые.
        • –3
          «Испытания с различными параметрами показали, что применение адаптивного фильтра позволяет добиться прибыли в среднем 7% от вложенных средств.»
          … в час.
          • –1
            Статья в стиле «как нарисовать сову».
            • 0
              Почему-то не удивился, когда обнаружил 0 публикаций у вас в профиле.
              • 0
                На Хабре есть статья и на тостере, тут нет еще, перевод статьи не прошел почему-то.
            • –1
              статья о поиске грааля методом алхимии и танцах с бубном в матлабе на исторических данных без конкретных примеров рабочих стратегий на реальных рынках ценных бумаг. ну фиг знает. думаю про волны вульфа, которые работают в реальных условиях, и то интереснее было бы.
              • 0
                Статья с подборкой ссылок на разные инструменты и исследования, можно их для начала прочитать, а потом говорить про Грааль
                • –1
                  статья про круговорот itinvest. куда бы не нажал везде ссылка на статью itinvest. о каких исследованиях идёт речь? об исследованиях itinvest? я думаю подход неправильный в корне. вместо того что бы описать каждый инструмент отдельно и полноценно с ссылками на другие ресурсы (а не только на статьи itinvest) с примерами моделирования на исторических данных и применения их на реальных рынках в реальных условиях что бы делать выводы об устойчивости применяемого метода к торговле в реальных условиях, вы вывалили эту кашу из собственных статей, что со стороны выглядит как самореклама. а потом начинается минусование негативных комментариев. материал надо уметь преподносить. а не кучей вываливать не связанный текст с 1 единственно формулой и парой картинок и без выводов.
                  • +1
                    Аналогично "эксперту" выше. Открыл профиль – 0 публикаций. Не понимаю я этого. Всегда можно самому показать класс вместо путаных советов с сомнительной базой.

                    Читаю много аналитики на англ – этой проблемы нет на западе. Люди больше нацелены на созидание, а не на засирание всего вокруг. Достаточно открыть хоть Hacker News, хоть Stack Overflow, чтобы в этом убедиться.
                    • –1
                      «Эксперту» выше. всегда можно потратить немного времени и прочитать комментарии, которые как никак «азм есмь» критика!!! не нравится критика, перевари комментарии и преподноси информацию в правильной форме. пока что комментарии (критика) говорят сами за себя. только слепой не увидит «кашу» в статье, на что народ и критикует.
                    • 0
                      Статьи, на которые оставлены ссылки — это в том числе русскоязычные адаптации англоязычных исследований, которые подготовлены учеными из США, Великобритании, Бразилии и даже ОАЭ. Но вы же даже не читали толком, что по ссылкам, для выводов и поиска теории заговора достаточно увидеть урл, все понятно.

                      • –3
                        зачем мне читать что по ссылкам когда я читаю статью? проще тогда было тупо накидать ссылок и статья готова. к чему остальная писанина была с выдернутой формулой на пол статьи и картинка адаптивного фильтра? что бы место занять в статье что бы статья не выглядела кратенькой? ну так лучше подобные статьи оформлять в виде новости типа «мы itinvest. мы живы. мы тут. не забывайте про нас. заходите люди добрые читайте наши статьи.». но в место этого просто «КАША» и минусованные комментарии причём вами из вредности потому как адекватно воспринимать критику вы видимо не можете кроме как натыкать минусов тем кого статья не устраивает с привлечением адепта в комментариях который хвастается тем что у него публикации есть, а у других нет.
                        • 0
                          Мы не минусовали ваши комментарии, не надо думать, что они всем нравятся. Лучше напишите сами парочку интересных статей, мы все от этого выиграем
                • 0
                  Смотрел я лекцию одного финансового ученого из Корнельского Университета.
                  Так он говорил, что все графики акций доу джонса начиная с 1900 года — это случайное распределение с какими-то параметрами. И он тупо показывал свои собственные случайные модели и сравнивал их с реальными графиками и выходило очень похоже. Так что все носит случайный характер.

                  Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                  Самое читаемое