[Красный Циркуль] Владислав Кузьменков - Торговый агент на основе сверточной сети (2019)
Вы можете создать множество моделей, которые с некоторым успехом прогнозирует цену, но разве это вам нужно? Трейдера зарабатывают не на прогнозах, а на верных решениях. Как научить модель не предсказывать, а принимать решения?
Представим трейдинг в виде игры и осуществим небольшое погружение в обучение с подкреплением. Напишем очень простое своё gym окружение для торговли индексом РТС. Реализуем метод обучения Policy Gradient и посмотрим на результаты эмуляции торговли нашей нейронной сети.
Программа
Занятие 1
СКАЧАТЬ
Вы можете создать множество моделей, которые с некоторым успехом прогнозирует цену, но разве это вам нужно? Трейдера зарабатывают не на прогнозах, а на верных решениях. Как научить модель не предсказывать, а принимать решения?
Представим трейдинг в виде игры и осуществим небольшое погружение в обучение с подкреплением. Напишем очень простое своё gym окружение для торговли индексом РТС. Реализуем метод обучения Policy Gradient и посмотрим на результаты эмуляции торговли нашей нейронной сети.
Программа
Занятие 1
- Что такое обучение с подкреплением и где оно используется Зачем нужен OpenAI Gym и как он работает Интуитивное представление о методе обучения Policy Gradient Пишем gym environment на Python
- Как работает Policy Gradient Реализация Policy Gradient на Python Результаты обучения нейронной сети Целесообразность такого подхода. Над чем нужно ещё работать
СКАЧАТЬ
Для просмотра скрытого содержимого вы должны войти или зарегистрироваться.