Тройка является одним из крупнейших игроков на российском рынке производных финансовых инструментов, сыгравших ключевую роль в создании рынка фьючерсов и опционов на бирже РТС. Объем активов, находящихся в управлении Тройки Диалог, составляет порядка 2,8 млрд долларов (на конец мая 2012 года). В январе 2012 года была закрыта сделка по объединению Сбербанка России и Тройки Диалог, в результате которой в России был создан крупнейший универсальный банковский институт.
Выполняя функции брокера на рынке ценных бумаг, Тройка Диалог проводит огромный объем сделок – как рыночных, связанных с обработкой биржевых запросов в режиме, близком к реальному времени, так и внебиржевых. Для брокеров генерируются все необходимые для работы аналитические прогнозы, таблицы с информацией, которая влияет на цену акций. С определённой периодичностью для каждого клиента генерируются брокерские отчёты обо всех проведенных сделках. Все данные по сделкам сохраняются в информационных системах компании не менее трех лет в соответствии с нормативными требованиями Федеральной службы по финансовым рынкам. Также для технического анализа по рынку акций сохраняются исторические данные по всем торгам.
Инвестиционная компания Тройка Диалог, входящая в Группу Сбербанка, использует EMC Greenplum как основу платформы хранилища данных с 2010 года
Информация обо всех сделках хранится в корпоративном хранилище данных. Объём данных каждый год в среднем удваивается, и это при том, что требования к производительности запросов не снижаются.
Хранилище используется для оперативных запросов, выгрузок в другие системы и большого количества исторических запросов. Кроме того, на основе хранилища построены системы мониторинга нормативных требований (Compliance Monitoring) и количественного анализа (данные по торгам, данные о стоимости акций и другая информация с различных бирж), которые генерируют существенную нагрузку на систему. Запросы к хранилищу обрабатываются практически в реальном времени. Загрузка данных из бэк-офисной системы компании в Greenplum также осуществляется в режиме, близком к реальному времени.
Хранилище данных компании построено на основе системы управления базами данных (СУБД) EMC Greenplum. Массово-параллельная архитектура (MPP) Greenplum обеспечивает высокопроизводительную, надёжную и масштабируемую платформу для решения задач компании в области аналитики. Открытая архитектура и возможность использования недорогого оборудования стандартной архитектуры гарантируют низкую стоимость владения и быстрый возврат инвестиций.
Greenplum – это многоузловая система с архитектурой, обеспечивающей эффективную параллельную обработку. Принципы функционирования Greenplum опираются на горизонтальное и вертикальное масштабирование. Система практически не имеет пределов масштабирования: она представляет собой многоузловой кластер с высоким уровнем резервирования и возможностью добавления новых узлов по мере роста объема данных в хранилище. Управляющий модуль сбалансированно перераспределяет нагрузку по узлам, а в случае выхода из строя какого-либо узла или узлов остальные возьмут на себя дополнительную часть нагрузки. Все это в сочетании с невысокой стоимостью Greenplum по сравнению с имеющимися на рынке аналогами определили выбор в пользу этого решения.
Встроенный механизм компрессии данных Greenplum обеспечивает эффективное и компактное хранение обширных исторических данных системы мониторинга нормативных требований (Compliance Monitoring).
EMC Greenplum эффективно справляется с разнородной нагрузкой, генерируемой системами и запросами «по требованию» (ad-hoc) на больших объемах данных, включая бэк-офисную систему и систему мониторинга выполнения нормативных требований. Отчеты и результаты незапланированных запросов доступны в режиме, близком к реальному времени. Полная поддержка аналитических функций позволяет упростить такие запросы по сравнению с тем, как это выполнялось раньше в СУБД, не специализированных для аналитики. Производительность решения можно оценить по тому факту, что, по сравнению с прежним хранилищем данных, построенным на традиционной реляционной СУБД, скорость выполнения запросов возросла в 10–100 раз.
За счёт использования серверов стандартной архитектуры EMC Greenplum обеспечивает не только низкие стартовые затраты, но и низкую и предсказуемую стоимость владения в будущем. Простая модель лицензирования и линейная масштабируемость делают расчёт стоимости владения несложным. При необходимости кластер можно будет расширить до 384 узлов, объем данных и вычислительная мощность увеличатся пропорционально.
После трех лет эксплуатации, несмотря на ежегодный двукратный рост объёмов данных, система зарекомендовала себя как надёжное и эффективное решение. Пользователи Тройки Диалог не почувствовали замедления при выполнении запросов. Однажды система пережила отказ одного из серверов кластера, что, однако, не привело к остановке комплекса благодаря встроенным средствам зеркалирования для обеспечения отказоустойчивости.