YTsaurus и аналитические витрины с актуальностью в 15 минут / Филипп Козьмин, Яндекс Маркет
Что, если бизнесу нужны сложные аналитические витрины с актуальностью данных в минуты, а выходить в стриминговую обработку на CEP-движках, таких как Flink, дорого и overkill по скорости поставки данных? Есть ли компромиссное решение, не требующее полного разворота на 180 градусов от ETL-процессов, реализованных на SQL-диалекте? И, конечно, это решение должно быть масштабируемым до cотен ТБ. Поэтому это не PostreSQL.
«И оно есть у нас».
Триплет технологий YTsaurus YQL динамические таблицы позволили найти архитектуру поставок данных, повторяющую подход к обработке данных, заложенный в стриминге, но упрощающий реализации. Это дало нам достаточную скорость обработки данных в минуты, помноженную на технологии с невысоким входом и прозрачную для потребителя структуру промежуточных и конечных данных. И — вишенкой на торте — такие поставки интегрированы по данным классическим с T-1-поставками и их можно легко пересчитывать.
Деталями этой реализации на примере расчета быстрой Юнит Экономики в Яндекс Маркете мы и хотим поделиться.
24 views
92
22
2 months ago 00:45:31 46
YTsaurus и аналитические витрины с актуальностью в 15 минут / Филипп Козьмин, Яндекс Маркет
3 months ago 08:33:21 1
от Yandex Infrastructure. Трек Bounce. 4 июня.
3 months ago 00:36:08 30
Что скрывают Blender и YTsaurus? Вся правда о технологии статического анализа
9 months ago 00:44:28 2
Владимир Верстов — Платформа управления данными вокруг YTsaurus
9 months ago 00:45:11 3
Алексей Озерицкий — Архитектура распределенного SQL-движка для аналитических запросов
9 months ago 00:45:10 5
Максим Бабенко — Как мы адаптировали динамические таблицы YTsaurus для хранения блобов
9 months ago 00:44:46 3
Игнат Колесниченко — Планирование миллиардов задач каждый день
1 year ago 00:54:15 1
YTsaurus: опыт эксплуатации хранилища из 180К дисков / Павел Сушин (Яндекс)
1 year ago 00:47:48 1
YTsaurus — это будущее DWH, и в Яндекс Маркете оно наступило / Филипп Козьмин (Яндекс Маркет)
1 year ago 00:39:39 1
YTsaurus SPYT: помогаем планировщику Apache Spark быть ещё эффективнее / Алексей Шишкин (Яндекс)
1 year ago 01:10:43 1
Open кто? Open source! Говорим про открытый исходный код (yet another podcast #14)
1 year ago 00:37:31 16
Павел Сушин. Как вырастить динозавра масштабирование платформы YTsaurus от 200 до 20’000 хостов
1 year ago 05:05:24 1
Data Open Source Day
2 years ago 00:56:19 4
Что такое YTsaurus и как развернуть его у себя
2 years ago 00:10:41 1
YTsaurus — платформа для хранения и обработки больших данных с открытым исходным кодом