Архитектура Client Spooling: Как быстро выгружать гигантские датасеты в Trino и Apache DataFusion

Работа с Big Data часто упирается в классическое “узкое горлышко”: кластер может обработать терабайты данных за секунды, но передача результатов...

StarRocks: Архитектура, Практика и место в современном Data Stack

StarRocks — это аналитическая MPP-база данных нового поколения

Действительно ли данные готовы к ИИ

Автор: Джейкоб Мэтсон

Битва титанов аналитики реального времени: StarRocks против ClickHouse

В мире больших данных, где счет идет на петабайты, а задержка измеряется миллисекундами, выбор правильного аналитического движка определяет успех продукта

R2 SQL: Глубокое погружение в наш новый движок для распределенных запросов

В современном мире объемы данных растут экспоненциально, и хранение петабайтов информации в объектных хранилищах

Data Stack 2.0: Закат Lambda-архитектуры и восход Fluss с Lance

В мире инфраструктуры данных происходит “тектонический сдвиг”, описанный в отчетах a16z.com. Индустрия отходит от сложной Lambda-архитектуры

Мир без Kafka: Почему Kafka не подходит для аналитики реального времени, что идет на смену)

Статья описывает переход от традиционных систем обмена сообщениями, таких как Apache Kafka, к специализированным решениям для потоковой аналитики, таким как Apache Fluss