QueryFlux: Universal SQL Proxy для аналитических движков

В этой статье я расскажу, как поднять полноценную инфраструктуру для аналитических запросов, используя QueryFlux — высокопроизводительный SQL-прокси на Rust

Распределённые вычисления с Ray и отчетики

ПредположенИИе 🤖

🚀 Создание почтиReal-Time Data Lake: Быстрая миграция данных в Apache Iceberg или Parquet

Сегодня Gemini 3.1 Pro Preview расскажет свое мненИИе))

OPA’ля :) и хранитель озера – Lakekeeper

https://github.com/lakekeeper/lakekeeper/tree/main/authz/opa-bridge

Архитектура Client Spooling: Как быстро выгружать гигантские датасеты в Trino и Apache DataFusion

Работа с Big Data часто упирается в классическое “узкое горлышко”: кластер может обработать терабайты данных за секунды, но передача результатов...

StarRocks: Архитектура, Практика и место в современном Data Stack

StarRocks — это аналитическая MPP-база данных нового поколения

Действительно ли данные готовы к ИИ

Автор: Джейкоб Мэтсон

Битва титанов аналитики реального времени: StarRocks против ClickHouse

В мире больших данных, где счет идет на петабайты, а задержка измеряется миллисекундами, выбор правильного аналитического движка определяет успех продукта

R2 SQL: Глубокое погружение в наш новый движок для распределенных запросов

В современном мире объемы данных растут экспоненциально, и хранение петабайтов информации в объектных хранилищах

Data Stack 2.0: Закат Lambda-архитектуры и восход Fluss с Lance

В мире инфраструктуры данных происходит “тектонический сдвиг”, описанный в отчетах a16z.com. Индустрия отходит от сложной Lambda-архитектуры

Yuriy Gavrilov

Tag: big data