Мир без Kafka: Почему Kafka не подходит для аналитики реального времени, что идет на смену)

Статья описывает переход от традиционных систем обмена сообщениями, таких как Apache Kafka, к специализированным решениям для потоковой аналитики, таким как Apache Fluss

Apache Iceberg V3: Готов ли он?

Автор: Guy Yasoor (Ryft Blog) Перевод и дополнения: Gemini 3 Pro Preview и я кофе носил

Сравнительный анализ self-hosted S3-совместимых хранилищ

Четкое сравнение семи self-hosted S3-совместимых решений для хранения данных

Сводная таблица exchange-compression: LZ4 vs NONE vs ZSTD в Trino

Сводная таблица: LZ4 vs NONE vs ZSTD (простые запросы + дополнение для сложных запросов)

Обработка логов Trino из Kafka с помощью Vector для удаления полей

В современных архитектурах данных, построенных на Kafka, часто возникает задача обработки или фильтрации потока событий “на лету”

Nimtable: Единая панель управления для зоопарка Iceberg-каталогов

В современных компаниях, активно использующих данные, часто возникает проблема “зоопарка” технологий...

Сравнение Apache Iceberg, Delta Lake и Apache Hudi: Глубокий анализ (2025)

С ростом популярности архитектуры Data Lakehouse усилился интерес к трём основным открытым проектам в этой области...

Битва Новых Архитектур: Сравниваем Arc, GigAPI и DuckLake

В мире данных происходит тихая революция. На смену тяжеловесным и дорогим OLAP-системам приходят легковесные, но мощные решения, построенные на идеологии Lakehouse

Сводная статья: Основы проектирования современного хранилища данных

Эта статья объединяет два материала из блога Apache SeaTunnel, посвященных фундаментальным принципам построения современных аналитических платформ

Искусство скорости: Руководство по оптимизации для аналитики в Data Lakehouse с DuckDB

DuckDB завоевал огромную популярность как “SQLite для аналитики”. Это невероятно быстрый, встраиваемый, колоночный движок, который не требует отдельного сервера

Yuriy Gavrilov

Tag: big data