Welcome to my personal place for love, peace and happiness 🤖

Tag: big data

48 posts   See also:  Data   Data Engineer   Open Source   Data Mesh   Data Governance

Nimtable: Единая панель управления для зоопарка Iceberg-каталогов

В современных компаниях, активно использующих данные, часто возникает проблема “зоопарка” технологий...

 No comments   8 h   big data   Data   Rest Catalog

Сравнение Apache Iceberg, Delta Lake и Apache Hudi: Глубокий анализ (2025)

С ростом популярности архитектуры Data Lakehouse усилился интерес к трём основным открытым проектам в этой области...

 No comments   19 d   big data   Data   Data Engineer   Iceberg

Битва Новых Архитектур: Сравниваем Arc, GigAPI и DuckLake

В мире данных происходит тихая революция. На смену тяжеловесным и дорогим OLAP-системам приходят легковесные, но мощные решения, построенные на идеологии Lakehouse

 No comments   1 mo   big data   Data   Database

Сводная статья: Основы проектирования современного хранилища данных

Эта статья объединяет два материала из блога Apache SeaTunnel, посвященных фундаментальным принципам построения современных аналитических платформ

 No comments   2 mo   big data   Data   Data Governance

Искусство скорости: Руководство по оптимизации для аналитики в Data Lakehouse с DuckDB

DuckDB завоевал огромную популярность как “SQLite для аналитики”. Это невероятно быстрый, встраиваемый, колоночный движок, который не требует отдельного сервера

Apache SeaTunnel – Движение к мультимодальной интеграции данных

В постоянно меняющемся мире больших данных эффективная и надежная интеграция данных является ключевым фактором для успеха любого предприятия

 No comments   3 mo   big data   Data   Data Engineer

RAW Hollow – революция в управлении данными от Netflix

Оригинал тут: RAW Hollow – революция в управлении данными от Netflix

 No comments   3 mo   big data   Data   Programming

Iceberg в Trino: Путешествие по Вариантам Хранения, Сжатия и Конфигурации для Оптимальной Производительности

Iceberg, как табличный формат, совершил революцию в управлении данными в озерах данных (data lakes), предоставив транзакционные гарантии и схематическую эволюцию для данных

 1 comment   4 mo   big data   Iceberg

Сравнение решений для Schema Registry: Confluent vs Apicurio

Schema Registry (реестр схем) — критический компонент в экосистеме Apache Kafka, обеспечивающий контракты данных, управление эволюцией схем и валидацию сообщений

 No comments   4 mo   big data   Metadata

Кликозявый эластикозавр обзёрнообразный – ClickStack

Представляем ClickStack Сегодня мы рады анонсировать ClickStack — новое опенсорсное решение для обсервабилити, созданное на базе ClickHouse...

 No comments   5 mo   big data   ClickHouse   Data Engineer   Logs
Earlier Ctrl + ↓