Welcome to my personal place for love, peace and happiness 🤖

Tag: big data

45 posts   See also:  Data   Data Engineer   Open Source   Data Mesh   Data Governance

Сводная статья: Основы проектирования современного хранилища данных

Эта статья объединяет два материала из блога Apache SeaTunnel, посвященных фундаментальным принципам построения современных аналитических платформ

 No comments   3 d   big data   Data   Data Governance

Искусство скорости: Руководство по оптимизации для аналитики в Data Lakehouse с DuckDB

DuckDB завоевал огромную популярность как “SQLite для аналитики”. Это невероятно быстрый, встраиваемый, колоночный движок, который не требует отдельного сервера

Apache SeaTunnel – Движение к мультимодальной интеграции данных

В постоянно меняющемся мире больших данных эффективная и надежная интеграция данных является ключевым фактором для успеха любого предприятия

 No comments   1 mo   big data   Data   Data Engineer

RAW Hollow – революция в управлении данными от Netflix

Оригинал тут: RAW Hollow – революция в управлении данными от Netflix

 No comments   1 mo   big data   Data   Programming

Iceberg в Trino: Путешествие по Вариантам Хранения, Сжатия и Конфигурации для Оптимальной Производительности

Iceberg, как табличный формат, совершил революцию в управлении данными в озерах данных (data lakes), предоставив транзакционные гарантии и схематическую эволюцию для данных

 1 comment   2 mo   big data   Iceberg

Сравнение решений для Schema Registry: Confluent vs Apicurio

Schema Registry (реестр схем) — критический компонент в экосистеме Apache Kafka, обеспечивающий контракты данных, управление эволюцией схем и валидацию сообщений

 No comments   2 mo   big data   Metadata

Кликозявый эластикозавр обзёрнообразный – ClickStack

Представляем ClickStack Сегодня мы рады анонсировать ClickStack — новое опенсорсное решение для обсервабилити, созданное на базе ClickHouse...

 No comments   3 mo   big data   ClickHouse   Data Engineer   Logs

The DuckLake Manifesto: SQL как формат Lakehouse

DuckLake упрощает Lakehouse, используя стандартную базу данных SQL для всех метаданных вместо сложных файловых систем, при этом храня данные в открытых форматах

 No comments   3 mo   big data   Data   DuckDB

Apache SeaTunnel MCP Server

SeaTunnel MCP Server – это интеллектуальный мост, соединяющий инструменты программирования ИИ и SeaTunnel

 No comments   5 mo   big data   Data Engineer
Earlier Ctrl + ↓