Welcome to my personal place for love, peace and happiness 🤖

Tag: Data Engineer

Сравнительный анализ self-hosted S3-совместимых хранилищ

Четкое сравнение семи self-hosted S3-совместимых решений для хранения данных

Просто duckdb 🦆 ну красота же 😍

А тут еще много всякой дополнительно утиной косметики https://query.farm/duckdb_extensions.html

Обработка логов Trino из Kafka с помощью Vector для удаления полей

В современных архитектурах данных, построенных на Kafka, часто возникает задача обработки или фильтрации потока событий “на лету”

dbt открывает исходный код MetricFlow: Управляемые метрики для AI и аналитики

Компания dbt Labs объявила о важном изменении в своей стратегии: `MetricFlow`, ключевая технология, лежащая в основе `dbt Semantic Layer`, становится полностью открытой

Сравнение Apache Iceberg, Delta Lake и Apache Hudi: Глубокий анализ (2025)

С ростом популярности архитектуры Data Lakehouse усилился интерес к трём основным открытым проектам в этой области...

Искусство скорости: Руководство по оптимизации для аналитики в Data Lakehouse с DuckDB

DuckDB завоевал огромную популярность как “SQLite для аналитики”. Это невероятно быстрый, встраиваемый, колоночный движок, который не требует отдельного сервера

Новая эра трансформации данных: dbt против Bruin и aaC

В мире данных произошла тихая, но фундаментальная революция. На смену традиционному подходу ETL (Extract, Transform, Load

Apache SeaTunnel – Движение к мультимодальной интеграции данных

В постоянно меняющемся мире больших данных эффективная и надежная интеграция данных является ключевым фактором для успеха любого предприятия

iceberg-kafka-connect

Крутой блог по всей экостистеме кафка, примеры по iceberg которые разобраны ниже

Описание патерна Slowly Changing Dimensions (SCD)

Slowly Changing Dimensions (SCD), или Медленно меняющиеся измерения, — это концепция и набор методов из области хранилищ данных

Earlier Ctrl + ↓