Welcome to my personal place for love, peace and happiness 🤖

Tag: Data Engineer

Рейтинг Open Source Графовых СУБД для AdTech

Для задач AdTech сегментации (профилирование пользователей, identity resolution, поиск look-alike аудиторий

Обзор pg_clickhouse: Как объединить мощь ClickHouse и удобство PostgreSQL

Недавно компания ClickHouse представила новый инструмент — расширение pg_clickhouse. Это событие стало ответом на одну из самых частых болей разработчиков

Сравнительный анализ self-hosted S3-совместимых хранилищ

Четкое сравнение семи self-hosted S3-совместимых решений для хранения данных

Просто duckdb 🦆 ну красота же 😍

А тут еще много всякой дополнительно утиной косметики https://query.farm/duckdb_extensions.html

Обработка логов Trino из Kafka с помощью Vector для удаления полей

В современных архитектурах данных, построенных на Kafka, часто возникает задача обработки или фильтрации потока событий “на лету”

dbt открывает исходный код MetricFlow: Управляемые метрики для AI и аналитики

Компания dbt Labs объявила о важном изменении в своей стратегии: `MetricFlow`, ключевая технология, лежащая в основе `dbt Semantic Layer`, становится полностью открытой

Сравнение Apache Iceberg, Delta Lake и Apache Hudi: Глубокий анализ (2025)

С ростом популярности архитектуры Data Lakehouse усилился интерес к трём основным открытым проектам в этой области...

Искусство скорости: Руководство по оптимизации для аналитики в Data Lakehouse с DuckDB

DuckDB завоевал огромную популярность как “SQLite для аналитики”. Это невероятно быстрый, встраиваемый, колоночный движок, который не требует отдельного сервера

Новая эра трансформации данных: dbt против Bruin и aaC

В мире данных произошла тихая, но фундаментальная революция. На смену традиционному подходу ETL (Extract, Transform, Load

Apache SeaTunnel – Движение к мультимодальной интеграции данных

В постоянно меняющемся мире больших данных эффективная и надежная интеграция данных является ключевым фактором для успеха любого предприятия

Earlier Ctrl + ↓