Welcome to my personal place for love, peace and happiness 🤖

Tag: Data Engineer

StarRocks: Архитектура, Практика и место в современном Data Stack

StarRocks — это аналитическая MPP-база данных нового поколения

Битва титанов аналитики реального времени: StarRocks против ClickHouse

В мире больших данных, где счет идет на петабайты, а задержка измеряется миллисекундами, выбор правильного аналитического движка определяет успех продукта

R2 SQL: Глубокое погружение в наш новый движок для распределенных запросов

В современном мире объемы данных растут экспоненциально, и хранение петабайтов информации в объектных хранилищах

Data Stack 2.0: Закат Lambda-архитектуры и восход Fluss с Lance

В мире инфраструктуры данных происходит “тектонический сдвиг”, описанный в отчетах a16z.com. Индустрия отходит от сложной Lambda-архитектуры

Мир без Kafka: Почему Kafka не подходит для аналитики реального времени, что идет на смену)

Статья описывает переход от традиционных систем обмена сообщениями, таких как Apache Kafka, к специализированным решениям для потоковой аналитики, таким как Apache Fluss

Рейтинг Open Source Графовых СУБД для AdTech

Для задач AdTech сегментации (профилирование пользователей, identity resolution, поиск look-alike аудиторий

Обзор pg_clickhouse: Как объединить мощь ClickHouse и удобство PostgreSQL

Недавно компания ClickHouse представила новый инструмент — расширение pg_clickhouse. Это событие стало ответом на одну из самых частых болей разработчиков

Сравнительный анализ self-hosted S3-совместимых хранилищ

Четкое сравнение семи self-hosted S3-совместимых решений для хранения данных

Просто duckdb 🦆 ну красота же 😍

А тут еще много всякой дополнительно утиной косметики https://query.farm/duckdb_extensions.html

Обработка логов Trino из Kafka с помощью Vector для удаления полей

В современных архитектурах данных, построенных на Kafka, часто возникает задача обработки или фильтрации потока событий “на лету”

Earlier Ctrl + ↓