Welcome to my personal place for love, peace and happiness 🤖

Tag: Data Governance

Мир без Kafka: Почему Kafka не подходит для аналитики реального времени, что идет на смену)

Статья описывает переход от традиционных систем обмена сообщениями, таких как Apache Kafka, к специализированным решениям для потоковой аналитики, таким как Apache Fluss

Data Contracts — соглашение между производителями и потребителями данных

Введение: Кризис доверия в мире данных Книга Чада Сандерсона и Марка Фримена «Data Contracts» выходит в момент глубокого кризиса в индустрии данных

От «зоопарка» технологий к Lakehouse: Итоги разговора с Вадимом Беловым

Летом в рамках стрима «Разговоры на Архитекторском» состоялась беседа с Вадимом Беловым, руководителем системной разработки больших данных в X5

Построение надежных ML-систем и технический долг

Машинное обучение (ML) превратилось из чисто исследовательской дисциплины в мощный инструмент для создания сложных и полезных продуктов

Сводная статья: Основы проектирования современного хранилища данных

Эта статья объединяет два материала из блога Apache SeaTunnel, посвященных фундаментальным принципам построения современных аналитических платформ

Описание патерна Slowly Changing Dimensions (SCD)

Slowly Changing Dimensions (SCD), или Медленно меняющиеся измерения, — это концепция и набор методов из области хранилищ данных

Описание патерна Write-Audit-Publish

Кстати, хорошо ложится на git-like подход работы с данными

Масштабируемые данные. 2-е изд. (Data Management at Scale)

Свежак, начал читать 📚 Около 700 рублей стоит цифровая версия тут

Как навести порядок в хаосе данных: стратегия для бизнеса

Любопытная статья про порядок и знания. Раньше к этому стремились большие компании, может даже инвестиционные, а сегодня это под силу даже мелким

Earlier Ctrl + ↓