Welcome to my personal place for love, peace and happiness❣️

Tag: big data

24 posts   See also:  Data Engineer   Data   Data Mesh   Open Source   Trino

Хроники Apache SeaTunnel

Давно откопал этого китайского друга уже успело выйти пару версий. Не могу сказать, что хорошо с ним знаком, но чем то он меня по прежнему манит, то ли своей солидностью гибкой архитектуры

2 mo   big data   Data Engineer   Data Mesh

Airflow 2.10

Введение Саммит Airflow не за горами (10–12 сентября), и поэтому время было идеальным для нового важного релиза Airflow

2 mo   big data   Data   Data Engineer   Open Source

Databricks открыли код Unity Catalog

Знали ли вы, что Databricks открыли код Unity Catalog? Если нет, вас можно понять. В конце концов, в ту же неделю, когда это было объявлено на Databricks Data + AI Summit

2 mo   big data   Data   Data Engineer

DuckDB + Attached postgres

Давно уже прошел вебинар про DuckDB, а я еще обещал ответить на вопросы

2 mo   big data   Data   Data Engineer

Почему мы перешли с Dremio на Trino

В нашей постоянно развивающейся индустрии данных, выбор правильного инструмента может существенно повлиять на эффективность и гибкость работы

3 mo   big data   Data Mesh   Trino

Lance — современный колоночный формат данных для ML

🌟 Lance — современный колоночный формат данных для ML-приложений, реализованный на Rust

4 mo   AI   big data

Как Binance строил 100PB сервис для обработки логов на Quickwit

Оригинал: https://quickwit.io/blog/quickwit-binance-story

4 mo   big data   Quickwit

Data Products Starburst Special Edition

Новая книга по теме “Продукты данных” на основе исходного текста с комментариями GPT

5 mo   big data   Data   Data Mesh   Data Products

Databricks откроет исходные коды Unity Catalog

Оригинал: https://www.datanami.com/2024/06/12/databricks-to-open-source-unity-catalog/

5 mo   big data

Подробное руководство по установке и настройке SeaTunnel и SeaTunnel-Web на CentOS 7.x

Оригинал: https://apacheseatunnel.medium.com/comprehensive-guide-to-installing-and-configuring-seatunnel-and-seatunnel-web-on-centos-7-x-d98827edf2fc

9 mo   big data   Data Engineer

Оценка качества данных: Следующий этап обеспечения качества данных в Airbnb

https://medium.com/airbnb-engineering/data-quality-score-the-next-chapter-of-data-quality-at-airbnb-851dccda19c3

10 mo   big data   Data Governance   Data Quality

Инженер по данным

https://medium.com/free-code-camp/the-rise-of-the-data-engineer-91be18f1e603

10 mo   big data   Data Engineer

Сравнение Query движков Trino и StarRocks

https://blog.devgenius.io/comparison-of-the-open-source-query-engines-trino-and-starrocks-cf959049f9ab

10 mo   big data   mpp   StarRocks   Trino
Earlier Ctrl + ↓