Tag: big data
Перевод: https://dev.to/seatunnel/seatunnel-powered-data-integration-how-58-group-handles-over-500-billion-data-points-daily-3d1m
Давно откопал этого китайского друга уже успело выйти пару версий. Не могу сказать, что хорошо с ним знаком, но чем то он меня по прежнему манит, то ли своей солидностью гибкой архитектуры
Введение Саммит Airflow не за горами (10–12 сентября), и поэтому время было идеальным для нового важного релиза Airflow
Знали ли вы, что Databricks открыли код Unity Catalog? Если нет, вас можно понять. В конце концов, в ту же неделю, когда это было объявлено на Databricks Data + AI Summit
В нашей постоянно развивающейся индустрии данных, выбор правильного инструмента может существенно повлиять на эффективность и гибкость работы
🌟 Lance — современный колоночный формат данных для ML-приложений, реализованный на Rust
Новая книга по теме “Продукты данных” на основе исходного текста с комментариями GPT
Оригинал: https://www.datanami.com/2024/06/12/databricks-to-open-source-unity-catalog/
Оригинал: https://apacheseatunnel.medium.com/comprehensive-guide-to-installing-and-configuring-seatunnel-and-seatunnel-web-on-centos-7-x-d98827edf2fc
https://medium.com/airbnb-engineering/data-quality-score-the-next-chapter-of-data-quality-at-airbnb-851dccda19c3