Нейронка для поиска локаций по фото
Очерендная нейронка для поиска по фото.
Работает норм. Варианты подбирает логично.



Welcome to my personal place for love, peace and happiness 🤖
Очерендная нейронка для поиска по фото.
Работает норм. Варианты подбирает логично.
Всем привет! Недавно посетил конференцию The Trends, посвященную криптовалютам, ИИ, трендам. Изначально не планировал идти, но возможность получить VIP-доступ в обмен на участие в дискуссионной панели была слишком соблазнительна. В целом, все прошло нормально, хотя организация была немного хуже, чем в прошлый раз, но масштаб мероприятия был больше.
Некоторые залы были полупустыми, например, где стартапы представляли свои проекты. Им хотелось бы больше внимания. Однако в других залах, например, в зале, посвященном искусственному интеллекту, где проходил конкурс короткометражных фильмов, созданных за 48 часов, было очень многолюдно. Главная сцена периодически заполнялась в ожидании интересных докладов. В целом, большинство участников остались довольны.
Конференция была посвящена трендам в различных областях: искусственном интеллекте, блокчейне, развитии городов, цифровом искусстве (где я участвовал в дискуссионной панели), инвестициях, майнинге, трейдинге и других “хайпожорских” направлениях).
Одно из интересных наблюдений было связано с докладом о направлении Depin. Если вы хотите узнать больше, вот статья на РБК по этой теме: https://www.rbc.ru/crypto/news/661f8a929a794794a96553d6.
Докладчик рассказал о том, как три года назад вложил 8 тысяч и заработал более 100 тысяч. Конечно, речь шла не о его успехах, а о популярном сейчас направлении среди венчурных капиталистов. Depin (decentralized physical infrastructure networks) – это объединение разрозненных вычислительных ресурсов в единую сеть, где эти ресурсы можно покупать и продавать и все управляется в блокчейне. Например, проект Rendernetwork объединяет ресурсы графических карт и позволяет арендовать их для различных вычислений за небольшую плату.
Другой известный проект – Internet Computer, который сейчас на слуху, но подобных проектов уже насчитывается более тысячи. Я участвую в одном из таких Depin-проектов, сдавая в аренду свой большой жесткий диск и получая за это небольшое вознаграждение. Чем больше проект задействован, тем больше нагрузка на чтение данных и выгода от этого. Всем хорошего воскресения – будьте в тренде 🙂 ПС: тут проходил конкурс фильмов: https://myfilm48.ru/ а вот фильм самого победителя
Первое место:
Второе место:
третье:
Был в прошлом году, было отлично! В этом году будет еще больше гостей!
15-16 Мая 2024 м. Павелецкая.
Билеты тут: The Trends 2.0
Локация: ->>
Присоединяйся!
Массово запустили минты и рынок заполнился, флор доходит до 3 тон за 10 млн. Но купить по такой цене практически нереально. Видимо боты работают.
Brickspacer ...
Brickspacer — современный художник, режиссер анимации и дизайнер персонажей. Его работы неоднократно взрывались в Интернете, вдохновляя множество других авторов. Вы наверняка хотя бы раз сталкивались с его потрясающими персонажами.
Видеохолсты художника не только доступны для покупки на рынке криптоарта, но и демонстрируются на видных выставках в мировых культурных столицах, таких как Токио, Дубай, Пекин, Берлин, Лондон и Нью-Йорк.
Хочу тартугу))
“Я вмещаю множество” – это медитация о глубоко сложной природе существования и парадоксе личности. Сначала я создал это произведение в смешанной технике “поток сознания”, используя акварель, акриловую краску, ручку, маркер, а затем добавил цифровую подтяжку лица. На заднем плане – отрывки из моего любимого стихотворения Уолта Уитмена “Песня о себе”. Давайте не будем бояться быть большими и иногда противоречить самим себе.
Гейб Вайс – художник смешанных медиа и NFT, живущий в районе залива. Художник-самоучка вдохновлен уличным искусством и философией стоицизма и использует подход потока сознания в своей работе, чтобы исследовать восприятие реальности.
Его физические и цифровые работы демонстрируются по всему миру. В прошлом году его работы были показаны на Венецианской биеннале, в музее Пикассо, на художественной ярмарке в Сиэтле и в различных галереях по всей Азии и Соединенным Штатам.
Гейб недавно выпустил коллекцию Stoics, состоящую из 5000 предметов, которая разошлась за считанные минуты и представляет его личную философию жизнестойкости через стоицизм.
Гейб привержен экологичности в своем ремесле. Повторно используя старые материалы, найденные по всему дому, такие как коробки из-под хлопьев, карты и старые словари, для создания вневременных произведений, он надеется, что его работа вдохновит других на повторное использование материалов в рамках их художественной практики.
https://superrare.com/0xb932a70a57673d89f4acffbe830e8ed7f75fb9e0/anitya-47535
Все было 🤘
Оригинал: https://alirezasadeghi1.medium.com/open-source-data-engineering-landscape-2024-8a56d23b7fdb
Исходный пост был опубликован на Practical Data Engineering Substack.
Введение
Пока широко распространенный хайп вокруг Генеративного ИИ и ChatGPT взволновал мир технологий, 2023 год стал еще одним захватывающим и живым годом в ландшафте инженерии данных, который стабильно становился более разнообразным и сложным, с непрерывным инновационным и эволюционным процессом на всех уровнях аналитической иерархии.
С продолжающимся распространением инструментов с открытым исходным кодом, фреймворков и решений возросло количество вариантов, доступных для инженеров данных! В таком быстро меняющемся ландшафте важность быть в курсе последних технологий и тенденций не может быть переоценена. Умение выбирать правильный инструмент для нужной работы – это важный навык, обеспечивающий эффективность и актуальность в условиях постоянно меняющихся вызовов инженерии данных.
Будучи внимательным наблюдателем за тенденциями в инженерии данных в моей роли старшего инженера данных и консультанта, я хотел бы представить ландшафт открытых исходных данных в начале 2024 года. Это включает в себя выявление ключевых активных проектов и важных инструментов, давая читателям возможность принимать обоснованные решения при навигации в этом динамичном технологическом ландшафте.
Почему представлять еще один ландшафт?
Почему тратить усилия на представление еще одного ландшафта данных!? Есть аналогичные периодические отчеты, такие как известный MAD Landscape, State of Data Engineering и Reppoint Open Source Top 25, однако ландшафт, который я представляю, фокусируется исключительно на инструментах с открытым исходным кодом, в основном применимых к платформам данных и жизненному циклу инженерии данных.
MAD Landscape предоставляет очень полное представление о всех инструментах и услугах для машинного обучения, искусственного интеллекта и данных, включая как коммерческие, так и открытые исходники, тогда как представленный здесь ландшафт предоставляет более полное представление о активных проектах с открытым исходным кодом в части данных MAD. Другие отчеты, такие как Reppoint Open Source Top 25 и Data50, фокусируются больше на поставщиках SaaS и стартапах, тогда как этот отчет фокусируется на самих проектах с открытым исходным кодом, а не на услугах SaaS.
Ежегодные отчеты и опросы, такие как Github’s state of open source, ежегодный опрос Stackoverflow и отчеты OSS Insight, также являются отличными источниками для получения представления о том, что используется или популярно в сообществе, но они охватывают только ограниченные разделы (например, базы данных и языки) общего ландшафта данных.
Поэтому из-за моего интереса к открытым стекам данных я составил список инструментов с открытым исходным кодом и услуг в экосистеме инженерии данных.
Так что без дополнительного ожидания, вот Экосистема открытых исходных данных инженерии 2024 года:
Критерии выбора инструментов
Доступные проекты с открытым исходным кодом для каждой категории, очевидно, обширны, что делает невозможным включение каждого инструмента и сервиса в картину. Поэтому я придерживался следующих критериев при выборе инструментов для каждой категории:
Обзор категорий инструментов
В следующем разделе кратко обсуждается каждая категория.
Для слоя хранения распределенные файловые системы и объектные хранилища по-прежнему являются основными технологиями, служащими основой как для реализаций хранилищ данных на месте, так и для облачных. В то время как HDFS по-прежнему является основной технологией, используемой для кластеров Hadoop на месте, распределенное объектное хранилище Apache Ozone набирает обороты, чтобы предоставить альтернативную технологию хранения данных на месте. Cloudera, основной коммерческий поставщик Hadoop, теперь предлагает Ozone в рамках своего предложения CDP Private Cloud.
Выбор формата сериализации данных влияет на эффективность хранения и производительность обработки. Apache ORC остается предпочтительным выбором для колоночного хранения в экосистемах Hadoop, в то время как Apache Parquet стал де-факто стандартом для сериализации данных в современных хранилищах данных. Его популярность обусловлена компактным размером, эффективным сжатием и широкой совместимостью с различными движками обработки.
Еще одним ключевым трендом в 2023 году стало разделение слоев хранения и вычислений. Многие системы хранения теперь предлагают интеграцию с облачными решениями для хранения объектов, такими как S3, используя их врожденную эффективность и эластичность. Такой подход позволяет масштабировать ресурсы обработки данных независимо от хранения, что приводит к экономии затрат и улучшенной масштабируемости. Поддержка Cockroachdb S3 в качестве хранилища и предложение Confluent по долгосрочному хранению данных тематической кафки на S3 дополнительно иллюстрируют этот тренд, подчеркивая растущее использование хранилищ данных как экономичных, долгосрочных решений для хранения.
Одним из самых горячих событий 2023 года стало появление открытых форматов таблиц. Эти фреймворки по существу действуют как абстракция таблицы и виртуальный уровень управления данными, находящийся над вашим хранилищем данных и слоем данных, как показано на следующей диаграмме.
Пространство открытых форматов таблиц в настоящее время контролируется ожесточенной борьбой за главенство между следующими тремя основными претендентами:
Apache Hudi: Изначально разработанный и открытый Uber, с основной целью разработки для обновлений данных практически в реальном времени и транзакций ACID.
Apache Iceberg: Родившийся из команды инженеров Netflix.
Delta Lake: Созданный и открытый Databricks, с безупречной интеграцией с платформой Databricks.
Полученное финансирование ведущими поставщиками SaaS в этой области в 2023 году – Databricks, Tabular и OneHouse – подчеркивает интерес рынка и их потенциал для дальнейшего развития управления данными на хранилищах данных.
Более того, сейчас разворачивается новый тренд с появлением объединенных уровней хранилищ данных. OneTable (недавно открыт OneHouse) и UniForm (в настоящее время не open source предложение от Databricks) – это первые два проекта, которые были объявлены в прошлом году. Эти инструменты выходят за рамки индивидуальных форматов таблиц, предлагая возможность работы со всеми тремя основными претендентами под одним зонтом. Это позволяет пользователям использовать универсальный формат, предоставляя данные обработчикам в их предпочитаемых форматах, что приводит к увеличению гибкости и мобильности.
Заключение
Это исследование открытой ландшафта инжиниринга данных представляет лишь мгновенный взгляд на динамичный и живой мир данных. Хотя важные инструменты и технологии были рассмотрены в различных категориях, экосистема продолжает быстро развиваться, появляясь новые решения.
Помните, что это не исчерпывающий список, и “лучшие” инструменты в конечном итоге определяются вашими конкретными потребностями и применением. Не стесняйтесь поделиться любыми замечательными инструментами, которые я упустил и которые, по вашему мнению, должны были быть включены.
Оригинальный пост был опубликован на Practical Data Engineering Substack.