<?xml version="1.0" encoding="utf-8"?> 
<rss version="2.0"
  xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd"
  xmlns:atom="http://www.w3.org/2005/Atom">

<channel>

<title>Yuriy Gavrilov: posts tagged bacalhau</title>
<link>https://gavrilov.info/tags/bacalhau/</link>
<description>Welcome to my personal place for love, peace and happiness 🤖 Yuiry Gavrilov</description>
<author></author>
<language>en</language>
<generator>Aegea 11.4 (v4171e)</generator>

<itunes:owner>
<itunes:name></itunes:name>
<itunes:email>yvgavrilov@gmail.com</itunes:email>
</itunes:owner>
<itunes:subtitle>Welcome to my personal place for love, peace and happiness 🤖 Yuiry Gavrilov</itunes:subtitle>
<itunes:image href="https://gavrilov.info/pictures/userpic/userpic-square@2x.jpg?1643451008" />
<itunes:explicit>no</itunes:explicit>

<item>
<title>Распределённое хранилище данных с Bacalhau и DuckDB</title>
<guid isPermaLink="false">218</guid>
<link>https://gavrilov.info/all/raspredelyonnoe-hranilische-dannyh-s-bacalhau-i-duckdb/</link>
<pubDate>Sun, 30 Mar 2025 21:35:04 +0300</pubDate>
<author></author>
<comments>https://gavrilov.info/all/raspredelyonnoe-hranilische-dannyh-s-bacalhau-i-duckdb/</comments>
<description>
&lt;p&gt;Оригинал тут: &lt;a href="https://blog.bacalhau.org/p/distributed-data-warehouse-with-bacalhau"&gt;https://blog.bacalhau.org/p/distributed-data-warehouse-with-bacalhau&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;Это часть 5-дневной серии о Bacalhau 1.7&lt;/p&gt;
&lt;p&gt;&lt;a href="https://blog.bacalhau.org/p/announcing-bacalhau-17-empowering"&gt;День 1: Анонс Bacalhau 1.7.0: Расширение возможностей предприятий за счет улучшенной масштабируемости, управления заданиями и поддержки&lt;/a&gt;&lt;br /&gt;
&lt;a href="https://blog.bacalhau.org/p/bacalhau-v170-day-2-scaling-your"&gt;День 2: Масштабирование вычислительных задач с помощью разделенных заданий Bacalhau&lt;/a&gt;&lt;br /&gt;
&lt;a href="https://blog.bacalhau.org/p/bacalhau-v170-day-3-streamlining"&gt;День 3: Упрощение безопасности: Облегчение модели аутентификации Bacalhau&lt;/a&gt;&lt;br /&gt;
&lt;a href="https://blog.bacalhau.org/p/bacalhau-v170-day-4-using-aws-s3"&gt;День 4: Использование разделения AWS S3 с Bacalhau&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;Это пятая часть – Распределенное хранилище данных с Bacalhau и DuckDB&lt;/p&gt;
&lt;p&gt;Во многих приложениях, полагающихся на хранилища данных, необходимо хранить источники данных в разных местах. Это может быть связано с соображениями конфиденциальности, нормативными требованиями или желанием обрабатывать данные ближе к источнику. Однако бывают случаи, когда необходимо проводить анализ этих источников данных из одного места, не перемещая данные.&lt;/p&gt;
&lt;p&gt;В этой статье Bacalhau используется для организации распределенной обработки, а DuckDB предоставляет возможности SQL-хранения и запросов для некоторой фиктивной информации о продажах, расположенной в ЕС и США.&lt;/p&gt;
&lt;p&gt;Предварительные требования&lt;/p&gt;
&lt;p&gt;Для воспроизведения этого руководства вам понадобятся следующие компоненты:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Bacalhau CLI&lt;/li&gt;
&lt;li&gt;Docker и Docker Compose&lt;/li&gt;
&lt;li&gt;Пример многорегиональной настройки:&lt;/li&gt;
&lt;/ul&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;git clone https://github.com/bacalhau-project/examples.git&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;Архитектура&lt;/p&gt;
&lt;p&gt;Пример файла Docker Compose и определения заданий Bacalhau в репозитории примеров имитируют следующую архитектуру:&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://gavrilov.info/pictures/image-169.png" width="1456" height="537" alt="" /&gt;
&lt;/div&gt;
&lt;ul&gt;
&lt;li&gt;Оркестратор Bacalhau:** Центральная панель управления для распределения заданий&lt;/li&gt;
&lt;li&gt;Вычислительные узлы:** Распределены по регионам, работают близко к данным&lt;/li&gt;
&lt;li&gt;Региональное хранилище:** Региональные хранилища данных, использующие MinIO в этой настройке&lt;/li&gt;
&lt;li&gt;DuckDB:** Механизм SQL-запросов, работающий на каждом вычислительном узле. Bacalhau использует пользовательский образ, который добавляет несколько определяемых пользователем функций для помощи в разделении больших наборов данных между узлами на основе следующих методов:
&lt;ul&gt;
  &lt;li&gt;`partition_by_hash`: Равномерное распределение файлов по разделам&lt;/li&gt;
  &lt;li&gt;`partition_by_regex`: Разделение на основе шаблонов&lt;/li&gt;
  &lt;li&gt;`partition_by_date`: Разделение на основе времени&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Вы можете найти более подробную информацию о том, как работают эти функции, в документации по пользовательскому образу.&lt;br /&gt;
Вы можете увидеть настройку каждого компонента в файле Docker Compose. Создайте архитектуру, выполнив следующую команду:&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;docker compose up -d&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;Файл Docker Compose использует несколько файлов конфигурации Bacalhau, которые вы можете увидеть в папке configuration, где вычислительные узлы помечены как узлы US и EU соответственно.&lt;/p&gt;
&lt;p&gt;Они также настраивают узлы оркестратора для записи данных в региональные бакеты MinIO.&lt;/p&gt;
&lt;p&gt;Создание образцов данных&lt;/p&gt;
&lt;p&gt;После того, как вы создали имитацию инфраструктуры, вы можете создать образцы данных, используя задание генератора данных, чтобы записать 3000 записей в каждый регион в формате JSON в соответствующий бакет MinIO.&lt;/p&gt;
&lt;h2&gt;Перейдите в каталог заданий&lt;/h2&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;cd ../jobs&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;Сгенерируйте данные для США:&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;bacalhau job run -V Region=us -V Events=3000 \
-V StartDate=2024-01-01 -V EndDate=2024-12-31 \
-V RotateInterval=month data-generator.yaml&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;Сгенерируйте данные для ЕС:&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;bacalhau job run -V Region=eu -V Events=3000 \
-V StartDate=2024-01-01 -V EndDate=2024-12-31 \
-V RotateInterval=month data-generator.yaml&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;Доступ к данным для анализа&lt;/p&gt;
&lt;p&gt;Bacalhau поддерживает два способа доступа к региональным данным:&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Источники ввода Bacalhau**&lt;/li&gt;
&lt;/ul&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;InputSources:
    - Type: s3
      Source:
        Bucket: local-bucket
        Key: &amp;quot;data/*&amp;quot;&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;Этот метод предоставляет больше контроля, параметров предварительной обработки и поддерживает другие типы источников, помимо S3.&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Прямой доступ DuckDB**&lt;/li&gt;
&lt;/ul&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;SET VARIABLE files = (
    SELECT LIST(file)
    FROM partition_by_hash('s3://local-bucket/**/*.jsonl')
    );
    SELECT * FROM read_json_auto(getvariable('files'));&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;Этот метод проще и привычнее для заданий, использующих только SQL. Определения заданий также используют SQL-запросы для обработки данных из источника ввода.&lt;/p&gt;
&lt;p&gt;Выполнение анализа&lt;/p&gt;
&lt;p&gt;После размещения данных вы можете отправлять задачи анализа в виде заданий Bacalhau. В каждом случае, после запуска задания используйте `&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;bacalhau job describe &amp;lt;job_id&amp;gt;&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;`, чтобы увидеть результаты задания, передав идентификатор задания из вывода команды `&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;bacalhau job run&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;`. Во всех примерах показано использование данных из США. Вы также можете изменить `Region` на `eu`, чтобы увидеть результаты из региона ЕС.&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;Анализ месячных трендов**&lt;/li&gt;
&lt;/ul&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;bacalhau job run -V Region=us monthly-trends.yaml&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;Определение задания.&lt;/p&gt;
&lt;p&gt;Пример вывода:&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;month      | total_txns | revenue | unique_customers | avg_txn_value
------------|------------|----------|------------------|---------------
2024-03-01 | 3,421      | 178,932  | 1,245            | 52.30
2024-02-01 | 3,156      | 165,789  | 1,189            | 52.53
2024-01-01 | 2,987      | 152,456  | 1,023            | 51.04&lt;/code&gt;&lt;/pre&gt;&lt;ul&gt;
&lt;li&gt;Оперативный мониторинг**&lt;/li&gt;
&lt;/ul&gt;
&lt;ul&gt;
&lt;li&gt;Hourly Operations (Почасовые операции)
&lt;ul&gt;
  &lt;li&gt;Отслеживает метрики работоспособности&lt;/li&gt;
  &lt;li&gt;Контролирует процент успешных транзакций&lt;/li&gt;
  &lt;li&gt;Показывает почасовые закономерности&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;/ul&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;bacalhau job run -V Region=us hourly-operations.yaml&lt;/code&gt;&lt;/pre&gt;&lt;ul&gt;
&lt;li&gt;Anomaly Detection (Обнаружение аномалий)
&lt;ul&gt;
  &lt;li&gt;Идентифицирует необычные паттерны&lt;/li&gt;
  &lt;li&gt;Использует статистический анализ&lt;/li&gt;
  &lt;li&gt;Отмечает значительные отклонения&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;/ul&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;bacalhau job run -V Region=us anomaly-detection.yaml&lt;/code&gt;&lt;/pre&gt;&lt;ul&gt;
&lt;li&gt;Бизнес-аналитика**&lt;/li&gt;
&lt;/ul&gt;
&lt;ul&gt;
&lt;li&gt;Product Performance (Эффективность продукта)
&lt;ul&gt;
  &lt;li&gt;Анализирует эффективность категорий&lt;/li&gt;
  &lt;li&gt;Отслеживает долю рынка&lt;/li&gt;
  &lt;li&gt;Показывает паттерны продаж&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;/ul&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;bacalhau job run -V Region=us product-performance.yaml&lt;/code&gt;&lt;/pre&gt;&lt;ul&gt;
&lt;li&gt;Monthly Trends (Месячные тренды)
&lt;ul&gt;
  &lt;li&gt;Долгосрочный анализ трендов&lt;/li&gt;
  &lt;li&gt;Месячные агрегации&lt;/li&gt;
  &lt;li&gt;Ключевые бизнес-показатели&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;/ul&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;bacalhau job run -V Region=us monthly-trends.yaml&lt;/code&gt;&lt;/pre&gt;&lt;ul&gt;
&lt;li&gt;Анализ клиентов**&lt;/li&gt;
&lt;/ul&gt;
&lt;ul&gt;
&lt;li&gt;Customer Segmentation (Two-Phase) (Сегментация клиентов (Двухфазная))
&lt;ul&gt;
  &lt;li&gt;Фаза 1: Вычисление локальных метрик&lt;/li&gt;
  &lt;li&gt;Фаза 2: Объединение и сегментация&lt;/li&gt;
  &lt;li&gt;Запустите Фазу 1&lt;/li&gt;
&lt;/ul&gt;
&lt;/li&gt;
&lt;/ul&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;bacalhau job run -V Region=us customer-segments-phase1.yaml&lt;/code&gt;&lt;/pre&gt;&lt;ul&gt;
&lt;li&gt;Запомните ID задания и запустите Фазу 2&lt;/li&gt;
&lt;/ul&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;bacalhau job run -V Region=us -V JobID=&amp;lt;phase1-job-id&amp;gt; customer-segments-phase2.yaml&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;Итог&lt;/p&gt;
&lt;p&gt;В этой статье объединены распределенные вычислительные мощности Bacalhau с гибкими возможностями SQL DuckDB для создания распределенного хранилища данных, разнесенного по регионам. Примеры заданий Bacalhau предоставляют ряд аналитических задач, от оперативного мониторинга до сегментации клиентов, при этом данные остаются в исходном месте и используются запросы SQL к данным, хранящимся в S3-совместимых бакетах.&lt;/p&gt;
</description>
</item>

<item>
<title>Распределенное машинное обучение с помощью Bacalhau Bluesky Bot</title>
<guid isPermaLink="false">188</guid>
<link>https://gavrilov.info/all/raspredelennoe-mashinnoe-obuchenie-s-pomoschyu-bacalhau-bluesky/</link>
<pubDate>Thu, 23 Jan 2025 00:14:48 +0300</pubDate>
<author></author>
<comments>https://gavrilov.info/all/raspredelennoe-mashinnoe-obuchenie-s-pomoschyu-bacalhau-bluesky/</comments>
<description>
&lt;h4&gt;Распределенное машинное обучение с помощью Bacalhau Bluesky Bot&lt;/h4&gt;
&lt;p&gt;Использование моделей машинного обучения стало проще, чем когда-либо!&lt;br /&gt;
&lt;b&gt;Шон М. Трейси&lt;/b&gt;&lt;/p&gt;
&lt;p&gt;22 января  2025&lt;/p&gt;
&lt;p&gt;Оригинал: &lt;a href="https://blog.bacalhau.org/p/distributed-ml-with-the-bacalhau"&gt;https://blog.bacalhau.org/p/distributed-ml-with-the-bacalhau&lt;/a&gt;&lt;br /&gt;
Бот: &lt;a href="https://github.com/bacalhau-project/bacalhau-bluesky-bot"&gt;https://github.com/bacalhau-project/bacalhau-bluesky-bot&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;---&lt;/p&gt;
&lt;p&gt;Некоторое время назад мы выпустили Bacalhau Bluesky Bot (профиль Bluesky). Мы подумали, что это будет интересный способ показать людям, насколько просто интегрировать существующие приложения и сервисы с сетью Bacalhau, а также дать возможность пользователям запускать задачи.&lt;/p&gt;
&lt;p&gt;Но Bacalhau Bot может делать гораздо больше, чем просто выполнять код и возвращать результаты. Мы решили продемонстрировать, как легко Bacalhau можно использовать для запуска моделей машинного обучения на любых доступных вычислительных ресурсах, и вот что у нас получилось!&lt;/p&gt;
&lt;h4&gt;Что он делает?&lt;/h4&gt;
&lt;p&gt;В первой версии Bacalhau Bluesky Bot вы могли запускать задачи, отправляя команды, как в Bacalhau CLI. Например:&lt;/p&gt;
&lt;p&gt;```&lt;br /&gt;
@jobs.bacalhau.org job run &lt;URL_TO_CONFIG.YAML_FILE&gt;&lt;br /&gt;
```&lt;/p&gt;
&lt;p&gt;Мы сделали это так, чтобы люди, знакомые с CLI, сразу понимали, что можно делать с помощью бота, а те, кто никогда не использовал CLI, могли познакомиться с Bacalhau, не настраивая всю сеть.&lt;/p&gt;
&lt;p&gt;Теперь мы немного отошли от интерфейса CLI, чтобы показать более специализированные сценарии использования. Начиная с сегодняшнего дня, вы можете классифицировать любое изображение, отправив его Bacalhau Bluesky Bot с прикрепленной картинкой в посте. Bacalhau использует YOLO для обнаружения объектов на изображении и отправляет результат обратно — всё это занимает менее 30 секунд!&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://gavrilov.info/pictures/image-112.png" width="1600" height="1036" alt="" /&gt;
&lt;/div&gt;
&lt;h4&gt;Как это работает?&lt;/h4&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://gavrilov.info/pictures/image-113.png" width="1600" height="800" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;В принципе работы Bacalhau Bluesky Bot мало что изменилось, просто добавился код для обработки задач классификации и возврата результатов после их выполнения.&lt;/p&gt;
&lt;p&gt;Когда вы отправляете изображение боту с командой:&lt;/p&gt;
&lt;p&gt;```&lt;br /&gt;
@jobs.bacalhau.org classify&lt;br /&gt;
```&lt;/p&gt;
&lt;p&gt;Бот читает ваш пост, получает URL изображения и отправляет задачу в сеть Bacalhau Bot Network. Эта сеть ничем не отличается от обычной сети Bacalhau, за исключением того, что взаимодействовать с ней можно только через Bacalhau Bluesky Bot.&lt;/p&gt;
&lt;p&gt;Бот загружает шаблонный файл `job.yaml`, который указывает контейнер для выполнения задачи, и передает переменные для загрузки вашего изображения и его классификации.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://gavrilov.info/pictures/image-114.png" width="1096" height="654" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;После загрузки YAML-файла он преобразуется в JSON и отправляется через API в оркестратор Bacalhau, который запускает задачу и возвращает ID задачи.&lt;/p&gt;
&lt;p&gt;Оркестратор анализирует сеть и назначает задачу на любой доступный вычислительный узел.&lt;/p&gt;
&lt;p&gt;Узел, получивший задачу, использует переменные окружения из `job.yaml`, чтобы загрузить изображение из CDN Bluesky, а затем применяет YOLO для классификации объектов на изображении.&lt;/p&gt;
&lt;p&gt;Этот процесс занимает около 10 секунд — даже на машине без GPU. Это яркий пример того, насколько продвинулись модели машинного обучения за последние годы, позволяя выполнять сложные задачи на устройствах, которые раньше с этим не справлялись.&lt;/p&gt;
&lt;p&gt;После классификации изображения наш код рисует ограничивающие рамки вокруг объектов на новом файле, отправляет его в хранилище объектов вместе с метаданными для последующего извлечения ботом и возвращает UUID, который бот использует для доступа к этим данным.&lt;/p&gt;
&lt;p&gt;Пока всё это происходит, Bacalhau Bluesky Bot отслеживает задачу и через 30 секунд использует возвращенный UUID, чтобы получить классифицированное изображение и метаданные из общего хранилища объектов.&lt;/p&gt;
&lt;p&gt;После этого бот использует API Bluesky, чтобы опубликовать ответ с метаданными и аннотированным изображением в ответ на исходный пост. И вуаля! Вы получаете результат работы распределенной системы машинного обучения прямо в уведомлениях Bluesky!&lt;/p&gt;
&lt;h4&gt;Попробуйте сами!&lt;/h4&gt;
&lt;p&gt;Эти изменения уже доступны! Просто зайдите в Bluesky под своим аккаунтом и отправьте пост:&lt;/p&gt;
&lt;p&gt;```&lt;br /&gt;
@jobs.bacalhau.org classify&lt;br /&gt;
```&lt;/p&gt;
&lt;p&gt;...с прикрепленным изображением, и мы предоставим вам результаты классификации менее чем за минуту!&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://gavrilov.info/pictures/image-115.png" width="1600" height="625" alt="" /&gt;
&lt;/div&gt;
&lt;h4&gt;Заключение&lt;/h4&gt;
&lt;p&gt;Мы создали Bacalhau Bluesky Bot, чтобы показать, насколько просто интегрировать продукты, приложения и платформы с Bacalhau. Если у вас есть идея, как можно использовать распределенные вычисления, дайте нам знать! Мы всегда рады услышать интересные и инновационные идеи, которые продвигают распределенные вычисления вперед!&lt;/p&gt;
&lt;p&gt;Работает :)&lt;/p&gt;
&lt;p&gt;@jobs.bacalhau.org classify&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://gavrilov.info/pictures/Snimok-ekrana-2025-01-23-v-00.38.18.png" width="1670" height="1638" alt="" /&gt;
&lt;/div&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://gavrilov.info/pictures/Snimok-ekrana-2025-01-23-v-00.41.29.png" width="1696" height="1062" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;и даже так :)&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://gavrilov.info/pictures/Snimok-ekrana-2025-01-23-v-20.58.20.png" width="1680" height="1568" alt="" /&gt;
&lt;/div&gt;
</description>
</item>

<item>
<title>Bacalhau – платформа для быстрой, недорогой и безопасной вычислительной технологии</title>
<guid isPermaLink="false">88</guid>
<link>https://gavrilov.info/all/bacalhau-platforma-dlya-bystroy-nedorogoy-i-bezopasnoy-vychislit/</link>
<pubDate>Sun, 03 Dec 2023 22:42:01 +0300</pubDate>
<author></author>
<comments>https://gavrilov.info/all/bacalhau-platforma-dlya-bystroy-nedorogoy-i-bezopasnoy-vychislit/</comments>
<description>
&lt;p&gt;Частичный перевод &lt;a href="https://www.bacalhau.org"&gt;https://www.bacalhau.org&lt;/a&gt; &lt;a href="https://github.com/bacalhau-project/bacalhau"&gt;https://github.com/bacalhau-project/bacalhau&lt;/a&gt; и &lt;a href="http://expanso.io"&gt;http://expanso.io&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;&lt;a href="https://www.bacalhau.org"&gt;https://www.bacalhau.org&lt;/a&gt; — это платформа для быстрой, недорогой и безопасной вычислительной технологии, которая позволяет пользователям запускать вычислительные задания там, где данные создаются и хранятся.&lt;br /&gt;
С открытым исходным кодом программного обеспечения bacalhau вы можете оптимизировать свои существующие рабочие процессы без необходимости переписывать код, выполняя задачи Docker и веб-ассемблера (WASM) в виде заданий. Эта архитектура также известна как вычисление над данными (CoD).&lt;br /&gt;
Название “bacalhau” происходит от португальского слова для треска.&lt;/p&gt;
&lt;p&gt;bacalhau стремится преобразовать обработку данных для больших наборов данных, улучшить эффективность и снизить стоимость, а также открыть обработку данных для более широкой аудитории. Наша цель — создать открытую, совместную вычислительную экосистему, которая позволит совершить несравненную коллаборацию. Мы (Expanso.io) предлагаем демонстрационную сеть, чтобы вы могли попробовать работу без установки. Попробуйте!&lt;/p&gt;
&lt;p&gt;Почему Бакальхау?&lt;br /&gt;
⚡️ Бакальхау упрощает процесс управления вычислительными заданиями, предоставляя единую платформу для управления заданиями в разных регионах, облаках и устройствах на границе сети.&lt;br /&gt;
🤝 Бакальхау обеспечивает надежную и устойчивую к сетевым сбоям оркестрацию, гарантируя, что ваши задания будут выполнены даже при сетевых сбоях.&lt;br /&gt;
🚨 Бакальхау предоставляет полную и постоянную аудиторскую запись того, что произошло, поэтому вы можете быть уверены, что ваши задания выполняются безопасно.&lt;br /&gt;
🔐 Вы можете запускать частные рабочие процессы для снижения вероятности утечки конфиденциальной информации или случайной передачи ваших данных за пределы вашей организации.&lt;br /&gt;
💸 Бакальхау снижает затраты на вход и выход, поскольку задания обрабатываются ближе к источнику.&lt;br /&gt;
🤗 Вы можете прикрепить свои данные к любой машине, и Бакальхау сможет выполнять задания с этими данными.&lt;br /&gt;
💥 Вы можете интегрироваться с сервисами, работающими на узлах, для выполнения заданий, например на DuckDB.&lt;br /&gt;
📚 Бакальхау масштабируется для обработки параллельных заданий. Вы можете обрабатывать петабайты (квадриллионы байт) данных.&lt;/p&gt;
&lt;p&gt;А вот еще одна статья из рассылки:&lt;/p&gt;
&lt;p&gt;В проекте lighthouse, который принимает новые технологии, ВМС США выбрали открытое программное обеспечение Bacalhau, поддерживаемое Expanso, в качестве решения для оркестрации. Программное обеспечение Bacalhau помогает ВМС США достичь своей цели развертывания возможностей искусственного интеллекта в подводных операциях. Совместно с нашим партнером Mycelial, Expanso преодолел несколько препятствий, чтобы позволить использование аналитики с использованием искусственного интеллекта в сложных и суровых условиях глубоководных сред. Bacalhau также соответствовал строгим стандартам безопасности ВМС США, одновременно позволяя доступ к данным и вычислениям по неустойчивым сетям.&lt;/p&gt;
&lt;p&gt;Роль Bacalhau в беспилотных морских операциях&lt;br /&gt;
Современные военно-морские суда оснащены сложными датчиками и системами, которые повышают их боевую эффективность. Среди них, беспилотные подводные аппараты (UUV) и беспилотные поверхностные аппараты (USV) ВМС США генерируют значительное количество ценных данных, которые необходимы для принятия решений. Bacalhau улучшает возможности вычисления на устройстве этих беспилотных систем (так называемая Compute-over-Data), используя свой инновационный подход к бесшовной развертываемости на краю и предоставляя возможность планировать и контролировать задания из любой точки мира.&lt;/p&gt;
&lt;p&gt;Вклад Bacalhau в программу JADC2&lt;br /&gt;
Программа Joint All Domain Command and Control (JADC2) Департамента обороны ознаменовала важный шаг в направлении искусственного интеллекта/машинного обучения (AI/ML)-ориентированной боевой готовности. Bacalhau сыграл ключевую роль в этом сдвиге. Bacalhau облегчает развертывание сложных моделей, обслуживание и наблюдаемость развернутых решений и обеспечивает надежное обновление новых версий по мере обучения и доработки. Предоставление глобального обзора и надежной вычислительной мощности может быть особенно сложным при работе с сетями, которые могут отключиться в любое время; Bacalhau platform эффективно решает эти проблемы как часть своего дизайна.&lt;br /&gt;
Безупречная интеграция данных&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://gavrilov.info/pictures/image-1.png" width="342" height="342" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Успех этого проекта зависел от обмена данными по всему флоту беспилотных судов, как управляемых, так и беспилотных, а также в облачных средах. Bacalhau platform, в сочетании с коннектором Kafka Mycelial, обеспечил синхронизацию реального времени и вычисление на устройстве по сетям различного качества и пропускной способности.&lt;/p&gt;
&lt;p&gt;Минимальная инфраструктура, максимальная защита&lt;/p&gt;
&lt;p&gt;Конвенциональные решения требуют значительных инвестиций в аппаратное обеспечение, тогда как Bacalhau спроектирован на максимизацию эффективности с минимальной инфраструктурой и передачей данных. Если имеется доступная емкость, платформа Bacalhau может работать на существующих устройствах и системах, избегая необходимости новых аппаратных установок. Повторное использование существующих систем в организации также предлагает преимущества, поскольку они были проверены и заданы требования безопасности. Кроме того, в области, где пространство, вес и энергия (SWaP) являются критическими, Bacalhau демонстрирует, что эффективная обработка данных и защита могут быть достигнуты с минимальным использованием ресурсов. Bacalhau работает в гармонии с существующими технологиями, предлагая удобное решение для удовлетворения интенсивных потребностей морских операций.&lt;/p&gt;
&lt;p&gt;Bacalhau доступен как открытое программное обеспечение.&lt;br /&gt;
&lt;a href="https://github.com/bacalhau-project/bacalhau"&gt;https://github.com/bacalhau-project/bacalhau&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;А вот еще кусочек как можно все проверить и ознакомиться с архитектурой:&lt;/p&gt;
&lt;p&gt;Архитектура&lt;br /&gt;
Bacalhau — это пиринговая сеть узлов, которая позволяет осуществлять децентрализованное общение между компьютерами. В сети существуют два типа узлов:&lt;br /&gt;
Узел-запросчик: отвечает за обработку запросов пользователей, обнаружение и ранжирование вычислительных узлов, пересылку заданий на вычисление узлам вычисления и мониторинг жизненного цикла задания.&lt;br /&gt;
Узел вычисления: отвечает за выполнение заданий и получение результатов. Различные узлы вычисления могут использоваться для разных типов заданий, в зависимости от их возможностей и ресурсов.&lt;/p&gt;
&lt;div class="e2-text-picture"&gt;
&lt;img src="https://gavrilov.info/pictures/image-2.png" width="814" height="610" alt="" /&gt;
&lt;/div&gt;
&lt;p&gt;Узел-запросчик и узлы вычисления вместе образуют пиринговую сеть и используют госспинг для обнаружения друг друга, обмена информацией о возможностях узла, доступных ресурсах и состоянии здоровья.&lt;br /&gt;
Чтобы взаимодействовать с сетью Bacalhau, пользователи могут использовать интерфейс командной строки Bacalhau (Bacalhau CLI) для отправки запросов узлу-запросчику в сети. Эти запросы отправляются в формате JSON по протоколу HTTP, широко используемому для передачи данных в интернете.&lt;/p&gt;
&lt;p&gt;Установка:&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;curl -sL https://get.bacalhau.org/install.sh | bash&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;Этот пример демонстрирует, как использовать stable diffusion на графическом процессоре и запускать его в сети Bacalhau. stable diffusion — это передовое текстовый модельер, который генерирует изображения из текста и был разработан как открытая альтернатива DALL·E 2. Он основан на модели смешения вероятностного типа и использует трансформер для генерации изображений из текста.&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;bacalhau docker run --gpu 1 ghcr.io/bacalhau-project/examples/stable-diffusion-gpu:0.0.1 -- python main.py --o ./outputs --p &amp;quot;cod swimming through data&amp;quot;&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;После чего нужно скачать результаты командой&lt;/p&gt;
&lt;pre class="e2-text-code"&gt;&lt;code class=""&gt;bacalhau get &amp;lt;id&amp;gt;&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;подробнее тут: &lt;a href="https://docs.bacalhau.org/examples/model-inference/stable-diffusion-gpu/"&gt;https://docs.bacalhau.org/examples/model-inference/stable-diffusion-gpu/&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;Сам проект: &lt;a href="https://github.com/bacalhau-project/bacalhau"&gt;https://github.com/bacalhau-project/bacalhau&lt;/a&gt;&lt;br /&gt;
Разные примеры: &lt;a href="https://docs.bacalhau.org/examples"&gt;https://docs.bacalhau.org/examples&lt;/a&gt;&lt;/p&gt;
&lt;p&gt;Сам проверял некоторые, отлично работают и дока хорошая.&lt;br /&gt;
Еще хорошо, что такую сеть можно запустить у себя в приватном режиме.&lt;/p&gt;
</description>
</item>


</channel>
</rss>