логотип PurpleSchool
логотип PurpleSchool

Развертывание Airflow в Docker

Автор

Ольга Смирнова

Введение

Apache Airflow – это платформа с открытым исходным кодом для автоматизации, составления и мониторинга рабочих процессов. Она чрезвычайно удобна для управления сложными процессами обработки данных и используется в различных отраслях для автоматизации рутинных задач. Одним из популярных способов развертывания Apache Airflow является использование Docker, который позволяет изолировать приложение и его зависимости в контейнере, обеспечивая портативность и легкость управления.

В этой статье мы рассмотрим, как развернуть Airflow в Docker, чтобы вы могли эффективно управлять рабочими процессами независимо от инфраструктуры. Мы погрузимся в детали настройки и посмотрим, как Airflow функционирует в контейнизированной среде.

Конфигурация и установка Docker

Установка Docker

Прежде чем приступить к развертыванию Airflow, вам необходимо убедиться, что у вас установлен Docker. Docker позволяет запускать приложения в изолированных контейнерах.

  1. Установка Docker на Ubuntu:

    sudo apt-get update
    sudo apt-get install docker-ce docker-ce-cli containerd.io
  2. Проверка установки Docker:

    После установки Docker, проверьте, работает ли он, выполнив команду:

    docker --version

    Эта команда должна вывести текущую версию Docker, что подтверждает успешную установку.

Установка Docker Compose

Docker Compose упрощает запуск мультимодульных контейнеров. Airflow обычно требует множества сервисов, и Docker Compose идеален для управления ими.

  1. Установка Docker Compose:

    sudo curl -L "https://github.com/docker/compose/releases/download/1.29.2/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose
    sudo chmod +x /usr/local/bin/docker-compose
  2. Проверка установки Docker Compose:

    Вы можете проверить успешность установки следующей командой:

    docker-compose --version

    Она должна вывести версию Docker Compose.

Настройка Airflow с использованием Docker Compose

Структура папок и файлов

Для начала работы создадим базовую структуру директорий и файлов, необходимых для запуска Airflow в Docker.

  1. Создайте новую директорию, в которой будет размещена конфигурация Airflow:

    mkdir airflow-docker
    cd airflow-docker
  2. Создайте файл docker-compose.yml, который будет содержать конфигурацию для Docker Compose:

    version: '3'
    services:
      postgres:
        image: postgres:13
        environment:
          POSTGRES_USER: airflow
          POSTGRES_PASSWORD: airflow
          POSTGRES_DB: airflow
        
      webserver:
        image: apache/airflow:2.2.2
        depends_on:
          - postgres
        environment:
          AIRFLOW__CORE__EXECUTOR: LocalExecutor
          AIRFLOW__CORE__SQL_ALCHEMY_CONN: 'postgresql+psycopg2://airflow:airflow@postgres/airflow'
          AIRFLOW__CORE__LOAD_EXAMPLES: 'true'
        volumes:
          - ./dags:/opt/airflow/dags
          - ./logs:/opt/airflow/logs
          - ./plugins:/opt/airflow/plugins
        ports:
          - "8080:8080"

Как видите, мы используем PostgreSQL в качестве бэкэнда базы данных и Airflow Webserver для доступа к интерфейсу Airflow.

Инициализация базы данных

Перед началом работы с Airflow необходимо инициализировать базу данных. Делается это с помощью следующей команды:

docker-compose up airflow-init

Эта команда создаст начальные таблицы в базе данных, необходимые для работы Airflow.

Запуск сервиса Airflow

Теперь, когда база данных инициализирована, мы можем запустить все сервисы:

docker-compose up

После этой команды Docker Compose начнет копировать образы и запустить сервисы на основе конфигурации в файле docker-compose.yml.

Проверка развертывания

Доступ к интерфейсу Airflow

После успешного старта контейнеров вы сможете получить доступ к веб-интерфейсу Airflow, введя в браузере следующий адрес:

http://localhost:8080

На этой странице будет отображена панель управления Airflow, где вы сможете наблюдать за состоянием ваших DAG (Directed Acyclic Graph), а также управлять их выполнением. Если вы видите главную страницу Airflow, значит развертывание было успешным.

Мониторинг работы контейнеров

Docker предоставляет удобные средства для мониторинга работы контейнеров. Вы можете использовать следующую команду для просмотра логов:

docker-compose logs

Эта команда выведет текущие логи всех контейнеров, что очень удобно для устранения неполадок или просто для понимания того, что происходит внутри контейнеров.

Заключение

Развертывание Apache Airflow с использованием Docker предоставляет множество преимуществ, включая простоту развертывания, масштабируемость и легкость управления зависимостями. Использование Docker Compose делает процесс более удобным, особенно когда у вас много сервисов и зависимостей.

Мы разобрали основные шаги по установке и первичной настройке Airflow в контейнерах: начиная от установки Docker и Docker Compose, до развертывания и тестирования работы Airflow. Теперь вы можете использовать эту платформу для управления и автоматизации ваших рабочих процессов, имея гибкость и надежность, предоставляемую контейнерами.

Стрелочка влевоСоздание и развертывание приложений с помощью Docker

Все гайды по Docker

Zerotier для создания виртуальных сетей в DockerНастройка и использование WireGuard в DockerНастройка Traefik в DockerTailscale для создания VPN-сетей в DockerПодключение по ssh-серверу к DockerКак подключить контейнеры через сокеты в DockerНастройка и запуск Nginx в контейнере DockerКак подключить прокси-сервер в DockerCеть Macvlan в DockerКак работать с localhost в Docker и что это значитKMS сервер в DockerJellyfin в Docker-настройка медиасервераНастройка IP-адресов в DockerПодключение Docker через HTTPSКак организовать хостинг с DockerНастройка firewall для контейнеров в DockerРабота с DNS в DockerКак организовать сети в DockerСетевой мост (bridge) в Docker
Трассировка запросов с помощью Zipkin в DockerСжатие образов с помощью ZIP в DockerYocto в Docker - упрощение разработки встраиваемых системРабота с repository в DockerРезервное копирование Docker volumesКак использовать базы данных с DockerКак подключить Nextcloud в DockerРабота с Grafana в DockerGitLab в DockerМонтирование tmpfs в DockerTarantool в Docker - Легкий запуск и управлениеРабота с tar-архивами в DockerКак тегировать и пушить образы в Docker RegistryДисковое пространство в DockerХранение и управление образами в Docker RegistryРабота с Redis в DockerИнтеграция QNAP с DockerРабота с Qdrant в DockerРабота с PostgreSQL в DockerРабота с MySQL в DockerМультистейдж сборка в DockerКак использовать монтирование директорий в DockerМонтирование томов и директорий в DockerMongoDB в DockerЗагрузка образов из реестров с помощью Pull в DockerЗагрузка образов с помощью команды load в DockerРабота со списками контейнеров в DockerКак использовать Docker с KafkaКак использовать JSON-конфигурации в DockerJDownloader в DockerКоманда inspect image в DockerВозможности команды image prune в DockerРазвертывание Graylog в Docker для управления логамиИзвлечение файлов из контейнера в DockerСоздание образа в DockerУправление дисковым пространством в DockerПринудительная пересборка образов в DockerПоиск образов и контейнеров (find) в DockerИспользование томов в DockerЗагрузка образа в DockerКак работать с Docker SwarmРабота с директорией и путем (directory, path) в DockerУдаление всех образов в DockerКак удалить все контейнеры в DockerХранилище данных в DockerКопирование данных с помощью copy в DockerОчистка данных в DockerУправление кэшем DockerCборка образа с Docker BuildxУказание конкретного dockerfile в DockerСборка образа без кеширования в DockerПередача аргументов при сборке образов в Docker
Улучшение безопасности с Zscaler в DockerZAP для тестирования безопасности в DockerАнализ уязвимостей с Xray в DockerVault в Docker - безопасное управление секретамиКак использовать root для хранения данных в DockerИспользование UFW для управления сетевой безопасностью в DockerЗащита с TLS в DockerSSL-сертификаты в DockerПривилегированный режим в DockerУправление доступом в DockerРабота с учетными данными DockerКак исправить ошибку "connect permission denied" в DockerСертификаты безопасности в Docker
Решение ошибок wsl error в DockerОшибка virtual machine platform not enabled в DockerОшибка version is obsolete в DockerОшибка status exited в DockerПерезапуск контейнера при сбоях состояния в DockerОшибка pull error в Docker - причины и решенияОшибка pull access denied в Docker - причины и решенияПроблемы с правами доступа к контейнерам в DockerКак исправить ошибку 'not found' в DockerОшибка no such file or directory в DockerРешение проблем login denied в DockerОшибка invalid reference format в DockerИсправление ошибки failed в DockerОшибка exited (1) в DockerРаспространенные ошибки в DockerКак решить ошибку "docker error response from daemon"Ошибка error during connect в Docker - как исправитьОшибка head dial tcp в Docker - устранение неполадок и решенияИсправление ошибки "daemon not running" в DockerКак исправить ошибку daemon connection failed в DockerОшибка containerconfig в Docker
Zookeeper в Docker как развернуть и настроить кластерУстановка и настройка ZoneMinder в контейнере DockerМониторинг инфраструктуры с помощью Zabbix в DockerУстановка XAMPP в DockerИспользование Wine в Docker - руководство и примерыИспользование Watchtower в DockerService в DockerИспользование TTY в DockerРабота с Tomcat и Java в Docker-контейнереTermux в Docker - интеграция и запускДашборд Synology в DockerРазработка с помощью Spring Boot в DockerНастройка сервера DockerРазработка приложений React в DockerРазвертывание RabbitMQ в DockerИспользование QEMU в DockerЗапуск Python-приложений в DockerЗапуск PHP-приложений в DockerРазвертывание pgadmin в DockerИспользование Oracle Linux в DockerГенерация образа с OpenWRT в DockerРазвертывание Ollama в DockerЗапуск Node.js-приложений в DockerРазвертывание n8n в DockerРазвертывание MinIO в DockerЗапуск контейнеризованных приложений с Mikrotik в DockerРазвертывание MariaDB в DockerЛогирование в DockerРазработка Laravel в DockerИнтеграция Docker с KubernetesРазвертывание Kibana в DockerУстановка и настройка Keycloak в контейнере DockerИспользование Kali Linux и Docker для безопасной и эффективной работыНастройка Jupyter для работы с Notebook, JupyterLab и другими интерфейсами в DockerРазработка JS в DockerРазвертывание и настройка Jira в контейнере DockerJenkins в Docker для CI/CDJava 21 в DockerЗапуск Java-приложений в DockerGolang в Docker - Практическое руководствоПлатформа dotnet в DockerИспользование CI-CD в DockerРазработка django в DockerРазвертывание clickhouse в DockerУстановка CentOS в DockerРазработка asp в DockerСоздание и развертывание приложений с помощью DockerРазвертывание Airflow в Docker
Как использовать системные переменные (vars) в DockerКак управлять пользовательскими данными в DockerКак подключить Docker в UNIX-системах в DockerНастройка Superset в DockerЗапуск скриптов в DockerБиблиотека resources в DockerРасширение функций Docker с помощью pluginsКак настроить права доступа в DockerУправление пакетами в DockerЧто такое overlay2 storage driver в DockerMapping в Docker - как использоватьРабота с php-fpm в DockerРаздел etc в DockerУправление драйверами DockerСоздание и работа с Deb пакетами, кросс-сборка и DockerНастройка имени контейнера в DockerКак настроить конфигурационные файлы (config) DockerИспользование CLI- команды и примеры в DockerПонимание Bind-монтирования в Docker
Использование томов в DockerПредварительное создание контейнера (create) для гибкой настройки в DockerИспользование API для управления контейнерами в DockerИспользование sudo при работе с DockerИспользование команды docker sh для запуска команд в контейнере DockerРабота с несколькими проектами в DockerНастройка портов в DockerУправление контейнерами через Portainer в DockerКак оптимизировать образы в DockerКак выполнить команду внутри контейнера с помощью exec в DockerПеременные окружения в DockerРабота с Docker EngineОстановка Docker compose через downНастройка и запуск daemon в DockerУстановка, команды и работа с конфигурацией Docker ComposeКак собрать образы с помощью docker buildАвтоматизация работы с образами в DockerАвтоматическое обновление контейнеров в Docker
Использование Zsh в контейнерах DockerИнтеграция Docker с WSLКак настроить рабочую директорию в DockerГде хранятся данные в Docker - переменные окружения, файлы, локальные образы и учётные данныеПроцесс установки программного обеспеченияКоманда wait в DockerНастройка и применение переменных окружения в DockerUsr bin в DockerУстановка и настройка ulimit в Docker для управления ресурсами контейнераUbuntu в DockerСоздание и управление токенами в DockerЗадачи tasks в DockerУправление системой DockerПринудительная остановка контейнера в DockerОстановка контейнеров DockerКак проверить состояние (status) DockerИсходный код DockerКак задать параметры конфигурации DockerСохранение образа DockerЗапуск контейнеров (run) в DockerВыполнение команд от имени root в контейнере DockerПроцессы и их просмотр в DockerPost запросы в DockerКак использовать пайпы в DockerПроверка соединения ping в DockerГде находится конфигурационный файл php.ini в DockerОперационные системы и DockerГрафический интерфейс OMV в DockerОткрытые стандарты виртуализации OCI и DockerПрисвоение и управление именами контейнеров в DockerРабота с metadata в DockerManifest файлы в DockerКонтейнер-менеджмент в DockerУтилита make в DockerКоманда ls в DockerЗапуск и настройка Docker в локальной средеЛимиты в Docker - Управление ресурсами контейнеровБиблиотеки для работы с DockerКоманда kill для остановки контейнеров в DockerКак удержать контейнер Docker в работающем состоянииФайлы jar в DockerЧто такое Docker.io и как его использоватьВнутренние процессы в DockerКоманда inspect в DockerИмпорт образа Docker - Полное руководствоОбразы -images- в DockerИсключения в DockerИспользование команды healthcheck в DockerГрафический интерфейс в Docker- как использовать GUI приложения внутри контейнеровРабота с группами пользователей в DockerРабота с GPU в DockerПросмотр логов в Docker с помощью команды get logsПодключение к запущенному контейнеру в DockerКак узнать IP-адрес контейнера в DockerУстановка и настройка Docker на FreeBSDИспользование флага v в DockerУстановка и использование Docker на FedoraИспользование директивы expose в DockerКоды выхода в Docker - значение и использованиеКак выйти из контейнера Docker корректноЗапуск bash в контейнере с exec в DockerРазница между entrypoint и cmd в DockerИспользование ENTRYPOINT в DockerfileВойти в работающий контейнер в DockerВключение функций (enable) в DockerElasticsearch в DockerDocker Hub и как с ним работатьОсновы работы с DockerfileВерсии Docker (0, 1, 2, 3)Как использовать команду docker ps для просмотра запущенных контейнеровЗапуск Docker внутри DockerКак запустить Docker Daemon (run, connect)Основы работы с Docker ContainerУстановка и использование Docker CEАнализ образов в Docker с помощью Docker DiveНабор инструментов Distribution в DockerНастройки по умолчанию в DockerСоздание контейнера в DockerПроверка состояния (сheck) DockerКонтекст сборки в DockerРабота с Docker через командную строку BashБазовый образ Docker – что это и как его использоватьИспользование Bake для сбора образов в DockerDocker attach и запуск bashDocker в Astra Linux - первые шагиАргументы в DockerАрхитектура Docker - основные компоненты и их взаимодействиеDocker на Arch Linux - установка и использованиеAnsible и Docker - автоматизация развертывания и управления контейнерамиОбразы на базе Alpine Linux в DockerДобавление ресурсов и компонентов в Docker
Открыть базу знаний