Managed Service для Apache Kafka

Разверните кластер Apache Kafka всего в несколько кликов с полностью управляемым сервисом. Сосредоточьтесь на разработке приложений, пока мы подбираем подходящие вам конфигурации и обеспечиваем мониторинг, резервное копирование и обновления.

Рассчитать стоимость

Решайте свои задачи с Managed Service для Apache Kafka

Распределенная обработка событий

Обрабатывайте множество событий в режиме реального времени, обеспечивая горизонтальное масштабирование и отказоустойчивость.

Централизованное журналирование

Агрегируйте журналы из различных источников для анализа, отладки и обеспечения соответствия.

Реактивная архитектура

Постройте асинхронную систему, которая может обрабатывать потоки данных, обеспечивая низкую задержку.

Логистические и телематические решения

Управляйте потоком данных из логистических и телематических источников, обеспечивая отслеживание и анализ местоположения, транспорта и маршрутов.

Микросервисная архитектура

Создавайте гибкую и масштабируемую архитектуру на основе микросервисов, обмениваясь сообщениями через Apache Kafka.

Почему Apache Kafka

Это надежная и масштабируемая платформа для обработки потоков данных в реальном времени:

  • Высокая пропускная способность и низкая задержка: Apache Kafka способна обрабатывать миллионы сообщений в секунду с быстрым откликом, обеспечивая мгновенную доставку данных.
  • Отказоустойчивость и резервирование данных: Apache Kafka обеспечивает высокую доступность данных и поддержку фоновой репликации, гарантируя сохранность данных даже при сбоях или отказах системы.
  • Горизонтальное масштабирование с возможностью практически безграничного роста: Apache Kafka легко справляется с обработкой и хранением колоссальных объемов данных без потери производительности.
  • Интеграция с различными источниками данных: Apache Kafka позволяет объединить данные из разных источников для анализа и обработки.
  • Гибкая и расширяемая структура: Apache Kafka поддерживает различные типы данных и форматы, а также предоставляет возможность разработки пользовательских расширений.
  • Простота использования с помощью языка SQL: Apache Kafka доступен и удобен для аналитиков данных и разработчиков благодаря использованию SQL.

Какие задачи мы берем на себя

Наша платформа предлагает удобное и гибкое администрирование управляемыми базами данных, а также надежность и высокую производительность. Сложность установки и настройка баз данных мы берем на себя, а вам отдаем свободное время, чтобы можно было сфокусироваться на развитии вашего бизнеса. Кроме того, наша команда экспертов всегда готова помочь с любыми вопросами.

  • Развертывание виртуальных машин
  • Установка ОС и ПО
  • Безопасность хранилища данных и оборудования
  • Настройка сети
  • Обновление брокеров
  • Инструменты мониторинга

Другие базы данных

DBaaS (Database as a Service) представляет собой концепцию хранения и управления данными в облачной среде, где пользователю не требуется устанавливать и поддерживать базу данных самостоятельно. Вместо этого пользователь получает готовое и оптимизированное решение в облаке, которое обеспечивает высокую доступность, масштабируемость и управление базой данных.

  • PostgreSQL

    PostgreSQL

    Платформа с массово-параллельной обработкой (MPP) для крупных хранилищ данных и аналитики.

    Тестировать
  • Greenplum

    Greenplum

    Платформа с массово-параллельной обработкой (MPP) для крупных хранилищ данных и аналитики.

    Тестировать
  • MySQL

    MySQL

    Самая популярная открытая база данных, известная своей надежностью, простотой и быстродействием.

    Тестировать
  • Redis

    Redis

    Хранилище структур данных в памяти, используемое как база данных, кэш и брокер сообщений для быстрого доступа к данным.

    Тестировать
  • ClickHouse

    ClickHouse

    Высокопроизводительная колоночная СУБД, оптимизированная для онлайн-аналитической обработки (OLAP).

    Тестировать
  • OpenSearch

    OpenSearch

    Открытый поисково-аналитический комплекс, используемый для мониторинга и анализа логов в реальном времени.

    Тестировать
  • Elasticsearch

    Elasticsearch

    Мощный поисковый и аналитический движок для индексирования больших объёмов данных и работы с запросами в реальном времени.

    Тестировать
  • MongoDB

    MongoDB

    Высокопроизводительная NoSQL база данных, подходящая для гибкого и эффективного управления большими объёмами данных.

    Тестировать

Остались вопросы?

Есть сложная настройка или дополнительные вопросы по ценам? Свяжитесь с нашим отделом продаж, чтобы получить необходимую информацию.

Хотите больше возможностей?
Полноценная инфраструктура на OpenStack готова

Для физических лиц и компаний любого размера

Ваши потребности — наше облако, которое им соответствует и масштабируется под задачи. Начните с небольшой виртуальной машины и развивайтесь с легкостью до высоконагруженных инфраструктур с кластерами, балансировщиками нагрузки и другими инструментами.

Для эффективной работы

Разворачивайте виртуальные машины, настраивайте сети и сложные сетевые архитектуры, управляйте хранилищем данных с большой гибкостью, получайте высокую доступность с помощью балансировщиков нагрузки и кластеров. Все это — в интуитивно понятном интерфейсе. С ним вы можете сосредоточиться на самом важном — вашем бизнесе и идеях.

Для Bare Metal с максимальной мощью

Если вам нужен максимальная производительность и контроль, мы предлагаем вам развернуть OpenStack на Bare Metal. Это ключевое решение для высокопроизводительных вычислений, обработки больших данных, и ситуаций, где необходим прямой доступ к аппаратным ресурсам.

Создайте свое облако

Зарегистрируйтесь сейчас, и уже через несколько минут вы сможете работать.

Начать

Другие продукты которые могут вас заинтересовать

Kubernetes (K8s)

Система оркестрации для автоматизации развертывания, масштабирования и управления контейнеризированными приложениями.

Попробовать

В это время в нашем блоге

  • Что такое Docker: зачем он нужен и как его использовать?

    Docker — это один из самых востребованных и, можно сказать, революционных инструментов для контейнеризации, который стал де-факто стандартом в мире DevOps и разработки. Он позволяет запускать...

  • Зачем VDS бизнесу? Облачный буст для стартапов и малого бизнеса

    Времена необъятных картотек на полках, отправки и получения бумажных писем, тонн офисных распечатанных документов для обработки и хранения информации прошли. В современном мире их успешно...

  • Микромир программной архитектуры высоконагруженных систем (ВНС): что важно при проектировании. Часть 1

    Сегодня мы начинаем цикл статей про проектирование высоконагруженных информационных систем - да и вообще информационных систем в целом, ведь почти у...

FAQ

Что такое Apache Kafka и для каких задач он подходит?

Apache Kafka - распределенный горизонтально масштабируемый программный брокер сообщений, предназначенный для организации сбора и хранения потоковой информации, ее обработки в реальном времени с высокой пропускной способностью и минимальными задержками.

Под потоковыми данными понимаются данные, которые непрерывно генерируются большим количеством источников, которые обычно отправляют записи данных небольшими объемами. Потоковыми данными могут быть, например, файлы журналов, сформированных клиентами при использовании приложений, информация о покупках в интернет-магазинах, действия пользователей в играх, информация из социальных сетей, данные торговых площадок и геопространственных сервисов, телеметрические данные. Для получения, обработки и реагирования на подобные данные и был разработан Apache Kafka.

Kafka это распределенная система с открытым исходным кодом, построенная на клиент-серверной архитектуре. Обмен данных в кластере Kafka производится с использованием своего собственного двоичного протокола передачи данных, предназначенного для снижения накладных расходов при пересылке данных.

Кластер Apache Kafka состоит из серверов и клиентов. Часть серверов образуют уровень хранения и называются брокерами, на других серверах  работает механизм Kafka Connect, они непрерывно импортируют и экспортируют данные в виде потоков событий. На клиентах размещаются распределенные приложения и микросервисы, которые работая параллельно получают, обрабатывают, и генерируют потоки событий.

Кластер Kafka отказоустойчив, в случае выхода из строя сервера, другие серверы возьмут на себя его работу, чтобы обеспечить непрерывную работу без потери данных.

Apache Kafka может применяться везде, где требуется получение и  обработка потока событий. Kafka используется в самых разных случаях, во множестве отраслей, но чаще всего Apache Kafka применяется для следующих задач:

  • Обработка финансовых транзакций и платежной информации в режиме реального времени, например, на фондовых биржах, в банках и страховых компаниях. Kafka используется такими  организациями: Сбербанк, Тинькофф, Альфа-Банк, ING Bank.
  • Отслеживание и мониторинг местонахождения пользователя, транспорта и грузов в режиме реального времени с использованием систем геопозиционирования. Например, Foursquare использует Kafka для передачи сообщений между системами и для интеграции мониторинга в свою инфраструктуру Big Data.
  • Непрерывный сбор и анализ данных от датчиков, телеметрии, устройств, контроллеров или другого оборудования. Kafka используется для реализации IoT/IIoT-систем, например, его используют телекоммуникационные операторы: ВымпелКом, МТС, Ростелеком. С помощью Kafka могут быть организованы системы мониторинга и прогнозирования состояния тех. процессов или пациентов.
  • Сбор событий для систем аналитики. Kafka позволяет построить конвейер данных, чтобы с помощью алгоритмов машинного обучения извлекать из сырой информации полезные сведения. Например, Kafka используется IBM и DataSift для сбора данных потоков событий от пользователей в режиме реального времени. В Twitter Kafka реализует потоковой обработку, а в LinkedIn потоковую передачу данных о показателях приложений.
  • Сбор и немедленное реагирование на события взаимодействия с клиентами, онлайн-игроками или реагирование на события заказа, например, в розничной торговле, гостиничном бизнесе, в мобильных приложениях и онлайн-играх.
  • В качестве основы для организации любых управляемых событиями платформ данных, архитектур и микросервисов.

Какие задачи берет на себя провайдер сервиса по управлению Apache Kafka?

Managed Service for Apache Kafka (управляемый сервис для Apache Kafka) - это услуга по предоставлению готового для применения брокера сообщений Apache Kafka, кластер которого использует для размещения облачную архитектуру.

Вы можете сосредоточиться на работе с Apache Kafka, пользоваться всеми его преимуществами, а технические вопросы по организации кластера базы данных и его эксплуатации мы возьмем на себя.

В нашей зоне ответственности находятся:

  • развёртывание кластера и его предварительная настройка;
  • мониторинг состояния кластера и управление им;
  • масштабирование кластера;
  • обеспечение высокой доступности и отказоустойчивости кластера;
  • резервное копирование данных;
  • обеспечение безопасности данных и ограничение доступа с помощью авторизации и шифрования;
  • обслуживание и ремонт инфраструктуры, на которой размещен кластер;
  • осуществление технической поддержки и предоставление доступа к технической документации по работе с сервисом.

Какие версии Apache Kafka поддерживает Managed Service for Apache Kafka?

В настоящий момент наш сервис поддерживает Apache Kafka версий 2.8.1 и 3.1.0.

Может ли пользователь провести обновление версии кластера Apache Kafka?

Пользователь может обновить кластер самостоятельно до любой поддерживаемой версии, выбрав нужную версию в свойствах кластера. Однако обновление кластера возможно только в сторону увеличения версии и после проведения обновления вернуть кластер к предыдущей версии невозможно.

Перед обновление версии убедитесь, что клиентское программное обеспечение позволит использовать функции новой версии кластера Apache Kafka. В рамках обновления версии кластера будет обновлено только серверное программное обеспечение, а не клиентское.

Рекомендуется последовательно обновлять кластер на следующую версию относительно текущей, например, чтобы обновить Apache Kafka с версии 2.8 до 3.1 вам нужно выполнять обновление в следующей последовательности: обновить приложение с версии 2.8 до версии 3.0, а уже затем обновить с версии  3.0 до 3.1.

Я получил сообщение об ошибке: "disk size must be at least ... according to topics partitions number and replication factor, but size is ...", что делать?

Ошибка вызвана тем, что сегменты логов топиков занимают больше места, чем доступно в хранилище брокеров. Для решения этой проблемы можно увеличить размер дискового хранилища или уменьшить размер сегмента для топиков или всего кластера.