Анализ данных на Scala — суровая необходимость или приятная возможность?

Традиционными инструментами в сфере Data Science являются такие языки, как R и Python — расслабленный синтаксис и большое количество библиотек для машинного обучения и обработки данных позволяет достаточно быстро получить некоторые работающие решения. Однако бывают ситуации, когда ограничения этих инструментов становятся существенной помехой — в первую очередь, если необходимо добиться высоких показателей по скорости обработки и/или работать с действительно крупными массивами данных. В этом случае специалисту приходится, скрепя сердце, обращаться к помощи “темной стороны” и подключать инструменты на “промышленных” языках программирования: Scala, Java и C++. Но так ли уж темна эта сторона? За годы развития инструменты “промышленного” Data Science прошли…

Анализ данных на Scala — суровая необходимость или приятная возможность?

[Перевод] Регистрация событий при помощи Kafka

Привет, Хабр!

Мы раскупорили последние резервы книги “Apache Kafka. Потоковая обработка и анализ данных” и отправили ее в допечатку. Более того, мы получили контракт на книгу “Kafka Streams in Action” и приступаем к ее переводу буквально на будущей неделе.

Чтобы показать занятный кейс использования библиотеки Kafka Streams, мы решили перевести статью о парадигме Event Sourcing в Kafka от того самого Адама Уорски, чья статья о языке Scala выходила у нас две недели назад. Тем интереснее, что мнение Адама Уорски не бесспорное: вот здесь, например, утверждается, что эта парадигма решительно для Kafka не подходит. Тем более запоминающимся, надеемся, получится впечатление от статьи.

Термин «Event Sourcing»…

[Перевод] Регистрация событий при помощи Kafka