Аннотация:Дипломная работа Власенко Д.В. посвящена сравнительному анализу систем сбора лог-файлов. Автор занимался сравнением трех, возможно, наиболее популярных на сегодняшний день систем сбора первичных данных в больших распределенных системах.
В работе рассмотрены три системы: Scribe разработки Facebook, Chukwa разработки Yahoo и Apache Software Foundation, а также Flume, разработки компании Cloudera.
Для каждой системы описаны ее функциональные элементы, приведена схема построения системы и схема работы. Также рассмотрены возможности по сбору и обработки данных.