Описание:Основной целью данного курса является предоставить студентам уникальную возможность приобрести концептуальную основу и математические инструменты, применимые к аналитике больших данных и вычислений в режиме реального времени. Курс дает краткий обзор основных фаз работы с большими данными, таких как извлечение, унификации, обновления и объединение информации и специфических особенностей обработки данных, которая должны быть в высшей степени параллельной и распределенной. Имея в виду эту специфические особенности, мы затем более подробно изучим ряд математических инструментов для анализа больших данных, таких как регрессионный анализ, линейное оценивание, проблемы калибровки, обработку в реальном масштабе времени входящего (потенциально бесконечного) потока данных. Мы увидим, как эти подходы могут быть преобразованы, чтобы соответствовать требованиям больших данных. Мы также обсудим, почему большинство широко используемых алгоритмических языков не вполне подходит для решения таких проблем и наметим альтернативные подходы.