Описание:В современном анализе данных принято выделять три уровня задач, методов и соответствующих технологий: сбор и хранение данных, оперативная аналитика и визуализация, интеллектуальный анализ. Обычно бизнес, опирающийся на анализ данных, последовательно проходит все три уровня. Сложные математические модели преобразования информации (машинное обучение) относятся к последнему III уровню. При этом всем сотрудникам компаний, непосредственно занимающимся или поддерживающим аналитическую деятельность, постоянно приходится работать с первыми двумя уровнями. Разумеется, в эру больших данных в первую очередь выросла сложность задач и технологий этих первых двух уровней. Общеизвестным примером является Google Analytics.
В данном курсе излагаются теоретические и практические знания, которые понадобятся всем будущим аналитикам, ведь всем им предстоит собирать, хранить, преобразовывать и «разглядывать» данные. Будут рассмотрены основные модели данных – разные способы мыслить и формализовать представление информации в аналитике. В связи с этим будет рассмотрена «аналитическая» часть SQL. В свою очередь, о визуализации будет рассказано одновременно с позиций аналитических целей и моделей данных. Будут рассмотрены практики «рассказывания историй по данным» (storytelling with data).