ИСТИНА |
Войти в систему Регистрация |
|
ИПМех РАН |
||
В последнее время в анализе данных (data mining) возникает большое число новых нестандартных задач. ``Нестандартность'' связана с огромными массивами информации, специальными форматами её представления, а также ограничениями на алгоритмы решения и требованиями к качеству и формату решений. В докладе сделана попытка систематизировать такие задачи, а также выделить в них позадачи, которые лежат в русле дискретной и вычислительной математики, но пока не достаточно подробно освящены в современных работах. К таким подзадачам относятся: 1) Предсказание связности графа (Link Prediction Problem - вычисление вероятности появления ребра в динамическом графе), 2) Восстановление частично-упорядоченных множеств (по неполной и агрегированной информации о порядках), 3) Нахождение оптимальной метрики в метрическом конусе (в смысле минимизации функционала качества при решении задач классификации методом, основанным на близости). Отметим, что доклад базируется на опыте участия в крупных международных соревнованиях по анализу данных, в том числе, в ``ECML/PKDD Discovery Challenge 2011 (VideoLectures.Net Recommender System Challenge)'' и ``IJCNN Social Network Challenge''. Работа выполнена при финансовой поддержке РФФИ (\No\,10-07-00609-а) и гранта Президента РФ (МД-757.2011.9).