Аннотация:Big data в управлении знаниями: примат стратегии над тактикой
Мартыненко Н.П., доктор философских наук, профессор, заведующий кафедрой Коммуникационных исследований и технологий Московского государственного машиностроительного университета (МАМИ), Москва, Россия, nick9@yandex.ru, +7(495) 6839983 (добав. 365).
Для цитирования: Мартыненко Н.П.
Big data в управлении знаниями: примат стратегии над тактикой
в сборнике Материалы Научно-практической конференции с международным участием «Управление в сфере науки, образования и технологического развития»,
место издания Московский Политехнический университет, Москва, 2016. с. 73-77
URL: https://istina.msu.ru/publications/article/64336748/
Работа с Big data - большими объёмами данных с 2008 года – это один из ведущих трендов в развитии современной науки, образования, технологий, все более и более актуальный для управления знаниями в разных отраслях. Успеху на этом относительно новом динамично развивающемся рынке способствует в том числе примат стратегии над тактикой. Это иллюстрируется, в частности, и моим личным примером опыта долгих лет – более 28 лет работы на рынке информационных технологий.
Ключевые слова: большие данные, знания, наука о данных, информация, технологии, история развития, стратегия.
Широкой публике термин «Big data» - «Большие данные» стал известен после его появления в 2008 году в специальном номере журнала «Nature», посвященном проблеме обработки больших объёмов разнообразных данных, влиянию технологий на развитие науки. [1] Термин «Big data» был предложен по аналогии с другими известными англоязычными метафорами: «большие деньги», «большая нефть», «большая руда».
С 2009 года термин «Big data» стал все чаще цитироваться в масс-медиа, а к 2011 году и в деловых стратегиях крупнейших производителей на рынке информационных технологий. Ведущие аналитики рынка стали проводить посвященные концепции больших данных исследования. Например, McKinsey & Company, одна из крупнейших международных консалтинговых компаний, специализирующихся на решении задач, связанных со стратегическим управлением, опубликовала прогноз потребности на рынке в США к 2018 году порядка 440 - 490 тысяч новых профессионалов в области больших данных. При этом, если не изменить образовательные стандарты, на рынке образуется нехватка в специалистах подобного рода на уровне 50-60%. [2]
С 2013 года в ведущих университетах мира стали создаваться новые образовательные программы комплексной подготовки специалистов нового профиля, получившего название «data science» — «наука о данных».
Например, в 2013 году $37,8 млн было выделено для Вашингтонского университета, Нью-Йоркского университета, Университета Калифорнии в Беркли на запуск пятилетней программы подготовки и создания целевых учебных программ, обеспечения соответствующих возможностей для академической карьеры профессионалов «науки о данных». В 2013 учебном году магистратуры по науке о данных были открыты в университетах Данди и Южной Калифорнии, в Оклендском университете. В бизнес-школе Лондонского Имперского колледжа новая образовательная программа была названа магистратурой «по науке о данных и менеджменту».
Термины «Big data», «data science» становятся все более актуальными в контексте развития науки, образования, технологий. При этом, можно утверждать, что сама проблема, обозначаемая с 2008 года термином «Big data», стала осознаваться в профессиональном сообществе намного раньше. Тогда, когда еще только начинали обозначаться те или иные подходы к ее вероятному дальнейшему решению.
Наиболее важно при этом было вовремя осознать ее, спрогнозировать не только в текущей ситуации, но и в прицеле на перспективу. Выбрать правильное решение в области архитектуры проектируемых систем, не принося ее в жертву конъюнктуре сиюминутных задач. Установить примат стратегии над тактикой.
Проиллюстрирую это на примере из своей собственной личной практики работы на рынке информационно-аналитического обеспечения и информационных технологий.
В конце 1995 - начале 1996 года я, тогда еще молодой выпускник философского факультета МГУ имени М.В. Ломоносова, стал начинающим аналитиком. Отрасль еще только начинала создаваться и мы, аналитики, работали в тесной кооперации с программистами - разработчиками систем управления базами данных, основным инструментом для наших аналитических исследований под задачи заказчиков, которые и кормили наше юридическое лицо – Ценр изучения институтов гражданского общества, акционерами которого выступали, с одной стороны Симон Гдальевич Кордонский, одновременно выступавший и генеральным директором ЦИИГО, а, с другой Нефтяная Компания Юкос еще в пору до её покупки Ходорркоским и его командой, присвоившей в дальнейшем эту крупнейшую по активам на тот момент российскую вертикально интегрированную нефтяную компанию.
Ядро нашей группы программистов состояло из выпускников механико-математического факультета МГУ имени М.В. Ломоносова. Прежде они работали в закрытых научно-исследовательских подразделениях военно-промышленного комплекса СССР, где разрабатывали программные комплексы автономного автоматического управления полетом разделяющихся боеголовок ядерных баллистических ракет, решая задачи преодоления противоракетной обороны потенциального противника - США. После развала СССР, в начале 90-х годов они были вынуждены искать себя в новых областях применения. И, волею судеб, они через Ирину Викторовну Попову, дочь известного в былые времена системного аналитика – архитектора программных вычислительных комплексов, были привлечены к сотрудничеству С.Г. Кордонским, а через него и с Некогда Совестким крупнейшим нефтяным активом – ЮКОСом. В ЦИИГО они были привлечены под задачу разработки и создания системы управления базами данных, называвшей в той её, первой версиии системы - «Нота-Пи». Над ее созданием совместно с ними также трудились и выпускники отделения структурной и прикладной лингвистики (ныне отделение теоретической и прикладной лингвистики) филологического факультета МГУ имени М.В. Ломоносова.
Все мы, и аналитики, и лингвисты, и программисты, являлись одной единой командой, сотрудниками одной организации, находились в разных комнатах одного подвального помещения и тесно общались друг с другом, постоянно решая возникавшие перед нами различные производственные задачи на потребу довольно широкого круга заказчиков. Программисты в первую очередь и развивали эту систему в ходе решения проблем, которые актуализировали перед ними мы, молодые сотрудники ЦИИГО, исполнявшие функции как бизнес-аналитиков, так и тесно связанных с донной функций аналитиков – политологов. Так как именно мы, в процессе своей работы и отвечали за конечный аналитический продукт, оплачиваемый нашими заказчиками заказчиками.
Как уже отмечалось ранее, главным заказчиком, к тому же акционером и основным инвестором нашей организации, являлась одна из крупнейших российских вертикально-интегрированных нефтяных компаний. Каждый день для нее требовались многочисленные аналитические продукты. Обзоры и прогнозы разной периодичности. Ситуативные материалы к бурным политическим, экономическим, финансовым, а порою и криминальным событиям. Аналитические материалы к совещаниям, командировкам руководителей компании и т.д. и т.п. Типичный наш рабочий день аналитика был заполнен ежедневным поиском информации в базах данных, выгрузкой и просматриванием тысяч страниц текстов с целью выявления значимой информации, требуемых нами верифицированных фактов. Выстраиванием их в системы знаний для понимания ситуации на рынках, обстановки в регионах, в нашей стране и в других странах, с которыми порою сотрудничали наши заказчики. То есть мы на постоянной основе в ежедневном режиме занимались сведением разнородных фактов в единую систему представлений, осмыслением тенденций, написанием текстов аналитического характера, прогнозов и рекомендаций заказчикам.
В процессе такой обработки информации постоянно накапливались все новые факты и знания. Это происходило в обстановке постоянного цейтнота. В ходе решения рутинных текущих задач не всегда хватало времени сохранить и структурировать всю это значимую информацию. Она затем порою и оставалась где-то в массивах баз данных в виде разного рода уже осмысленных фактов. И ты помнил, что там она есть, но, будучи ограниченным во времени при составлении аналитического документа, не имел возможности сохранить ее в удободоступной форме, неким образом структурировать и иметь под рукой на будущее. А это будущее порою наступало буквально на следующий день, два. Вновь же найти ее и тем более быстро обобщить было не всегда легко. Так, имея факты и информацию, мы накапливали знания и некоторые из них сохранялись в латентной форме. А вновь и вновь извлечь их под решение все новых конкретных задач было не всегда просто и порою требовало избыточно много времени.
Через непродолжительное время после начала работы, за мною закрепили функцию ведущего нефтегазового аналитика. Отвечая за работу с генеральным заказчиком и имея на это все меньшее количество времени в связи с ростом объемов заказов, я стал все более часто оказываться в ситуации, когда знаешь о фактах, но не имеешь возможности их быстро извлечь. Поэтому задача дальнейшей доработки системы управления базами данных для решения данной проблемы стала для меня более чем актуальной. Тем более, что ее актуальность диктовалась и интересами главного заказчика. Я озвучил эту проблему и было решено провести совместное с программистами совещание.
Проблема имела свое теоретическое решение в рамках создания более жестко структурированной системы управления базами данных. Но наша система управления базами данных функционировала в формате слабоструктурированной полнотекстовой системы. Возник конфликт интересов, целей и задач, когда программисты заявили, что не советуют и не станут тратить силы на создание решений в русле жестко структурированной системы управления базами данных. Не собираются этого делать, так как это закроет ряд возможностей более универсального характера, важных для развития системы. А будут продолжать развивать свою систему в прежнем ключе, поскольку только при таком подходе возможно дальнейшее серьезное развитие их программного продукта.
Я выслушал их аргументы, сумел понять и принять их. Принять то, что в настоящий момент у меня не будет столь необходимого мне в каждодневной работе инструмента. Но мы можем начать совместно думать и работать над разрешением вышеописанной проблемы. И, в рамках архитектуры нашей системы, эта задача решаема, но, при имевшихся у нас на тот момент ресурсах, это займет годы. Что мы и начали: обсуждать, размышлять, думать над вероятными алгоритмами реализации необходимых функциональных возможностей системы.
И программисты были правы, особенно в свете столь явно актуализировавшейся в мировом научном сообществе к 2008 году проблемы, обозначенной понятием «Big data». Собственно и её также можно свести в самом общем виде к в чем-то аналогичной проблеме, с которой мы столкнулись в своей работе еще в середине 90-х годов. Жестко структурированные системы имеют свои ограничения по целому ряду параметров. И, рано или поздно, ограничения дают о себе знать. Что и произошло. Теперь это стало главной проблемой и задачей участников глобального информационно-технологического рынка в их поисках дальнейшего развития. Мы с коллегами и столкнулись с аналогичной проблемой намного раньше 2008 года. О чем я кракто и постарался рассказать.
Через несколько лет наш небольшой коллектив стал трансформироваться, превращаясь в различные подразделения разных совершенно других независимых юридических лиц. Но дружба, общение, сотрудничество и партнерство сохранялись. Я затем стал работать аналитиком в федеральной телекомпании «НТВ». Продолжая оставаться заказчиком и эксплуатантом все той же самой системы «Нота-ПИ», являвшейся на тот момент наилучшим предложением из всех появлявшихся затем на рынке. Ее продолжали писать и развивать все те же наши программисты и лингвисты, сперва в одной, затем второй, третьей организации.
На телевидении для меня актуализировались новые задачи, потребовались возможности и для их решения. Одной из инноваций в данной связи стала идея, например, использовать математический аппарат теории вероятностей. Множилось количество актуализируемых задач, увеличивался круг заказчиков. Это стало благотворным фоном для дальнейшего развития системы как комплекса математических, программных, технологических решений.
В настоящее время ядро группы программистов продолжает успешно развивать систему, объединив свои усилия и технологии с достижениями другого лидера российского рынка в области обработки неструктурированной и слабо структурированной информации, управления знаниями, ООО «ЭР СИ О» (www.rco.ru). Среди заказчиков государственные структуры, крупные корпорации. Например, такие, как ФСБ, Банк России, Роснано, Газпром, Мегафон, Медиалогия, Oracle и многие другие. Всего более сотни юридических лиц. Принятое творцами этой системы решение, с которым пришлось примириться некогда и мне самом - сделать приматом стратегию, а не тактику, оправдало себя. Позволило успешно развиваться и сегодня, когда проблема «больших данных» становится все более и более актуальной, иметь перспективную платформу для успешного ее решения в своем сегменте бизнеса.
Описанная ситуация иллюстрирует важность умения мыслить стратегически. Это одно из наиболее важных умений в области Big data для специалистов data science. Оно и определяет их востребованность в условиях современных динамично развивающихся и меняющихся рынков.
Согласно данным исследования рекрутингового сервиса Glassdoor самых востребованных в США профессий 2015 года, специализация «data science» стала самой интересной, доходной, многообещающей профессией. [3] Предполагается, что специалисты подобного профиля, благодаря аналитическим навыкам и умениям извлекать закономерности из больших массивов данных, способны успешно управлять знаниями и обеспечивать конкурентные преимущества, занимая ключевые позиции в компаниях, государствах, выстраивая успешные стратегии их развития.
Литература
1. Clifford Lynch. Big data: How do your data grow? // Nature. 2008. Vol. 455. № 7209. P. 28-29.
2. James Manyika, Michael Chui, Brad Brown, Jacques Bughin, Richard Dobbs, Charles Roxburgh, Angela Hung Byers. Big data: The next frontier for innovation, competition, and productivity. // McKinsey Global Institute. May 2011. – Режим доступа URL: http://www.mckinsey.com/business-functions/business-technology/our-insights/big-data-the-next-frontier-for-innovation
3. 25 Best Jobs For Work-Life Balance (2015) // Glassdoor Team. October 20, 2015. – Режим доступа URL: https://www.glassdoor.com/blog/25-jobs-worklife-balance-2015/