Обзор алгоритмов переводов видеопоследовательности в текст (video-text retrieval) с использованием мультимодальных больших языковых моделейдоклад на конференции