Аннотация:Имеется множество алгоритмов и программ, предназначенных для реконструкции филогении набора белков на основе выравнивания их последовательностей. К тому же многие программы позволяют задавать параметры своего алгоритма. например, для программ. основанных на принципе максимального правдоподобия, одним из параметров является модель аминокислотных замен. Различные программы и различные наборы параметров одной программы часто выдают различные результаты на одном и том же исходном материале.
В настоящее время все опубликованные бенчмарки (наборы эталонных выравниваний с известной филогенией) для сравнения работы различных программ или различных значений параметров основаны на симулированных последовательностях. Целью описанной в данном препринте работы было создать бенчмарк, который позволил бы сравнивать филогенетические программы на больших наборах выравниваний последовательностей природных белков.