Введение. Процесс преобразования наследственной информации от гена в РНК или белок называется экспрессией генов. Каждая клетка транскрибирует различные гены в виде молекулы РНК в соответствии с типом клетки, биологическими процессами, нормальным или патологическим состоянием и т. д. Разнообразие в профилях генной экспрессии интенсивно изучается ввиду его биологического и клинического значения.
Целью данной работы является решение проблемы определения относительной значимости генов при патогенезе болезни Альцгеймера, используя данные, полученные с помощью технологии микрочипов, с учетом уровня взаимодействия между генами.
Обзор литературы. Сегодня есть возможность одновременно отслеживать экспрессию десятков тысяч генов благодаря технологии микрочипов, впервые использованной в конце 1980-х годов. Полученные данные могут быть использованы для выявления генов, отвечающих за конкретное заболевание.
В литературе представлено большинство моделей для анализа данных: вывода из матрицы данных экспрессии генов, роли генов, их взаимодействий и их поведения при изменении состояния биологической системы. Кроме аналитических методов также может использоваться теория кооперативных игр. В [1] введен класс игр с микрочипами, позволяющий количественно оценить значимость каждого гена в патогенезе генетического заболевания, представляющего интерес, с учетом наблюдаемых взаимосвязей во всех подгруппах генов и обосновано использование вектора Шепли для ранжирования генов. В [2] предложено множество свойств, характеризующих индекс Банзафа, и доказана правомерность его использования для вычисления индекса значимости генов.
Математическая модель. Основная идея данной модели заключается в применении теории кооперативных игр, где в роли игроков выступают гены. Пусть множество генов, и , соответственно, множества образцов клеток из здоровых тканей и тканей с генетическим заболеванием.
Задача экспериментов с микрочипами состоит в сопоставлении каждому образцу профиль экспрессии , где —величина экспрессии гена в образце . Вместе эти значения называются набором данных эксперимента микрочипов и могут быть представлены в форме двух матриц и , где столбцы — это профили экспрессии образцов. Пусть — микрочиповая экспериментальная ситуация (МЭС).
Для начала необходимо определить, экспрессия каких генов из больных клеток выражается аномально по отношению к экспрессии генов из здоровых. Так строим булевый профиль экспрессии , элементы которого принимают значение , если ген выражен аномально, и — в противном случае. Отображение , присваивающее каждому профилю экспрессии из больных образцов соответствующий булевый профиль экспрессии, называется дискриминантным методом. В итоге получаем булевую матрицу экспрессии .
Микрочиповая игра — это кооперативная игра , где
– конечное множество генов в роли игроков,
– — характеристическая функция, присваивающая каждой коалиции среднее значение количества образцов с интересующей нас болезнью
где , а — опора вектора.
Класс микрочиповых игр обозначим символом ℳ.
Простой игрой будем называть игру на , где если , и — в противном случае.
Любая кооперативная игра может быть записана в виде линейной комбинации единогласных игр:
где — коэффициент единогласия, а .
Через коэффициенты единогласия игры могут быть даны модифицированные представления вектора Шепли
и индекса Банзафа
которые обладают свойствами, соответствующими биологическим законам.
Индексом значимости — это решение в классе микрочиповых игр с набором генов в качестве множества игроков. В контексте микрочиповых игр, решение рассматривается как вектор ранжирования силы генов, то есть ген получивший наибольший «выигрыш» является наисильнейшим в данной выборке и так далее.
Результаты. Возьмем посмертные данные микрочипов из тканей лобной и височной коры головного мозга, а также гиппокампа у пациентов с наличием болезни Альцгеймера или другой сосудистой деменции.Эти данные находятся в открытом доступе [3]. За больные образцы взяты образцы тканей с болезнью Альцгеймера, за «здоровые» — образцы с другой деменцией.
Рассмотрим МЭС , где , . Получаем следующие данные. При использовании индекса Банзафа многие гены получили одинаковый индекс значимости (рис. 1), что обусловлено слишком большим значением, стоящим в знаменателе при вычислении индекса Банзафа, а именно , где — мощность коалиции, в то время, как в знаменателе вектора Шепли стоит просто . Первые 10 генов по убыванию индекса значимости, вычисленному с помощью вектора Шепли, представлены в таблице 1.
Таблица 1
Первые 10 генов по индексу значимости, посчитанному спомощью вектора Шепли, умужчин иженщин вместе ипо отдельности
Мужчины иЖенщины |
Мужчины |
Женщины |
|||
Ген |
|
Ген |
|
Ген |
|
RYR1 |
1,42125 |
ACAA1 |
0,87529 |
ZC3H11A |
1,40275 |
HYDIN2 |
1,3214 |
HNRNPA3P1 |
0,79922 |
CCDC190 |
1,39448 |
FAHD2B |
1,31450 |
MMAB |
0,79355 |
ALDH2 |
1,19962 |
GALNT15 |
1,27645 |
TDH |
0,7922 |
AF074983 |
1,10729 |
ECHDC2 |
1,17365 |
NINL |
0,78509 |
RHBDD1 |
1,08732 |
PLEC |
1,16275 |
TDRD3 |
0,78163 |
ARHGEF10 |
1,07735 |
PFDN5 |
1,14733 |
WDR49 |
0,77295 |
AK023372 |
1,02686 |
ZC3H11A |
1,13735 |
ZNF185 |
0,77011 |
ZNF761 |
0,99062 |
NDUFS6 |
1,1145 |
PFDN5 |
0,76712 |
ADGRA3 |
0,98517 |
WDR49 |
1,08939 |
ZNF844 |
0,76267 |
RYR1 |
0,98269 |
Глобально разница в результатах представлена на левом графике (рис. 1), по вертикали стоит значение индекса значимости, а по горизонтали — ранг гена, вычисленного с помощью вектора Шепли. На правом графике показано, что при уменьшении количества рассматриваемых генов с 4033 до 15 уменьшается и разница в рангах генов, найденных двумя разными способами, что говорит о возможности использования индекса Банзафа для вычисления индекса значимости при небольшом количестве генов.
Рис. 1. Разница в индексах значимости генов, полученных с помощью вектора Шепли и индекса Банзафа для 4033 и 15 генов
Доказано, что у мужчин и женщин болезнь Альцгеймера протекает по-разному. Рассмотрим еще две МЭС для мужчин и для женщин. В таблице 2 так же представлены первые 10 позиций по индексу значимости, посчитанного с помощью вектора Шепли отдельно для мужчин и женщин.
Многие полученные результаты подтверждены современными научными публикациями: например, влияние генов RYR1 и ALDH2 на процесс болезни Альцгеймера описано в [4] и [5], роль шаперонов в патогенезе болезни Альцгеймера, в комплекс которых входит ген PFDN5, описана в [6]. Также выявлены гены, которые могут играть ключевую роль при патогенезе этой болезни, но еще не рассмотренные в научной литературе.
Вывод. Результатом использования рассмотренного подхода является распределение вектора решения, примененного к микрочиповой игре. Данный подход представляет интерес для генетического анализа и предлагает новый математический подход для данной области.
Литература:
- Moretti S., Patrone F., Bonassi S. The class of microarray games and the relevance index for genes // TOP. 2007. No 15. P. 256–280.
- Lucchetti R., Moretti S., Patrone F., Radrizzani P. The Shapley and Banzhaf value in microarray games. // Computers & Operations Research 37. 2010. P. 1406–1412.
- The National Center for Biotechnology Information. https://www.ncbi.nlm.nih.gov/geo/gds/analyze/analyze.cgi?ID=GDS4758.
- Chami M., Checler F. Ryanodine receptors: dual contribution to Alzheimer disease? // Channels (Austin). 2014. P. 168–168.
- Ma L., Lu Z. N. Role of ADH1B rs1229984 and ALDH2 rs671 gene polymorphisms in the development of Alzheimer’s disease // Genet. Mol. Res. 2016. Vol. 15. No 4. P. 1–8.
- Loke S. Y., Wong P. T., Ong W. Y. Global gene expression changes in the prefrontal cortex of rabbits with hypercholesterolemia and/or hypertension // J. Mol. Neurosci. 2007. No 102. P. 33–56.