Применение методов теории кооперативных игр в генетике | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 26 октября, печатный экземпляр отправим 30 октября.

Опубликовать статью в журнале

Библиографическое описание:

Василевская, Е. В. Применение методов теории кооперативных игр в генетике / Е. В. Василевская, И. А. Пелешок, А. Р. Сеитова, О. А. Кащеева. — Текст : непосредственный // Молодой ученый. — 2020. — № 18 (308). — С. 1-6. — URL: https://moluch.ru/archive/308/69474/ (дата обращения: 16.10.2024).



Анализ данных генной экспрессии требует подходящих инструментов для хранения и использования, соответствующих объемом данных; одной из последних и полезных технологий является технология микрочипов, которые позволяют хранить данные в единой матрице. В настоящее время данная технология может генерировать огромное количество информации о генной экспрессии. Эта информация должна быть статистически обработана и проанализирована для выявления тех генов, которые полезны для диагностики и прогноза конкретных заболеваний. Мы рассмотрим возможность применения игровых теоретических инструментов для анализа данных экспрессии генов, аксиоматически охарактеризуем эти инструменты, используя свойства с генетической интерпретацией.

Ключевые слова: коалиционная игра, значение Шепли, Индекс Банзафа, MSC-вектор, CGM-вектор, метод равных доходов, экспрессия гена, патогенез.

Как известно, белки являются структурными составляющими клеток и тканей и могут действовать при необходимости как ферменты для реакций в биологических системах. Большинство генов содержат информацию для изготовления конкретного белка. Она кодируется в генах с помощью дезоксирибонуклеиновой кислоты (ДНК). С помощью технологии микрочипов можно выяснить роль отдельных генов или групп генов в появлении болезни. В практическом отношении применение микрочипов уже сегодня позволяет решать следующие задачи:

– точная постановка диагноза и выявление новых подтипов заболевания

– прогнозирование течения болезни и клинического исхода, выявление генов, вовлеченных в патогенез онкогематологических заболеваний

– разработка и создание более простых и дешевых диагностических тестов, в том числе и на основе технологии микрочипов (микрочипы, содержащие пробы на десятки или сотни генов вместо десятков и сотен тысяч).

В статье [3] V. Fragnelli и S. Moretti рассматривают игру с генами для классификации образцов в определенные классы (например, класс образцов из нормальных тканей и из тканей больных раком). В некоторых численных примерах авторы используют вектор Шепли для вычисления генов с высоким влиянием в вычислении образцов.

В статье [4] дана аксиоматическая характеристика значения Шепли с помощью пяти свойств, подходящих для генетической интерпретации этого индекса.

Математическая постановка

Пусть G= {1, 2,..., n} набор из n генов, SR={1, 2,..., r} множество образцов клеток из здоровых тканей, и SD={1, 2,..., d} множество образцов из тканей, представляющих интерес. Цель состоит в том, чтобы сопоставить каждому образцу jSD∪SR профайл экспрессии G. Набор данных представлен в форме двух матриц экспрессии: и (где индекс представляет столбец, являющийся профайлом экспрессии образца j).

Характеристическая функция будет вычисляться по формуле:v (T) = , где |SD|-мощность множества больных образцов, а |Q(T)|- мощность множества:

Вектор , где будем называть анормальным профайлом экспрессии. В виде отображения m выразим дискриминантный метод. Существуют различные дискриминантный методы. Например, наивный метод: где 1- аномально, 0- нормально выраженный ген:

Также можно воспользоваться более консервативным методом. Для каждого

Где и являются 25-ым и 75-ым процентилями распределения экспрессии гена в соответствующей матрице экспрессии

Возможные методы решения

В настоящее время для данной задачи существует несколько возможных методов решения: вектор Шепли, индекс Банзафа, MSC-вектор, CGM-вектор, метод равных доходов. Рассмотрим каждый из них.

Одно из самых популярных решений — вектор Шепли.

Для подсчета вектора необходимо ввести понятие личного вклада каждого гена в образование генотипа, определяемого формулой: m(v, S)= v(S)-v(S\{i}).

Полученные нами данные позволяют ввести вектор Шепли:

Другое решение кооперативной игры — индекс Банзафа:

MSC-вектор[5]принцип оптимальности, определяющий выигрыш игрока по следующей формуле:

и

CGM-вектор[6] — принцип оптимальности, основанный на r- значении игры и вычисленный по формуле:

Метод равных доходов [7]- вектор, который обеспечивает как можно более высокую относительную прибыль среди игроков:

Аксиоматическая характеристика возможных методов решения с помощью свойств, подходящих для генетической интерпретации.

Для того чтобы охарактеризовать решения с помощью свойств с генетической интерпретацией, определение партнерства генов играет основную роль.

Определение 1. Пусть v MN. Коалиция S 2N\ {} такой, что для каждого T⊊S и каждого R ⊆ N \ S: v (R ∪ T) = v (R) — это партнерство генов в игре микроматрицы v.

Значение v(S) партнерства генов S-максимальное среднее количество появлений опухоли. Пусть vM. Максимальное партнерство S ∈ \ {∅} в v является максимальным подмножеством N с возможностью быть партнерством в v. Обозначим через P(v) множество всех максимальных партнерств в v. Отметим, что из определения 1 следует, что все коалиции одного игрока являются партнерствами в v. Набор максимальных партнерств в v образует разделение N. Здесь мы рассмотрим некоторые интересные свойства для решений игр с микрочипами, которые связаны с концепцией партнерства генов. Пусть F: MN→ IRN — решение на классе игр с микрочипами.

Свойство 1. Пусть (N,v) ∈ Решение F имеет Рациональность Партнерства (Partnership Rationality), если для каждого S ∈ \ {∅} такого, что S является партнерством генов в игре (N,v).

Свойство 2. Пусть (N,v) ∈ Решение F обладает свойством вероятности партнерства (Partnership Feasibility), если для каждого такого S ∈ \ {∅}, что S является партнерством генов в игре (N,v).

Свойство 3. Пусть (N,v) ∈ Решение F обладает свойством монотонности партнерства (Partnership Monotonicity), если для каждого i ∈ S и каждого j ∈ T, где S, T ∈ \ {∅}партнерства генов в (N,v), такой, что S ∩ T = ∅, v (S) = v (T), v (S ∪ T) = v (N), |S|≤|T|.

Свойство 4. Пусть . Решение F обладает свойством равного деления (Equal Splitting), если .

Определение 2. Нулевым геном игры (𝑁, 𝑣) будем называть ген 𝑖 ∈ 𝑁 такой что 𝑣(𝑆 ∪ 𝑖) = 𝑣(𝑆) для каждой коалиции 𝑆 ⊆ 𝑁\{𝑖}

Свойство 5. Пусть v, w ∈ . Решение F, удовлетворяет свойству нулевого игрока (Null Player), если для каждого нулевого игрока i ∈ N: Fi(v) = 0.

В статье [8] представлено доказательство утверждения, что значение Шепли удовлетворяет свойствам PM, PR, PF. В этой же статье можно найти доказательство следующей теоремы:

Теорема 1. Пусть дано конечное множество N. Значение Шепли на классе MN игр с микрочипами — это уникальный индекс релевантности, который удовлетворяет PR, PF, PM, ES и NP.

Таким образом, можем сделать вывод, что кооперативная теория игр может применяться для микрочиповых игр, например вектор Шепли и индекс Банзафа.

Далее было проверено, удовлетворяют ли MSC-вектор, CGM-вектор и метод равных доходов свойствам PR,PF,PM,ES и NP.

Рассмотрим MSC-вектор.

А) Для каждого SS- максимальное партнерство по v. Так как v- монотонна и MSC- вектор находится в C- ядре, то справедлива запись:

Так как MSC-вектор является одноточечным, то это решение эффективно. А из этого следует: значит, аксиома PF выполняется.

Б) Исходя из того, что это вектор, можем умножить на скаляр. Из чего следует однородность, а значит, справедлива запись: Для MSC-вектора свойство ES выполняется.

В) Для доказательства удовлетворения MSC- вектора аксиоме PR, вспомним, что v- монотонна и MSC-вектор принадлежит C-ядру, а значит, верна запись: Таким образом, для MSC- вектора выполняется аксиома PR.

Г) Теперь рассмотрим, выполняется ли для MSC-вектора аксиома болвана: пусть вклад i-ого игрока в коалицию: , то есть

По условию индивидуальной рациональности: . О равенстве нулю однозначно сложно сказать. Было проведено исследование свойств одноточечных решений и их применения для исследований. Вектор MSC в общем случае не удовлетворяет аксиоме NP. Записав условия на компоненты вектора X: , можно сделать вывод, что данный вектор будет удовлетворять аксиоме NP, в том случае, если

Рассмотрим метод равных доходов:

А) Пусть вклад i-ого игрока в коалицию: , то есть Это возможно, при Условие коалиционной рациональности: Таким образом, метод равных доходов удовлетворяет условию NP, при

Б) Так как v- монотонна и EPM находится в С-ядре, то верно:

Данное решение является вектором, а значит одноточечно. Из всего перечисленного следует эффективность:

Следовательно, аксиома PF выполняется для метода равных доходов.

В)Для доказательства удовлетворения метода равных доходов аксиоме PR, вспомним, что v- монотонна и данное решение принадлежит C-ядру, а значит, верна запись: Таким образом, для EPM выполняется аксиома PR.

Г) Исходя из того, что это вектор, можем умножить на скаляр. Из чего следует однородность, а значит, справедлива запись: Для EPM свойство ES выполняется.

Рассмотрим CGM- вектор:

А) Так как это вектор, можем умножить на скаляр, следовательно, данное решение удовлетворяет свойству однородности, а значит, справедлива запись: Для CGM свойство ES выполняется.

Б) Рассмотрим CGM-вектор. Для каждого SS- максимальное партнерство по v. Так как v- монотонна и CGM- вектор находится в C- ядре, то справедлива запись: Так как CGM-вектор является одноточечным, то это решение эффективно. А из этого следует значит, аксиома PF выполняется.

В) Для доказательства удовлетворения CGM- вектора аксиоме PR, вспомним, что v- монотонна и CGM-вектор принадлежит C-ядру, а значит, верна запись: Таким образом, для CGM- вектора выполняется аксиома PR.

Г) Теперь рассмотрим, выполняется ли для CGM-вектора аксиома болвана: пусть вклад i-ого игрока в коалицию: , то есть

То есть для того, чтобы CGM- вектор удовлетворял аксиоме болвана должно выполняться: или

Выводы

Проведённые исследования показали, что значение Шепли на классе MN игр с микрочипами — это уникальный индекс релевантности, который удовлетворяет PR, PF, PM, ES и NP. Таким образом, можем сделать вывод, что кооперативная теория игр может применяться для микрочиповых игр, например вектор Шепли и индекс Банзафа. Другие приведенные методы MSC-вектор, CGM-вектор и метод равных доходов в общем случае не удовлетворят свойствам PR,PF,PM,ES и NP. Также в данной работе представлены условия, при выполнении которых вышеупомянутые методы можно реализовывать для задач генетики.

Заключение

В данной работе были рассмотрены различные методы теории игр и аксиоматическая характеристика возможных методов решения с помощью свойств, подходящих для генетической интерпретации. Было проведено исследование свойств одноточечных решений, а именно подробное изучение факта удовлетворения свойствам, обеспечивающим возможность применения в генетике.

Литература:

  1. статья Gupta S., Manubhai K. P., Kulkarni V., Srivastava S. An overview of innovations and industrial solutions in Protein Microarray Technology // Proteomics. 2016. 16:1297–1308.
  2. Moretti, S., Vasilakos, Athanasios V. «An overview of recent applications of Game Theory to bioinformatics».
  3. «A game theoretical approach to the classification problem in gene expression data analysis» V. Fragnelli и S. Moretti.
  4. Stefano Moretti, Fioravante Patrone, Stefano Bonassi. ‘The class of microarray games and the relevance index for genes’.
  5. Jaeger J, Spang R, 2006.
  6. Smyth, G. K., Yang, Y.-H., Speed, T. P. «Statistical issues in cDNA microarray data analysis»
  7. Dhammika Amaratunga & Javier Cabrera “Exploration and Analysis of DNA Microarray and Protein Array Data”.
  8. «A game theoretical approach to the classification problem in gene expression data analysis» V. Fragnelli и S. Moretti.
Основные термины (генерируются автоматически): CGM, MSC, вектор, EPM, партнерство генов, свойство, генетическая интерпретация, решение, аксиома, возможный метод решения.


Ключевые слова

патогенез, коалиционная игра, значение Шепли, Индекс Банзафа, MSC-вектор, CGM-вектор, метод равных доходов, экспрессия гена

Похожие статьи

Применение методов теории кооперативных игр в генетике

Анализ данных генной экспрессии требует подходящих инструментов для хранения и использования, соответствующих объемом данных; одной из последних и полезных технологий является технология микрочипов, которые позволяют хранить данные в единой матрице. ...

Применение моделей машинного обучения для поддержки принятия врачебных решений

В статье автор исследует возможности применения моделей машинного обучения для поддержки врачебных решений при проведении медицинской диагностики по симптомам и фотоснимкам дерматологических заболеваний. Спроектированы и разработаны модели на основе ...

Исследование эффективности гибридной нейросетевой архитектуры в контексте прогностического анализа энергопотребления в зданиях коммерческого назначения

Точное предсказание энергопотребления зданий играет важную роль в оптимизации планирования энергетических систем объектов. Энергопотребление зданий подвержено воздействию различных факторов и характеризуется как нелинейное, так и нестационарное явлен...

Роль больших данных в глубинном обучении

Цель данной исследовательской работы основывается на двух ключевых темах: как глубинное обучение может помочь в разрешении специфичных проблем в анализе больших данных, и, как определенные области глубинного обучения могут быть улучшены для соответст...

Применение нейронных сетей в создании цифрового двойника колонны фракционирования

В современном мире анализ и изучение физических объектов с помощью цифровых технологий имеют высокую актуальность из-за относительной дешевизны и простоты процесса. Одним из ключевых направлений использования цифровых технологий в сфере нефтехимическ...

Применение деревьев решений для оценки важности признаков на основе датасета больных раком

В статье автор рассматривает деревья решений как один из методов машинного обучения для решения задачи классификации. Метод применяется на наборе данных пациентов, больных раком шейки матки. С помощью деревьев решений производится оценка важности при...

Аспекты использования различных методов распознавания лиц в современных системах безопасности

В статье авторы стараются обозреть существующие аспекты использования различных методов распознавания лиц в современных системах безопасности.

Ключевые моменты в развитии сверточных нейронных сетей

В данной работе рассматривается архитектуры сети с обходными путями. При этом ключевые моменты исследуются отдельно. И в итоге на основании полученных знаний делается вывод об эффективности использования данного алгоритма.

Характеристические подходы при распознавании изображений

В данной работе рассматриваются характеристические методы идентификации. Они применяются в распознавании изображений, что является актуальным на сегодняшний день.

Методы детектирования состязательных атак

В статье рассматривается подходы к детектированию состязательных атак. Используются такие классические атаки как FSGM, Deep Fool, C&W и PGD, нейронная сеть ResNet-18, датасеты MNIST и CIFAR-10.

Похожие статьи

Применение методов теории кооперативных игр в генетике

Анализ данных генной экспрессии требует подходящих инструментов для хранения и использования, соответствующих объемом данных; одной из последних и полезных технологий является технология микрочипов, которые позволяют хранить данные в единой матрице. ...

Применение моделей машинного обучения для поддержки принятия врачебных решений

В статье автор исследует возможности применения моделей машинного обучения для поддержки врачебных решений при проведении медицинской диагностики по симптомам и фотоснимкам дерматологических заболеваний. Спроектированы и разработаны модели на основе ...

Исследование эффективности гибридной нейросетевой архитектуры в контексте прогностического анализа энергопотребления в зданиях коммерческого назначения

Точное предсказание энергопотребления зданий играет важную роль в оптимизации планирования энергетических систем объектов. Энергопотребление зданий подвержено воздействию различных факторов и характеризуется как нелинейное, так и нестационарное явлен...

Роль больших данных в глубинном обучении

Цель данной исследовательской работы основывается на двух ключевых темах: как глубинное обучение может помочь в разрешении специфичных проблем в анализе больших данных, и, как определенные области глубинного обучения могут быть улучшены для соответст...

Применение нейронных сетей в создании цифрового двойника колонны фракционирования

В современном мире анализ и изучение физических объектов с помощью цифровых технологий имеют высокую актуальность из-за относительной дешевизны и простоты процесса. Одним из ключевых направлений использования цифровых технологий в сфере нефтехимическ...

Применение деревьев решений для оценки важности признаков на основе датасета больных раком

В статье автор рассматривает деревья решений как один из методов машинного обучения для решения задачи классификации. Метод применяется на наборе данных пациентов, больных раком шейки матки. С помощью деревьев решений производится оценка важности при...

Аспекты использования различных методов распознавания лиц в современных системах безопасности

В статье авторы стараются обозреть существующие аспекты использования различных методов распознавания лиц в современных системах безопасности.

Ключевые моменты в развитии сверточных нейронных сетей

В данной работе рассматривается архитектуры сети с обходными путями. При этом ключевые моменты исследуются отдельно. И в итоге на основании полученных знаний делается вывод об эффективности использования данного алгоритма.

Характеристические подходы при распознавании изображений

В данной работе рассматриваются характеристические методы идентификации. Они применяются в распознавании изображений, что является актуальным на сегодняшний день.

Методы детектирования состязательных атак

В статье рассматривается подходы к детектированию состязательных атак. Используются такие классические атаки как FSGM, Deep Fool, C&W и PGD, нейронная сеть ResNet-18, датасеты MNIST и CIFAR-10.

Задать вопрос