Программа обучения акселератора 2026

19 января 2026 года запланирован старт программы обучения акселератора HealthOS.

Паспорт курса

  • Название: Научно-исследовательская работа (НИР, research) с токенизацией результатов в экосистеме точной медицины.
  • Аудитория: Врачи или IT-шники 25-35 лет.
  • Язык: Русский с двуязычной терминологией.
  • Объем: 140 академических часов теории и практических занятий, не включая лабораторную работу и курсовой проект.
  • Состав: 16 теоретических модулей с практическими заданиями, одна лабораторная работа и курсовой проект.
  • Самокалибровка: Тест перед началом курса.
  • Пререквизиты:
    • Медицинское или техническое образование.
    • Опыт работы 2+ года.
    • Навыки data science и использования LLM.
    • Потребность в создании новых инструментов для акселерации своих НИР.
  • Целевые результаты (отчетность):
    1. Навыки создания онтологий и выполнения SPARQL-запросов.
    2. Лабораторная работа — общая онтология русской философской мысли XIX начала XX вв., в форме токенизированного артефакта.
    3. Курсовой проект — граф знаний расшифровки 12-ти канальной ЭКГ и идентификации рисков жизнеугрожающих состояний в форме токенизированного артефакта.
  • Методика освоения:
    • Курс представлен в «форме ДНК»: теоретическая часть состоит из валидированных запросов (prompt-ов) к рекомендуемой LLM («машине»), которая на основе запроса подготавливает ответ («вывод»).
    • Обучаемый copy+paste тексты запросов в интерфейс диалога с машиной.
    • Обучаемый внимательно изучает вывод машины для каждого запроса.
    • При появлении новых или уточняющих вопросов, обучаемый формулирует их и вводит текстом в режиме диалога для получения ответов на свои вопросы.
    • Обучаемый соблюдает дисциплину обучения, проходит модули и выполняет упражнения строго по порядку от первого до последнего.
    • Практические задания выполняются с использованием ресурсов курса.
  • Ресурсы:
    • Рекомендуемые LLM — deepseek.ai, qwen.ai, duck.ai (бесплатные открытые ресурсы).
    • Редактор онтологий Protégé (устанавливается локально, бесплатный открытый ресурс).
    • SPARQL Endpoint для доступа к общему биомедицинскому графу знаний (доступно под VPN).
    • Русская философская мысль конца 18-го начала 20-го века (бесплатные открытые ресурсы).
    • Признаки и жизнеугрожающие риски ЭКГ, 12 стандартных отведений — существующий граф знаний HealthOS (доступно под VPN).
  • Тематический состав:
    1. Семантическая стабильность и интероперабельность (semantic stability, interoperability) медицинской информации.
    2. Концепция точной медицины (precision medicine).
    3. Концепция институционального доверия (institutional trust).
    4. Графы знаний точной медицины (precision medicine knowledge graphs).
    5. Токенизация знаний (tokenisation) в сценариях «токены доступа» (access tokens), «токены ценности» (value tokenization).
    6. Экосистема точной медицины (precision medicine ecosystem) в сценариях кооперации исследователей и юридических лиц.
  • Дополнительная информация:
    • Сертификат об окончании обучения по результатам защит лабораторной работы и курсового проекта.
    • Курс предполагает последующее продолжение работы с HealthOS с целью разработки токенизируемых дата-продуктов.

Структура курса

  1. Модуль «Введение в семантические технологии». Знакомство с теорией множеств, дескрипционной логикой, Resource Description Framework (RDF), Web Ontology Language (OWL), Protégé (IDE для разработки онтологий), SPARQL и Apache Jena Fuseki (Triple Store для хранения онтологий).
  2. Модуль «Постановка НИР (research framing) в точной медицине». НИР (research) в точной медицине начинается с перевода клинической потребности в проверяемый исследовательский вопрос (research question) с результатами исследования, которые должны иметь возможность повторного использования.
  3. Модуль «Точная медицина как парадигма, объединяющая науку и клинику». Точная медицина в контексте курса означает адаптацию лечения под индивидуальные характеристики каждого пациента. Это не создание уникальных препаратов, а способность точно найти и/или определить индивидуальные характеристики.
  4. Модуль «Общий мультимодальный граф знаний как слой знаний для НИР». Масштабы общего мультимодального графа знаний: белковые взаимодействия (protein perturbations), биологические процессы и пути (pathways), анатомическая и фенотипическая шкалы, воздействия среды (exposures), одобренные и экспериментальные препараты с механизмом действия.
  5. Модуль «Основы семантической стабильности». Онтология (ontology) фиксирует смысл терминов, чтобы медицинские данные, включая графы, были интероперабельны (interoperable) между информационными системами и во времени.
  6. Модуль «Валидация и контракты данных». Shapes-формы выступают машиноисполняемой спецификацией «контракта данных» (data contract), они обеспечивают воспроизводимый формальный критерий «что является корректным артефактом НИР».
  7. Модуль «Паспортизация происхождения данных». Происхождение (provenance) данных — информация о сущностях, действиях и людях, вовлечённых в создание данных или объекта, созданного на их основе. Используется для оценки надёжности (trustworthiness) и интеграции разнородных источников.
  8. Модуль «Паспортизация пайплайна НИР (research pipeline provenance)». Этапы НИР моделируются как действия (activities), выполняемые в зоне ответственности определенной роли (actors). К этапам обычно относят сбор данных (data collection), очистку (cleaning), разрешение сущностей (entity resolution), аналитику (analysis), публикацию результатов (publication).
  9. Модуль «План распределения дохода НИР». План распределения дохода выступает сущностью (entity), которую можно версионировать, аудитировать и использовать в смарт-контрактах.
  10. Модуль «Основы цифрового представления прав». Токенизация (tokenisation) — процесс создания и записи цифрового представления дата-продукт (актива) на платформе экосистемы точной медицины.
  11. Модуль «Экономика данных и знаний». Токенизированный актив (tokenised asset) — дата-продукт (актив), представленный цифровым токеном на платформе экосистемы точной медицины. Токены могут представлять «право доступа к датасету», «право на долю в доходе» и «право голоса в управлении экосистемой». Различают рыночную (market liquidity) и организационную ликвидность (organizational liquidity) токенов.
  12. Модуль «Модель рисков ликвидности (liquidity risks) токенов». Базовое противоречие: токены можно быстро продать (высокая ликвидность), но базовый актив приносит доход медленно (долгосрочная ценность). Ликвидность токенов зависит от дизайна и состава актива (settlement asset), а также требований надзора и регулирования (oversight, regulation, supervision).
  13. Модуль «Модель распределения дохода». Базовые варианты модели: лицензирование или подписка (licensing/subscription), оплата по использованию (pay-per-use), вклад в производный продукт (downstream product), возвраты и отмены токенов (refunds/chargebacks).
  14. Модуль «Три сценария монетизации НИР». Рассматриваем практические сценарии монетизации: «Фармкомпания оплатила лицензию на доступ к артефакту НИР», «Клиника платит за каждый запрос к артефакту НИР», «Компания разработала продукт на основе артефакта НИР, продаёт его. Доход распределяется между участниками НИР и компанией».
  15. Модуль «Институциональное доверие (institutional trust) и его механизмы». Доверие  необходимо для поддержки инноваций, внедрения и прогресса, а также для снижения рисков (Trust is essential to support innovation, adoption, and progress, as well as risk mitigation). Без воплощенного институционального доверия преимущества искусственного интеллекта не могут быть реализованы в масштабе.
  16. Модуль «Надежное управление и риск-менеджмент». Потенциальное улучшение безопасности и эффективности (safety and efficiency) механизмов токенизации требует надёжного управления и риск-менеджмента (sound governance and risk management), при сохранении присущих им рисков (liquidity risks).
  17. Лабораторная работа как токенизируемый артефакт НИР по теме «Общая онтология русской философской мысли XIX начала XX вв».
  18. Курсовой проект как токенизируемый артефакт НИР по теме «Граф знаний расшифровки 12-ти канальной ЭКГ и идентификации рисков жизнеугрожающих состояний».