19 января 2026 года запланирован старт программы обучения акселератора HealthOS.
Паспорт курса
- Название: Научно-исследовательская работа (НИР, research) с токенизацией результатов в экосистеме точной медицины.
- Аудитория: Врачи или IT-шники 25-35 лет.
- Язык: Русский с двуязычной терминологией.
- Объем: 140 академических часов теории и практических занятий, не включая лабораторную работу и курсовой проект.
- Состав: 16 теоретических модулей с практическими заданиями, одна лабораторная работа и курсовой проект.
- Самокалибровка: Тест перед началом курса.
- Пререквизиты:
- Медицинское или техническое образование.
- Опыт работы 2+ года.
- Навыки data science и использования LLM.
- Потребность в создании новых инструментов для акселерации своих НИР.
- Целевые результаты (отчетность):
- Навыки создания онтологий и выполнения SPARQL-запросов.
- Лабораторная работа — общая онтология русской философской мысли XIX начала XX вв., в форме токенизированного артефакта.
- Курсовой проект — граф знаний расшифровки 12-ти канальной ЭКГ и идентификации рисков жизнеугрожающих состояний в форме токенизированного артефакта.
- Методика освоения:
- Курс представлен в «форме ДНК»: теоретическая часть состоит из валидированных запросов (prompt-ов) к рекомендуемой LLM («машине»), которая на основе запроса подготавливает ответ («вывод»).
- Обучаемый
copy+pasteтексты запросов в интерфейс диалога с машиной. - Обучаемый внимательно изучает вывод машины для каждого запроса.
- При появлении новых или уточняющих вопросов, обучаемый формулирует их и вводит текстом в режиме диалога для получения ответов на свои вопросы.
- Обучаемый соблюдает дисциплину обучения, проходит модули и выполняет упражнения строго по порядку от первого до последнего.
- Практические задания выполняются с использованием ресурсов курса.
- Ресурсы:
- Рекомендуемые LLM — deepseek.ai, qwen.ai, duck.ai (бесплатные открытые ресурсы).
- Редактор онтологий Protégé (устанавливается локально, бесплатный открытый ресурс).
- SPARQL Endpoint для доступа к общему биомедицинскому графу знаний (доступно под VPN).
- Русская философская мысль конца 18-го начала 20-го века (бесплатные открытые ресурсы).
- Признаки и жизнеугрожающие риски ЭКГ, 12 стандартных отведений — существующий граф знаний HealthOS (доступно под VPN).
- Тематический состав:
- Семантическая стабильность и интероперабельность (semantic stability, interoperability) медицинской информации.
- Концепция точной медицины (precision medicine).
- Концепция институционального доверия (institutional trust).
- Графы знаний точной медицины (precision medicine knowledge graphs).
- Токенизация знаний (tokenisation) в сценариях «токены доступа» (access tokens), «токены ценности» (value tokenization).
- Экосистема точной медицины (precision medicine ecosystem) в сценариях кооперации исследователей и юридических лиц.
- Дополнительная информация:
- Сертификат об окончании обучения по результатам защит лабораторной работы и курсового проекта.
- Курс предполагает последующее продолжение работы с HealthOS с целью разработки токенизируемых дата-продуктов.
Структура курса
- Модуль «Введение в семантические технологии». Знакомство с теорией множеств, дескрипционной логикой, Resource Description Framework (RDF), Web Ontology Language (OWL), Protégé (IDE для разработки онтологий), SPARQL и Apache Jena Fuseki (Triple Store для хранения онтологий).
- Модуль «Постановка НИР (research framing) в точной медицине». НИР (research) в точной медицине начинается с перевода клинической потребности в проверяемый исследовательский вопрос (research question) с результатами исследования, которые должны иметь возможность повторного использования.
- Модуль «Точная медицина как парадигма, объединяющая науку и клинику». Точная медицина в контексте курса означает адаптацию лечения под индивидуальные характеристики каждого пациента. Это не создание уникальных препаратов, а способность точно найти и/или определить индивидуальные характеристики.
- Модуль «Общий мультимодальный граф знаний как слой знаний для НИР». Масштабы общего мультимодального графа знаний: белковые взаимодействия (protein perturbations), биологические процессы и пути (pathways), анатомическая и фенотипическая шкалы, воздействия среды (exposures), одобренные и экспериментальные препараты с механизмом действия.
- Модуль «Основы семантической стабильности». Онтология (ontology) фиксирует смысл терминов, чтобы медицинские данные, включая графы, были интероперабельны (interoperable) между информационными системами и во времени.
- Модуль «Валидация и контракты данных». Shapes-формы выступают машиноисполняемой спецификацией «контракта данных» (data contract), они обеспечивают воспроизводимый формальный критерий «что является корректным артефактом НИР».
- Модуль «Паспортизация происхождения данных». Происхождение (provenance) данных — информация о сущностях, действиях и людях, вовлечённых в создание данных или объекта, созданного на их основе. Используется для оценки надёжности (trustworthiness) и интеграции разнородных источников.
- Модуль «Паспортизация пайплайна НИР (research pipeline provenance)». Этапы НИР моделируются как действия (activities), выполняемые в зоне ответственности определенной роли (actors). К этапам обычно относят сбор данных (data collection), очистку (cleaning), разрешение сущностей (entity resolution), аналитику (analysis), публикацию результатов (publication).
- Модуль «План распределения дохода НИР». План распределения дохода выступает сущностью (entity), которую можно версионировать, аудитировать и использовать в смарт-контрактах.
- Модуль «Основы цифрового представления прав». Токенизация (tokenisation) — процесс создания и записи цифрового представления дата-продукт (актива) на платформе экосистемы точной медицины.
- Модуль «Экономика данных и знаний». Токенизированный актив (tokenised asset) — дата-продукт (актив), представленный цифровым токеном на платформе экосистемы точной медицины. Токены могут представлять «право доступа к датасету», «право на долю в доходе» и «право голоса в управлении экосистемой». Различают рыночную (market liquidity) и организационную ликвидность (organizational liquidity) токенов.
- Модуль «Модель рисков ликвидности (liquidity risks) токенов». Базовое противоречие: токены можно быстро продать (высокая ликвидность), но базовый актив приносит доход медленно (долгосрочная ценность). Ликвидность токенов зависит от дизайна и состава актива (settlement asset), а также требований надзора и регулирования (oversight, regulation, supervision).
- Модуль «Модель распределения дохода». Базовые варианты модели: лицензирование или подписка (licensing/subscription), оплата по использованию (pay-per-use), вклад в производный продукт (downstream product), возвраты и отмены токенов (refunds/chargebacks).
- Модуль «Три сценария монетизации НИР». Рассматриваем практические сценарии монетизации: «Фармкомпания оплатила лицензию на доступ к артефакту НИР», «Клиника платит за каждый запрос к артефакту НИР», «Компания разработала продукт на основе артефакта НИР, продаёт его. Доход распределяется между участниками НИР и компанией».
- Модуль «Институциональное доверие (institutional trust) и его механизмы». Доверие необходимо для поддержки инноваций, внедрения и прогресса, а также для снижения рисков (Trust is essential to support innovation, adoption, and progress, as well as risk mitigation). Без воплощенного институционального доверия преимущества искусственного интеллекта не могут быть реализованы в масштабе.
- Модуль «Надежное управление и риск-менеджмент». Потенциальное улучшение безопасности и эффективности (safety and efficiency) механизмов токенизации требует надёжного управления и риск-менеджмента (sound governance and risk management), при сохранении присущих им рисков (liquidity risks).
- Лабораторная работа как токенизируемый артефакт НИР по теме «Общая онтология русской философской мысли XIX начала XX вв».
- Курсовой проект как токенизируемый артефакт НИР по теме «Граф знаний расшифровки 12-ти канальной ЭКГ и идентификации рисков жизнеугрожающих состояний».