Budowa zintegrowanego repozytorium farmakogenetycznych modeli predykcyjnych wraz z adnotacją, analizą i dokumentacją techniczną w ramach realizacji Minigrantu pn. „Platforma PGx forge – Od algorytmu do stratyfikacji pacjentów” dla potrzeb Instytutu Farmakologii im. Jerzego Maja Polskiej Akademii Nauk w Krakowie.

Notice description

Powstaje w kontekście projektu:
FENG.02.05-IP.07-0001/23 - Platforma PGx forge – Od algorytmu do stratyfikacji pacjentów

Przedmiotem zamówienia jest usługa badawczo-rozwojowa polegająca docelowo na opracowaniu bazy danych, obejmującej budowę zintegrowanego repozytorium farmakogenetycznych modeli predykcyjnych w ramach projektu „Platforma PGx forge - Od algorytmu do stratyfikacji pacjentów” dla potrzeb Instytutu Farmakologii im. Jerzego Maja Polskiej Akademii Nauk w Krakowie.
Zakres usługi obejmuje w szczególności:
• strukturyzację dużego zbioru wyników wielkoskalowych analiz asocjacyjnych (GWAS) fenotyp-genotyp w jednolitą, standaryzowaną bazę danych;
• dodanie adnotacji biologicznych, funkcjonalnych oraz farmakogenetycznych, tablic metadanych i metryk jakości wyników asocjacji;
• szczegółową analizę zestawu modeli predykcyjnych dla wybranych leków (min. 10 modeli) z obliczeniem kluczowych metryk jakości (tj. procent wyjaśnianej wariancji, czułość, specyficzność);
• implementację funkcji interpretowalności i raportowania wkładu poszczególnych czynników do modelu (warianty farmakogenów, rzadkie warianty uszkadzające, częste polimorfizmy, płeć, wiek, BMI oraz inne cechy kliniczne);
• przygotowanie dokumentacji technicznej i użytkowej bazy danych, umożliwiającej jej samodzielną obsługę, rozbudowę i adnotację nowymi danymi przez Zamawiającego.

Usługa musi obejmować:
Etap 1. Budowa bazy danych oraz mechanizmu importu wyników
Harmonizacja i systematyzacja setek milionów wyników wielkoskalowych analiz asocjacyjnych (ok. 9 000 analiz × 1,7 mln wariantów różnych typów: SNP, CNV, HLA, CYP) w jednolity, standaryzowany schemat danych. Zakres prac obejmuje:
• zaprojektowanie schematu bazy danych uwzględniającego metadane: strukturę populacji, zestawy cech demograficznych i klinicznych (m.in. palenie papierosów, urbanizacja, BMI, ciśnienie krwi) oraz pola na adnotacje wariantów;
• opracowanie i wdrożenie mechanizmu importu, walidacji spójności oraz indeksowania wyników asocjacji;
• wdrożenie bazy danych na serwerze Zamawiającego wraz z testami poprawności importu.

Etap 2. Kontrola jakości i adnotacja biologiczna zestawu wyników GWAS
Przeprowadzenie szczegółowej kontroli jakości (QC) wyników analiz GWAS oraz wzbogacenie bazy danych o adnotacje biologiczne i funkcjonalne wariantów. Zakres prac obejmuje:
• ocenę inflacji statystyki testowej (współczynnik lambda, wykresy QQ) dla każdej analizy;
• kontrolę częstości wariantów (MAF), współczynnika imputacji (INFO score) oraz zgodności z równowagą Hardy-Weinberga;
• generowanie wykresów Manhattan i QQ-plotów dla wszystkich analizowanych fenotypów;
• adnotację konsekwencji funkcjonalnych wariantów (narzędzia Ensembl VEP, CADD lub ekwiwalent);
• oznaczenie wariantów rzadkich uszkadzających (loss-of-function, missense deleterious) oraz częstych polimorfizmów;
• zapis wyników QC i adnotacji biologicznej jako dodatkowych warstw w bazie danych.

Etap 3. Przygotowanie adnotacji wariantów pod względem cech farmakogenetycznych, klinicznych, oraz metadanych stratyfikujących
Powiązanie wariantów z wiedzą farmakogenetyczną i kliniczną oraz rozszerzenie bazy danych o metadane stratyfikujące. Zakres prac obejmuje:
• oznaczenie wariantów w farmakogenach (m.in. CYP2D6, CYP2C19, SLCO1B1, VKORC1, HLA-B) i powiązanie z poziomami rekomendacji klinicznych wg źródeł CPIC, PharmGKB, ClinPGx, DPWG i FDA;
• mapowanie wariantów na allelotypy gwiaźdkowe (*alleles) tam, gdzie jest to możliwe;
• przypisanie wariantów do leków i obszarów terapeutycznych objętych projektem;
• włączenie do bazy danych cech demograficznych i klinicznych uczestników UK Biobank (m.in. BMI, palenie papierosów, ciśnienie tętnicze, wiek, płeć) niezbędnych do analiz w podgrupach;
• harmonizację kodowania zmiennych i obsługę brakujących danych.

Etap 4. Analiza zestawu modeli predykcyjnych dla wybranych leków
Szczegółowa analiza zestawu modeli predykcyjnych dla wybranych leków (min. 10), w oparciu o wyniki zintegrowane w bazie danych i warstwy adnotacyjne dodane w poprzednich etapach. Zakres prac obejmuje:
• obliczenie kluczowych metryk jakości modeli: procentu wyjaśnianej wariancji (r²), czułości i specyficzności w holdout set oraz na podzbiórach populacyjnych;
• raportowanie predykcji skutków niepożądanych oraz profilu odpowiedzi terapeutycznej dla każdego z modelowanych leków;
• testy stabilności i odporności modeli na symulowane braki danych oraz na podgrupach płci i grup wiekowych;
• zapis metryk i wyników analizy jako odrębnych tabel wynikowych w bazie danych.

Etap 5. Implementacja funkcji interpretowalności, raportowania i dokumentacja techniczna
Wdrożenie funkcjonalności generowania raportów wag czynników dla każdego leku oraz przygotowanie pełnej dokumentacji technicznej i użytkowej bazy danych. Zakres prac obejmuje:
• implementację algorytmów szacowania wkładu poszczególnych zmiennych do predykcji odpowiedzi na lek (m.in. warianty farmakogenów, rzadkie warianty uszkadzające, częste polimorfizmy, płeć, wiek, BMI i inne cechy kliniczne);
• wygenerowanie raportów wag i relatywnego znaczenia zmiennych dla każdego leku objętego analizami, zapisanych w bazie danych i w postaci plików zewnętrznych (CSV/JSON wraz z wizualizacjami);
• opracowanie dokumentacji schematu bazy danych (opis tabel, relacje, diagram ERD) oraz instrukcji administratora;
• opracowanie instrukcji użytkownika/analityka: sposób przeglądania danych, wykonywania typowych zapytań;
• opracowanie procedury adnotacji bazy nowymi danymi (dodawanie nowych wyników asocjacji, tabel adnotacyjnych, aktualizacja metadanych).

Warunki realizacji usługi:
• Wszystkie prace z wykorzystaniem danych UK Biobank muszą być realizowane zgodnie z wytycznymi UK Biobank (platforma RAP/DNAnexus) oraz obowiązującymi politykami bezpieczeństwa danych.
• Wykonawca zobowiązany jest do przekazania pełnego kodu źródłowego w repozytorium wskazanym przez Zamawiającego.
• Wykonawca zobowiązany jest do uczestnictwa w cyklicznych spotkaniach on-line z Zamawiającym (min. raz w miesiącu) oraz do wysyłania cyklicznych raportów miesięcznych.
Miejsce realizacji
Cała polska

Make an offer

Time limit for receipt of tenders

2026-05-07 08:00:00.0

Location

Kraj: Polska

Category assortment

Measurements, tests and technical acceptance

Buyer details

Instytut Farmakologii im. Jerzego Maja Polskiej Akademii Nauk
Smętna 12
31-343 Kraków
Województwo: małopolskie
Kraj: Polska
NIP: 6750001828

Notice description

Time limit for receipt of tenders

Location

Category assortment

Buyer details

Contact details