Zapytanie ofertowe nr 5/2026 na wykonanie usługi inżynierii danych . Niniejsze zapytanie ofertowe jest realizowane w ramach projektu, którego Zamawiający jest wnioskodawcą. Numer naboru - FENG.01.01-IP.02-001/26
Notice description
Przedmiotem zamówienia jest wykonanie usługi inżynierii danych składającej się z następujących zadań:
Zadanie 1. Opracowanie technologii pozyskiwania danych z urządzeń CPAP w czasie rzeczywistym (Badania przemysłowe) - czas trwania: 01/11/2026 - 31/07/2027 (9 miesięcy)
• Podzadanie 1. Prototyp interfejsu BLE-SD (01/11/2026 - 31/01/2027, 3 miesiące): Zaprojektowanie jednolitych schematów danych telemetrycznych w celu ich standaryzowanego pozyskiwania, stworzenie potoków walidacyjnych do prototypowych kontroli jakości danych oraz ustanowienie ram tagowania metadanych. Zapewnienie odpowiedniej struktury pozyskanych danych do dalszego przetwarzania ML/LLM
• Podzadanie 2. Kompatybilność z wieloma urządzeniami (01/02/2027 - 31/07/2027, 6 miesięcy): Projektowanie niezależnych od urządzeń CPAP schematów danych, które ujednolicają heterogeniczne formaty telemetryczne, wdrożenie potoków transformacji danych w celu standaryzacji oraz stworzenie ram walidacji zapewniających spójność między różnymi typami urządzeń. Utworzenie biblioteki wzorcowych śladów do automatycznego testowania regresji.
Zadanie 2. Opracowanie i wytrenowanie modeli uczenia maszynowego na podstawie danych telemetrycznych CPAP (Badania przemysłowe) - czas trwania: 01/08/2027 - 30/04/2028 (9 miesięcy)
• Podzadanie 3. Zatwierdzenie etyczne i rekrutacja wolontariuszy (01/08/2027 - 30/09/2027, 2 miesiące): Wdrożenie procesów pseudonimizacji danych wolontariuszy, utworzenie struktury tagowania metadanych dla telemetrii uczestników oraz ustanowienie procesów walidacji jakości danych dla rejestracji wolontariuszy. Zapewnienie, że dane uczestników są odpowiednio anonimizowane i śledzone zgodnie z protokołami etycznymi
• Podzadanie 4. Ciągłe przechwytywanie danych zakończone (01/10/2027 - 31/10/2027, 1 miesiąc): Utworzenie zautomatyzowanych procesów walidacji jakości danych, wdrożenie weryfikacji sum kontrolnych w celu monitorowania integralności oraz utworzenie systemów raportowania zgodności z RODO. Zapewnienie, że zebrane dane spełniają standardy jakości i wymogi regulacyjne
• Podzadanie 5. Budowa bazy wiedzy LLM (RAG) (01/11/2027 - 31/12/2027, 2 miesiące): Budowa zautomatyzowanych procesów ekstrakcji tekstu z plików PDF z wykorzystaniem technologii OCR i analizy układu graficznego. Wdrożenie kontroli jakości danych, normalizacja i przetwarzanie wstępne tekstu oraz opracowanie procesów tagowania metadanych dla zbioru dokumentów
• Podzadanie 6. Integracja LLM z telemetrią i zabezpieczeniami (01/01/2028 - 29/02/2028, 2 miesiące): Tworzenie potoków ETL dla danych testowych przeciwników, wdrożenie infrastruktury śledzenia metrycznego do oceny bezpieczeństwa oraz opracowanie automatycznej kontroli jakości danych dla zarejestrowanych interakcji. Obsługa generowania ścieżki audytu
• Podzadanie 7. Podstawowy model uczenia maszynowego (01/03/2028 - 31/03/2028, 1 miesiąc): Budowa kompleksowych potoków inżynierii funkcji, wyodrębniając pasma przepływu spektralnego, wariancję wycieku, fazę dobową i flagi urządzeń z telemetrii CPAP. Wdrożenie procesów czyszczenia danych, ponownego próbkowania i normalizacji, które mają kluczowe znaczenie dla jakości modeli ML
• Podzadanie 8. Ocena kliniczną LLM (01/03/2028 - 30/04/2028, 2 miesiące): Tworzenie potoków danych ewaluacyjnych służących do agregowania ocen, obliczania wskaźników zgodności między oceniającymi (kappa) oraz generowania wyników złożonych. Wdrożenie kontroli jakości i wykrywania anomalii dla danych ewaluacyjnych.
Zadanie 3. Integracja i skalowanie rozwiązania (Prace rozwojowe) - czas trwania: 01/05/2028 - 31/10/2028 (6 miesięcy)
• Podzadanie 9. Fuzja ML-LLM dla spersonalizowanych porad (01/05/2028 - 31/05/2028, 1 miesiąc): Zapewnienie, że procesy inżynierii funkcji prawidłowo formatują dane wyjściowe ML do schematu JSON wymaganego do wykorzystania przez LLM. Sprawdzenie jakości transformacji danych i wdrożenie automatycznych kontroli kompletności i dokładności metryk w oprogramowaniu pośredniczącym typu fusion middleware
• Podzadanie 10. Profesjonalna kalibracją ML Insights (01/06/2028-31/07/2028, 2 miesiące): Wdrożenie procesu warstwowego losowego doboru próbek w celu wybrania reprezentatywnych segmentów telemetrycznych obejmujących różne poziomy resztkowego AHI i profile nieszczelności. Zapewnienie, że wstępne przetwarzanie danych zachowuje kontekst kliniczny, jednocześnie wspierając statystyczną ważność wyników kalibracji eksperckiej
• Podzadanie 11. Wersja beta (01/08/2028 - 30/09/2028, 2 miesiące): Weryfikacja wdrożenia potoku MLOps za pomocą automatycznych kontroli jakości danych i monitorowania modeli w środowisku produkcyjnym. Zapewnienie spójności procesów inżynierii funkcji podczas wdrażania wersji beta, wdrażając alerty dotyczące odchyleń danych lub awarii potoku
• Podzadanie 12. Walidacja końcowa (01/10/2028 - 31/10/2028, 1 miesiąc): Stworzenie dokumentacji procesu MLOps, w tym raportów śledzenia eksperymentów, zautomatyzowanych procesów ponownego szkolenia oraz wskaźników jakości danych. Zapewnienie powtarzalności wszystkich artefaktów inżynierii danych w ramach długoterminowego planu konserwacji.
Miejsce realizacji
Kraj: Polska, Województwo: małopolskie, Powiat: Kraków, Gmina: Kraków-Śródmieście, Miejscowość: Kraków
Zadanie 1. Opracowanie technologii pozyskiwania danych z urządzeń CPAP w czasie rzeczywistym (Badania przemysłowe) - czas trwania: 01/11/2026 - 31/07/2027 (9 miesięcy)
• Podzadanie 1. Prototyp interfejsu BLE-SD (01/11/2026 - 31/01/2027, 3 miesiące): Zaprojektowanie jednolitych schematów danych telemetrycznych w celu ich standaryzowanego pozyskiwania, stworzenie potoków walidacyjnych do prototypowych kontroli jakości danych oraz ustanowienie ram tagowania metadanych. Zapewnienie odpowiedniej struktury pozyskanych danych do dalszego przetwarzania ML/LLM
• Podzadanie 2. Kompatybilność z wieloma urządzeniami (01/02/2027 - 31/07/2027, 6 miesięcy): Projektowanie niezależnych od urządzeń CPAP schematów danych, które ujednolicają heterogeniczne formaty telemetryczne, wdrożenie potoków transformacji danych w celu standaryzacji oraz stworzenie ram walidacji zapewniających spójność między różnymi typami urządzeń. Utworzenie biblioteki wzorcowych śladów do automatycznego testowania regresji.
Zadanie 2. Opracowanie i wytrenowanie modeli uczenia maszynowego na podstawie danych telemetrycznych CPAP (Badania przemysłowe) - czas trwania: 01/08/2027 - 30/04/2028 (9 miesięcy)
• Podzadanie 3. Zatwierdzenie etyczne i rekrutacja wolontariuszy (01/08/2027 - 30/09/2027, 2 miesiące): Wdrożenie procesów pseudonimizacji danych wolontariuszy, utworzenie struktury tagowania metadanych dla telemetrii uczestników oraz ustanowienie procesów walidacji jakości danych dla rejestracji wolontariuszy. Zapewnienie, że dane uczestników są odpowiednio anonimizowane i śledzone zgodnie z protokołami etycznymi
• Podzadanie 4. Ciągłe przechwytywanie danych zakończone (01/10/2027 - 31/10/2027, 1 miesiąc): Utworzenie zautomatyzowanych procesów walidacji jakości danych, wdrożenie weryfikacji sum kontrolnych w celu monitorowania integralności oraz utworzenie systemów raportowania zgodności z RODO. Zapewnienie, że zebrane dane spełniają standardy jakości i wymogi regulacyjne
• Podzadanie 5. Budowa bazy wiedzy LLM (RAG) (01/11/2027 - 31/12/2027, 2 miesiące): Budowa zautomatyzowanych procesów ekstrakcji tekstu z plików PDF z wykorzystaniem technologii OCR i analizy układu graficznego. Wdrożenie kontroli jakości danych, normalizacja i przetwarzanie wstępne tekstu oraz opracowanie procesów tagowania metadanych dla zbioru dokumentów
• Podzadanie 6. Integracja LLM z telemetrią i zabezpieczeniami (01/01/2028 - 29/02/2028, 2 miesiące): Tworzenie potoków ETL dla danych testowych przeciwników, wdrożenie infrastruktury śledzenia metrycznego do oceny bezpieczeństwa oraz opracowanie automatycznej kontroli jakości danych dla zarejestrowanych interakcji. Obsługa generowania ścieżki audytu
• Podzadanie 7. Podstawowy model uczenia maszynowego (01/03/2028 - 31/03/2028, 1 miesiąc): Budowa kompleksowych potoków inżynierii funkcji, wyodrębniając pasma przepływu spektralnego, wariancję wycieku, fazę dobową i flagi urządzeń z telemetrii CPAP. Wdrożenie procesów czyszczenia danych, ponownego próbkowania i normalizacji, które mają kluczowe znaczenie dla jakości modeli ML
• Podzadanie 8. Ocena kliniczną LLM (01/03/2028 - 30/04/2028, 2 miesiące): Tworzenie potoków danych ewaluacyjnych służących do agregowania ocen, obliczania wskaźników zgodności między oceniającymi (kappa) oraz generowania wyników złożonych. Wdrożenie kontroli jakości i wykrywania anomalii dla danych ewaluacyjnych.
Zadanie 3. Integracja i skalowanie rozwiązania (Prace rozwojowe) - czas trwania: 01/05/2028 - 31/10/2028 (6 miesięcy)
• Podzadanie 9. Fuzja ML-LLM dla spersonalizowanych porad (01/05/2028 - 31/05/2028, 1 miesiąc): Zapewnienie, że procesy inżynierii funkcji prawidłowo formatują dane wyjściowe ML do schematu JSON wymaganego do wykorzystania przez LLM. Sprawdzenie jakości transformacji danych i wdrożenie automatycznych kontroli kompletności i dokładności metryk w oprogramowaniu pośredniczącym typu fusion middleware
• Podzadanie 10. Profesjonalna kalibracją ML Insights (01/06/2028-31/07/2028, 2 miesiące): Wdrożenie procesu warstwowego losowego doboru próbek w celu wybrania reprezentatywnych segmentów telemetrycznych obejmujących różne poziomy resztkowego AHI i profile nieszczelności. Zapewnienie, że wstępne przetwarzanie danych zachowuje kontekst kliniczny, jednocześnie wspierając statystyczną ważność wyników kalibracji eksperckiej
• Podzadanie 11. Wersja beta (01/08/2028 - 30/09/2028, 2 miesiące): Weryfikacja wdrożenia potoku MLOps za pomocą automatycznych kontroli jakości danych i monitorowania modeli w środowisku produkcyjnym. Zapewnienie spójności procesów inżynierii funkcji podczas wdrażania wersji beta, wdrażając alerty dotyczące odchyleń danych lub awarii potoku
• Podzadanie 12. Walidacja końcowa (01/10/2028 - 31/10/2028, 1 miesiąc): Stworzenie dokumentacji procesu MLOps, w tym raportów śledzenia eksperymentów, zautomatyzowanych procesów ponownego szkolenia oraz wskaźników jakości danych. Zapewnienie powtarzalności wszystkich artefaktów inżynierii danych w ramach długoterminowego planu konserwacji.
Miejsce realizacji
Kraj: Polska, Województwo: małopolskie, Powiat: Kraków, Gmina: Kraków-Śródmieście, Miejscowość: Kraków
Time limit for receipt of tenders
2026-03-26 22:59:59.0
Location
Kraj: Polska, Województwo: małopolskie, Powiat: Kraków, Gmina: Kraków-Śródmieście, Miejscowość: Kraków
Category assortment
Measurements, tests and technical acceptance
Market research and development
Maintenance and support
Market research and development
Maintenance and support
Buyer details
KOLOMOLO SPÓŁKA Z OGRANICZONĄ ODPOWIEDZIALNOŚCIĄ
Grzegórzecka 8/2
31-530 Kraków
Województwo: małopolskie
Kraj: Polska
NIP: 6762613454
Grzegórzecka 8/2
31-530 Kraków
Województwo: małopolskie
Kraj: Polska
NIP: 6762613454