Program Diffprot umożliwia analizę statystyczną danych ilościowych z eksperymentów proteomicznych prowadzonych bez znakowania izotopowego lub ze znakowaniem metodą iTRAQ. Narzędzie jest szczególnie dobrze przystosowane do analizy danych pochodzących z niewielkiej liczby próbek i wykazuje się dużą odpornością na błędy mogące wynikać z nieprawidłowej identyfikacji peptydów.
Podstawowe funkcje programu
- Wyznaczanie stosunków stężeń białek w porównywanych grupach próbek na podstawie pomiarów ilościowych peptydów.
- Określanie istotności statystycznej stosunków stężeń białek przy użyciu nieparametrycznego testu permutacyjnego, który wyznacza rozkład statystyki testowej przy prawdziwości hipotezy zerowej na podstawie losowych zmian przypisań próbek do grup oraz peptydów do białek. Wynikowe p-wartości korygowane są pod kątem wielokrotności testowania w celu kontroli FDR (False Discovery Rate).
- Normalizacja wartości ilościowych pochodzących z osobnych pomiarów przy użyciu liniowego skalowania lub za pomocą metody nieliniowej, wykorzystującej lokalnie ważoną regresję wielomianową LOESS.
- Eliminacja ze zbioru danych peptydów nie spełniających zadanych kryteriów co do jakości identyfikacji lub intensywności obserwowanych pików oraz białek reprezentowanych przez zbyt małą liczbę peptydów. Możliwe jest również wykluczenie z dalszej analizy białek wybranych przez użytkownika (np. znanych białek zanieczyszczających).
- Grupowanie białek o dużym stopniu wspólności peptydów.
- Wizualizacja zbiorów danych oraz parametrów białek i wyników testów, w tym m. in.: histogramy stosunków intensywności, wykresy typu scatterplot, wizualizacja rozkładu próbek na płaszczyźnie wyznaczonej przez wybrane składowe główne.
- Automatyczne pobieranie informacji o białkach z baz danych NCBI i SwissProt.
- Program wykorzystuje wieloprocesorowość w celu zwiększenia efektywności przetwarzania danych.
Format danych wejściowych
- Listy peptydów wraz z ich parametrami ilościowymi generowane przez program MSparky.
- informacje ilościowe z eksperymentów ze znakowaniem iTRAQ generowane przez program MScan.
- Pliki z wynikami identyfikacji system Mascot w formacie DAT.
Format danych wyjściowych
- Raporty zawierające listy białek wraz z ich parametrami w formatach HTML, CSV lub w postaci plików tekstowych. W raportach umieszczane są odnośniki do rekordów baz danych NCBI i SwissProt.
- eksport wykresów w formatach PNG, JPEG, PNG, TIFF oraz EPS.
Aktualna wersja
Diffprot | 1.5.19 | 03.01.2013 | Windows | |
Linux x86 |
Dokumentacja
Opisy algorytmów
Opis statystyki testowej |
Dokumentacja użytkowa
Strona podręcznika systemowego |
Opis programu
Pliki
Autor
Michał Kistowski
Instytut Biochemii i Biofizyki
PAN