WISE był eksperymentem mającym na celu obserwację nieba w podczerwieni dla czterech różnych długości fal od 5 do 35 razy większej niż widzi ludzkie oko. Dzięki jego właściwościom skatalogowano najzimniejsze gwiazdy, najjaśniejsze galaktyki, oraz najciemniejsze bliskie ziemi komety oraz asteroidy. Ogromna ilość danych, która została zebrana w eksperymencie WISE pozwoli na próbę odpowiedzi na fundamentalne pytania o pochodzeniu planet, gwiazd, galaktyk oraz zapewni ogromną ilość informacji dla astronomów na lata.
WISE krążył nad Ziemią na wysokości ok. 525 km, okrążając ją ok. 15 razy dziennie, robiąc zdjęcia co ok. 11 sekund. Każdy fragment nieba był sfotografowany co najmniej 8 razy, a niektóre znajdujące się nad biegunami ponad 1000 razy. W rezultacie dziennie wykonywane było ok. 7500 zdjęć, dla czterech różnych długości fal.
Eksperyment WISE dostarczył ogromnej ilości danych. Ze względu na to, konieczne jest znalezienie sposobu na automatyczne odfiltrowanie obiektów które nas interesują. Jedną z metod jest użycie algorytmów SVM (Support vector machine) zaimplementowanych w języku R. Pozwalają one na dobór odpowiedniego klasyfikatora, dzięki któremu możliwe będzie odfiltrowanie obiektów, które będą interesujące w dalszej analizie dla astronomów.
Dobór odpowiedniego klasyfikatora polega na dobraniu odpowiedniej próbki treningowej, oraz testowej, oraz zestawu parametrów, za pomocą którego klasyfikowane są obiekty. Kolejnym krokiem jest rozpoczęcie procesu „nauki” algorytmu SVM. Ze względu na duże zapotrzebowanie mocy obliczeniowych, zazwyczaj obliczenia te wykonywane są na rozbudowanych klastrach komputerowych. Nowopowstałe Centrum Informatyczne Świerk stanowi wiec idealną szansę na prowadzenie tych prac z dużą wydajnością w Polsce. Jednym z podstawowych warunków, który musi spełniać dobry klasyfikator jest generalizowanie wiedzy, dzięki czemu poprawnie klasyfikuje obiekty, które nie są jednoznacznie określone. Dzięki użyciu automatycznych klasyfikatorów możliwe jest stworzenie katalogów obiektów w zależności od potrzeb, złożonych np.: tylko z galaktyk. Analiza danych z tak utworzonych katalogów służy później do odpowiedzi na nurtujące astronomów pytania.
Rysunek 1 przedstawia wydajność algorytmu SVM. Widzimy na nim obszary o różnych kolorach. Jest to graficzna interpretacja poszukiwania minimum globalnego dla funkcji. Najważniejsze z punktu widzenia klasyfikatorów jest to, żeby wartość zerowa znajdowała się tylko w jednym możliwie małym obszarze. Oznacza to, iż algorytm znalazł minimum globalne, co przekłada się bezpośrednio na odpowiednią klasyfikację obiektów.
Rysunek 2 przedstawia graficzna wizualizację tzw. „Self check (testu na próbce trenującej)” wykonywany przez skrypt, którego używamy do trenowania algorytmu SVM. Na rysunku powyżej istotne jest to, że dla wszystkich „binów (jasności obiektów)” wydajność algorytmu jest na poziomie ok 94-96%. Oznacza to, że klasyfikator poprawnie rozpoznaje większość obiektów, oraz to, że nie został „przeuczony (miałoby to miejsce gdyby poprawnie rozpoznano 100% obiektów)”.