Prosimy o zgłaszanie swojego SVM w jądro!


Original: http://brenocon.com/blog/2011/01/please-report-your-svms-kernel/
Copyright: Brendan O’Connor

Jestem zmęczony czytaniem gazety używające SVM ale nie mów, które jądro one używane. (Jest mnóstwo takich dokumentów w NLP i myślę, że w innych dziedzinach nie stosowanych uczenie maszynowe.) Podejrzewam, wiele z tych prac są rzeczywiście stosując liniowy jądra.

Un-kernelized liniowa SVM jest prawie taki sam, jak regresji logistycznej – każda cecha niezależnie zwiększa lub zmniejsza klasyfikatora w prognozy wyjścia. Ale kwadratowa kernelized SVM jest znacznie bardziej zwiększające głębokość-2 decyzyjnych drzew. Może zrobić automatyczne kombinacje par cech – rzecz potencjalnie bardzo różne, ponieważ można zacząć rzucać w funkcje, które nie robią nic na własną rękę, ale miał użytecznych interakcji z innymi. (I oczywiście, bardziej skomplikowane jądra robić coraz bardziej skomplikowane i nieliniowe rzeczy.)

Słyszałem, ludzie mówią, że pobranie SVM pakiet, spróbuj kilka różnych ziaren, i znaleźć liniowy kernel jest najlepszy. W takich przypadkach mogą być używane tylko do regresji logistycznej. (Który jest szybszy i prostszy sposób trenować! Można zaimplementować PLN za to w kilku linii kodu!)

Liniowa SVM czasami ma odrobinę lepszą dokładność niż regresji logistycznej, ponieważ strata zawias jest odrobinę bardziej jak poziom błędów niż log-strat. Ale wątpię to byłoby ważne w każdej aplikacji w rzeczywistym świecie, gdzie znacznie większe problemy są dzieje (jak czystość danych, inżynierii funkcja, itp.)

Jeżeli klasyfikator liniowy robi lepiej niż te, nieliniowych, to mówi coś całkiem istotną o swoim problemie. Mówiąc, że używasz SVM brakuje punktu.SVM jest interesujący tylko wtedy, gdy jest to kernelized. W przeciwnym razie jest to tylko niepotrzebnie skomplikowany wariant regresji logistycznej.

Comments are closed.