O nas

Otwarty System Antyplagiatowy (OSA) powstał w ramach projektu realizowanego przez Międzyuniwersyteckie Centrum Informatyzacji (MUCI) przy współpracy z Instytutem Podstaw Informatyki Polskiej Akademii Nauk, jako odpowiedź na rosnące zjawisko plagiatowania prac dyplomowych. Na polskim rynku istnieje już kilka rozwiązań, które pozwalają weryfikować jakość pracy pod kątem jej oryginalności. Autorzy systemu OSA proponują kolejne narzędzie, którego filozofia działania odbiega od pozostałych rozwiązań.

System OSA, do porównania tekstów, nie korzysta bezpośrednio z oryginalnej ich postaci, lecz ze struktur danych przechowującymi częściową informację o tekstach. Są to tzw. wektory częstości i mapy. Takie podejście ma trzy zasadnicze zalety.

  • Z bazy tych struktur nie można odtworzyć żadnego z tekstów, który posłużył do jej utworzenia.
  • Porównanie map w bazie wystarcza do wskazania zapożyczeń między badanymi pracami ze znacznie lepszą efektywnością niż porównanie oryginalnych tekstów jeden do jednego. Przeprowadzone dotychczas testy wykazały wielką odporność systemu na wszelkie, znane jego autorom, metody kamuflażu nieuprawnionych zapożyczeń (zmiana szyku, przestawianie zdań, zastąpienie części słów ich synonimami, kompilacja z wielu źródeł, podstawienia czcionek).
  • Jest możliwość indeksacji wielkich baz prac referencyjnych (np. ORPPD) poprzez wektory częstości lub inne skróty nieodwracalne.
  • Tworzenie i aktualizacja bazy map ‒ oraz innych baz niezbędnych do funkcjonowania systemu ‒ jest w pełni zautomatyzowane i odbywa się na podstawie przetworzenia wskazanych przez użytkownika plików zapisanych w jednym z następujących formatów zapisu tekstu: txt, pdf, doc, docx, odt, rtf. Dodatkowo w ramach jednej Uczelni system OSA umożliwia dokładniejsze przyjrzenie się oryginałom prac, w odniesieniu do których stwierdził zbyt wysoki poziom podobieństwa ich map. Tekst badanej pracy można porównać, jeden do jednego, z oryginalnym tekstem każdej z podzbioru prac referencyjnych i polskojęzycznych stron internetowych wyselekcjonowanych przez system na bazie podobieństwa map. Zwykle jest to podzbiór pusty lub kilkuelementowy.

    Należy pamiętać, że każdy system antyplagiatowy, by działać skutecznie musi mieć dużą bazę wzorców (tekstów referencyjnych), z którymi następuje sprawdzenie. W tej wersji systemu prace mogą być porównywane z ponad 600 milionami polskojęzycznych stron internetowych.