Analiza danych tekstowych w projektowaniu wybranego systemu informacyjnego na przykładzie dokumentacji ze zdarzeń krajowego systemu ratowniczo-gaśniczego

Niżej przedstawiam streszczenie referatu jaki zostanie odczytany na seminarium Wydziału Informatyki Politechniki Białostockiej.  Zachęcam do lektury. Ewentualnie streszczenie można odnaleźć na stronie Wydziału Informatyki Politechniki Białostockiej.

Czytaj dalej

Praca badawcza…

Cały czas podnoszę się na duchu, dość dobrze obrazującym aktualny stan badań, cytatem Albert Einsteina: „Gdybym wiedział co robię, to przecież nie była by praca badawcza.” Tak więc aby do przodu.

Notka z badań

Ostatnio cały czas spędzam nad składaniem rozprawy i szlifowaniem tez w celu ich prezentacji. Szczerze jest to niebanalne wyzwanie. W czasie tych 3 lat, sporo się działo, powstało parę ciekawych opracowań i artykułów. Większość jest jeszcze w recenzjach. W końcu znalazłem problem badawczy, aktualnie jestem w dalszym ciągu na etapie implementacji oprogramowania do jego zbadania. Wszystko jest na papierze, teraz należy to sprawdzić w praktyce. Co z tego wyjdzie, kto wie. Chyba właśnie na tym polega nauka i badania, że do końca nie wiadomo co z tego wszystkiego wyniknie. Na początku jest mgliste pojęcie o pewnych sprawach i zjawiskach, na szczęście wraz z zawężaniem problemu, mgła niewiadomej się trochę rozwiewa. Najważniejsze jest teraz zebranie wszystkich materiałów oraz otrzymanych wyników ze wstępnych analiz w jedną całość. Nie ma co zwlekać, trzeba ruszać z powrotem do badań nad raportami.

Małe podsumowanie

Ankieta ruszyła, dane powoli się zbierają…. Aktualnie wykonuje zlecenia dla Netsolution i projekt Motogarage… Artykuł do SIMIS został przyjęty należy go trochę poprawić zgodnie z uwagami recenzenta, jestem bardzo zadowolony z tego faktu. Jeszcze byłbym bardziej zadowolony gdybym mógł całkowicie poświęcić się nauce i pisaniom opracowań. Niestety nie jest różowo. Dobrze, że są zlecenia i należy się z tego cieszyć. Aktualnie pisanie nowych opracowań i artykułów trochę przystopowało, permanentny brak czasu. Będzie trzeba się mocno zorganizować i znowu napisać o tym co w głowie siedzi i przeprowadzić eksperyment który już całkiem dojrzał do tego aby go zrealizować. Na co więc czekać, do dzieła…

Weka

Zacząłem kompletować w końcu oprogramowanie do badań. Po przeglądzie rynku oprogramowania do badań dokumentów tekstowych wychodzi na to że postawię na Wekę. Jeśli ktoś jest zainteresowany to oprogramowanie można ciągnąc ze strony http://www.cs.waikato.ac.nz/~ml/index.html. W grę wchodziły jeszcze takie pakiety jak SAS Text Miner i Statistica Text Miner niestety aktualnie uczelnia nie posiada do nich licencji więc postawiłem na open sorce. Weka to projekt to przeprowadzania projektów z zakresu eksploracji danych napisana w ramach grantu na jednej z uczelni w Australii (po więcej szczegółów odsyłam na wyżej podaną stronę).  Wokół niej zgromadzone jest dość duże community oraz sam program posiada dobrą dokumentację nie wspominając już o książkach na jego temat. Nic tylko korzystać w szczególności, że całość napisana jest w Javie i można tworzyć własne pluginy. Niestety polski rynek programów do analizy tekstów rodzimego języka nie wygląda jeszcze różowo chodź istnieje możliwość, że jeszcze za mało go przeszukałem. W następnych notatkach umieszczę parę ciekawych linków do stron osób i projektów z zakresu analizy tekstów a zebrało się tego trochę i w Blogrollu raczej wszystko się nie pomieści.

Początek dziennika

Dzisiaj postanowiłem zacząć pisać dziennik badań dotyczący opisu aspektów realizacji badań ilościowo-jakościowych dotyczących raportów sporządzanych przez decydentów służb ratowniczych Państwowej Straży Pożarnej PSP. Póki co treści są ukryte, niemniej po ukończeniu formułowania podstawowych celów badania i opisu metody do analizy tego typu dokumentów, całą część udostępnię na tym blogu.