System monitoringu prasy dla firmy TAI
Krakowska Firma dmt Systemy Informatyczne wykonała
system monitoringu prasy dla firmy TAI.
Telefoniczna
Agencja Informacyjna jest liderem w dostarczaniu usług z zakresu monitoringu mediów.
Stanowi źródło bieżących informacji gospodarczych dla przedsiębiorstw, które w
oparciu o nie kontrolują i planują swoje działania rynkowe. Firma zdecydowała
się na modernizację procesu realizacji zamówień. W tym celu powierzyła firmie
dmt Systemy Informatyczne wykonanie kompleksowego systemu w najwyższym stopniu
automatyzującego monitoring rynku prasowego.
Jak łatwo sobie wyobrazić codzienne analizowanie kilkuset tytułów prasowych pod
kątem pojedynczego słowa kluczowego jest zadaniem niezwykle żmudnym i czasochłonnym.
Klient może zlecić dowolną liczbę słów bądź szerszy zakres tematyczny, co dodatkowo
komplikuje cały proces.
Wyszukiwanie
informacji to jeden z etapów pracy. Klient powinien otrzymać serwis prasowy
w estetycznej i przejrzystej formie - w postaci pliku PDF, lub pliku MS Word,
który obejmuje wyłącznie artykuł z poszukiwaną informacją.
Pod koniec ubiegłego roku TAI rozpoczęła współpracę z firmą dmt Systemy Informatyczne,
efektem było opracowanie i wdrożenie systemu monitoringu. Jako, że wdrożenie zostało
już zakończone można mówić o konkretnej funkcjonalności systemu.
Pierwszym etapem przetwarzania w systemie dmt jest skanowanie dokumentów. Ze względu
na konieczność uwzględniania prasy lokalnej skanowanie wykonywane jest zarówno
w warszawskiej centrali firmy jak i we wszystkich jej oddziałach regionalnych.
Skanowanie wykonywane jest przy pomocy specjalnego modułu firmy dmt, który jednocześnie
rejestruje nazwy danego czasopisma, daty wydania, etc.
Zeskanowane obrazy transmitowane są automatycznie do nowego Centrum Przetwarzania
Danych w Warszawie. Do tego celu używany jest specjalny protokół pozwalajacy na
maksymalne użycie dostępnego łącza internetowego. Dzięki temu w oddziałach nie
było konieczne stosowanie wysoko przepustowych łączy.
Serwery
pracujące w Centrum Przetwarzania Danych kolekcjonują wszystkie dokumenty - z
całej Polski. Podstawą tego Centrum jest serwer SQL przechowujący informacje o
wszystkich dokumentach. Same obrazy dokumentów przechowywane są na oddzielnym
dedykowanym serwerze.
Zeskanowane dokumenty przesłane do Centrum są natychmiast przekazywane do komputerów
pełniącycych rolę serwerów OCR. Działa na nich specjalny moduł autorstwa firmy
dmt oparty o wiodący silnik rozpoznawania pisma: ABBYY FineReader. Dokumenty poddawane
są filtrowaniu - w celu poprawienia jakości obrazu a następnie rozpoznawane są
wszystkie słowa zamieszczone na każdej stronie zeskanowanych czasopism. Jak mówi
prezes firmy dmt Systemy Informatyczne Tomasz Macura - "Potencjalna wydajność
systemu jest gigantyczna - wystarczy powiedzieć, że oprócz paru dedykowanych serwerów
- w miarę potrzeb - dostępnych jest kilkanaście dodatkowych komputerów".
Rozpoznawanie pisma jest procesem całkowicie automatycznym i nie wymaga od użytkownika
żadnej interakcji.
Informacje
z rozpoznanych stron czasopism trafiają z powrotem do serwera SQL, na którym specjalny
proces bada czy w rozpoznanych słowach nie pojawiły się takie, których poszukuje
klient. Dzięki temu możliwe jest automatyczne przypisanie listy stron do konkretnych
klientów.
Na tym jednak nie koniec. Informacja to przecież nie tylko pojedyncze słowa, ale
również kontekst całego artykułu. Klient może przecież zlecić wyszukiwanie informacji
o telewizji. W takim przypadku wyszukiwanie słowa "TV" nie załatwia
sprawy - zostaną bowiem wyszukane również wszystkie artykuły zawierające słowa
"odbiornik TV" a pominiętych może zostać wiele innych - cennych - publikacji.
Dlatego "podejrzane" strony czasopism trafiają do specjalnego modułu
analizy. Z jego pomocą analityk firmy TAI podejmuje ostateczną decyzję, czy dany
artykuł rzeczywiście odpowiada wymaganiom danego klienta.
W
typowym przypadku to już koniec "ręcznej obsługi" - system samodzielnie
bowiem tworzy wymagane przez klienta pliki (np. pliki PDF) i za pomocą zintegrowanego
z systemem serwera MS Exchange wysyła je pocztą elektroniczną w formie załączników.
Możliwa jest również wysyłka materiałów faxem - za pomocą zintegrowanego z systemem
serwera faxowego. Można wreszcie materiały drukować i przesyłać w tradycyjnej,
papierowej formie. Dane z systemu mogą być też publikowane w formie stron WWW.
System pozwala na wprowadzenie znaczącej automatyzacji prac.
W typowych firmach systemy informatyczne wspomagają raczej proces realizacji zamówień.
W przypadku TAI system de facto realizuje te zamówienia.
System dzięki automatyzacji pracy: