Istota, historia, ewolucja

System konwersacyjny to program komputerowy zaprojektowany do symulacji inteligentnej konwersacji przez metody tekstowe lub werbalne. Celem takiego systemu jest takie prowadzenie rozmowy, aby użytkownik miał wrażenie, że rozmawia z człowiekiem. System konwersacyjny często uwzględnia takie elementy jak wizualizację postaci (awatara) oraz maszynę generującą mowę (synteza mowy).

Program konwersacyjny zwany jest także: wirtualnym rozmówcą, wirtualną postacią, wirtualną istotą, chatterbotem, chatbotem, lingubotem, agentem chatu, czy interaktywny agent konwersacyjny. Najczęściej używanymi synonimami są: wirtualny rozmówca, program konwersacyjny i chatterbot.

Chatterboty zyskały popularność dzięki szerokiej możliwości zastosowania. Na przykład program konwersacyjny można zamieścić na stronie firmy, by przedstawiał jej ofertę i udzielał wsparcia potencjalnym klientom. Może także pełnić rolę przewodnika na stronach internetowych bibliotek czy być trenerem w nauczaniu zdalnym. System konwersacyjny może także prowadzić luźną, rozrywkową rozmowę z użytkownikiem (np. iGod który pozwala na wirtualną rozmowę z Bogiem).

HISTORIA SYSTEMÓW KONWERSACYJNYCH

Pierwszy chatterbot o nazwie ELIZA został utworzony w 1966 roku przez Josepha Weizenbauma z MIT (Massachusets Institute of Technology). Program pełnił rolę psychoterapeuty, jednakże nie posiadał żadnej wiedzy psychiatrycznej. ELIZA znała tylko pewne zestawy odpowiedzi. Jej zadaniem było zadawanie pytań pomagających pacjentowi zrozumieć swoje problemy. Program w budowie był bardzo prosty – opierał się na wychwytywaniu słów kluczowych i dopasowywaniu do wzorców. Przykładowo na zdanie użytkownika „Źle się czuję.” odpowiadała „Przyszedłeś do mnie bo się źle czujesz?”.

Wśród innych, wartych wymieniania wirtualnych rozmówców znajdują się:

  • BASEBALL (1960 r.) – prowadził rozmowy na temat rozgrywek baseballowych,
  • Agile (1960 r.) – program mógł sam układać odpowiedzi na zadane pytania,
  • Sad Sam (1961 r.) – wirtualny rozmówca opowiadający na temat koligacji rodzinnych,
  • Student (1964 r.) – chatterbot umożliwiający wymianę zdań na temat algebry,
  • SIR (1965 r.) – program gromadzący wiedzę zawartą w wypowiedziach rozmówców i na jej podstawie budujący swoje wypowiedzi,
  • PARRY (1972 r.) – wirtualny rozmówca symulujący człowieka chorego na schizofrenie paranoidalną,
  • pierwszy komercyjny chatterbot (1997 r.) stworzony przez niemiecką firmę Kiwilogic.com AG.

Przełomem w rozwoju wirtualnych rozmówców było powstanie w 2000 r. programu A.L.I.C.E. (Artificial Linguistic Internet Computer Entity). Chatterbot został stworzony przez dr Richarda Wallace'a w Eastport Internet Assiociates. Jest on pierwszym programem konwersacyjnym wykorzystującym język AIML. ALICE nie posiada umiejętności samodzielnego uczenia się, ponieważ musi posiadać wbudowane reguły dopasowywania wzorców.  Kod A.L.I.C.E. jest darmowy, stąd w oparciu o jego strukturę tworzone są inne chatboty. Ściśle z A.L.I.C.E. związana jest organizacja na rzecz rozwoju chatterbotów, o nazwie The A.L.I.C.E. AI Foundation.

Początki wirtualnych rozmówców w Polsce sięgają lat siedemdziesiątych XX w. Pierwszy polski chatterbot o nazwie Marysia powstał w 1973 r. na Uniwersytecie Warszawskim w Instytucie Maszyn Matematycznych. Kolejny wirtualny rozmówca o nazwie Teresa powstaje w 1977 roku na Akademii Górniczo-Hutniczej w Krakowie. Był on odpowiedzią polskich specjalistów na Elizę i tak samo jak jego pierwowzór symulował psychiatrę. W 2000 r. powstaje w Krakowie oddział amerykańskiej firmy tworzącej agentów internetowych Bot.Net. Przedsięwzięcie zakończyło się niepowodzeniem i w lipcu 2001 r. firma ogłosiła upadłość. W tym samym roku powstaje firma Fido, która korzysta z licencji niemieckiej firmy Kiwilogic. Wprowadza ona jeszcze w 2001 r. pierwszego komercyjnego chatterbota do polskiego Internetu. 

EWOLUCJA PROGRAMÓW KONWERSACYJNYCH

Wyróżnić trzy generacje programów konwersacyjnych.

Wirtualni rozmówcy I generacji to proste programy komputerowe, których celem jest zastąpienie pracy człowieka. Chatterboty te nie wykorzystują syntezatorów mowy, a wizualne kreacje postaci są w 2D lub ich brak. Głównie zastosowanie znalazły na różnego rodzajach forach dyskusyjnych, chat-roomach czy kanałach komunikacyjnych, gdzie pełnią rolę moderatora. Najpopularniejszym botem działającym na kanałach komunikacyjnych jest chatterbot eggdrop działający na IRC. Ostatnio dużą popularność w Polsce zdobył InfoBot – wirtualna pomoc komunikatora internetowego Gadu-Gadu.

Wirtualni rozmówcy I generacji występują także na stronach internetowych. Przykładem są: Ania - wirtualny rozmówca znajdujący się na stronie internetowej Ikei. Opowiada o usługach i ofercie firmy, ułatwia odnajdowanie szukanego produktu na stronie. Jej wizualizacja jest dość schematyczna, rysunkowa - daleka od fotorealizmu. Zakres mimiki jest bardzo ograniczony, co nie wzbudza w użytkowniku poczucia jakoby prowadził konwersację z człowiekiem.


Ania - wirtualny rozmówca znajdujący się na stronie Ikei

Źródło: [Ikea11]

Wirtualni rozmówcy II generacji są złożonymi programami komputerowymi, które wykorzystują algorytmy sztucznej inteligencji. Dokonują analizy znaczeniowej tekstu wprowadzonego przez użytkownika. Posiadają realistyczną kreację – nierzadko łudząco przypominają postać człowieka. Ich wizualna postać potrafi wykonać podstawowe ruchy, jest wzbogacona o gesty i mimikę. Większość z chatterbotów tej generacji stosuje syntezę mowy, jednakże nie rozpoznaje mowy użytkownika. Wirtualni rozmówcy tej generacji mogą być wykorzystywani w prawie każdym celu m.in. jako:

  • konsultanci, doradcy i sprzedawcy na stronach internetowych,
  • operatorzy contact center,
  • partnerzy do dyskusji na swobodne tematy,
  • pomocnicy w wyszukiwaniu informacji w obrębie serwisu,
  • nauczyciele w kursach e-learningowych,
  • postacie w grach.

Wirtualni rozmówcy II generacji są obecnie najczęściej występującymi programami konwersacyjnymi w sieci. Przykładem z polskiego Internetu jest Ewa na stronie domowej firmy Stanusch Technologies.  Jej zadaniem jest przekazywanie informacji na temat firmy, jej produktów oraz stosowanych technologii. Potrafi także wykonać proste obliczenia matematyczne, wymienić stolice różnych państw, czy udzielić podstawowych informacji na temat wielu miast Polski.

Wirtualni doradcy III generacji podobnie jak chatterboty II generacji wykorzystują algorytmy sztucznej inteligencji, jednakże umożliwiają dialog oparty na dwukierunkowym przekazie głosowym. Wizualizacje tych programów są wykonywane w grafice trójwymiarowej, dzięki której postacie są coraz bardziej realistyczne. Coraz trudniej użytkownicy mogą rozpoznać, że rozmawiają z programem a nie z prawdziwym człowiekiem.

Inteligentni wirtualni rozmówcy III generacji mogą pełnić w niej wiele wiodących funkcji wśród których najważniejsze to:

  • zaawansowane wyszukiwanie treści,
  • kompleksowa obsługa w sklepie internetowym,
  • fachowe doradztwo (wyselekcjonowanie informacji w sieci i syntetyzowanie ich w nową wiedzę).