Belgijski računari koji razumeju |
Jelena Rupnik |
Kada je Dataquest, na konferenciji posvećenoj evropskom IT tržištu, izneo podatke koji upućuju na to da se unutar Zapadne Evrope otvaraju neka nova tržišta, malo ko je pomislio na Belgiju i Finsku. Posetili smo Belgijsku kompaniju koja zauzima vodeće mesto na tržištu softvera za prepoznavanje govora. |
U Belgiji, uz predstavništva najvećih svetskih kompjuterskih firmi, postoji i veliki broj
domaćih kompanija, među kojima posebno mesto ima firma Lernout & Hauspie Speech Products iz
Ipra, specijalizovana za razvoj tehnologije u oblasti prepoznavanja govora - ima neke logike u
tome što je jedan od vodećih centara za istraživanje jezika i govora lociran upravo u
multilingvalnoj Belgiji. Čak i mnogim kompjuterskim novinarima ime Lernout & Hauspie ne znači
mnogo, uglavnom zato što kompanija retko ima direktan pristup tržištu: njihova tehnološka
rešenja ugrađena su u proizvode i usluge kompanija čija su imena mnogo zvučnija: Microsoft,
Novell, Nortel, Unisys, Ford, Hitachi, Philips ...
Nedavno je L&H bio domaćin grupi novinara iz cele Evrope kojima su predstavljena dostignuća u
oblasti prepoznavanja govora, nekoliko najnovijih proizvoda i strateški planovi za budućnost.
Novinari iz Britanije su poznatim tunelom ispod Lamanša dopremljeni pravo u srce Belgije, gde
im je za nekoliko dana firma Lernout & Hauspie demonstrirala domete svojih istraživanja, kao
i legendarni izbor od preko 160 vrsta piva koje se prave u Belgiji.
Godine čekanja
Jo Lernout i Pol Hauspie imaju puno razloga da budu zadovoljni poslovanjem svoje firme - L&H je
verovatno jedina belgijska firma koja može da se pohvali prisustvom na Nasdaq -u. Za proteklih
godinu dana, od kako su njene deonice puštene u opticaj, kompanija je ostvarila profit u
vrednosti od 24 miliona dolara. Ali, ono čime su želeli da impresioniraju svoje goste je nivo
tehnologije čijim razvojem se bave.
Nedavno je L&H bio domaćin grupi novinara iz cele Evrope kojima su predstavljena dostignuća u
Već dugo se čeka na komercijalni sistem za konverziju govora u tekst. Poslednjih godina
pojavila su se softverska rešenja po prihvatljivim cenama, ali ona nisu zainteresovala široku
podršku, uglavnom zbog ograničene upotrebljivosti: zahtevani govor sa pauzama između reči,
dosadan proces "privikavanja" softvera na korisnikov glas, veliki procenat grešaka... "čitanje
sa usana" koje je demonstrirao HAL 2000 u Odiseji još uvek je daleki san. Povrh toga, najveći
broj ovih programa namenjen je isključivo američkom engleskom govornom području.
Nedavno je L&H bio domaćin grupi novinara iz cele Evrope kojima su predstavljena dostignuća u
I pored principijelnih nedostataka od kojih trenutno boluju komercijalni sistemi za
prepoznavanje govora, analitičari tržišta procenjuju da će u narednih pet godina prodaja ovih
sistema sa 214 miliona porasti na 4.3 milijarde dolara. Osim L&H, glavni "igrači" na tržištu su
IBM, Apple, Dragon Systems i Philips . Da bi ojačao svoju poziciju, Lernout&Hauspie je
nedavno otkupio kompaniju Kurzweil Applied Intelligence , koja se takođe bavi razvojem
proizvoda koji personalnim kompjuterima omogućavaju da prepoznaju izgovorenu reč i konvertuju
je u tekst, ili na osnovu nje automatski izvode određene operacije. Jedan od najpoznatijih
Kurzweil -ovih proizvoda je Voice for Windows , koji prepoznaje govor osobe koju nikada ranije
nije čuo ( speaker independent ) i raspolaže rečnikom od 60 hiljada reči.
Univerzalna gramatika
L&H bavi se razvojem tehnologije za prepoznavanje govora iz lingvističkog ugla; njihovi
algoritmi se dobrim delom oslanjaju na teorijske pretpostavke Noama Čomskog o univerzalnoj
gramatici. Primene tih algoritama su podeljene u četiri tehnološke oblasti: speech-to-text
konverzija (automatsko prepoznavanje govora), text-to speech (TTS), text-to-text
(prevođenje) i digitalnu kompresiju govora.
Nedavno je L&H bio domaćin grupi novinara iz cele Evrope kojima su predstavljena dostignuća u
Očekuje se da će kvantni skok u interakciji sa kompjuterom biti ostvaren tek kada ovakve
tehnologije dostignu zrelost. Ako je verovati tehničkim stručnjacima iz L&H, već smo na pragu
te mogućnosti: u sledećih 10 godina glavni pomak biće vezan za razvoj korisničkog interfejsa
zasnovanog na govoru ( Language User Interface - LUI). Umesto da klikćete mišem po ikonama
Windows -a, kompjuteru ćete izdavati kratke naredbe. Ali to je samo jedna od oblasti u kojoj
tehnologija prepoznavanja govora neposredno primenjuje.
Nedavno je L&H bio domaćin grupi novinara iz cele Evrope kojima su predstavljena dostignuća u
Među proizvodima koje su domaćini predstavili najinteresantniji su bili upravo oni koji su već
prodrli u svakodnevnu upotrebu. Tako je putnicima po SAD snalaženje olakšano zahvaljujući
sistemu za navigaciju automobila, AudioNav , koji pomaže vozaču kada se nađe u nepoznatom
gradu. Sistem radi na običnom CD plejeru, koji je već postao sastavni deo svakog boljeg
automobila - ako ste se izgubili negde u Americi, dovoljno je da stavite odgovarajući CD u
plejer, izgovorite (slovo po slovo) naziv mesta ili ulice u kojoj se nalazite i tačke do koje
želite da stignete, a AudioNav će vam reći kojim putem da krenete.
Nedavno je L&H bio domaćin grupi novinara iz cele Evrope kojima su predstavljena dostignuća u
Uticaj tehnologije za prepoznavanje govora je već očigledan u oblasti telefonije i
telekomunikacija. Novinarima je ovom prilikom demonstriran sistem koji, prilkom korišćenja
mobilnog telefona u autu, omogućava biranje brojeva bez korišćenja ruku. Radi se o pojavi koja
je u Britaniji već prilično uzela maha, pa čak postoji i časopis pod nazivom In Car
Communications (čiji je urednik bio jedan od počasnih gostiju na ovoj turneji). Jedna od
posledica ovog trenda je da se sve veći broj saobraćajnih nezgoda pripisuje upotrebi mobilnih
telefona prilikom vožnje, pa se mnoge Zapadne zemlje spremaju da, iz bezbednosnih razloga,
uvedu zakone kojima bi se to zabranilo.
Nedavno je L&H bio domaćin grupi novinara iz cele Evrope kojima su predstavljena dostignuća u
Vocam 2.0 se aktivira jednostavnom komandom Wake up (Probudi se!), nakon čega je sistem
spreman da automatski pozove pretplatnika čiji mu broj izdiktirate cifru po cifru. Takođe je
moguće pozivanje pretplatnika čiji su brojevi prethodno uneti u memoriju, jednostavnim
izgovaranjem njihovog imena. Da bi demonstrirali kako to funkcioniše, domaćini su novinare u
grupama od po 3-4 smeštali u kola u kojima je instaliran jedan ovakav uređaj i vozili ulicama
Ipra. Pokazalo se da sistem ne samo što funkcioniše kako je najavljeno, već je i izuzetno
efikasan: zahvaljujući High Noise Recogniser modulu, neosetljiv je na buku koju generiše rad
motora i žamor saputnika. Interesatno je da je upravno ovaj modul kupio Microsoft da bi ga
koristio u nekim svojim budućim proizvodima, koji će, očigledno, biti namenjeni radu u bučnim
okruženjima.
Nedavno je L&H bio domaćin grupi novinara iz cele Evrope kojima su predstavljena dostignuća u
Novinarima su demonstrirani i proizvodi američko-belgijske kompanije Keyware , koja je nedavno
počela da isporučuje voice authentication server zasnovan na tehnologiji koja je razvijena u
L&H. Verifikacija se izvodi na osnovu analize govora na nivou fonema i poređenja inputa sa
osobenim voiceprint -om smeštenim u bazi podataka. Server je namenjen kompanijama koje imaju
potrebu za sigurnom identifikacijom osoblja, a posebno je primenjiv u finansijskim
institucijama i na Internetu, jer je identifikacija korisnika moguća i preko telefona.
Nedavno je L&H bio domaćin grupi novinara iz cele Evrope kojima su predstavljena dostignuća u
Internet je bio tako vruća tema u proteklih godinu dana da ni ova demonstracija tehnologije
nije mogla da prođe bez prikazivanja primena u ovoj oblasti. Novinari su najviše bili
impresionirani čitačem email poruka: radi se o automatskoj konverziji otkucanog teksta u
kompjuterski generisani glas koji oponaša ljudski govor. Čitač email -a nije se "sapleo" ni
kod rogobatnih rečenica smišljenih samo zato da ga zbune: " I permit you to ask for a permit to
record a record " - sadrži parove reči koje se isto pišu a različito izgovaraju. Razne
majmunske znakove, kvadratiće, zvezdice i smajlije da i ne spominjem.
Razgovor sa časovnikom
Osim konverzije govora u tekst i obrnuto, L&H bavi se i text-to-text transkripcijom, tj.
razvojem algoritama za automatsko prevođenje teksta s jednog jezika na drugi. Lako je zamisliti
šta bi to značilo za korisnike Interneta, čiji broj brzo raste i u delovima sveta u kojima se
ne govori engleski. Sliku o L&H kao kompaniji koja ima jedinstven status na ovom tržištu
zaokružuje njihov rad na kompresionim tehnikama koje omogućavaju da se govor beleži, prenosi i
transkribuje brže i efikasnije.
Nedavno je L&H bio domaćin grupi novinara iz cele Evrope kojima su predstavljena dostignuća u
Mogućnost da sa elektronskim uređajima komuniciramo pomoću "prirodnog govora" je jako
rasprostranjena maštarija. Koliko je duboko uvrežena ta želja, može se videti iz malog
nesporazuma do kojeg je došlo prilikom ove novinarske turneje po Belgiji. Svim gostima je
podeljen kao poklon mali stoni radio/sat, lepo dizajniran i sa vidljivim oznakama firme
Lernout&Hauspie ( Made in Taiwan nalepnica bila je sasvim neupadljiva). Za vreme neformalne
večere, dobar deo prisutnih novinara je priznao da je, u samoći hotelske sobe, pokušao da
komunicira sa svojim satom nežno mu šapućući; kad je od L&H, mora da ima neke veze s glasom...
Ostaje da se nadamo da će sledeća generacija L&H proizvoda značajno olakšati upotrebu mnogih
elektronskih uređaja iz naše svakodnevice, ali i da će tokom neke buduće turneje L&H darivati
novinare satovima koji razumeju šta im se kaže...
|