Belgijski računari koji razumeju

Jelena Rupnik
Kada je Dataquest, na konferenciji posvećenoj evropskom IT tržištu, izneo podatke koji upućuju na to da se unutar Zapadne Evrope otvaraju neka nova tržišta, malo ko je pomislio na Belgiju i Finsku. Posetili smo Belgijsku kompaniju koja zauzima vodeće mesto na tržištu softvera za prepoznavanje govora.

 U Belgiji, uz predstavništva najvećih svetskih kompjuterskih firmi, postoji i veliki broj domaćih kompanija, među kojima posebno mesto ima firma Lernout & Hauspie Speech Products iz Ipra, specijalizovana za razvoj tehnologije u oblasti prepoznavanja govora - ima neke logike u tome što je jedan od vodećih centara za istraživanje jezika i govora lociran upravo u multilingvalnoj Belgiji. Čak i mnogim kompjuterskim novinarima ime Lernout & Hauspie ne znači mnogo, uglavnom zato što kompanija retko ima direktan pristup tržištu: njihova tehnološka rešenja ugrađena su u proizvode i usluge kompanija čija su imena mnogo zvučnija: Microsoft, Novell, Nortel, Unisys, Ford, Hitachi, Philips ...
 Nedavno je L&H bio domaćin grupi novinara iz cele Evrope kojima su predstavljena dostignuća u oblasti prepoznavanja govora, nekoliko najnovijih proizvoda i strateški planovi za budućnost. Novinari iz Britanije su poznatim tunelom ispod Lamanša dopremljeni pravo u srce Belgije, gde im je za nekoliko dana firma Lernout & Hauspie demonstrirala domete svojih istraživanja, kao i legendarni izbor od preko 160 vrsta piva koje se prave u Belgiji.


Godine čekanja

 Jo Lernout i Pol Hauspie imaju puno razloga da budu zadovoljni poslovanjem svoje firme - L&H je verovatno jedina belgijska firma koja može da se pohvali prisustvom na Nasdaq -u. Za proteklih godinu dana, od kako su njene deonice puštene u opticaj, kompanija je ostvarila profit u vrednosti od 24 miliona dolara. Ali, ono čime su želeli da impresioniraju svoje goste je nivo tehnologije čijim razvojem se bave.
 Nedavno je L&H bio domaćin grupi novinara iz cele Evrope kojima su predstavljena dostignuća u Već dugo se čeka na komercijalni sistem za konverziju govora u tekst. Poslednjih godina pojavila su se softverska rešenja po prihvatljivim cenama, ali ona nisu zainteresovala široku Slika 1 podršku, uglavnom zbog ograničene upotrebljivosti: zahtevani govor sa pauzama između reči, dosadan proces "privikavanja" softvera na korisnikov glas, veliki procenat grešaka... "čitanje sa usana" koje je demonstrirao HAL 2000 u Odiseji još uvek je daleki san. Povrh toga, najveći broj ovih programa namenjen je isključivo američkom engleskom govornom području.
 Nedavno je L&H bio domaćin grupi novinara iz cele Evrope kojima su predstavljena dostignuća u I pored principijelnih nedostataka od kojih trenutno boluju komercijalni sistemi za prepoznavanje govora, analitičari tržišta procenjuju da će u narednih pet godina prodaja ovih sistema sa 214 miliona porasti na 4.3 milijarde dolara. Osim L&H, glavni "igrači" na tržištu su IBM, Apple, Dragon Systems i Philips . Da bi ojačao svoju poziciju, Lernout&Hauspie je nedavno otkupio kompaniju Kurzweil Applied Intelligence , koja se takođe bavi razvojem proizvoda koji personalnim kompjuterima omogućavaju da prepoznaju izgovorenu reč i konvertuju je u tekst, ili na osnovu nje automatski izvode određene operacije. Jedan od najpoznatijih Kurzweil -ovih proizvoda je Voice for Windows , koji prepoznaje govor osobe koju nikada ranije nije čuo ( speaker independent ) i raspolaže rečnikom od 60 hiljada reči.


Univerzalna gramatika

 L&H bavi se razvojem tehnologije za prepoznavanje govora iz lingvističkog ugla; njihovi algoritmi se dobrim delom oslanjaju na teorijske pretpostavke Noama Čomskog o univerzalnoj gramatici. Primene tih algoritama su podeljene u četiri tehnološke oblasti: speech-to-text konverzija (automatsko prepoznavanje govora), text-to speech (TTS), text-to-text (prevođenje) i digitalnu kompresiju govora.
 Nedavno je L&H bio domaćin grupi novinara iz cele Evrope kojima su predstavljena dostignuća u Očekuje se da će kvantni skok u interakciji sa kompjuterom biti ostvaren tek kada ovakve tehnologije dostignu zrelost. Ako je verovati tehničkim stručnjacima iz L&H, već smo na pragu te mogućnosti: u sledećih 10 godina glavni pomak biće vezan za razvoj korisničkog interfejsa zasnovanog na govoru ( Language User Interface - LUI). Umesto da klikćete mišem po ikonama Windows -a, kompjuteru ćete izdavati kratke naredbe. Ali to je samo jedna od oblasti u kojoj tehnologija prepoznavanja govora neposredno primenjuje.
 Nedavno je L&H bio domaćin grupi novinara iz cele Evrope kojima su predstavljena dostignuća u Među proizvodima koje su domaćini predstavili najinteresantniji su bili upravo oni koji su već prodrli u svakodnevnu upotrebu. Tako je putnicima po SAD snalaženje olakšano zahvaljujući sistemu za navigaciju automobila, AudioNav , koji pomaže vozaču kada se nađe u nepoznatom gradu. Sistem radi na običnom CD plejeru, koji je već postao sastavni deo svakog boljeg automobila - ako ste se izgubili negde u Americi, dovoljno je da stavite odgovarajući CD u plejer, izgovorite (slovo po slovo) naziv mesta ili ulice u kojoj se nalazite i tačke do koje želite da stignete, a AudioNav će vam reći kojim putem da krenete.
 Nedavno je L&H bio domaćin grupi novinara iz cele Evrope kojima su predstavljena dostignuća u Uticaj tehnologije za prepoznavanje govora je već očigledan u oblasti telefonije i telekomunikacija. Novinarima je ovom prilikom demonstriran sistem koji, prilkom korišćenja mobilnog telefona u autu, omogućava biranje brojeva bez korišćenja ruku. Radi se o pojavi koja je u Britaniji već prilično uzela maha, pa čak postoji i časopis pod nazivom In Car Communications (čiji je urednik bio jedan od počasnih gostiju na ovoj turneji). Jedna od posledica ovog trenda je da se sve veći broj saobraćajnih nezgoda pripisuje upotrebi mobilnih telefona prilikom vožnje, pa se mnoge Zapadne zemlje spremaju da, iz bezbednosnih razloga, uvedu zakone kojima bi se to zabranilo.
 Nedavno je L&H bio domaćin grupi novinara iz cele Evrope kojima su predstavljena dostignuća u Vocam 2.0 se aktivira jednostavnom komandom Wake up (Probudi se!), nakon čega je sistem spreman da automatski pozove pretplatnika čiji mu broj izdiktirate cifru po cifru. Takođe je moguće pozivanje pretplatnika čiji su brojevi prethodno uneti u memoriju, jednostavnim izgovaranjem njihovog imena. Da bi demonstrirali kako to funkcioniše, domaćini su novinare u grupama od po 3-4 smeštali u kola u kojima je instaliran jedan ovakav uređaj i vozili ulicama Ipra. Pokazalo se da sistem ne samo što funkcioniše kako je najavljeno, već je i izuzetno efikasan: zahvaljujući High Noise Recogniser modulu, neosetljiv je na buku koju generiše rad motora i žamor saputnika. Interesatno je da je upravno ovaj modul kupio Microsoft da bi ga koristio u nekim svojim budućim proizvodima, koji će, očigledno, biti namenjeni radu u bučnim okruženjima.
 Nedavno je L&H bio domaćin grupi novinara iz cele Evrope kojima su predstavljena dostignuća u Novinarima su demonstrirani i proizvodi američko-belgijske kompanije Keyware , koja je nedavno počela da isporučuje voice authentication server zasnovan na tehnologiji koja je razvijena u L&H. Verifikacija se izvodi na osnovu analize govora na nivou fonema i poređenja inputa sa Slika 2 osobenim voiceprint -om smeštenim u bazi podataka. Server je namenjen kompanijama koje imaju potrebu za sigurnom identifikacijom osoblja, a posebno je primenjiv u finansijskim institucijama i na Internetu, jer je identifikacija korisnika moguća i preko telefona.
 Nedavno je L&H bio domaćin grupi novinara iz cele Evrope kojima su predstavljena dostignuća u Internet je bio tako vruća tema u proteklih godinu dana da ni ova demonstracija tehnologije nije mogla da prođe bez prikazivanja primena u ovoj oblasti. Novinari su najviše bili impresionirani čitačem email poruka: radi se o automatskoj konverziji otkucanog teksta u kompjuterski generisani glas koji oponaša ljudski govor. Čitač email -a nije se "sapleo" ni kod rogobatnih rečenica smišljenih samo zato da ga zbune: " I permit you to ask for a permit to record a record " - sadrži parove reči koje se isto pišu a različito izgovaraju. Razne majmunske znakove, kvadratiće, zvezdice i smajlije da i ne spominjem.


Razgovor sa časovnikom

 Osim konverzije govora u tekst i obrnuto, L&H bavi se i text-to-text transkripcijom, tj. razvojem algoritama za automatsko prevođenje teksta s jednog jezika na drugi. Lako je zamisliti šta bi to značilo za korisnike Interneta, čiji broj brzo raste i u delovima sveta u kojima se ne govori engleski. Sliku o L&H kao kompaniji koja ima jedinstven status na ovom tržištu zaokružuje njihov rad na kompresionim tehnikama koje omogućavaju da se govor beleži, prenosi i transkribuje brže i efikasnije.
 Nedavno je L&H bio domaćin grupi novinara iz cele Evrope kojima su predstavljena dostignuća u Mogućnost da sa elektronskim uređajima komuniciramo pomoću "prirodnog govora" je jako rasprostranjena maštarija. Koliko je duboko uvrežena ta želja, može se videti iz malog nesporazuma do kojeg je došlo prilikom ove novinarske turneje po Belgiji. Svim gostima je podeljen kao poklon mali stoni radio/sat, lepo dizajniran i sa vidljivim oznakama firme Lernout&Hauspie ( Made in Taiwan nalepnica bila je sasvim neupadljiva). Za vreme neformalne večere, dobar deo prisutnih novinara je priznao da je, u samoći hotelske sobe, pokušao da komunicira sa svojim satom nežno mu šapućući; kad je od L&H, mora da ima neke veze s glasom... Ostaje da se nadamo da će sledeća generacija L&H proizvoda značajno olakšati upotrebu mnogih elektronskih uređaja iz naše svakodnevice, ali i da će tokom neke buduće turneje L&H darivati novinare satovima koji razumeju šta im se kaže...





PC home - osnovna strana Novi broj|Arhiva|Pretrazivanje svih brojeva|O nama
Pretplatite se na PC|Postanite saradnik casopisa PC|Pitanja i komentari u vezi casopisa