Definicija neslaganja u jezičnim studijama

U lingvistika, nerazumijevanje je postupak utvrđivanja smisla a riječ koristi se u određenoj kontekst. Poznata i kao leksička nerazumijevanje.

U računskoj lingvistici naziva se ovaj diskriminirajući postupak riječ u smislu riječi (WSD).

Primjeri i zapažanja

"Tako se događa da je naša komunikacija, u različitim Jezici na isti način, omogućava da se isti oblik riječi koristi za značenje različitih stvari u pojedinačnim komunikacijskim transakcijama. Posljedica toga je da u određenoj transakciji treba shvatiti predviđeno značenje određene riječi među njezinim potencijalno povezanim osjetilima. Dok nejasnoće koje proizlaze iz takvih višestrukih udruga značenja oblika nalaze se na leksički oni se često moraju riješiti širem kontekstu od diskurs ugrađivanje riječi. Otuda bi različita osjetila riječi "usluga" mogla biti različita samo ako se može gledati izvan same riječi, kao u suprotnosti igračeva usluga na Wimbledonu 'uz' uslugu konobara u Sheratonu '. Ovaj postupak prepoznavanja značenja riječi u diskursu općenito je poznat kao

instagram viewer

smislu riječi razdvojbena (WSD). "(Oi Yee Kwong, Nove perspektive računske i kognitivne strategije za raščlanjivanje riječi riječi. Springer, 2013.)

Leksička nerazumijevanje i rasprava u smislu riječi (WSD)

„Leksički razdvojbena u njezinoj široj definiciji nije ništa drugo nego određivanje značenja svake riječi u kontekstu, što se čini uglavnom nesvjesnim procesom kod ljudi. Kao računski problem često se opisuje kao "AI-Complete", odnosno, problem čije rješenje pretpostavlja dovršenje rješenja prirodnom jeziku razumijevanje ili zdravorazumsko rasuđivanje (Ide i Véronis 1998.).

"U području računalne lingvistike, problem se općenito naziva disambikulacija riječi riječi (WSD) i definira se kao problem računskog određivanja koji se 'smisao' riječi aktivira upotrebom riječi u određenom kontekst. WSD je u osnovi zadatak klasifikacije: riječ osjetila su klase, a kontekst pruža dokaz, a svaka pojava riječi dodjeljuje se jednoj ili više mogućih klasa temeljenih na dokaz. Ovo je tradicionalna i uobičajena karakterizacija WSD-a koja to vidi kao eksplicitni postupak neslaganja s obzirom na fiksni popis riječi osjetila. Pretpostavlja se da riječi imaju konačan i diskretan skup osjetila iz a rječnik, leksička baza znanja ili ontologija (u potonjem, osjetila odgovaraju pojmovima koje riječ leksikalizira). Također se mogu koristiti zalihe specifične za primjenu. Na primjer, u postavkama strojnog prijevoda (MT) može se tretirati prijevod riječi kao osjetila riječi, an pristup koji postaje sve izvediviji zbog dostupnosti velikog višejezičnog jezika paralelno korpusi koji mogu poslužiti kao podaci o obuci. Fiksni popis tradicionalnih WSD smanjuje složenost problema, ali postoje alternativna polja.. .. "(Eneko Agirre i Philip Edmonds," Uvod. " Rješavanje riječi riječi: Algoritmi i primjene. Springer, 2007)

Homonimija i neslaganje

„Leksički razdvojbena vrlo je pogodno za slučajeve homonimija, na primjer, pojava bas mora biti preslikana na bilo koji od leksičkih predmeta bas₁ ili bas₂, ovisno o predviđenom značenju.

"Leksička nerazumijevanje podrazumijeva kognitivni izbor i zadatak je koji inhibira procese razumijevanja. Treba ga razlikovati od procesa koji dovode do diferencijacije osjetilnih riječi. Prvi zadatak izvršava se prilično pouzdano, također bez puno kontekstualnih informacija, dok drugi nije (usp. Veronis 1998, 2001). Pokazalo se i da istoimene riječi, koje zahtijevaju neslaganje, usporavaju leksički pristup, dok polisem riječi, koje aktiviraju mnoštvo riječi riječi, ubrzavaju leksički pristup (Rodd e.a. 2002).

"Međutim, i produktivna izmjena semantičkih vrijednosti i neposredan izbor između leksički različitih predmeta postoje zajedničko im je što zahtijevaju dodatne neleksičke informacije. "(Peter Bosch," Produktivnost, polisemija i indeks predikata ". Logika, jezik i računanje: 6. međunarodni simpozij o logici, jeziku i računarstvu u Tbilisiju, ed. autor Balder D. deset Cate i Henk W. Zeevat. Springer, 2007)

Razotkrivanje leksičke kategorije i načelo vjerojatnosti

"Corley i Crocker (2000) predstavljaju model širokog obuhvata leksička kategorijarazdvojbena bazirano na Načelo vjerojatnosti. Konkretno, predlažu da se za rečenicu koja se sastoji od riječi w₀... w_n, procesor rečenica usvaja najvjerojatnije dio govora sekvenca t₀... t_n. Konkretnije, njihov model koristi dvije jednostavne vjerojatnosti: (ja) uvjetna vjerojatnost riječi w_ja s obzirom na određeni dio govora t_ja, i (ii) vjerojatnost t_ja s obzirom na prethodni dio govora t_I-1. Kako se susreće svaka riječ rečenice, sustav joj dodjeljuje onaj dio govora t_ja, što maksimizira produkt ove dvije vjerojatnosti. Ovaj model iskorištava uvid mnogih sintaksni nejasnoće imaju leksičku osnovu (MacDonald i sur., 1994), kao u (3):

(3) Skladišne cijene / marke jeftinije su od ostalih.

"Te su rečenice privremeno dvosmislene između čitanja u kojem cijene ili pravi je Glavni glagol ili dio a složena imenica. Nakon obuke na velikom korpusu, model predviđa najvjerojatniji dio govora cijene, ispravno vodeći računa o činjenici koju ljudi razumiju cijena kao imenica, ali pravi kao glagol (vidjeti Crocker & Corley, 2002, i tamo navedene reference). Model ne samo što obuhvaća niz preferencija koje se razilaze u leksičkoj kategoriji dvosmislenost, ona također objašnjava zašto su ljudi općenito vrlo precizni u rješavanju takvih nejasnoća. " (Matthew W. Crocker, "Racionalni modeli razumijevanja: adresiranje paradoksa performansi." Psiholingvistika dvadeset prvog stoljeća: četiri temeljna kamena, ed. autorice Anne Cutler. Lawrence Erlbaum, 2005.)