Računalniško jezikoslovje. Razmerje med jezikoslovjem in računalništvom

Vsebina članka

RAČUNALNIŠKO JEZIKOSLOVJE, smer uporabnega jezikoslovja, usmerjena v uporabo računalniških orodij – programov, računalniških tehnologij za organiziranje in obdelavo podatkov – za modeliranje delovanja jezika v določenih razmerah, situacijah, problemskih območjih ipd., kot tudi v celotnem obsegu uporabe računalniški jezikovni modeli v jezikoslovju in sorodnih disciplinah. Pravzaprav le v slednjem primeru govorimo o uporabnem jezikoslovju v ožjem pomenu, saj lahko računalniško modeliranje jezika obravnavamo tudi kot področje uporabe računalniške znanosti in teorije programiranja pri reševanju problemov v znanosti o jeziku. V praksi pa računalniško jezikoslovje vključuje skoraj vse, kar je povezano z uporabo računalnikov v jezikoslovju.

Računalniško jezikoslovje se je kot posebno znanstveno področje izoblikovalo v šestdesetih letih prejšnjega stoletja. Ruski izraz "računalniška lingvistika" je prevod iz angleškega računalniškega jezikoslovja. Ker pridevnik računalniški v ruščini lahko prevedemo tudi kot »računalniški«, v literaturi najdemo tudi izraz »računalniška lingvistika«, ki pa ima v ruski znanosti ožji pomen in se približuje pojmu »kvantitativna lingvistika«. Pretok objav na tem področju je zelo velik. Poleg tematskih zbirk v ZDA četrtletno izhaja revija Computer Linguistics. Veliko organizacijskega in znanstvenega dela opravlja Združenje za računalniško jezikoslovje, ki ima regionalne strukture (predvsem evropsko podružnico). Vsaki dve leti potekajo mednarodne konference o računalniški lingvistiki – COLING. Ustrezna vprašanja so običajno široko zastopana na različnih konferencah o umetni inteligenci.

Zbirka orodij za računalniško jezikoslovje.

Računalniško jezikoslovje kot posebno aplikativno disciplino odlikuje predvsem instrument – ​​t.j. o uporabi računalniških orodij za obdelavo jezikovnih podatkov. Ker lahko računalniški programi, ki modelirajo določene vidike delovanja jezika, uporabljajo različna programska orodja, se zdi, da ni treba govoriti o splošnem konceptualnem aparatu računalniškega jezikoslovja. Vendar to ne drži. Obstajajo splošna načela računalniškega modeliranja mišljenja, ki so nekako implementirana v kateri koli računalniški model. Temeljijo na teoriji znanja, ki se je prvotno razvila na področju umetne inteligence, kasneje pa je postala ena od vej kognitivne znanosti. Najpomembnejše konceptualne kategorije računalniškega jezikoslovja so takšne strukture znanja, kot so "okvirji" (konceptualne ali, kot pravijo, konceptualne strukture za deklarativno predstavitev znanja o tipizirani tematsko enotni situaciji), "scenariji" (konceptualne strukture za proceduralne predstavitev znanja o stereotipni situaciji ali stereotipnem vedenju), »načrti« (strukture znanja, ki zajemajo ideje o možnih dejanjih, ki vodijo k doseganju določenega cilja). S kategorijo okvirja je tesno povezan koncept »scene«. Kategorija prizora se v literaturi o računalniškem jezikoslovju uporablja predvsem kot označba konceptualne strukture za izjavno predstavitev situacij in njihovih delov, aktualiziranih v govornem dejanju in poudarjenih z jezikovnimi sredstvi (leksemi, skladenjske konstrukcije, slovnične kategorije itd.) .

Organiziran niz struktur znanja na določen način tvori »svetovni model« kognitivnega sistema in njegov računalniški model. V sistemih umetne inteligence model sveta tvori poseben blok, ki lahko glede na izbrano arhitekturo vključuje splošno znanje o svetu (v obliki enostavnih predlogov, kot je »pozimi je hladno« ali v obliki produkcijskih pravil "če zunaj dežuje, potem morate obleči dežni plašč ali vzeti dežnik"), nekaj posebnih dejstev ("Najvišji vrh na svetu je Everest"), pa tudi vrednote in njihove hierarhije, včasih ločene v poseben »aksiološki blok«.

Večina elementov konceptov orodij računalniške lingvistike je homonimnih: hkrati označujejo nekatere resnične entitete človeškega kognitivnega sistema in načine predstavljanja teh entitet, ki se uporabljajo pri njihovem teoretičnem opisu in modeliranju. Z drugimi besedami, elementi pojmovnega aparata računalniške lingvistike imajo ontološke in instrumentalne vidike. Na primer, v ontološkem vidiku delitev deklarativnega in proceduralnega znanja ustreza različnim vrstam znanja, ki je na voljo osebi - tako imenovano znanje KAJ (deklarativno; kot npr. poznavanje poštnega naslova katerega koli NN), na eni strani in znanje KAKO (proceduralno; takšno, na primer znanje, ki vam omogoča, da najdete stanovanje tega NN, tudi če ne poznate njegovega uradnega naslova) - na drugi strani. Z instrumentalnega vidika je znanje lahko utelešeno v nizu opisov (opisov), v nizu podatkov na eni strani in v algoritmu, navodilu, ki ga izvaja računalnik ali kakšen drug model kognitivnega sistema, na drugi strani.

Smeri računalniškega jezikoslovja.

Področje CL je zelo raznoliko in vključuje področja, kot so računalniško modeliranje komunikacije, modeliranje strukture zapletov, tehnologije hiperbesedila za predstavitev besedila, strojno prevajanje in računalniška leksikografija. V ožjem smislu problematiko JZ pogosto povezujemo z interdisciplinarnim aplikativnim področjem z nekoliko neposrečenim imenom »procesiranje naravnega jezika« (prevod angleškega izraza Natural Language Processing). Nastala je v poznih šestdesetih letih prejšnjega stoletja in se razvila v okviru znanstvene in tehnološke discipline »umetne inteligence«. V svoji notranji obliki fraza »obdelava naravnega jezika« zajema vsa področja, kjer se računalniki uporabljajo za obdelavo jezikovnih podatkov. Medtem se je v praksi uveljavilo ožje razumevanje tega pojma - razvoj metod, tehnologij in specifičnih sistemov, ki zagotavljajo komunikacijo med človekom in računalnikom v naravnem ali omejenem naravnem jeziku.

Hiter razvoj področja »procesiranja naravnega jezika« se je zgodil v sedemdesetih letih prejšnjega stoletja, kar je bilo povezano z nepričakovano eksponentno rastjo števila končnih uporabnikov računalnikov. Ker je poučevanje jezikov in tehnologije programiranja za vse uporabnike nemogoče, se je pojavil problem organizacije interakcije z računalniškimi programi. Rešitev tega komunikacijskega problema je potekala po dveh glavnih poteh. V prvem primeru so bili poskusi prilagoditi programske jezike in operacijske sisteme končnemu uporabniku. Posledično so se pojavili jeziki na visoki ravni, kot je Visual Basic, pa tudi priročni operacijski sistemi, zgrajeni v konceptualnem prostoru ljudem znanih metafor - DESK, KNJIŽNICA. Drugi način je razvoj sistemov, ki bi omogočali interakcijo z računalnikom na določenem problemskem področju v naravnem jeziku ali neki njegovi omejeni različici.

Arhitektura sistemov za obdelavo naravnega jezika v splošnem primeru vključuje blok za analizo govornega sporočila uporabnika, blok za interpretacijo sporočila, blok za generiranje pomena odgovora in blok za sintezo površinske strukture izjave. Poseben del sistema je dialoška komponenta, ki beleži strategije vodenja dialoga, pogoje za uporabo teh strategij in načine premostitve morebitnih komunikacijskih napak (napak v komunikacijskem procesu).

Med računalniškimi sistemi za obdelavo naravnega jezika običajno ločimo sisteme za vprašanje-odgovor, interaktivne sisteme za reševanje problemov in povezane sisteme za obdelavo besedil. Sprva so se sistemi vprašanj in odgovorov začeli razvijati kot reakcija na slabo kakovost kodiranja poizvedb pri iskanju informacij v sistemih za iskanje informacij. Ker je bilo problemsko področje takih sistemov zelo omejeno, je to nekoliko poenostavilo algoritme za prevajanje poizvedb v formalno jezikovno predstavitev in obratni postopek za pretvorbo formalne predstavitve v izjave v naravnem jeziku. Med domačimi dogodki tovrstni programi vključujejo sistem POET, ki ga je ustvarila skupina raziskovalcev pod vodstvom E.V. Popova. Sistem obdela zahteve v ruščini (z manjšimi omejitvami) in sintetizira odgovor. Diagram poteka programa vključuje prehod skozi vse stopnje analize (morfološke, sintaktične in semantične) in ustrezne stopnje sinteze.

Pogovorni sistemi za reševanje problemov imajo za razliko od sistemov prejšnjega tipa aktivno vlogo pri komunikaciji, saj je njihova naloga pridobiti rešitev problema na podlagi znanja, ki je v njem predstavljeno, in informacij, ki jih lahko dobi od uporabnika. Sistem vsebuje strukture znanja, ki beležijo tipična zaporedja dejanj za reševanje problemov na danem problemskem področju, ter informacije o potrebnih virih. Ko uporabnik postavi vprašanje ali določi določeno nalogo, se aktivira ustrezen skript. Če nekatere komponente skripta manjkajo ali nekateri viri manjkajo, sistem sproži komunikacijo. Tako deluje na primer sistem SNUKA, ki rešuje probleme načrtovanja vojaških operacij.

Sistemi za obdelavo povezanih besedil so po zgradbi precej raznoliki. Njihovo skupno značilnost lahko štejemo za široko uporabo tehnologij za predstavitev znanja. Funkcije tovrstnih sistemov so razumevanje besedila in odgovarjanje na vprašanja o njegovi vsebini. Razumevanje ni obravnavano kot univerzalna kategorija, temveč kot proces pridobivanja informacij iz besedila, ki ga določa določena komunikacijska intenca. Z drugimi besedami, besedilo se »bere« samo s predpostavko, da točno to, kar potencialni uporabnik želi vedeti o njem. Tako se izkaže, da sistemi za obdelavo povezanih besedil niso univerzalni, temveč problemsko usmerjeni. Tipična primera sistemov obravnavanega tipa sta sistema RESEARCHER in TAILOR, ki tvorita enoten programski paket, ki uporabniku omogoča pridobivanje informacij iz patentnih povzetkov, ki opisujejo kompleksne fizične objekte.

Najpomembnejše področje računalniškega jezikoslovja je razvoj sistemov za iskanje informacij (IRS). Slednji je nastal v poznih petdesetih in zgodnjih šestdesetih letih 20. stoletja kot odgovor na močno povečanje obsega znanstvenih in tehničnih informacij. Glede na vrsto shranjenih in obdelanih informacij ter lastnosti iskanja so sistemi za iskanje informacij razdeljeni v dve veliki skupini - dokumentarne in stvarne. Sistemi za iskanje dokumentarnih informacij hranijo besedila dokumentov ali njihove opise (izvlečke, bibliografske kartice itd.). Factual IRS obravnavajo opis specifičnih dejstev in ne nujno v besedilni obliki. To so lahko tabele, formule in druge vrste predstavitve podatkov. Obstajajo tudi mešani informacijski sistemi, ki vključujejo dokumente in dejanske informacije. Trenutno so faktografski informacijski sistemi zgrajeni na podlagi tehnologij baz podatkov (DB). Da bi zagotovili iskanje informacij v sistemu za iskanje informacij, so ustvarjeni posebni jeziki za iskanje informacij, ki temeljijo na tezavrih za iskanje informacij. Jezik za iskanje informacij je formalni jezik, zasnovan za opis določenih vidikov načrta vsebine dokumentov, shranjenih v sistemu za iskanje informacij, in zahteve. Postopek za opisovanje dokumenta v jeziku za iskanje informacij se imenuje indeksiranje. Kot rezultat indeksiranja se vsakemu dokumentu dodeli njegov formalni opis v jeziku za iskanje informacij - iskalna slika dokumenta. Na podoben način se indeksira poizvedba, ki ji je dodeljena slika iskalne poizvedbe in iskalni recept. Algoritmi za iskanje informacij temeljijo na primerjavi iskalnega predpisa z iskalno sliko poizvedbe. Kriterij za izdajo dokumenta na zahtevo je lahko popolno ali delno ujemanje iskalne slike dokumenta in iskalnega navodila. V nekaterih primerih ima uporabnik možnost, da sam oblikuje merila za izdajo. To je odvisno od njegove potrebe po informacijah. Avtomatizirani sistemi za iskanje informacij pogosto uporabljajo deskriptorske jezike za iskanje informacij. Predmet dokumenta je opisan z nizom deskriptorjev. Deskriptorji so besede in izrazi, ki označujejo preproste, dokaj elementarne kategorije in koncepte problematičnega področja. V iskalno sliko dokumenta je vnesenih toliko deskriptorjev, kot je različnih tem, ki jih pokriva dokument. Število deskriptorjev ni omejeno, kar vam omogoča, da dokument opišete v večdimenzionalni matriki značilnosti. V jeziku za iskanje informacij o deskriptorju so pogosto uvedene omejitve glede združljivosti deskriptorjev. V tem primeru lahko rečemo, da ima jezik za iskanje informacij sintakso.

Eden prvih sistemov, ki je deloval z deskriptorskim jezikom, je bil ameriški sistem UNITERM, ki ga je ustvaril M. Taube. Ključne besede dokumenta – uniterms – so v tem sistemu delovale kot deskriptorji. Posebnost tega IRS je, da na začetku slovar informacijskega jezika ni bil določen, ampak je nastal v procesu indeksiranja dokumenta in poizvedbe. Razvoj sodobnih sistemov za iskanje informacij je povezan z razvojem sistemov za iskanje informacij brez tezavra. Takšni informacijski sistemi delujejo z uporabnikom v omejenem naravnem jeziku, iskanje pa poteka po besedilih izvlečkov dokumentov, po njihovih bibliografskih opisih, pogosto pa tudi po samih dokumentih. Za indeksiranje v netezavrskem tipu IRS se uporabljajo besede in besedne zveze naravnega jezika.

Področje računalniške lingvistike lahko do neke mere vključuje delo na področju ustvarjanja hiperbesedilnih sistemov, ki veljajo za poseben način organiziranja besedila in celo kot bistveno novo vrsto besedila, ki je v številnih svojih lastnostih v nasprotju z običajnim besedilom, oblikovanim v Gutenbergovo tradicijo tiskanja. Zamisel o hipertekstu je povezana z imenom Vannevarja Busha, svetovalca predsednika F. Roosevelta za znanost. V. Bush je teoretično utemeljil projekt tehničnega sistema Memex, ki je uporabniku omogočal povezovanje besedil in njihovih fragmentov z različnimi vrstami povezav, predvsem z asociativnimi razmerji. Pomanjkanje računalniške tehnologije je otežilo izvedbo projekta, saj se je mehanski sistem izkazal za preveč zapletenega za praktično izvedbo.

Busheva ideja se je ponovno rodila v šestdesetih letih prejšnjega stoletja v sistemu Xanadu T. Nelsona, ki je že vključeval uporabo računalniške tehnologije. »Xanadu« je uporabniku omogočal branje nabora besedil, vnesenih v sistem, na različne načine, v različnih zaporedjih; Skupek besedil z razmerji, ki jih povezujejo (sistem prehodov), je T. Nelson poimenoval hipertekst. Mnogi raziskovalci menijo, da je nastanek hiperteksta začetek nove informacijske dobe, v nasprotju z dobo tiskanja. Linearnost zapisa, ki navzven odseva linearnost govora, se izkaže za temeljno kategorijo, ki omejuje človekovo razmišljanje in razumevanje besedila. Pomenski svet je nelinearen, zato stiskanje semantičnih informacij v linearnem govornem segmentu zahteva uporabo posebnih »komunikacijskih paketov« - delitev na temo in remo, delitev vsebinskega načrta izjave na eksplicitne (izjava, predlog, fokus). ) in implicitne (predpostavka, posledica, implikatura diskurza) plasti . Zavrnitev linearnosti besedila tako v procesu njegovega podajanja bralcu (torej med branjem in razumevanjem) kot v procesu sinteze bi po mnenju teoretikov prispevala k »osvoboditvi« mišljenja in celo nastanku njegovega nove oblike.

V računalniškem sistemu je hiperbesedilo predstavljeno v obliki grafa, katerega vozlišča vsebujejo tradicionalna besedila ali njihove fragmente, slike, tabele, video posnetke itd. Vozlišča so povezana z različnimi odnosi, katerih tipe določijo razvijalci hiperbesedilne programske opreme ali bralec sam. Odnosi določajo potencialne možnosti gibanja ali navigacije skozi hipertekst. Odnosi so lahko enosmerni ali dvosmerni. Skladno s tem dvosmerne puščice omogočajo uporabniku premikanje v obe smeri, medtem ko enosmerne puščice omogočajo uporabniku premikanje le v eno smer. Veriga vozlišč, skozi katere gre bralec, ko gleda sestavine besedila, tvori pot ali pot.

Računalniške izvedbe hiperteksta so lahko hierarhične ali omrežne. Hierarhična – drevesna – struktura hiperbesedila bistveno omejuje možnosti prehoda med njegovimi komponentami. V takšnem hiperbesedilu razmerja med komponentami spominjajo na strukturo tezavra, ki temelji na odnosih med rodom in vrsto. Omrežno hiperbesedilo omogoča uporabo različnih vrst razmerij med komponentami, ki niso omejene na razmerja med rodom in vrsto. Glede na način obstoja hiperbesedila ločimo statična in dinamična hiperbesedila. Statični hipertekst se med delovanjem ne spreminja; vanj lahko uporabnik zapiše svoje komentarje, ki pa ne spremenijo bistva zadeve. Za dinamično hiperbesedilo je sprememba normalna oblika obstoja. Značilno je, da dinamična hiperbesedila delujejo tam, kjer je treba stalno analizirati pretok informacij, tj. informacijskih storitev različnih vrst. Hipertekst je na primer Arizonski informacijski sistem (AAIS), ki se mesečno posodablja s 300–500 izvlečki na mesec.

Razmerja med elementi hiperbesedila lahko na začetku določijo ustvarjalci ali pa se ustvarijo vsakič, ko uporabnik dostopa do hiperbesedila. V prvem primeru govorimo o hiperbesedilih trde strukture, v drugem pa o hiperbesedilih mehke strukture. Toga struktura je tehnološko povsem razumljiva. Tehnologija za organizacijo mehke strukture mora temeljiti na semantični analizi bližine dokumentov (ali drugih virov informacij) drug drugemu. To je netrivialna naloga v računalniškem jezikoslovju. Dandanes je uporaba tehnologij mehke strukture na ključnih besedah ​​zelo razširjena. Prehod iz enega vozlišča v drugega v hipertekstnem omrežju se izvede kot rezultat iskanja ključnih besed. Ker je nabor ključnih besed lahko vsakič drugačen, se struktura hiperbesedila vsakič spremeni.

Tehnologija za gradnjo hiperbesedilnih sistemov ne razlikuje med besedilnimi in nebesedilnimi informacijami. Vključevanje vizualnih in zvočnih informacij (videov, slik, fotografij, zvočnih posnetkov itd.) pa zahteva bistveno spremembo uporabniškega vmesnika ter zmogljivejšo programsko in računalniško podporo. Takšni sistemi se imenujejo hipermedijski ali multimedijski. Prepoznavnost multimedijskih sistemov je vnaprej določila njihovo široko uporabo v izobraževanju in pri ustvarjanju računalniških različic enciklopedij. Obstajajo na primer čudovito izdelani CD-romi z multimedijskimi sistemi, ki temeljijo na otroških enciklopedijah, ki jih je izdal Dorlin Kindersley.

V okviru računalniške leksikografije se razvijajo računalniške tehnologije za sestavljanje in delovanje slovarjev. Posebni programi - baze podatkov, računalniške omare, programi za obdelavo besedil - vam omogočajo samodejno ustvarjanje slovarskih vnosov, shranjevanje slovarskih informacij in njihovo obdelavo. Številne različne računalniške leksikografske programe delimo v dve veliki skupini: programe za podporo leksikografskim delom in avtomatske slovarje različnih vrst, vključno z leksikografskimi bazami podatkov. Samodejni slovar je slovar v posebni strojni obliki, ki je namenjen uporabi v računalniku s strani uporabnika ali računalniškega programa za obdelavo besedil. Z drugimi besedami, obstaja razlika med samodejnimi slovarji za končnega uporabnika in samodejnimi slovarji za programe za obdelavo besedil. Avtomatski slovarji, namenjeni končnemu uporabniku, se po vmesniku in strukturi slovarskega vnosa bistveno razlikujejo od avtomatskih slovarjev, ki so vključeni v sisteme za strojno prevajanje, sisteme za samodejno abstrahiranje, sisteme za iskanje informacij itd. Najpogosteje gre za računalniške različice znanih običajnih slovarjev. Na trgu programske opreme obstajajo računalniški analogi razlagalnih slovarjev angleškega jezika (avtomatski Webster, samodejni razlagalni slovar angleškega jezika, ki ga je izdal Collins, avtomatska različica novega velikega angleško-ruskega slovarja, ki ga je uredil Yu.D. Apresyan). in E.M. Mednikova), obstaja tudi računalniška različica Ozhegovega slovarja. Avtomatske slovarje za programe za obdelavo besedil lahko imenujemo avtomatski slovarji v ožjem pomenu besede. Na splošno niso namenjeni povprečnemu uporabniku. Značilnosti njihove strukture in obseg besednega gradiva določajo programi, ki z njimi sodelujejo.

Računalniško modeliranje strukture ploskve je še eno obetavno področje računalniške lingvistike. Študij strukture zapleta se nanaša na probleme strukturalne literarne kritike (v širšem smislu), semiotike in kulturnih študij. Razpoložljivi računalniški programi za modeliranje ploskev temeljijo na treh osnovnih formalizmih za ploskevni prikaz - morfološki in sintaktični smeri ploskevskega predstavljanja ter na kognitivnem pristopu. Ideje o morfološki strukturi ploskve segajo v znana dela V.Ya Proppa ( cm.) o ruski pravljici. Propp je opazil, da je ob obilici likov in dogodkov v pravljici število funkcij likov omejeno, in predlagal aparat za opisovanje teh funkcij. Proppove ideje so bile osnova računalniškega programa TALE, ki simulira generiranje pravljičnega zapleta. Algoritem programa TALE temelji na zaporedju funkcij likov v pravljici. Proppove funkcije so namreč definirale nabor tipiziranih situacij, urejenih na podlagi analize empiričnega materiala. Možnosti povezovanja različnih situacij v pravilih generiranja so bile določene s tipičnim zaporedjem funkcij – v obliki, kot je to mogoče ugotoviti iz besedil pravljic. V programu so bila tipična zaporedja funkcij opisana kot tipični scenariji srečanja likov.

Teoretična podlaga skladenjskega pristopa k zapletu besedila so bile »zgodbene slovnice« ali »zgodbene slovnice«. Pojavili so se sredi sedemdesetih let prejšnjega stoletja kot posledica prenosa idej generativne slovnice N. Chomskega na opis makrostrukture besedila. Če so bile najpomembnejše sestavine skladenjske strukture v generativni slovnici glagolske in samostalniške besedne zveze, potem so bili v večini plotnih slovnic kot osnovni izpostavljeni ekspozicija (prizorišče), dogodek in epizoda. V teoriji slovnic zapletov so bili pogoji minimalnosti, to je omejitve, ki določajo status zaporedja elementov zapleta kot normalnega zapleta, na široko razpravljani. Izkazalo pa se je, da tega ni mogoče storiti s čisto lingvističnimi metodami. Veliko omejitev je sociokulturne narave. Slovnice zapletov so se sicer precej razlikovale v naboru kategorij v generacijskem drevesu, vendar so dopuščale zelo omejen nabor pravil za spreminjanje narativne strukture.

V zgodnjih osemdesetih letih prejšnjega stoletja je eden od študentov R. Schenka, V. Lehnert, v okviru svojega dela na ustvarjanju računalniškega generatorja zapletov predlagal izvirni formalizem čustvenih zapletov (Affective Plot Units), ki se je izkazal za močno sredstvo. predstavljanja strukture parcele. Kljub temu, da je bil prvotno razvit za sistem umetne inteligence, je bil ta formalizem uporabljen v povsem teoretičnih študijah. Bistvo Lehnertovega pristopa je bilo, da je bil zaplet opisan kot zaporedna sprememba kognitivno-emocionalnih stanj likov. Tako Lehnertov formalizem ni osredotočen na zunanje sestavine zapleta - ekspozicijo, dogodek, epizodo, moralo - temveč na njegove vsebinske značilnosti. V tem pogledu je Lehnertov formalizem deloma vrnitev k Proppovim idejam.

V pristojnost računalniškega jezikoslovja sodi tudi strojno prevajanje, ki trenutno doživlja preporod.

Literatura:

Popov E.V. Komunikacija z računalnikom v naravnem jeziku. M., 1982
Sadur V.G. Govorna komunikacija z elektronskimi računalniki in problemi njihovega razvoja. – V knjigi: Govorna komunikacija: problemi in obeti. M., 1983
Baranov A.N. Kategorije umetne inteligence v lingvistični semantiki. Okvirji in skripte. M., 1987
Kobozeva I.M., Laufer N.I., Saburova I.G. Modeliranje komunikacije v sistemih človek-stroj. – Jezikovna podpora informacijskih sistemov. M., 1987
Olker H.R. Pravljice, tragedije in načini prikazovanja svetovne zgodovine. – V knjigi: Jezik in modeliranje socialne interakcije. M., 1987
Gorodetsky B.Yu. Računalniško jezikoslovje: modeliranje jezikovne komunikacije
McQueen K. Diskurzne strategije za sintezo besedil v naravnem jeziku. – Novosti v tujem jezikoslovju. vol. XXIV, Računalniško jezikoslovje. M., 1989
Popov E.V., Preobraženski A.B. . Značilnosti implementacije sistemov NL
Preobraženski A.B. Stanje razvoja sodobnih NL sistemov. - Umetna inteligenca. Knjiga 1, Komunikacijski sistemi in ekspertni sistemi. M., 1990
Subbotin M.M. Hipertekst. Nova oblika pisne komunikacije. – VINITI, Ser. Računalništvo, 1994, letnik 18
Baranov A.N. Uvod v uporabno jezikoslovje. M., 2000



Od leta 2012 Inštitut za jezikoslovje Ruske državne univerze za humanistične vede usposablja magistre v magistrskem programu Računalniško jezikoslovje(smer Fundamentalno in uporabno jezikoslovje). Ta program je zasnovan za pripravo profesionalnih jezikoslovci ki obvladajo tako osnove jezikoslovja kot sodobne metode raziskovalnega, strokovno-analitskega, inženirskega dela in so sposobni učinkovito sodelovati pri razvoju inovativnih jezikovnih računalniških tehnologij.

V izobraževalnem procesu sodelujejo razvijalci velikih raziskovalnih in komercialnih sistemov na področju avtomatske obdelave besedil, kar zagotavlja povezavo magistrskega izobraževanja z glavnim tokom sodobne računalniške lingvistike. Posebna pozornost je namenjena udeležbi magistrov na ruskih in mednarodnih konferencah.

Med učitelji so avtorji osnovnih učbenikov o jezikoslovnih specialitetah, strokovnjaki svetovnega razreda, vodje projektov velikih avtomatskih sistemov za obdelavo jezikov: Ya.G. Testelec, I.M. Boguslavsky, V.I. Belikov, V.I. Podlesskaya, V.P. Selegey, L.L. Iomdin, A.S. Starostin, S.A. Sharov, pa tudi zaposleni v podjetjih, ki so vodilna v svetu na področju računalniške lingvistike: IBM (sistem Watson), Yandex, ABBYY (sistemi Lingvo, FineReader, Compreno).

Osnova za usposabljanje magistrov v tem programu je projektni pristop. Vključevanje magistrskih študentov v raziskovalno delo na področju računalniškega jezikoslovja poteka na podlagi Ruske državne univerze za humanistiko in na podlagi podjetij, ki razvijajo programe na področju AOT (ABBYY, IBM itd.), ki , pa je seveda velik plus tako za same mojstre kot za njihove morebitne delodajalce. V magistrski program so sprejeti predvsem ciljni magistri, katerih usposabljanje izvajajo bodoči delodajalci.

Vstopni testi: "Formalni modeli in metode sodobnega jezikoslovja." Točne informacije o času izpita lahko dobite na spletni strani magistrskega oddelka Ruske državne univerze za humanistične vede.

Predstojniki magistrata - vodja. Izobraževalno-znanstveni center za računalniško jezikoslovje, direktor jezikoslovnih raziskav pri ABBYY Vladimir Pavlovič Selegej in doktor filoloških znanosti, prof Vera Isaakovna Podleskaya .

Program sprejemnega izpita in razgovora za disciplino “Formalni modeli in metode sodobne lingvistike.”

Komentarji na program

  • Vsako programsko vprašanje lahko spremljajo naloge, povezane z opisi specifičnih jezikovnih pojavov, povezanih z delom vprašanja: konstrukcija struktur, opis omejitev, možni algoritmi za konstrukcijo in/ali identifikacijo.
  • Vprašanja, označena z zvezdicami, so neobvezna (na listkih so pod številko 3). Poznavanje ustreznega gradiva je velik bonus za kandidate, vendar ni obvezno.
  • Poleg teoretičnih vprašanj bodo izpitne karte ponudile majhen delček posebnega (jezikovnega) besedila v angleščini za prevod in diskusijo. Od kandidatov se zahteva, da izkažejo zadovoljivo raven znanja angleške znanstvene terminologije in znanstvene analize besedil. Kot primer besedila, ki vlagatelju ne bi smelo povzročati večjih težav, je spodaj del članka https://en.wikipedia.org/wiki/Anaphora_(lingvistika):

V jezikoslovju je anafora (/əˈnæfərə/) uporaba izraza, katerega razlaga je odvisna od drugega izraza v kontekstu (njegovega predhodnika ali postcedenta). V ožjem smislu je anafora uporaba izraza, ki je posebej odvisen od predhodnega izraza in je zato v nasprotju s kataforo, ki je uporaba izraza, ki je odvisen od postcedentnega izraza. Anaforični (napotni) izraz se imenuje anafora. Na primer, v stavku Sally je prišla, a je nihče ni videl, je zaimek njena anafora, ki se nanaša nazaj na predhodnico Sally. V stavku Pred njenim prihodom nihče ni videl Sally se zaimek njena nanaša naprej na postcedent Sally, zato je njena zdaj katafora (in anafora v širšem, ne pa ožjem pomenu). Običajno je anaforični izraz predforma ali kakšna druga vrsta deiktičnega (kontekstualno odvisnega) izraza. Anafora in katafora sta vrsti endofore, ki se nanašata na nekaj, kar je omenjeno drugje v pogovornem oknu ali besedilu.

Anafora je pomemben koncept iz različnih razlogov in na različnih ravneh: prvič, anafora nakazuje, kako je diskurz konstruiran in vzdrževan; drugič, anafora povezuje različne skladenjske elemente na ravni stavka; tretjič, anafora predstavlja izziv za obdelavo naravnega jezika v računalniškem jezikoslovju, saj je lahko identifikacija reference težavna; in četrtič, anafora pove nekaj o tem, kako se jezik razume in obdeluje, kar je pomembno za področja jezikoslovja, ki jih zanima kognitivna psihologija.

TEORETIČNA VPRAŠANJA

SPLOŠNA VPRAŠANJA JEZIKOSLOVJA

  • Predmet jezikoslovja. Jezik in govor. Sinhronija in diahronija.
  • Ravni jezika. Formalni modeli jezikovnih ravni.
  • Sintagmatika in paradigmatika. Koncept distribucije.
  • Osnove medjezikovnih primerjav: tipološko, genealoško in arealno jezikoslovje.
  • *Matematična lingvistika: predmet in raziskovalne metode

FONETIKA

  • Predmet fonetika. Artikulacijska in akustična fonetika.
  • Segmentna in suprasegmentna fonetika. Prozodija in intonacija.
  • Osnovni pojmi fonologije. Tipologija fonoloških sistemov in njihove fonetične izvedbe.
  • *Računalniška orodja in metode fonetičnih raziskav
  • * Analiza in sinteza govora.

MORFOLOGIJA

  • Predmet morfologije. Morfemi, morfemi, alomorfi.
  • Pregibanje in besedotvorje.
  • Slovnični pomeni in načini njihove implementacije. Slovnične kategorije in gramemi. Morfološki in skladenjski slovnični pomeni.
  • Pojmi besedne oblike, debla, leme in paradigme.
  • Deli govora; osnovni pristopi k prepoznavanju delov govora.
  • *Formalni modeli za opis pregiba in besedotvorja.
  • *Morfologija pri nalogah avtomatske obdelave jezika: preverjanje črkovanja, lematizacija, POS-označevanje

SINTAKSA

  • Predmet sintakse. Načini izražanja skladenjskih odnosov.
  • Načini predstavitve skladenjske zgradbe stavka. Prednosti in slabosti dreves odvisnosti in komponent.
  • Načini opisovanja linearnega reda. Pomanjkanje projektivnosti in zlom komponent. Koncept transformacije; transformacije, povezane z linearnim redom.
  • Razmerje med sintakso in semantiko: valence, kontrolni modeli, aktanti in cirkonstante.
  • Diateza in kolaterala. Izpeljava aktanta.
  • Komunikativna organizacija izreka. Tema in rema, dano in novo, kontrast.
  • *Glavne sintaktične teorije: MST, generativizem, funkcijska slovnica, HPSG
  • *Matematični modeli sintakse: klasifikacija formalnih jezikov po Chomskem, algoritmi za prepoznavanje in njihova kompleksnost.

SEMANTIKA

  • Predmet semantike. Naivne in znanstvene jezikovne slike sveta. Sapir–Whorfova hipoteza.
  • Pomen v jeziku in govoru: pomen in referent. Vrsta reference (denotativni status).
  • Leksikalna semantika. Načini za opis semantike besede.
  • Slovnična semantika. Glavne kategorije na primeru ruskega jezika.
  • Semantika stavka. Propozicijska komponenta. Deiksis in anafora. Kvantifikatorji in vezniki. Modalnost.
  • Hierarhija in sistematičnost leksikalnih pomenov. Polisemija in homonimija. Pomenska struktura večpomenske besede. Pojma invariant in prototip.
  • Paradigmatska in sintagmatska razmerja v besedišču. Leksikalne funkcije.
  • Tolmačenje. Jezik tolmačenja. Moskovska semantična šola
  • Semantika in logika. Resnična vrednost izjave.
  • Teorija govornih dejanj. Izrek in njegova ilokucijska moč. Performativi. Klasifikacija govornih dejanj.
  • Frazeologija: popis in metode opisovanja frazeoloških enot.
  • *Modeli in metode formalne semantike.
  • *Modeli semantike v sodobnem računalniškem jezikoslovju.
  • *Distributivna in operativna semantika.
  • *Osnovne ideje konstrukcijske slovnice.

TIPOLOGIJA

  • Tradicionalne tipološke klasifikacije jezikov.
  • Tipologija slovničnih kategorij samostalnika in glagola.
  • Tipologija preprostega stavka. Glavne vrste konstrukcij: tožilnik, ergativ, aktiv.
  • Tipologija besednega reda in Greenbergove korelacije. Levo in desno razvejani jeziki.

LEKSIKOGRAFIJA

  • Besedišče kot inventar kulture; družbena variiranost besedišča, leksikalna raba, norma, kodifikacija.
  • Tipologija slovarjev (na ruskem gradivu). Odsev besedišča v slovarjih različnih vrst.
  • Dvojezična leksikografija z uporabo ruskega jezika.
  • Deskriptivna in predpisovalna leksikografija. Strokovni jezikoslovni slovarji.
  • Posebnosti glavnih ruskih razlagalnih slovarjev. Zgradba slovarskega stavka. Tolmačenje in enciklopedične informacije.
  • Besedišče in slovnica. Zamisel o integralnem modelu jezika v moskovski semantični šoli.
  • *Metodologija leksikografa.
  • *Korpusne metode v slovaropisju.

LINGVISTIKA BESEDILA IN DISKURZA

  • Pojem besedila in diskurza.
  • Mehanizmi medfrazne komunikacije. Glavne vrste sredstev za njihovo jezikovno izvajanje.
  • Stavek kot jezikovna enota in kot prvina besedila.
  • Nadfrazne enote, načela njihovega oblikovanja in izolacije, osnovne lastnosti.
  • Glavne kategorije razvrščanja besedil (žanr, slog, register, predmetno področje itd.)
  • *Metode za samodejno žanrsko razvrščanje.

SOCIOLINGVISTIKA

  • Problem predmeta in meja sociolingvistike, njena interdisciplinarna narava. Osnovni pojmi sociologije in demografije. Ravni jezikovne strukture in sociolingvistika. Osnovni pojmi in smeri sociolingvistike.
  • Jezikovni stiki. Dvojezičnost in diglosija. Divergentni in konvergentni procesi v zgodovini jezika.
  • Socialna diferenciacija jezika. Oblike obstoja jezika. Knjižni jezik: raba-norma-kodifikacija. Funkcionalna področja jezika.
  • Jezikovna socializacija. Hierarhičnost družbene in jezikovne identitete. Posameznikovo jezikovno vedenje in njegov sporazumevalni repertoar.
  • Metode sociolingvističnega raziskovanja.

RAČUNALNIŠKO JEZIKOSLOVJE

  • Naloge in metode računalniškega jezikoslovja.
  • Korpusno jezikoslovje. Glavne značilnosti ohišja.
  • Predstavitev znanja. Osnovne ideje teorije okvirov M. Minskyja. Sistem FrameNet.
  • Tezavrusi in ontologije. WordNet.
  • Osnove statistične analize besedil. Frekvenčni slovarji. Analiza kolokacij.
  • *Koncept strojnega učenja.

LITERATURA

Izobraževalna (osnovna raven)

Baranov A.N. Uvod v uporabno jezikoslovje. M.: Uredništvo URRS, 2001.

Baranov A.N., Dobrovolsky D.O. Osnove frazeologije (kratek tečaj) Študijski vodnik. 2. izdaja. Moskva: Flinta, 2014.

Belikov V.A., Krysin L.P. Sociolingvistika. M., Ruska državna univerza za humanistične vede, 2001.

Burlak S.A., Starostin S.A. Primerjalnozgodovinsko jezikoslovje. M.: Akademija. 2005

Vakhtin N.B., Golovko E.V. Sociolingvistika in sociologija jezika. Sankt Peterburg, 2004.

Knyazev S. V., Pozharitskaya S. K. Sodobni ruski knjižni jezik: fonetika, grafika, črkovanje, črkovanje. 2. izd. M., 2010

Koboževa I.M. Jezikovna semantika. M.: Uvodnik URSS. 2004.

Kodzasov S.V., Krivnova O.F. Splošna fonetika. M.: RSUH, 2001.

Krongauz M.A. Semantika. M.: RSUH. 2001.

Krongauz M.A. Semantika: Naloge, naloge, besedila. M.: Akademija. 2006..

Maslov Yu.S. Uvod v jezikoslovje. Ed. 6., izbrisano. M.: Akademija, fil. fak. Državna univerza v Sankt Peterburgu,

Plungyan V.A. Splošna morfologija: Uvod v predmet. Ed. 2. M.: Uvodnik URSS, 2003.

Testelec Ya.G. Uvod v splošno sintakso. M., 2001.

Shaikevič A.Ya. Uvod v jezikoslovje. M.: Akademija. 2005.

Znanstveno in referenčno

Apresyan Yu.D. Izbrana dela, zvezek I. Leksikalna semantika: 2. izd., špan. in dodatno M.: Šola "Jeziki ruske kulture", 1995.

Apresyan Yu.D. Izbrana dela, II. zvezek. Celostni opis jezika in sistemske leksikografije. M.: Šola "Jeziki ruske kulture", 1995.

Apresyan Yu.D.(ur.) Nov razlagalni slovar sinonimov ruskega jezika. Moskva - Dunaj: "Jeziki ruske kulture", Wiener Slavistischer Almanach, Sonderband 60, 2004.

Apresyan Yu.D.(ur.) Jezikovna slika sveta in sistemska leksikografija (ur. Yu. D. Apresyan). M.: "Jeziki slovanskih kultur", 2006, Predgovor in poglavje. 1, str.26-74.

Bulygina T.V., Shmelev A.D. Jezikovna konceptualizacija sveta (na podlagi ruske slovnice). M.: Šola "Jeziki ruske kulture", 1997.

Weinreich W. Jezikovni stiki. Kijev, 1983.

Vezhbitskaya A. Semantične univerzalije in opis jezikov. M .: Šola "Jeziki ruske kulture". 1999.

Galperin I.R. Besedilo kot predmet jezikoslovnega raziskovanja. 6. izd. M.: LKI, 2008 ("Jezikovna dediščina 20. stoletja")

Zaliznyak A.A."Ruski nominalni pregib" z uporabo izbranih del o sodobnem ruskem jeziku in splošnem jezikoslovju. M.: Jeziki slovanske kulture, 2002.

Zaliznyak A.A., Paducheva E.V. K tipologiji odnosnih stavkov. / Semiotika in računalništvo, let. 35. M., 1997, str. 59-107.

Ivanov Vjač. sonce.. Jezikoslovje tretjega tisočletja. Vprašanja za prihodnost. M., 2004. Str. 89-100 (11. Jezikovna situacija v svetu in napoved za bližnjo prihodnost).

Kibrik A.E. Eseji o splošnih in uporabnih vprašanjih jezikoslovja. M.: Založba Moskovske državne univerze, 1992.

Kibrik A.E. Jezikovne konstante in spremenljivke. Sankt Peterburg: Aletheya, 2003.

Labov U. O mehanizmu jezikovnih sprememb // Novo v jezikoslovju. številka 7. M., 1975. P.320-335.

Lyons J. Jezikovna semantika: Uvod. M.: Jeziki slovanske kulture. 2003.

Lyons John. Jezik in jezikoslovje. Začetni tečaj. M: URSS, 2004

Lakoff J.Ženske, ogenj in nevarne stvari: kaj nam kategorije jezika povedo o mišljenju. M.: Jeziki slovanske kulture. 2004.

Lakoff J, Johnson M. Metafore, po katerih živimo. per. iz angleščine 2. izdaja. M.: URSS. 2008.

Lingvistični enciklopedični slovar / Ed. V.I. Jarceva. M.: Znanstvena založba "Big Russian Encyclopedia", 2002.

Melchuk I.A. Tečaj splošne morfologije. Tt. I-IV. Moskva-Dunaj: "Jeziki slovanske kulture", Wiener Slavistischer Almanach, Sonderband 38/1-38/4, 1997-2001.

Melčuk I. A. Izkušnje v teoriji lingvističnih modelov “POMEN ↔ BESEDILO”. M.: Šola "Jeziki ruske kulture", 1999.

Fedorova L.L. Semiotika. M., 2004.

Filippov K. A. Jezikoslovje besedila: Potek predavanj - 2. izd., špan. in dodatno Ed. Sankt Peterburg Univerza, 2007.

Haspelmath, M., et al. (ur.). Svetovni atlas jezikovnih struktur. Oxford, 2005.

Sušilec, M.S. in Haspelmath, M.(ur.) Svetovni atlas jezikovnih struktur na spletu. Leipzig: Inštitut Maxa Plancka za evolucijsko antropologijo, 2013. (http://wals.info)

Croft W. Tipologija in univerzalije. Cambridge: Cambridge University Press, 2003. Shopen, T. (ur.). Jezikovna tipologija in sintaktični opis. 2. izdaja. Cambridge, 2007.

V. I. Belikov. O slovarjih, »ki vsebujejo norme sodobnega ruskega knjižnega jezika, kadar se uporablja kot državni jezik Ruske federacije«. 2010 // Portal Gramota.Ru (http://gramota.ru/biblio/research/slovari-norm)

Računalniško jezikoslovje in intelektualne tehnologije: Na podlagi gradiva letne mednarodne konference "Dialog". vol. 1-11. - M.: Založba Nauka, Ruska državna humanistična univerza, 2002-2012. (Članki o računalniški lingvistiki, http://www.dialog-21.ru).

Nacionalni korpus ruskega jezika: 2006-2008. Novi rezultati in obeti. / Rep. izd. V. A. Plungjan. - Sankt Peterburg: Nestor-zgodovina, 2009.

Novost v tujem jezikoslovju. vol. XXIV, Računalniško jezikoslovje / Comp. B. Yu Gorodetsky. M.: Napredek, 1989.

Shimchuk E. G. Ruska leksikografija: učbenik. M.: Akademija, 2009.

Nacionalni korpus ruskega jezika: 2003-2005. Zbirka člankov. M.: Indrik, 2005.

Za kontakte:

Izobraževalni in znanstveni center za računalniško jezikoslovje Inštituta za jezikoslovje Ruske državne univerze za humanistične vede


1. Aktivnosti za formalizacijo znanja o naravnem jeziku na njegovih različnih ravneh za namene uporabe v računalniških tehnologijah. 2. Področje znanja, ki rešuje probleme komunikacije med osebo in računalnikom v naravnem jeziku. 3. Širok nabor uporabe računalniških orodij - programov, računalniških tehnologij za organiziranje in obdelavo podatkov - za modeliranje delovanja jezika v določenih pogojih, situacijah, problemskih področjih.


Umetna inteligenca je veja računalništva, katere cilj je razviti računalniške sisteme, ki so sposobni izvajati funkcije, ki se tradicionalno štejejo za intelektualne – razumevanje naravnega jezika, logično sklepanje, uporaba nabranega znanja, usposabljanje, načrtovanje akcij itd.








3. Izdelava algoritmov za jezikovno analizo - razvoj algoritmov za analizo besedil v naravnem jeziku na vseh jezikovnih ravneh: fonemski, morfemski, oblikoslovni, skladenjski, pragmatični. Gradnja sintaktičnega drevesa odvisnosti (projekt samodejne obdelave besedila)


4. Korpusno jezikoslovje – ukvarja se z razvojem, nastajanjem in uporabo besedilnih (jezikovnih) korpusov. Domača stran spletnega mesta Nacionalnega korpusa ruskega jezika


5. Strojno prevajanje je smer znanstvenega raziskovanja, povezana z izgradnjo avtomatskih sistemov za prevajanje besedil iz enega naravnega jezika v drugega. Domača stran spletnega mesta Google prevajalnik


6. Samodejno abstrahiranje – izdelava programov za stisnjeno predstavitev besedil v naravnem jeziku. Storitev za izdelavo izvlečka na spletni strani Visual World


7. Polnobesedilno iskanje informacij – razvoj sistemov za iskanje informacij z jezikovno analizo besedil informacijskega polja in zahtev uporabnikov. Domača stran informacijskega iskalnega sistema Yandex









Izraz "računalniška lingvistika" se običajno nanaša na široko področje uporabe računalniških orodij - programov, računalniških tehnologij za organiziranje in obdelavo podatkov - za modeliranje delovanja jezika v določenih pogojih, situacijah, problemskih področjih, pa tudi obsega uporaba računalniških modelov jezika ne le v jezikoslovju, ampak tudi v sorodnih disciplinah. Pravzaprav le v slednjem primeru govorimo o uporabnem jezikoslovju v ožjem pomenu, saj lahko računalniško modeliranje jezika štejemo tudi za področje uporabe računalniške teorije na področju jezikoslovja. Kljub temu je splošna praksa, da področje računalniškega jezikoslovja zajema skoraj vse, kar je povezano z uporabo računalnikov v jezikoslovju: »Izraz »računalniško jezikoslovje« določa splošno usmeritev k uporabi računalnikov za reševanje različnih znanstvenih in praktičnih problemov, povezanih z na jezik, ne da bi omejili načine za reševanje teh težav."

Institucionalni vidik računalniškega jezikoslovja. Računalniško jezikoslovje se je kot posebno znanstveno področje izoblikovalo v 60. letih. Pretok objav na tem področju je zelo velik. Poleg tematskih zbirk v ZDA četrtletno izhaja revija Computational Linguistics. Veliko organizacijskega in znanstvenega dela opravlja Združenje za računalniško jezikoslovje, ki ima regionalne strukture po vsem svetu (predvsem evropsko podružnico). Vsaki dve leti potekajo mednarodne konference o računalniški lingvistiki – COLING. Pomembna vprašanja so široko zastopana tudi na mednarodnih konferencah o umetni inteligenci na različnih ravneh.

Kognitivna orodja za računalniško jezikoslovje

Računalniško jezikoslovje kot posebno aplikativno disciplino odlikuje predvsem instrument - to je uporaba računalniških orodij za obdelavo jezikovnih podatkov. Ker lahko računalniški programi, ki modelirajo določene vidike delovanja jezika, uporabljajo različna programska orodja, se zdi, da ni treba govoriti o splošnem metajeziku. Vendar to ne drži. Obstajajo splošna načela računalniškega modeliranja mišljenja, ki so nekako implementirana v kateri koli računalniški model. Ta jezik temelji na teoriji znanja, ki se je razvila v umetni inteligenci, in tvori pomembno vejo kognitivne znanosti.

Glavna teza teorije znanja pravi, da je mišljenje proces predelave in generiranja znanja. »Znanje« ali »znanje« velja za nedoločljivo kategorijo. Človeški kognitivni sistem deluje kot »procesor«, ki obdeluje znanje. V epistemologiji in kognitivni znanosti ločimo dve glavni vrsti znanja - deklarativno (»vedeti, kaj«) in proceduralno (»vedeti, kako«2)). Deklarativno znanje je običajno predstavljeno v obliki nabora predlogov, izjav o nečem. Tipičen primer deklarativnega znanja lahko štejemo za razlago besed v navadnih razlagalnih slovarjih. Na primer, skodelica] - "majhna posoda za pitje okrogle oblike, običajno z ročajem, izdelana iz porcelana, lončene posode itd." Deklarativno znanje je primerno za postopek preverjanja v smislu "true-false". Proceduralno znanje je predstavljeno kot zaporedje (seznam) operacij, dejanj, ki jih je treba izvesti. To je nekaj splošnih navodil o ravnanju v določeni situaciji. Tipičen primer postopkovnega znanja so navodila za uporabo gospodinjskih aparatov.

Za razliko od deklarativnega znanja postopkovnega znanja ni mogoče preveriti kot resnično ali napačno. Ocenimo jih lahko le po uspešnosti ali neuspešnosti algoritma.

Večina konceptov kognitivnih orodij računalniškega jezikoslovja je homonimnih: hkrati označujejo nekatere resnične entitete človeškega kognitivnega sistema in načine predstavljanja teh entitet v določenih metajezikih. Z drugimi besedami, elementi metajezika imajo ontološki in instrumentalni vidik. Ontološko delitev na deklarativno in proceduralno znanje ustreza različnim vrstam znanja človekovega kognitivnega sistema. Tako je znanje o določenih predmetih, predmetih realnosti pretežno deklarativno, funkcionalne sposobnosti človeka za hojo, tek in vožnjo avtomobila pa se v kognitivnem sistemu realizirajo kot proceduralno znanje. Instrumentalno lahko znanje (tako ontološko proceduralno kot deklarativno) predstavimo kot niz opisov, opisov in kot algoritem ali navodilo. Z drugimi besedami, ontološko deklarativno znanje o objektu realnosti »tabela« je lahko proceduralno predstavljeno kot nabor navodil, algoritmov za njegovo ustvarjanje, sestavljanje (= kreativni vidik proceduralnega znanja) ali kot algoritem za njegovo tipično uporabo (= funkcionalno). vidik proceduralnega znanja). V prvem primeru bi bil to lahko priročnik za mizarja začetnika, v drugem pa opis zmožnosti pisarniške mize. Velja tudi nasprotno: ontološko proceduralno znanje je mogoče predstaviti deklarativno.

Zahteva ločeno razpravo, ali je mogoče vsako ontološko deklarativno znanje predstaviti kot proceduralno in vsako ontološko proceduralno znanje mogoče predstaviti kot deklarativno. Raziskovalci se strinjajo, da je vsako deklarativno znanje načeloma mogoče predstaviti proceduralno, čeprav se to lahko izkaže za zelo potratno za kognitivni sistem. Obratno verjetno ne bo res. Dejstvo je, da je deklarativno znanje veliko bolj eksplicitno, človek ga lažje razume kot proceduralno znanje. V nasprotju z deklarativnim znanjem je proceduralno znanje pretežno implicitno. Tako je jezikovna sposobnost, ki je proceduralno znanje, skrita pred osebo in se je ne zaveda. Poskus razlage mehanizmov delovanja jezika vodi v disfunkcijo. Strokovnjaki na področju leksikalne semantike na primer vedo, da dolgotrajna pomenska introspekcija, potrebna za preučevanje vsebine besede, povzroči, da raziskovalec delno izgubi sposobnost razlikovanja med pravilno in nepravilno uporabo analizirane besede. Navedemo lahko še druge primere. Znano je, da je človeško telo z vidika mehanike kompleksen sistem dveh medsebojno delujočih nihal.

V teoriji znanja se za preučevanje in predstavljanje znanja uporabljajo različne strukture znanja – okviri, scenariji, načrti. Po mnenju M. Minskyja je »okvir podatkovna struktura, oblikovana tako, da predstavlja stereotipno situacijo« [Minsky 1978, str.254]. Natančneje lahko rečemo, da je okvir konceptualna struktura za deklarativno predstavitev znanja o tipizirani tematsko enotni situaciji, ki vsebuje reže, ki so med seboj povezane z določenimi pomenskimi razmerji. Zaradi jasnosti je okvir pogosto predstavljen kot tabela, katere vrstice tvorijo reže. Vsaka reža ima svoje ime in vsebino (glejte tabelo 1).

Tabela 1

Fragment okvirja "table" v pogledu tabele

Strukturiranje okvirja je lahko glede na specifično nalogo bistveno bolj kompleksno; okvir lahko vsebuje ugnezdene podokvirje in sklicevanja na druge okvire.

Namesto tabele se pogosto uporablja predikatna oblika prikaza. V tem primeru je okvir v obliki predikata ali funkcije z argumenti. Obstajajo tudi drugi načini za predstavitev okvirja. Na primer, lahko ga predstavimo kot torko naslednje oblike: ( (ime okvirja) (ime reže)) (vrednost reže,),..., (ime reže n) (vrednost reže l)).

Običajno imajo okvirji v jezikih za predstavitev znanja to vrsto.

Tako kot druge kognitivne kategorije računalniškega jezikoslovja je koncept okvirja homonim. Ontološko je del človekovega kognitivnega sistema in v tem smislu okvir lahko primerjamo s pojmi, kot so gestalt, prototip, stereotip, shema. V kognitivni psihologiji se te kategorije obravnavajo z ontološkega vidika. Tako D. Norman razlikuje dva glavna načina obstoja in organizacije znanja v človeškem kognitivnem sistemu - semantične mreže in sheme. »Sheme,« piše, »so organizirani paketi znanja, sestavljeni tako, da predstavljajo posamezne, neodvisne enote znanja. Moja shema za Sama lahko vsebuje informacije, ki opisujejo njegove fizične značilnosti, njegove dejavnosti in osebnostne lastnosti. Ta shema se nanaša na druge sheme, ki opisujejo njene druge strani" [Norman 1998, str. 359]. Če vzamemo instrumentalno stran kategorije okvirja, potem je to struktura za deklarativno reprezentacijo znanja. V obstoječih sistemih umetne inteligence lahko okvirji tvorijo kompleksne strukture znanja; Sistemi okvirjev omogočajo hierarhijo – en okvir je lahko del drugega okvirja.

Vsebinsko je koncept okvirja zelo blizu kategoriji interpretacije. Dejansko je reža analog valence, polnjenje reže je analog aktanta. Glavna razlika med njima je v tem, da interpretacija vsebuje le jezikovno pomembne informacije o vsebini besede, okvir pa, prvič, ni nujno vezan na besedo, in, drugič, vključuje vse informacije, pomembne za dano problemsko situacijo, vključno z vključno z zunajjezikovnimi (vedenje o svetu) 3).

Skript je konceptualna struktura za proceduralno predstavitev znanja o stereotipni situaciji ali stereotipnem vedenju. Elementi skripta so koraki algoritma ali navodila. Običajno govorijo o "scenariju obiska restavracije", "scenariju nakupa" itd.

Sprva se je okvir uporabljal tudi za procesno predstavitev (prim. izraz "proceduralni okvir"), zdaj pa se izraz "skripta" pogosteje uporablja v tem pomenu. Scenarij je mogoče predstaviti ne le kot algoritem, ampak tudi kot omrežje, katerega oglišča ustrezajo določenim situacijam, loki pa povezavam med situacijami. Poleg pojma skripta nekateri raziskovalci za računalniško modeliranje inteligence uporabljajo tudi kategorijo skripta. Po R. Schenku je scenarij neko splošno sprejeto, dobro znano zaporedje vzročnih odnosov. Na primer razumevanje dialoga

Zunaj lije kot iz vedra.

Še vedno boste morali iti v trgovino: v hiši ni ničesar za jesti - včeraj so gostje vse pometli.

temelji na neeksplicitnih pomenskih povezavah, kot je "če dežuje, ni zaželeno iti ven, ker lahko zboliš." Te povezave tvorijo pisavo, ki jo materni govorci uporabljajo za razumevanje govora in negovornega vedenja drug drugega.

Kot rezultat uporabe scenarija na določeno problemsko situacijo, a načrt). Načrt se uporablja za proceduralno predstavitev znanja o možnih dejanjih, ki vodijo k doseganju določenega cilja. Načrt povezuje cilj z zaporedjem dejanj.

V splošnem načrt vključuje zaporedje postopkov, ki spremenijo začetno stanje sistema v končno stanje in vodijo k doseganju določenega podcilja in cilja. V sistemih umetne inteligence načrt nastane kot rezultat načrtovanja ali načrtovalske dejavnosti ustreznega modula - modula za načrtovanje. Postopek načrtovanja lahko temelji na prilagajanju podatkov iz enega ali več scenarijev, ki se aktivirajo s postopki testiranja, da se razreši problemska situacija. Načrt izvaja izvršni modul, ki nadzoruje kognitivne postopke in fizična dejanja sistema. V osnovnem primeru je načrt v inteligentnem sistemu preprosto zaporedje operacij; v bolj zapletenih različicah je načrt povezan z določenim predmetom, njegovimi viri, zmožnostmi, cilji, podrobnimi informacijami o problemski situaciji itd. Nastanek načrta se pojavi v procesu komunikacije med svetovnim modelom, katerega del tvorijo scenariji, načrtovalskim modulom in izvršnim modulom.

Za razliko od scenarija je načrt povezan z določeno situacijo, določenim izvajalcem in je namenjen doseganju določenega cilja. Izbira načrta je odvisna od virov izvajalca. Izvedljivost načrta je predpogoj za njegovo generiranje v kognitivnem sistemu, značilnost izvedljivosti pa ni uporabna za scenarij.

Drug pomemben koncept je model sveta. Model sveta običajno razumemo kot nabor znanja o svetu, organiziranem na določen način, ki je značilen za kognitivni sistem ali njegov računalniški model. V nekoliko bolj splošni obliki se o modelu sveta govori kot o delu kognitivnega sistema, ki shranjuje znanje o zgradbi sveta, njegovih vzorcih itd. V drugem razumevanju je model sveta povezan z rezultati razumevanja besedila. ali, širše, diskurz. V procesu razumevanja diskurza se gradi njegov mentalni model, ki je rezultat interakcije vsebinskega načrta besedila in znanja o svetu, značilnega za dani subjekt [Johnson-Laird 1988, str. Prvo in drugo razumevanje se pogosto združujeta. To je značilno za lingvistične raziskovalce, ki delujejo v okviru kognitivnega jezikoslovja in kognitivne znanosti.

S kategorijo okvirja je tesno povezan koncept scene. Kategorija prizora se v literaturi uporablja predvsem kot označba konceptualne strukture za izjavno predstavitev situacij in njihovih delov, ki so aktualizirani v govornem dejanju in poudarjeni z jezikovnimi sredstvi (leksemi, skladenjske konstrukcije, slovnične kategorije itd.) Ker je prizor povezan z jezikovnimi oblikami, je pogosto aktualiziran z določeno besedo ali izrazom. V slovnici zapletov (glej spodaj) se prizor pojavi kot del epizode ali pripovedi. Tipični primeri prizorov so niz kock, s katerimi deluje sistem AI, lokacija dogajanja v zgodbi in udeleženci v dejanju itd. V umetni inteligenci se prizori uporabljajo v sistemih za prepoznavanje slik, pa tudi v programih, ki so osredotočeni na preučevanje (analiza, opis) problemskih situacij. Koncept scene se je razširil v teoretičnem jezikoslovju, pa tudi logiki, zlasti v situacijski semantiki, v kateri je pomen leksikalne enote neposredno povezan s sceno.

načrt:

1. Kaj je računalniško jezikoslovje?

2. Objekt in predmet računalniškega jezikoslovja

4. Problemi računalniškega jezikoslovja

5. Raziskovalne metode za računalniško jezikoslovje

6. Zgodovina in razlogi za nastanek računalniškega jezikoslovja

7. Osnovni pojmi računalniškega jezikoslovja

8. Znanstveniki, ki se ukvarjajo s problemom računalniškega jezikoslovja

9. Združenja in konference o računalniškem jezikoslovju

10. Uporabljena literatura.


Računalniško jezikoslovje – samostojna smer uporabnega jezikoslovja, usmerjena v uporabo računalnikov za reševanje problemov, povezanih z rabo naravnega jezika. (Shchilikhina K.M.)


Računalniško jezikoslovje– kot eno izmed področij uporabne lingvistike preučuje lingvistične temelje računalništva in vse vidike povezave med jezikom in mišljenjem, modeliranje jezika in mišljenja v računalniškem okolju z uporabo računalniških programov, zanima pa se na področjih: 1) optimizacija komunikacije na podlagi jezikovnega znanja 2) ustvarjanje naravnega jezikovnega vmesnika in tipologij razumevanja jezika za komunikacijo človek-stroj 3) ustvarjanje in modeliranje informacijskih računalniških sistemov (Sosnina E.P.)


Predmet računalniške lingvistike– analiza jezika v njegovem naravnem stanju, kot ga ljudje uporabljajo v različnih komunikacijskih situacijah, in kako je mogoče oblikovati značilnosti jezika.


Naloge računalniškega jezikoslovja:


Raziskovalne metode računalniškega jezikoslovja:

1. metoda modeliranja - poseben predmet preučevanja, ki ni na voljo z neposrednim opazovanjem. Po definiciji matematika K. Shannona je model predstavitev predmeta v neki obliki, ki se razlikuje od oblike njegovega realnega obstoja.

2. metoda teorije reprezentacije znanja pomeni metode predstavljanja znanja, ki so usmerjene v avtomatsko obdelavo s sodobnimi računalniki.

3. metoda teorije programskega jezika(teorija programskega jezika) je področje računalništva, povezano z načrtovanjem, analizo, določanjem značilnosti in klasifikacijo programskih jezikov ter proučevanjem njihovih posameznih značilnosti.


Vzroki za nastanek računalniškega jezikoslovja

1. Pojav računalnikov

2. Problem komuniciranja z računalniki neizučenih uporabnikov


1. Sistem iskanja po slovarju, razvit na Birkbeck College v Londonu leta 1948.

2. Memorandum Warrena Weaverja

3. Začetek uvajanja prvih računalnikov na področju strojnega prevajanja

4. Projekt Georgetown leta 1954


1. ALPAC (Svetovalni odbor za avtomatsko obdelavo jezikov) 2. nova faza v razvoju računalniških tehnologij in njihova aktivna uporaba v jezikovnih nalogah 3. ustvarjanje nove generacije računalnikov in programskih jezikov 4. vse večje zanimanje za strojno prevajanje 60

-70 let dvajsetega stoletja


Konec 80-ih - začetek 90-ih let 20. stoletja

    Pojav in aktiven razvoj interneta

  • Hitra rast obsega besedilnih informacij v elektronski obliki

  • Potreba po avtomatski obdelavi besedil v naravnem jeziku


1. Izdelki PROMT in ABBY (Lingvo) 2. Tehnologije strojnega prevajanja 3. Tehnologije Translation Memory

Sodobni komercialni sistemi

  • Oživljanje besedil

  • Komunikacijski modeli

  • Računalniška leksikografija

  • Strojno prevajanje

  • Korpus besedil


Analiza besedila v naravnem jeziku

3 stopnje strukture besedila:
  • Površinska skladenjska zgradba

  • Globoka sintaktična struktura

  • Semantična raven


Problem sinteze je nasproten problemu analize

Oživljanje besedila

1. Izmenjava besedil preko vizualnih podob na zaslonu

2. 2 modaliteti človeškega mišljenja: simbolna in vizualna.


1. Posnemanje komunikacijskega procesa 2. Ustvarjanje učinkovitega modela dialoga Komunikacijski modeli


Hipertekst- poseben način organiziranja in podajanja besedila, pri katerem je več besedil ali odlomkov besedila mogoče med seboj povezati z različnimi vrstami povezav.


Razlike med hiperbesedilom in tradicionalnim besedilom

Hipertekst

    1. obdelava govorjenega jezika

  • 2. obdelava pisnega besedila


Obdelava govora

1. avtomatska sinteza govora

A) razvoj sintetizatorjev besedila v govor. Vključuje 2 bloka: blok za jezikovno obdelavo besedil in blok akustične sinteze.

2. samodejno prepoznavanje govora


1) prepoznavanje besedila

2) analiza besedila

3) sinteza besedila


IRS (sistem za iskanje informacij)– to so programski sistemi za shranjevanje, iskanje in izdajanje zanimivih informacij.

Zakharov V.P. verjame, da IPS je urejen nabor dokumentov in informacijskih tehnologij, namenjenih shranjevanju in pridobivanju informacij – besedil ali podatkov.


3 vrste IPS

3 vrste IPS

    Priročnik- To je iskanje v knjižnici.

  • Mehanizirano IPS so tehnična sredstva, ki zagotavljajo izbor potrebnih dokumentov

  • Samodejno- iskanje informacij z uporabo računalnikov


Računalniška leksikografija

Računalniška leksikografija– eno od pomembnih področij uporabnega jezikoslovja, ukvarja se s teorijo in prakso sestavljanja slovarjev.

V leksikografiji obstajata dve smeri:
  • Tradicionalna leksikografija sestavlja tradicionalne slovarje

  • Strojna leksikografija se ukvarja z avtomatizacijo priprave slovarjev in rešuje probleme razvoja elektronskih slovarjev


Naloge računalniške leksikografije

  • Samodejno pridobivanje različnih slovarjev iz besedila

  • Izdelava slovarjev, ki so elektronske različice tradicionalnih slovarjev ali kompleksnih elektronskih jezikovnih slovarjev za tradicionalno slovarsko delo, na primer LINGVO

  • Razvoj teoretičnih in praktičnih vidikov sestavljanja posebnih računalniških slovarjev, na primer za iskanje informacij, strojno prevajanje


Strojno prevajanje

Strojno prevajanje– pretvorbo besedila v enem naravnem jeziku v drug naravni jezik z uporabo računalnika.

Vrste strojnega prevajanja
  • FAMT(Fully Automated Machine Translation) – popolnoma samodejno prevajanje

  • HAMT(Human Aided Machine Translation) - strojno prevajanje s sodelovanjem človeka

  • MAHT(Machine Aided Human Translation) – prevod, ki ga izvaja oseba z uporabo pomožne programske opreme in jezikovnih orodij.


  • 2) poklicni poslanec– kakovostnejši prevod, ki mu sledi človeško urejanje

  • 3) interaktivni MP– se šteje za prevod v posebnih podpornih sistemih; poteka v dialogu z računalniškim sistemom. Kakovost MP je odvisna od možnosti prilagajanja, virov in vrste besedil.

Korpus besedil

Korpus besedil- to je določena zbirka besedil, ki temelji na logičnem konceptu, logični ideji, ki združuje ta besedila.

Jezikovni korpus- velik, elektronsko predstavljen, enoten, strukturiran, označen, filološko kompetenten niz jezikovnih podatkov, namenjenih reševanju specifičnih jezikovnih problemov.


Reprezentativnost je najpomembnejša lastnost korpusa


Namen jezikovnega korpusa je prikazati delovanje jezikovnih enot v njihovem naravnem vsebinskem okolju



Na podlagi korpusa lahko pridobite naslednje podatke:

1. o pogostnosti slovničnih kategorij

2. o frekvenčnih spremembah

3. o spremembah kontekstov v različnih časovnih obdobjih

5. o sopojavnosti leksikalnih enot

6. o značilnostih njihove združljivosti


Brown Corps


Korpus besedil - to je določena zbirka besedil, ki temelji na logičnem konceptu, logični ideji, ki združuje ta besedila. Utelešenje te logične ideje: pravila za organizacijo besedil v korpus, algoritmi in programi za analizo korpusa besedil, pripadajoča ideologija in metodologija. Nacionalni korpus predstavlja dani jezik na določeni stopnji (ali stopnjah) njegovega obstoja in v vsej raznolikosti žanrov, stilov, teritorialnih in družbenih različic itd. Osnovni pojmi računalniškega jezikoslovja

    Programski jeziki (LP) je razred umetnih jezikov, zasnovanih za obdelavo informacij z uporabo računalnika. Vsak programski jezik je strog (formalni) znakovni sistem, s pomočjo katerega so napisani računalniški programi. Po različnih ocenah trenutno obstaja od tisoč do deset tisoč različnih programskih jezikov.

  • Informatika(Računalništvo) - veda o zakonitostih zapisovanja, shranjevanja, obdelave, prenosa in uporabe informacij s tehničnimi sredstvi.



Iskanje informacij (Pridobivanje informacij) je postopek iskanja tovrstnih dokumentov (besedil, zapisov in

itd.), ki ustrezajo prejeti zahtevi.

« Sistem za iskanje informacij (IPS) je urejen niz dokumentov (nizov dokumentov) in informacijskih tehnologij, namenjenih shranjevanju in pridobivanju informacij – besedil (dokumentov) ali podatkov (dejstev).

Strojna leksikografija(Računalniška leksikografija) se ukvarja z avtomatizacijo priprave slovarjev in rešuje probleme razvoja el

slovarji.

Strojno prevajanje je računalniško preoblikovanje besedila na eno

naravnega jezika v vsebinsko enakovredno besedilo v drugem

naravni jezik.

Hipertekst je tehnologija za organiziranje informacij in posebej strukturiranega besedila, razdeljenega na ločene bloke, ki imajo nelinearno predstavitev, za učinkovito predstavitev informacij v računalniških okoljih.


    Okvir je struktura za reprezentacijo deklarativnega znanja o tipizirani tematsko enotni situaciji, tj. struktura podatkov o stereotipni situaciji.

  • Scenarij - to je zaporedje več epizod v času, to je tudi prikaz stereotipne situacije ali stereotipnega vedenja, le elementi scenarija so koraki algoritma ali navodila.
  • Načrtujte – predstavitev znanja o možnih dejanjih, ki so potrebna za dosego določenega cilja.



Znanstveniki s področja računalniškega jezikoslovja:

  • Sovjetski in ruski znanstveniki: Aleksej Ljapunov, Igor Melčuk, Olga Kulagina, Yu.D. Apresjan, N.N. Leontyeva, Yu.S. Martemjanov, Z.M. Šaljapina, Igor Boguslavski, A.S. Narignani, A.E. Kibrik, Baranov A.N.

  • Zahodni znanstveniki Igralci: Yorick Wilks, Gregory Grefenstette, Gravil Corbett, John Carroll, Diana McCarthy, Luis Marquez, Dan Moldovan, Joakim Nivre, Victor Raskin, Eduard Hovey.


Združenja in konference v računalniškem jezikoslovju:
  • "Dialog"- glavna ruska konferenca o računalniško jezikoslovje z mednarodno udeležbo.

Prednostna naloga dialoga je računalniško modeliranje ruski jezik. Delovna jezika konference sta ruščina in angleščina. Da bi pritegnili tuje recenzente, je večina prijavljenih del oddana v angleščini.

Glavne usmeritve konference:
  • Jezikovna semantika in semantično analizo

  • Formalni jezikovni modeli in njihove aplikacije

  • Teoretično in računalniško leksikografija

  • Metode za vrednotenje sistemov za analizo besedil in strojnega prevajanja

  • Korpusno jezikoslovje. Izdelava, uporaba, vrednotenje korpusov

  • Internet kot jezikovni vir. Jezikoslovne tehnologije na internetu

  • Ontologije. Pridobivanje znanja iz besedil

  • Računalniška analiza dokumentov: abstrahiranje, razvrstitev, iskanje

  • Samodejna analiza sentimenta besedil

  • Strojno prevajanje

  • Komunikacijski modeli. Komunikacija, dialog in govorno dejanje

  • Analiza in sinteza govora



2. Združenje za računalniško jezikoslovje (ACL) je mednarodno znanstveno in strokovno združenje ljudi, ki se ukvarjajo s problemi, ki vključujejo naravni jezik in računalništvo. Letno srečanje poteka vsako poletje na lokacijah, kjer se izvajajo pomembne raziskave računalniške lingvistike. Ustanovljeno leta 1962, s prvotnim imenom Združenje za strojno prevajanje in računalniško jezikoslovje (AMTCL). Leta 1968 je postal ACL.
  • UACL ima evropsko (EACL) in severnoameriški (NAACL) veje.

  • Revija ACL, Računalniško jezikoslovje, je glavni forum za raziskave računalniškega jezikoslovja in obdelave naravnega jezika. Od leta 1988 revija izhaja za ACL MIT Press.
  • Serija knjig ACL, Raziskave na področju obdelave naravnega jezika, objavljeno Cambridge University Press.

  • ACL in njegovi oddelki vsako leto organizirajo mednarodne konference v različnih državah.

ACL 2014 je potekal v Baltimoru v ZDA.

  • Uporabljena literatura:

  • 1. Marchuk Yu.N. Računalniško jezikoslovje: učbenik / Yu.N. Marchuk.- M.:AST: Vzhod-Zahod, 2007-317 str.

  • 2. Shilikhina K.M. Osnove uporabne lingvistike: učbenik za specialnost 021800 (031301) - Teoretično in uporabno jezikoslovje, Voronež, 2006.

  • 3. Boyarsky K.K. Uvod v računalniško jezikoslovje. Učbenik St. Petersburg: NRU ITMO, 2013. - 72 str.

  • 4. Shchipitsina L.Yu. Informacijske tehnologije v jezikoslovju: učbenik / L.Yu. Shchipitsina.- M.: FLINTA: znanost, 2013.- 128 str.

  • 5. Sosnina E.P. Uvod v uporabno jezikoslovje: učbenik / E.P., 2. izd. in dodatno – Uljanovsk: Uljanovska državna tehnična univerza, 2012. -110 str.

  • 6. Baranov A.N. Uvod v uporabno jezikoslovje: Učbenik : Editorial URSS, 2001. - 360 str.

  • 7. Uporabno jezikoslovje: učbenik / L.V. Bondarko, L.A. Verbitskaya, G.Ya. Martynenko in drugi; Rep. Urednik A.S. Gerd. Sankt Peterburg: založba St. Petersburg. Univ., 1996.- 528 str.

  • 8. Šemjakin Ju.I. Začetki računalniškega jezikoslovja: Učbenik. M.: Založba MGOU, JSC "Rosvuznauka", 1992.

Najnovejši materiali v razdelku:

Analiza zgodovinskega razvoja pojma »funkcionalna pismenost« Oblikovanje funkcionalne pismenosti
Analiza zgodovinskega razvoja pojma »funkcionalna pismenost« Oblikovanje funkcionalne pismenosti

BBK 60.521.2 A. A. Verjajev, M. N. Nečunaeva, G. V. Tatarnikova Funkcionalna pismenost učencev: ideje, kritična analiza, merjenje...

Prvi umetni satelit Zemlje Razredna ura o prvem satelitu
Prvi umetni satelit Zemlje Razredna ura o prvem satelitu

Tema: "Potovanje v vesolje." Cilji: razširiti znanje otrok o vesolju, slavnih astronavtih;

predstavi zgodovino nastanka rakete...
predstavi zgodovino nastanka rakete...

Katera morja umivajo najbolj suho celino?