Aðgengi að orðaforðanum

Laugardagur 10. mars kl. 13-14.30
Stofa 218 í Aðalbyggingu Háskóla Íslands

Aðgengi að orðaforðanum

Orðabækur hafa löngum veitt best yfirlit um orðaforðann og samsetningu hans. Hefðbundin efnisskipan þeirra er þó ekki  alls kostar hentug þegar orðaforðinn á að birtast í heillegu samhengi  eins og það endurspeglast í lifandi málnotkun.  Þá geta flettimyndirnar þrengt sjónarhornið og takmarkað nauðsynlega yfirsýn.

Orðabókarlýsing í rafrænni mynd, þar sem byggt er á margþættri greiningu orðabókargagnanna, kallar á sveigjanlegt aðgengi að lýsingu orðaforðans, þar sem fleiryrtar flettimyndir og merkingarbundnar fyrirsagnir binda saman samstæðan orðaforða.

Með málfræðilega greindum textasöfnum (málheildum) hefur opnast aðgangur að orðum og orðanotkun út frá ýmsum málfræðilegum einkennum, svo sem beygingarmyndum og setningargerð. Slíkt aðgengi veitir nýja innsýn í orðaforðann og fyllir út í þá mynd sem dregin er upp í orðabókum.

Greiður aðgangur að orðagögnum er mjög háður því að um sé að ræða staðlaðar ritmyndir. Textar og textasöfn frá fyrri tímum eru því ekki nógu aðgengileg nema  eldri og óreglulegar ritmyndir séu leiðréttar eða túlkaðar sem reglulegar myndir. Vörpunarreglur sem tengja saman orð og orðmyndir úr textum með ólíkum rithætti og frá ólíkum tímabilum greiða götuna að eldri málstigum og málsögulegum samanburði.

Í málstofunni verða þessar aðstæður metnar út frá rannsóknarverkefnum sem nú er unnið að á Stofnun Árna Magnússonar í íslenskum fræðum og gerð grein fyrir því hvernig þau í sameiningu bæta aðgengi að íslenskum orðaforða.

Fyrirlesarar:

  • Jón Hilmar Jónsson, rannsóknarprófessor á Stofnun Árna Magnússonar í íslenskum fræðum: Orðaleit og flettimyndir
  • Kristín Bjarnadóttir, rannsóknarlektor á Stofnun Árna Magnússonar í íslenskum fræðum: Glíman við orðmyndirnar
  • Sigrún Helgadóttir, verkefnisstjóri á Stofnun Árna Magnússonar í íslenskum fræðum: Málheild sem hluti af orðabókarlýsingu

Málstofustjóri: Gunnlaugur Ingólfsson, rannsóknardósent á Stofnun Árna Magnússonar í íslenskum fræðum

Útdrættir:

Jón Hilmar Jónsson, rannsóknarprófessor á Stofnun Árna Magnússonar í íslenskum fræðum
Orðaleit og flettimyndir

Hefðbundin leit í orðabókum er bundin stökum orðum sem tilgreind eru í staðlaðri nefnimynd (flettimynd ) sinni og er raðað innbyrðis í stafrófsröð. Það fyrirkomulag mótar jafnframt ásýnd orðabókartextans. Gagnvart orðabók í rafrænum búningi hefur slíkt fyrirkomulag ekki meginþýðingu, þar sem tilgreindur leitarstrengur kallar fram umbeðið orð án þess að nálæg orð séu í sjónmáli. Orðabókarleit sem er háð nefnimyndum stakra orða þrengir á ýmsan hátt kosti notenda og torveldar innsýn í þau gögn sem mynda margbrotna orðabókarlýsingu. Gera þarf ráð fyrir að leit fari fram stig af stigi og að tengja megi saman samstæðar einingar, jafnt formlega sem merkingarlega. Það kallar á að orðasambönd fái sjálfstæða stöðu og eigi sér sínar nefnimyndir sem fleiryrtar einingar.  Með því getur leitarsviðið einnig náð til málfræðilegra og setningarlegra einkenna. Í erindinu verða þessir kostir skoðaðir nánar með hliðsjón af efnisskipan og leitarleiðum í Íslensku orðaneti.

 

Kristín Bjarnadóttir, rannsóknarlektor hjá Stofnun Árna Magnússonar í íslenskum fræðum
Glíman við orðmyndirnar

Leit í orðabókum hefur tekið stakkaskiptum við færsluna af pappír í tölvu. Nú þykir sjálfsagt að hægt sé að leita að orðabókarfærslu með því að slá inn hvaða beygingarmynd sem er, eins og gert er á snara.is. Jafnframt er hægt að leita að orðmyndum í orðabókartextanum sjálfum á sama hátt sem oft birtir orðabókarefnið í mjög áhugaverðu samhengi, t.d. í mörgum orðabókum í einu og á mörgum tungumálum. Við leit af þessu tagi kemur Beygingarlýsing íslensks nútímamáls (BÍN) að góðu gagni. Þegar farið er að nota textasöfn til þess að fylla út í myndina sem dregin er upp í orðabókum dugar leitarvél sem miðast við orðmyndir í nútímamáli ekki. Þá þarf að safna gögnum um orðmyndir úr eldra máli, bæði stafsetningarafbrigði, beygingarafbrigði og orðmyndunarafbrigði, og tengja þau við orðmyndir nútímamáls. Þetta er hægt að byggja inn í leitarvél þannig að leitað sé að gömlum og nýjum orðmyndum í einu. Flóknara er að búa til nýja gerð af eldri textum á nútímamáli, nýtt lag sem notað er í leitarskyni og til greiningar og úrvinnslu. Þessi aðferð hefur þann kost að hægt er að beita tólum sem gerð hafa verið til greiningar á nútímamáli líka á texta frá eldri málstigum.    

    

Sigrún Helgadóttir, verkefnisstjóri á Stofnun Árna Magnússonar í íslenskum fræðum
Málheild sem hluti af orðabókarlýsingu

Í erindinu verður leitast við að sýna hvernig nýta megi Markaða íslenska málheildsem viðbót við orðabókarlýsingu. Málheildin  er safn fjölbreyttra texta sem eru geymdir í stöðluðu sniði í rafrænu formi. Til þess að textarnir verði sem gagnlegastir við málrannsóknir eru þeir greindir á margvíslegan hátt. Hverri orðmynd fylgir greiningarstrengur, mark, sem sýnir orðflokk og oft líka málfræðileg atriði eins og fall, tölu og kyn fallorða og persónu, tölu og tíð sagna. Auk þess fylgir nefnimynd (flettimynd) með hverri orðmynd, t.d. nefnifall í eintölu fyrir fallorð og nafnháttur sagna. Hverjum texta í málheildinni fylgja jafnframt bókfræðilegar upplýsingar um verkið sem textinn er úr. Leitarkerfi málheildarinnar býður upp á leit að einstökum orðmyndum eða nefnimyndum, orðasamböndum eða leit eftir málfræðilegum atriðum. Sem dæmi má taka að leita má að sögninni „fara“ í ýmsum myndum, forsetningunni „í“ og nafnorði og finnast þá dæmi eins og „fer í stríð“ og „fóru í vaskinn“. Með því að tengja leitina við upplýsingar úrÍslensku orðaneti mætti t.d. leita að orðastæðum eins og „fara í flík“ þar sem „flík“ er samnefnari ýmissa fatnaðarorða. Málheildina má því nota til þess að leita að margvíslegum notkunardæmum sem finnast ekki í venjulegum orðabókum. Málheildina má einnig nota til þess að finna tíðni orðmynda. Annar möguleiki er að tengja málheildina við rafræna orðabók. Notandi getur þá valið að fara yfir í málheildina og fá þar dæmi um notkun þeirra orða sem hann hefur fundið í rafrænu orðabókinni.

 

Deila: 
Þú ert að nota: brimir.rhi.hi.is