Udtaleordbog.dk er live med de første 2000 ord

Udtaleordbog.dk er en realisering af en drøm der går helt tilbage til da jeg var på begyndelsen af lingvistikstudiet for 20 år siden. Jeg har altid haft en fascination af lydskrift og de regler der ligger til grund for vores udtale. Gennem årene har jeg udviklet forskellige værktøjer til at skrive lydskrift (se mere på schwa.dk) og arbejdet hen imod at kunne automatisere processen i højere og højere grad.

I sommer offentliggjorde jeg at udtaleordbog.dk var på vej, og nu er den første meget tidlige udgave her. Som man kan se, er der stadig mange ting der er under udvikling, og ordforrådet er stadig meget sparsomt. Men skelettet er på plads nok til at jeg tør lægge det online, så de interesserede kan følge med, og i den kommende tid vil ordbogen vokse sig større og større.

Hvad rummer ordbogen lige nu?

Jeg har i første omgang lagt 2000 ord op. Der er primært tale om morfologisk simple ord og visse afledninger. Der er lige nu to forskellige udtalestandarder, en meget konservativ udtale og en mere moderne. Udtalerne vises med bred IPA, dvs. kun med betydningsadskillende kontraster, og uden de meget lokaliserede danske tilpasninger som mange er vant til fra traditionel dansk fonetisk faglitteratur.

Hvad er på vej?

Jeg arbejder sideløbende på en række ting. Al lydskrift genereres med scripts, og jeg arbejder skiftevis på at godkende de udtaler mine scripts genererer, og at raffinere og rette fejl i mine scripts. På indholdssiden arbejder jeg på:

  • Flere ord
  • Afledninger og bøjningsformer
  • Flere udtalevarianter og -standarder
  • Visning i snæver IPA
  • Visning i andre lydskriftstandarder
  • Kortere artikler om enkeltord

På brugerfladesiden arbejder jeg på:

  • Forbedret webdesign
  • Information om brug af siden og anden baggrundsinformation
  • Feedbackmuligheder
  • Community for fonetik- og lydskriftentusiaster

Lidt mere info

Sproget rummer mange hundrede tusinde ord, som hver især kan udtales på mange forskellige måder. Jeg har i løbet af mine studier og karriere lydskrevet eller korrekturlæst lydskrift af 500.000-1.000.000 ord, men med udtaleordbog.dk gør jeg det helt fra grunden.

Alle vores mange hundrede tusinde ord er baseret på et mere beskedent antal morfemer, som er baseret på et endnu mere beskedent antal fonemer. Størstedelen af de gængse udtaler og udtalevarianter kan beskrives med regler baseret på ords stavemåde og morfologiske struktur. Det udnytter jeg i skabelsen af udtaleordbog.dk.

Udtaleordbog.dk er baseret på data fra Retskrivningsordbogen og andre kilder. I min nuværende database er der ca.

  • 15.000 morfologisk simple ord
  • 2-300 præfikser
  • 2-300 afledningsendelser
  • 20 bøjningsendelser
  • 20 fugeelementer

Alle danske ord består af forskellige kombinationer af disse elementer. Udtalen af de simple ord og de morfofonologiske regler der er knyttet til de forskellige affikser, kombinerer jeg til ordets morfofonologiske form. Og ud fra den morfofonologiske form kan jeg generere alle de forskellige regelmæssige udtalevarianter som findes. Således er jeg – når alle rødder og affikser er beskrevet – i stand til at generere udtalen af alle ord.

/Ruben Schachtenhaufen