Ytterbium, vortemælk, oliventræ og 1000 andre ord

Ytterbium, vortemælk, oliventræ, skrumlekasse, kuldkastelse, stjernestøv, nyreragout, stradivarius og 1000 andre ord er føjet til udtaleordbog.dk.

Desuden er der et par mindre updates af hjemmesiden. Bl.a. vises moderne udtale vises nu med IPA /p t k/ i stedet for /b d g/. Der er tilføjet link til info om IPA ved hver udtale.

Hold øje med siden fra d. 1. december, hvor der tilføjes en lille julekalender med finurlige fonetikfacts hver dag.

Hvorfor benytter udtaleordbog.dk ikke traditionel dansk lydskrift?

Lydskriften på udtaleordbog er IPA (The International Phonetic Alphabet). Se oversigten over de enkelte lyde her.

Den Danske Ordbog, danske fonetikbøger m.v. identificerer sig som IPA-brugere, men i dansk er der opstået en tradition med at bruge nogle lokale tilpasninger som ikke er i overensstemmelse med IPAs principper, hvilket resulterer i at lydskriften i disse værker ikke er sammenlignelig med brugen af IPA i andre sprog. Dette går stik imod ideen med et internationalt lydskriftalfabet.

udtaleordbog.dk holdes der fast i IPAs principper, og derfor ser lydskriften lidt anderledes ud end man måske er vant til. Holdningen bag dette er at det er vigtigt og på høje tid med et værk hvor man kan få vist udtalen i ren IPA, som er fonetisk præcis, international sammenlignelig, nem at afkode og bruge.

De vigtigste forskelle på IPA, som benytte på udtaleordbog.dk, vs. dansk lydskrifttradition er:

  • Skelnen mellem bred og snæver lydskrift (broad, narrow). Bred lydskrift skrives mellem / /, mens snæver lydskrift skrives mellem [ ]. Bred lydskrift rummer de distinktive lyde, dvs. de lyde man skal beherske for at adskille betydninger. Fx betyder [mæð mæt] to forskellige ting, hhv. mad, mat, og derfor skal bred lydskrift skelne de to lyde i slutningen af ordet. Derimod betyder [hæt ɦæt] det samme, hat, og derfor skal man ikke i bred lydskrift skelne, man skriver blot /hæt/. Finere detaljer kan derimod skelnes i snæver lydskrift. I bred IPA bruges desuden fortrinsvis umodificerede tegn. Bred lydskrift skal ikke forveksles med meget abstrakt fonemskrift.
  • De danske plosiver er som udgangspunkt ustemte. Det skrives i IPA med /p t k/ for uaspirerede plosiver og /pʰ kʰ/ for aspirerede plosiver. I IPA kan man også skrive [b̥ d̥ ɡ̊] som er identisk med [p t k], men det går imod principperne for bred transskription at benytte unødige diakritika; det besværliggør også transskriptionen og giver anledning til misforståelser. Derfor benyttes kun /p t k/ her.
  • Affrikater skrives som kombination af plosiv og frikativ. Her skrives derfor /ts tɕ/ i fx /tsak tɕɛk/ tak, tjek. Traditionelt benyttes {t tj} (DDO) eller {tˢ tˢj}. Tegnet {ˢ} blev fjernet fra IPA i 1987, herefter kombineres /t/ blot med /s/ – /ts/.
  • Vokalen i Lars svarer i moderne dansk til IPA /a/ [a~ä], hvor den traditionelt skrives med {ɑ}, som i IPA snarere svarer til vokalen i hop.
  • Traditionelt skrives kort/langt a forskelligt i fx mase/masse (DDO: {æ a}). Denne brug af {a} er upræcis ift. IPA, hvor det står for vokalen i Lars. De to vokaler er ikke distinktive hos de fleste yngre danskere, og derfor er det ikke nødvendigt at skelne dem i bred IPA. Her bruges blot /æ/. Man kan godt vælge at skelne, men det kræver at man benytter diakritiske tegn, hvilke går imod princippet for bred IPA. Derfor skelnes vokalerne her kun i snæver IPA.
  • Traditionelt skrives kort/langt o forskelligt i fx måtten/Morten (DDO: {ɒ ʌ}). Denne brug af {ʌ} er upræcis ift. IPA, hvor det står for et urundet å, en lyd vi ikke umiddelbart har i dansk. De to vokaler er ikke distinktive, og derfor er det ikke nødvendigt at skelne dem i bred IPA. Her bruges blot /ɒ/. Man kan godt vælge at skelne dem, men det kræver at man benytter diakritiske tegn, hvilke går imod princippet for bred IPA. Derfor skelnes vokalerne her kun i snæver IPA.
  • Her skelnes mellem fire distinktive rundede fortungevokaler /y ø œ ɶ/, jf. /kʰyːlə kʰøːlə kʰœːlə fyːɐ føːɐ fɶːɐ/ kyle, køle, curle, fyre, føre, fyrre. I ældre værker benyttes typisk flere rundede fortungevokaler, men de er ikke distinktive og derfor ikke nødvendige at skelne i bred IPA.

Der kan være forskellige udmærkede grunde til at bruge andre alfabeter end IPA, afvige fra IPA eller lave hybrider af forskellige lydskriftalfabeter. Det kan fx være aht. sammenlignelighed med traditionelle værker, at skabe mere intuitivt forhold mellem ortografi og transskription m.v. Jeg arbejder derfor på at implementere muligheden for at få vist lydskrift efter andre standarder end IPA.

2200 ord tilføjet

Hovskisnovski, capriccioso, rekonvalescens, retspolitik, søanemone, skrivepapir og 2200 andre ord er føjet til ordbogen. Der er nu i alt 5200 ord at boltre sig i.

Alle ord er genereret med scripts, fra morfologisk analyse, grafem-til-foneme-analyse, og fonem-til-allofon-regler. Så der glæder mig at kunne begynde at begynde at kunne generere lidt mere komplekse ord.

Der er rettet lidt småfejl hist og her, og jeg kan godt se at der er nogle ting der stadig skal rettes til. En topprioritet er at få oprettet et forum hvor man kan diskutere fejl og forbedringsforslag.

1000 tilfældige ord fra ordbogen

låse knække tvær privat skose ilt stimulus bynke pirat få hår ar pulse data føde virulent hofte skot rede sø væve for ravine pilsner kompetent manufaktur bimle strimmel heraldik grat fiks autarki kure garrotte svingle fætter beskeden die gæste drøje inkasso stunde sulfit Herning borte levre naver pedal factor kjole søle bikse mætte Rønne tysk gryn kærte flyde trods råge mager kambrium rynke logo hive honning mæske trave dug dårlig grund tribut rus handel lig kalve krable pelikan kravat sprælsk løjpe tue måle skaft plante refugie svip feste emalje kolloid gen vade stenografi ankel bånde sløse brint skide impuls menu rutte sago røge smult strø gnidsel drik hage stak fingre strejf fissil gestalte sukre vrå drejl gruse pjalt sladre baldrian gjaldre klukke såh trold flyve tazet musvit søbe bæk grafolog skalle føj bouclé jod kimære ego røbe slips elm firs sive havarti excellence lud smægte ilter vejre rusk stase kristne bål æde lykke kortisol klatte hylde bank paria hænde chateau gåde blotte litotes sprøjt nota tavs spyt smalte puge virolog salep gammen krebs falde kælke vippe angst pris smerte rafte hæge fnat føre Bramming skrible jubilar slig klore tres live tyst tumle sprut intakt på famle farisæer plette ol skænde minde kargo kitsch snorke blu floskel pamflet dekorum ditten fad metallurgi hungre plaf potentil melasse fod svigt klusil biocid folde foster hin Botswana Salling bruse spilde svinde spån pensle nyde rime viola klø koloni køje trakeotomi klynge polt mops kalorius bobine mistral burlesk byde bitte pris lede hulke riv lidse ridt finsk fritte kætter kommode tarok rinde lag periferi snippe finit hak fællig hu pastrami kahyt kvote ovn hutle zeta makulatur skræve skulke skovle patrulje visne sigma male nøkke pisse plumre galla brunst klæbe dranker huske dyb perifrase strejfe vanke dominant hu handske takle kolonne fjant observant valsk drøfte bunde næste fag ny sile verbal vinyl midje kir vånde sved skitse sprætte justits liv dryade satire sari canasta logge dele hænde trave skole skrå fenol adresse snubbe fiol hamle klima måne titte værke glans mikse krejle gafle aske drægtig topas trone komplot permanent glut servitut syssel dure gylpe fenyl difteri parasit sjæl snage veto gump græsse lade kanut replik nu prud sats fis regel palisade løs metyl moneter fart ål svigte stylte drikke faun rokade kollapse Jelling kaskade vrinsk sarkasme gane øst force mjav høj frister grant bøjle hale bap karse tapper bak hiv noppe oceanolog gære karbon Danmark kamille svovle lager ros pagt rock hej rå lemming kalk kuld pral tøffe skravl disk bor visk invalid skrige brik krage piraya tutte fantasme diva filter flintre styrte skuldre trusse binokular sværte slunken arabesk retræte smelte sinke tusch lipid flekse doble lyve svejse si poppe tjald balsam serviet ark tulle sæt stræb pande mås gnalling lur svinge stevnsk botanik svide slibe quisling vride vægt mask bid type havre drop dykke spinne passe sigte rabundus grissini planke fremme lux gazelle kollega spore glamme lange ælde lide rubrik rasle skimme mosle nat holdt hitte erindre viril maori mobil smæk gælde exe kran ende gemmolog rejse hyle Merkur id sinde glibe plesken bræge sniffe springe skur snobbe tyre blanke løsne emblematik tak prise fimse kneb simre verfe sang ragout pirol lampret skabe snakke lide stemple guttural krater medalje ski spydig vejle drosle dyb kræs briks skabe spange infarkt bakke sjavs hibiscus swing mokke svige fortynde trombone drop merian sko flette pryde kaliber hundse gjalde hvene akut diæter plet vrang brokke volt skjold charme stativ tvivle novice fjerne pløs mælk proppe vølve krukke nitrit cirrose hor plumpe stødt oppe franc pilaster fure pæl vink salut libertiner Prøjsen ajle torv pianino pile smakke palatal stadig merkantil deponi bulimi tude nitte over dysse vind naiv rask maltose sprød mulle dreje opak sæde klasse huldre ryge sekt flamme centre grøble tjans tynge knase jeremiade skrat slække vulkanolog lige pamper men konsilium vræle funkle pine skinger helle hævn strøg rim kemo øde centrum fals grammatik lut spat mør kapriol få ur krans ruin sin Milano skvætte marina tavle spot sitre dryppe hørme pode vært tun stramme facil skabiose kusk eje tinte mejsel trope glide skralde bulter dæksel servitrice hjul skryde se rysler kanonade skandale manna plakette dyk råd liste visum kommune sauna under bodega diabetes drue glæde drømme liguster knag hybrid grosserer oval tinde kateter zone bole lunde laps tætne debil piment harve flora løfte slynge bøvle gelejde støv så prompte tjalk huri bryozo peseta yver gøde lumske brasen ase kommen drone syge køle riviera kombinatorik etikette heppe kommando pift elev hede score knob tarif ditto promille fordakning terzine gul skrumpe koma tremolo dolke spidde knald bejdse stride plusse urdu takke vunde lyne læge statur snor arkade munter kny mange spin forte pøbel flet talent våde gnide koster zulu hingst reprise montrice stund blomme bauxit tragt lask flugt batte rage bramme grunde vænge katalog pro synftig varme pige kræve vams kabale domicil blod endokrin strø svastika værk skride tømme knogle vægte rase fortætte sund røsken lilje ranke grin tusk knyst vold bakse Mali dejse kime ræbe orne fjerte lysne ege rotte blomst mødding rive krumme asp benzol raspe pilaf tralle bekræfte toupé dement faktoid tut lind prale teori plus vippe sidst muræne rense skyr mose credo lunke gæk scripte blære cirkle strid stil vise løse tølt smykke pligt fjog skurv kælve okker tema batalje slendrian fenne valid pæn klumpe mester frodig passiar forsytia sande haspe facet nisse violet møller hæk emir kyrie lig snude banke pullimut nørkle svang friske musik ørred gak klimaks gæt inspektrice diurese tapir knitre jan fise glat mildne angre enke divisor ting lampet fuse kvæde spatel legation tre slat frynse fikse enklave gæv tit rær hel ild vånde zygote skolde slip boks bøde vægre hinke Lisboa myte analyse ortodoks telt sænk hjule himle træn domæne bylte maske hynde din spag kløgt spække stejle slæng cymbel vrage ranunkel kalla hellebard cirkel tejne grandezza nippe hæld strikke militær tretten vildt rakker bisam lude viol ose aspidistra fersken stritte absolut kollekt lak kravle snitte smide gønge vinde tremme klerk tviste tit mangle sejre strube monolit stakater glane

Udtaleordbog.dk er live med de første 2000 ord

Udtaleordbog.dk er en realisering af en drøm der går helt tilbage til da jeg var på begyndelsen af lingvistikstudiet for 20 år siden. Jeg har altid haft en fascination af lydskrift og de regler der ligger til grund for vores udtale. Gennem årene har jeg udviklet forskellige værktøjer til at skrive lydskrift (se mere på schwa.dk) og arbejdet hen imod at kunne automatisere processen i højere og højere grad.

I sommer offentliggjorde jeg at udtaleordbog.dk var på vej, og nu er den første meget tidlige udgave her. Som man kan se, er der stadig mange ting der er under udvikling, og ordforrådet er stadig meget sparsomt. Men skelettet er på plads nok til at jeg tør lægge det online, så de interesserede kan følge med, og i den kommende tid vil ordbogen vokse sig større og større.

Hvad rummer ordbogen lige nu?

Jeg har i første omgang lagt 2000 ord op. Der er primært tale om morfologisk simple ord og visse afledninger. Der er lige nu to forskellige udtalestandarder, en meget konservativ udtale og en mere moderne. Udtalerne vises med bred IPA, dvs. kun med betydningsadskillende kontraster, og uden de meget lokaliserede danske tilpasninger som mange er vant til fra traditionel dansk fonetisk faglitteratur.

Hvad er på vej?

Jeg arbejder sideløbende på en række ting. Al lydskrift genereres med scripts, og jeg arbejder skiftevis på at godkende de udtaler mine scripts genererer, og at raffinere og rette fejl i mine scripts. På indholdssiden arbejder jeg på:

  • Flere ord
  • Afledninger og bøjningsformer
  • Flere udtalevarianter og -standarder
  • Visning i snæver IPA
  • Visning i andre lydskriftstandarder
  • Kortere artikler om enkeltord

På brugerfladesiden arbejder jeg på:

  • Forbedret webdesign
  • Information om brug af siden og anden baggrundsinformation
  • Feedbackmuligheder
  • Community for fonetik- og lydskriftentusiaster

Lidt mere info

Sproget rummer mange hundrede tusinde ord, som hver især kan udtales på mange forskellige måder. Jeg har i løbet af mine studier og karriere lydskrevet eller korrekturlæst lydskrift af 500.000-1.000.000 ord, men med udtaleordbog.dk gør jeg det helt fra grunden.

Alle vores mange hundrede tusinde ord er baseret på et mere beskedent antal morfemer, som er baseret på et endnu mere beskedent antal fonemer. Størstedelen af de gængse udtaler og udtalevarianter kan beskrives med regler baseret på ords stavemåde og morfologiske struktur. Det udnytter jeg i skabelsen af udtaleordbog.dk.

Udtaleordbog.dk er baseret på data fra Retskrivningsordbogen og andre kilder. I min nuværende database er der ca.

  • 15.000 morfologisk simple ord
  • 2-300 præfikser
  • 2-300 afledningsendelser
  • 20 bøjningsendelser
  • 20 fugeelementer

Alle danske ord består af forskellige kombinationer af disse elementer. Udtalen af de simple ord og de morfofonologiske regler der er knyttet til de forskellige affikser, kombinerer jeg til ordets morfofonologiske form. Og ud fra den morfofonologiske form kan jeg generere alle de forskellige regelmæssige udtalevarianter som findes. Således er jeg – når alle rødder og affikser er beskrevet – i stand til at generere udtalen af alle ord.

/Ruben Schachtenhaufen