Update januar 2022: Snæver transskription, download + 2.300 nye ord

Godt nytår! Det var både sjovt og lærerigt (og tidskrævende) at lave julekalenderen i sidste måned. Jeg vil fortsætte med at lave lignende opslag på ugentlig basis i det nye år, så hold øje med udtaleordbog.dk‘s facebookside.

Der er kommet meget god feedback via den feedback-funktion jeg tilføjede i sidste update. Jeg har læst det hele, også det jeg ikke har reageret på. Det meste er implementeret og resten er på vej.

I årets første update har jeg tilføjet ca. 2.300 nye ord (16.000 inkl. bøjningsformer), lavet enkelte justeringer og rettelser af lydskriften, tilføjet snæver transskription, og så har jeg gjort et udsnit af udtaleordbogen tilgængelig til download.

Snæver transskription

Standardudtalerne (dvs. den øverste udtale i hvert opslag) har fået tilføjet snæver transskription, noteret i de kantede klammer [ ]. Der kommer et indlæg om hvilke detaljer der er inkluderet i den snævre transskription. Jeg arbejder på at finjustere dette element og tilføje det til øvrige udtaleangivelser.

Opdateret lydskrift

Jeg har tilrettet nogle transskriptionsprincipper. Det meste er knapt synligt. Det mest iøjnefaldende er ændringer af ord med –lg. Tidligere stod der fx /ˈsæl̰j ˈvæl̰j ˈføl̰j/ salg, valg, følg. Det er nu rettet til /ˈsæl̰ ˈvæl̰ ˈføl̰/, og i konservativ udtale til /ˈsæl̰ʲ ˈvæl̰ʲ ˈføl̰ʲ/ dvs. med palataliseret /l/. Jeg tvivler på at man nogensinde har udtalt ordene med en approksimant efter en kontoid konsonant, selvom det traditionelt har været transskriberet sådan.

Efter forsøg og diskussioner med mine studerende har jeg opgraderet nogle udtaler fra ‘reduceret’ til ‘på vej frem’. Schwa-assimilation i ord som penge, fremme, finde er ved at være standardudtale i den unge generation. Det samme gælder udjævning af /ɪ ʊ/ før /ɤ/, så fx /leːʊɤ ʁɒɪɤ/ levet, røget efterhånden som standard er /leːɤ ʁɒːɤ/.

Download udtaleordbog.dk

Dele af udtaleordbog.dk kan nu downloades og benyttes til forskning eller sprogteknologi. Jeg vil lægge større dele af ordbogen ud i takt med at siden vokser.

Bemærk at det kun er dele af ordbogen der er tilgængelig. Man er velkommen til at henvende sig hvis man er interesseret i et samarbejde der inkluderer øvrige data.

I støbeskeen

Der er kommet mange nye brugere til siden den sidste måneds tid. Topprioritet lige nu er en side med introduktion til IPA-lydskriften og det danske lydsystem i det hele taget.

Derudover har jeg fokus på afledningsendelsers fonologi, som jeg holder oplæg om på konferencen FiNo 2022 senere i januar.

200.000 ord, nye funktioner + julekalender

Udtaleordbog.dk er i dag opdateret med ca. 2000 nye ord + bøjningsformer. I alt runder ordbogen nu 200.000 ord. Samtidig er der tilføjet nogle nye funktioner.

Julekalender

Følg med i december. Igen i år vil der være en julekalender på udtaleordbog. Hved dag i december vil der være en ny lille historie om udtalen af et bestemt ord.

I år vil julekalenderens format trække på nogle af de funktioner der er udviklet i løbet af året, nemlig muligheden for at tilkendegive hvilken udtale man bruger + lydafspilning.

Julekalenderen kræver din deltagelse. Jo flere der deltager, des klogere bliver vi alle sammen, så sørg for at dele julekalenderen på de sociale medier.

Nye funktioner

  • Lydfiler
  • Forbedret feedbackformel

Nu kan man ikke blot få IPA-lydskriften af et ord, men også afspille de forskellige udtalevarianter. Det er endnu kun meget begrænset hvilke ord der har lydfiler tilknyttet, men hold øje med højtalerikonet 🔊.

Savner du at din egen udtale er repræsenteret, eller finder du fejl i ordbogen? Så er det blevet nemt at give feedback. Klik bare på feedback-feltet, så popper der en formel op.

Udtaleordbog.dk fylder 1 år

D. 1/11/20 lagde jeg første udgave af udtaleordbog.dk på nettet. Der var på det tidspunkt 2000 ord i ordbogen og ingen andre features end at man kunne søge på et ord og få en enkelt udtaleangivelse i IPA.

Nu, et år efter, har ordbogen 27.000 ord, 160.000 bøjningsformer, 320.000 udtaleangivelser i både mindre distinkte og mere konservative varianter af dansk.

Der er tilføjet en række feature siden starten, bl.a.:

  • Forskellige udtalevarianter
  • Udtale af bøjningsformer
  • Morfologisk analyse af ordene
  • Opdaterede lydskriftstandarder, og mulighed for at vælge mellem forskellige standarder
  • Sociale medier
  • Navigationsmuligheder
  • Mulighed for at interagere og markere hvilke udtaler man selv bruger

Ordbogen bliver ved med at vokse og får tilføjet nye features. Noget af det jeg drømmer om at få tilføjet i det kommende år, er:

  • flere ord, og flere navne
  • automatisk transskription af tekster
  • forbedrede feedback-muligheder
  • mulighed for at søge på udtaler
  • rimordbog
  • mere information om udtale
  • mere interaktivitet
  • og meget mere

Følg med på de sociale medier og få besked når der er nye opdateringer af ordbogen.

Søg på bøjningsformer og andre nye features. Nu 150.000 søgeord, 300.000 udtaler.

Udtaleordbog.dk er blevet opdateret med nye features, nye ord og nogle principielle ændringer i transskriptionsprincipper. Læs om:

  • Søg på bøjningsformer
  • Ændringer i udtaleregler
  • Andre nye features
  • Nye ord

Søg på bøjningsformer

Det er nu muligt at søge på bøjningsformer. Tidligere kunne man kun få information om bøjningsformers udtale ved at søge på opslagsformen, og man fik kun oplyst den ‘almindelige distinkte’ udtale. Nu dukker bøjede former også op i søgeresultater, og man får endvidere oplyst evt. konservative, reducerede eller andre varianter. Søgeresultater viser først almindelige ubøjede opslagsformer, derefter bøjede former. I bøjede former linkes der endvidere til opslagsformen.

Søgeresultat for ‘prøver’ viser pluralis af substantivet ‘prøve’ og præsens af verbet ‘prøve’.

Ændringer i lydskrift

I nogle tilfælde syntes jeg den udtale der er angivet som ‘almindelig distinkt’ enten var for distinkt/konservativ eller for reduceret. Der er derfor lavet nogle forskellige opdateringer af udtalerne, som især handler om schwa-reduktion.

  • Der er indført synkope i ord som /ˈmɛnskə ˈhuːsnə/ menneske, husene (tidligere /ˈmɛnəskə ˈhuːsənə/)
  • Prioriteringen af |r| og |d| er ændret så schwa først assimileres til |r| frem for |d|. Det har konsekvenser for ord som /ˈlæːɐɤ ˈɔntʁɐɤ/ lærred, undret (tidligere /ˈlæɐ̯ɤ ˈɔntʁɤ/)
  • Schwa-assimilation efter ubetonede korte vokaler var tidligere overset, fx /tˢʁiiˈnæːlə/ triennale (tidligere /tˢʁiəˈnæːlə/)
  • Assimilation til sonorant før betonet stavet er nu fjernet, fx /maməˈlæːɤ kʰænəˈlyːɐ/ marmelade, kannelure (tidligere /mamm̩ˈlæːɤ kʰænn̩ˈlyːɐ/). Den assimilerede form er nu angivet som ‘mindre distinkt’.
  • Udtalen af |rør| er ændret til /ˈʁɶɐ̰/, tidligere /ˈʁœɐ̰/. Udtalen med /œ/ er angivet som ‘mere konservativ’.

Nye funktioner

Jeg har tilføjet muligheden for at interagere med ordbogen og ‘stemme’ på de udtaler man selv benytter. Dette er en funktion der nok vil blive udviklet videre i fremtiden. Lige nu fungerer det ret primitivt. Jeg drømmer om i fremtiden at gøre det lidt mere funktionelt så man kan bruge ordbogen til at få en indikation af hvilke udtaler der er mest benyttet, om der er sammenhæng mellem hvilke udtaler man bruger i forskellige ord, hvilke udtaler der benyttes af forskellige sproggrupper osv. Men det kræver at jeg får programmeret en loginfunktion, beder folk om tilladelse til at indsamle data osv. Det ligger lidt længere nede på prioriteringslisten. Indtil videre kan man hygge sig med denne funktion.

I teknikken bag udtaleordbogen har jeg også arbejdet på at kunne integrere manuelle rettelser og tilføjelser. Indtil videre har jeg kun kunnet inkludere regelrette udtaler, altså ord der udtales systematisk ift. stavemåden og som er regelrette udviklinger fra konservativt > moderne > mindre distinkt el.lign. Men ganske mange ord opfører sig ikke helt forudsigeligt på denne måde, og det er ofte nogle af dem der er mest interessante at slå op i en udtaleordbog. Nu er det teknisk muligt for mig at tilføje usystematiske udtaler og at overrule de generelle regler i specifikke ord.

Endelig har jeg tilføjet muligheden for at tilføje bemærkninger til enkeltord.

De to sidste funktioner er kun oprettet, men ikke konkret anvendt i særlig mange ord endnu. Men de åbner for muligheden for at imødekomme meget af den feedback jeg får. Jeg har eksemplificeret det i ordet cider, se herunder:

Nye ord

Jeg har tilføjet ca. 1.000 ord til ordbogen. Der er nu ca. 24.000 leksemer, 157.000 opslagsord inkl. bøjede former, og ca. 313.000 forskellige udtaleangivelser.

Udtaleordbog.dk er udvidet med morfologi, ɤ, socialt forum og 3000 nye ord

Udtaleordbog.dk er tilbage efter sommerferien, hvor jeg brugte en del tid på at opdatere min anden side, schwa.dk, hvor man blandt kan læse om utilpasset IPA og argumenterne bag den lydskriftstandard som benyttes her på udtaleordbog.dk. Jeg har også opdateret lydskriftværktøjerne.

Morfologisk information

Udtaleordbog.dk er blevet udbygget med morfologisk information.

Udtaleordbog.dk er baseret på morfofonologisk analyse af ordene, og nu er noget af den bagvedliggende analyse tilgængelig. Siden er således ikke længere kun en udtaleordbog, men også en morfologisk ordbog. For alle ord får man nu oplyst om ordet er et kompositum, derivativ eller en rod (andre typer orddannelser er ikke behandlet endnu). Man kan desuden se hvad der er stammer, affikser og fugeelementer.

Når man klikker på en stamme, bliver man ført til opslaget for dette ord hvor man evt. kan få yderligere information om udtale. Fugeelementer og affikser er ikke gjort klikbare endnu, men det er en af de ting jeg gerne vil have tilføjet med tiden.

Det bløde d

Traditionelt lydskrives det bløde d med tegnet ð. Efter grundig overvejelse har jeg besluttet at udskifte det med ɤ i moderne udtale, se fx tid.

Det bløde d er i moderne udtale en laminal-velær vokallyd, og lyden opfører sig på mange måder som de svage vokaler /ə ɐ ɪ ʊ/, som den kommuterer med i ord som disse:

  • /fætə fætɐ fætɪ fætɤ/ fatte, fatter, fattig, fattet
  • /kæːɐ kæːʊ kæːɤ/ gære, gave, gade
  • kʁa̰ɪ kʁa̰ʊ kʁa̰ɤ/ grej, grav, grad

Lyden fortjener derfor at blive noteret med et vokalsymbol. Tegnet ɤ betegner en halvlukket velær vokal, og det er både artikulatorisk og auditivt adækvat, i snæver transskription [ɤ̻̈]. Rent grafisk forveksles det ikke med andre vokaler, og tilfældigvis har det grafiske ligheder med det traditionelle ð, så det virker nærmest meant to be.

(Jeg måtte selv bruge et par dage på at vænne mig til det, men nu kan jeg slet ikke forestille mig at gå tilbage til den traditionelle notation)

3000 nye ord

I den seneste opdatering er der tilføjet 3000 nye ord med bøjningsinformation, såsom vrøvlebøtte, underbenklæder, væskebalance og ørkenspredning. Ja, vi er i den sidste ende af alfabetet i denne iteration.

Nyt socialt forum

Har du spørgsmål, forslag, fundet en fejl eller brug for hjælp til lydskrift? Nu kan du skrive på udtaleordbog.dk’s padlet. Det er supernemt at tilgå. Du kan både bruge browseren eller hente padlet-appen i din app store. Jeg pensionerer i samme omgang den lidt mere bøvlede discord-server. Du er velkommen til at kigge forbi med det samme og fortælle hvad du synes om de seneste opdateringer.

På trapperne

Jeg er næsten klar med en smart feedback-funktion, så man med enkelte klik kan markere fejl, foreslå alternative udtaler og like bestemte udtalevarianter. Snæver IPA bliver også tilføjet i løbet af efteråret.

Der er et par kendte fejl i bøjningsformerne som jeg arbejder på at få løst. Der er noget knas med homografer der bliver blandet sammen og rødder der forsvinder.

5000 nye ord, nye udtalevarianter, farvel til stød

Der er i dag tilføjet 5.000 nye ord, så der i alt er ca. 20.000 opslagsord i udtaleordbog.dk. Samtidig er der tilføjet nogle nye udtalevarianter og et par principielle opdateringer af lydskriften.

Nye udtalevarianter

Jeg har tilføjet udtalevarianter for nogle udtaleudviklinger der er på vej frem. Dels har jeg tilføjet den velkendte udvikling af ord som /næɐ̯ʊ fæɐ̯ʊ/ > /næːʊ fæːʊ/ nerve, færge. Jeg har også tilføjet udviklingen /ʁi ʁy/ > /ʁe ʁø/, som er ved at vinde frem blandt de unge.

Dertil har jeg tilføjet københavnsk udtale af /ʁu/ > /ʁo/.

Principielle ændringer

Et af målene med udtaleordbog.dk er at levere udtale i IPA (‘ren IPA’, dvs. uden de traditionelle danske tilpasninger). Et af principperne i IPA er diakritiske tegn så vidt muligt skal undgås i bred transskription, navnlig hvis de ikke er distinktive.

Jeg har taget konsekvensen af dette og fjernet ◌̯ under vokaler der indgår i en diftonger, så fx hej skrives /haɪ/ frem for /haɪ̯/. Det diakritiske tegn tilføjer her ikke nogen ekstra information, idet det kan underforstås at sammensætninger med /ɪ ɐ ʊ/ udgør en diftong. Denne ændring bringer lydskriften på udtaleordbog.dk bedre i overensstemmelse med praksis i andre sprog, hvilket er en væsentlig grund til overhovedet at benytte IPA.

I konservativ udtale er ◌̯ bevaret, idet det er distinktivt i ord som /fɒˈtsɛ̰ːɐ fɒˈtsɛ̰ːɐ̯/ fortære, fortær.

En anden ændring er at erstatte stødtegnet ◌ˀ med ◌̰ (creaky voice). Stødtegnet har aldrig været et officielt IPA-tegn. Termen stød er i det hele taget ikke transparent, og jeg opfordrer til at erstatte det med en international fonetisk fagterm. For at holde mig inden for IPA, bruger jeg jf. Nina Grønnums Fonetik & Fonologi tegnet ◌̰ som refererer til en slags knirkestemme. Dette er ikke dækkende for alle udtalevarianter, men det er passende til min egen variant af dansk. Jeg overvejer hvordan andre varianter kan implementeres enten i bred eller snæver IPA.

100.000 ord

2000 nye opslagsord og 10.000 bøjningsformer er føjet til ordbogen i dag. Dermed er ordbogen oppe på 15.000 opslagsord og 85.000 bøjningsformer, i alt 100.000 ord.

Desuden har jeg rettet et par tusind ortografiske og fonetiske fejl i bøjningsformerne, navnlig i uregelmæssige ord.

100.000 ord dækker omtrent en fjerdedel af retskrivningsordbogen, så der er et stykke vej endnu.

Stor update: bøjningsformer, lydskriftstandarder og bedre navigation + 75.000 ord

Jeg har netop lanceret en større update af udtaleordbog.dk. De mest markante tilføjelser er tilføjelse af bøjningsformer, mulighed for at vælge mellem forskellige lydskriftstandarder og navigationsmuligheder.

Vælg lydskriftstandard

Jeg har tilføjet en mulighed for at vælge mellem forskellige lydskriftstandarder. Lige nu kan man kun vælge mellem IPA og udtalordbog.dk’s egen standard, forkortet UOB.

IPA er det internationale lydskriftalfabet (uden de traditionelle danske tilpasninger). Lige nu vises kun bred IPA, mens snæver IPA er ved at få den sidste finpudsning, og det tilføjes i næste update.

UOB afviger fra IPA ved at bruge <b d g> i stedet for IPA /p t k/ i starten af ord og betonede stavelser. Alle andre steder fastholdes IPA /p t k/. Det kan give en lidt mere intuitiv læsning af ord der starter med bogstaverne b, d, g.

Jeg arbejder på at tilføje flere lydskriftstandarder.

Bøjningsformer

Det er nu muligt at se udtalen af ordenes bøjningsformer, en mulighed som ikke findes i andre udtaleordbøger end Gyldendals Dansk Udtale fra 1989. Denne funktion har stadig lidt småproblemer, som der arbejdes på, så tag det med forbehold her i starten. Man kan fx endnu ikke søge på bøjningsformer, bøjningsformerne vises kun med en enkelt udtale, og visse uregelmæssige bøjningsformer bliver endnu ikke vist korrekt.

Der tilføjes med dette ca. 75.000 nye ord til ordbogen.

Navigation

Nu vises ved hvert opslagsord link til foregående og følgende ord i ordbogen. Der er således mulighed for at bladre igennem ordbogen, og er blevet lettere at finde eksisterende ord.

Kommende forbedringer

Jeg arbejder på disse ting, som bliver klar inden for nærmeste fremtid:

  • flere opslagsord
  • bedre søgemuligheder
  • snæver IPA
  • flere udtaleformer
  • uddybende information ved udvalgte ord
  • flere lydskriftstandarder
  • betydningsafklaring ved homografer
  • forbedrede muligheder for feedback, diskussion, hjælp til udtale osv.
  • og meget mere

Har du særlige ønsker til ordbogen, så er du meget velkommen til at kontakte mig – kontakt@udtaleordbog.dk.