LexicoNordica-symposium: Hvilket datamateriale bygger nordiske ordbøger på? Skævheder, udfordringer og løsninger
Aktivitet: Deltagelse i arrangement eller begivenhed - typer › Organisation af og deltagelse i konference
Dokumenter
- LexicoNordica symposium 31 program
123 KB, PDF-dokument
06/03/2024
Henrik Hovmark - Arrangør
Terje Svardal - Arrangør
Leksikografiske resurser spiller en central rolle for nordisk sprogforståelse både mellem talere af de forskellige sprog og for gensidig forståelse mellem forskellige etniske og sociale grupper. De tilgrundliggende tekstkorpusser kan imidlertid være skævt sammensatte, med for ringe repræsentation af fx talesprog, unges sprog og minoriteters sprog. Der er dermed risiko for at resurserne ikke i tilstrækkelig grad inkluderer og tilgodeser den sprogbrug, og dermed de
opfattelser og værdier, som fx kendetegner forskellige mindretal.
Tekstkorpusser indsamles i stigende grad også automatisk af maskiner. Det giver risiko for en for stor repræsentation af maskinoversat, dvs. uoriginal tekst i tekstkorpusser, med risiko for fejl i de leksikografiske resurser.
Nordisk Forening for Leksikografi indkalder hermed forslag til foredrag ved det 31. LexicoNordica-symposium, der kan belyse hvordan der arbejdes med at kvalitetssikre det datamateriale som ligger til grund for nordiske ordbøger. Vi er interesserede i foredrag inden for følgende delemner:
• Komplettering af det eksisterende datamateriale som ligger til grund for nordiske ordbøger: Hvordan sikres det at materialet er så afbalanceret og repræsentativt som muligt, sprogligt og kulturelt?
• Håndtering af megakorpussernes automatisk indsamlede nettekster: Hvordan sikrer man sig imod maskingenereret sprog og indflydelsen fra chatbots o.l.
• Indsamling af materiale som er repræsentativt for minoriteters sprog, talesprog,
ungdomssprog, m.fl. Eksempler på datamateriale og evt. alternative måder at indsamle materiale på?
• Eksempler på anvendergenererede resurser som kilder: muligheder og udfordringer?
opfattelser og værdier, som fx kendetegner forskellige mindretal.
Tekstkorpusser indsamles i stigende grad også automatisk af maskiner. Det giver risiko for en for stor repræsentation af maskinoversat, dvs. uoriginal tekst i tekstkorpusser, med risiko for fejl i de leksikografiske resurser.
Nordisk Forening for Leksikografi indkalder hermed forslag til foredrag ved det 31. LexicoNordica-symposium, der kan belyse hvordan der arbejdes med at kvalitetssikre det datamateriale som ligger til grund for nordiske ordbøger. Vi er interesserede i foredrag inden for følgende delemner:
• Komplettering af det eksisterende datamateriale som ligger til grund for nordiske ordbøger: Hvordan sikres det at materialet er så afbalanceret og repræsentativt som muligt, sprogligt og kulturelt?
• Håndtering af megakorpussernes automatisk indsamlede nettekster: Hvordan sikrer man sig imod maskingenereret sprog og indflydelsen fra chatbots o.l.
• Indsamling af materiale som er repræsentativt for minoriteters sprog, talesprog,
ungdomssprog, m.fl. Eksempler på datamateriale og evt. alternative måder at indsamle materiale på?
• Eksempler på anvendergenererede resurser som kilder: muligheder og udfordringer?
15 feb. 2024 → 17 feb. 2024
Konference
Konference | LexicoNordica-symposium: Hvilket datamateriale bygger nordiske ordbøger på? Skævheder, udfordringer og løsninger |
---|---|
Nummer | 31 |
Afholdelsessted | Voksenåsen kultursentrum |
Land | Norge |
By | Oslo |
Periode | 15/02/2024 → 17/02/2024 |
Internetadresse |
- leksikografi, sprogteknologi, sprogvidenskab, nordiske sprog, nordisk sprogforståelse, AI, korpuslingvistik, minoritetssprog, ordbøger, sprog og kultur, repræsentativitet, data
Forskningsområder
ID: 384408870