Støtteopprop for VISLCG3 i Odense
Det er med sjokk og vantro vi hører at VISL/språkteknologi-gruppa ved SDU planlegges lagt ned. Det er ikke første gang det verserer slike planer, og også forrige gang (i 2011) uttrykte vi i det internasjonale fagmiljøet svært sterk bekymring (se vedlegg). På de årene som har gått har betydninga til visl-miljøet i Odense bare økt: Sammenlignet med situasjonen den gangen har flere språksamfunn internasjonalt tatt i bruk teknologien som blir utviklet ved SDU, og teknologien har utviklet seg i samsvar med økende bruk og behov. VISL/språkteknologi-gruppa ved DSU er spydspissen i den resultatsbaserte delen av dansk språkteknologi, og må utvides og styrkes med flere stillinger (jf. konklusjonen i brevet vårt fra 2011).
Siden 2011 har det skjedd mye i språkteknologien, framforalt en forbedring av statistiske metoder og overgang til neurale nett, mest profilert i applikasjoner som Google Translate og ChatGPT. I en slik situasjon er det lett å tenke at å utvikle alternativer til denne teknologien ikke er nødvendig. For alle andre enn noen avgrensede bruksområder for et lite knippe språk stemmer ikke dette. I et dansk perspektiv er det for eksempel verdt å legge merke til at to av de tre språkene i riksfellesskapet står utenfor maskinlæringsutviklingen. Uten miljøet i Odense vil Danmark rett og slett ikke være i stand til å gjennomføre sin egen språkpolitikk for grønlandsk og færøysk.
Den dominerende trenden innenfor språkteknologien har de siste årene levert nye resultater: Robust maskinoversetting til bruk for tekstforståelse mellom ca. 100 språk (av 7000+), og en interaktiv chattjeneste som kan simulere visse sider ved menneskelig språkbruk (for ikke like mange språk). Samtidig er denne nye teknologien fullstendig avhengig av at hvert språksamfunn har en stor tekstsamling (helst hundrevis av milliarder av ord) som følger og dermed uttrykker den språknormen språksamfunnet vil ha. Uheldigvis er det bare et par titalls språk som har slike ressurser. Språksamfunn som grønlandsk og færøysk er svært fjernt fra en slik situasjon. Disse språkene har ikke nok tilgjengelig tekst til å lage språkmodeller ved hjelp av maskinlæring, og mye av teksten som finnes avviker også fra skriftnormen. Det disse språksamfunnene trenger er også noe annet enn det et neuralt nett kan tilby dem: De trenger språkteknologiske verktøy til bruk i språkplanlegging og støtte for korrekt bruk av språkene i en presset situasjon.
Det språkteknologiske miljøet i Tromsø har i likhet med mange andre språkteknologiske miljø brukt teknologien fra visl-gruppen på SDU i over 20 år. Selve visl-teknologien har produsert verktøy for brukerere siden 1990. Den felles infrastrukturen (
giellalt.github.io) som både vi og visl bruker inneholder 140 språk som bruker eller har tilgang til visl-teknologien (der i underkant av 50 språk har praktiske applikasjoner). Resultatet er fungerende programmer for bl.a. grammatisk analyse, stavekontroll, grammatikkontroll, maskinoversetting og taleteknologi. Bare i 2023 lanserer vi i Tromsø grammatikkontroll for 3 nye språk (enaresamisk, lulesamisk og sørsamisk), der alle har Odenses vislcg som en kjernekomponent. I tillegg til vår infrastrukt er visl-teknologien også i bruk andre steder i Norden, i alle fall i Uleåborg, Helsingfors, Stockholm, Göteborg, Oslo, Tórshavn og Nuuk. Via maskinoversettingsnettverket Apertium (
wiki.apertium.org) er visl-programvaren i bruk på alle kontinent.
Vi oppfatter den foreslåtte nedleggelsen av visl-gruppen som en trussel mot utviklingen innenfor språkteknologisk forsking. Visl-gruppen inngår i et nettverk der Helsingfors leverer løsninger for ordstruktur, Odense for syntaktisk struktur og semantikk og Tromsø generell infrastruktur og programvareintegrering. Uten Odense vil også andre språkteknologer ha vanskeligere for å argumentere for språkteknologiens samfunnsmessige relevans. Visl-miljøet i Odense står fram med toppforskning på internasjonale konferanser, shared tasks og paneldiskusjoner, og har deltatt i ulike samarbeidsprosjekt som har produsert fungerende verktøy. Når våre servere i Tromsø blir stengt ned pga. hackerangrep eller vedlikehold har vi språksamfunnet på telefonen innen et par minutter. Samtidig kan de fleste andre nordiske miljø innenfor språkteknologisk forsking ikke vise til resultater gode nok for faktisk implementering og bruk i språksamfunn, eller de har fokus andre steder. I en situasjon med stadig sterkere fokus på humanioras samfunnsrelevans er det en svært dårlig idé å legge ned det eneste språkteknologiske miljøet som faktisk leverer samfunnsrelevant programvare.
Visl er uerstattelig for den delen av det nordiske språkteknologimiljøet som arbeider med andre enn store offisielle statsspråk. Miljøet er en sentral del av språkteknologien i grensesnittet mellom fungerende og lingvistisk interessant språkteknologi. Vi ser med skuffelse på nyheten om at toppkompetanse i både internasjonal forskning og utvikling innenfor språkteknologi står i fare. I en situasjon der språkteknologi er i rampelyset som aldri før er det farlig å legge ned det eneste alternative til neurale nett, og vi vil med dette på det sterkeste oppfordre til å endre kurs. Visl-gruppen på SDU er allerede uerstattelig for mange av verdens språk, og burde ha vært det for langt flere. Vårt råd er tvert i mot at visl-gruppen får styrket sine ressurser kraftig.
Divvun- og Giellatekno-gruppene ved UiT Norges arktiske universitet, ved
Professor Trond Trosterud
Sjefsingeniør Sjur Moshagen
Dr Linda Wiechetek
Dr Flammie Pirinen