Datorlingvistik

Datorlingvistikgruppen vid Uppsala universitet forskar om datormodeller för naturligt språk och praktiska tillämpningar av språkteknologi.

Datorlingvistik, eller språkteknologi, är ett tvärvetenskapligt forskningsfält som sysslar med datormodeller av naturligt språk. Traditionellt har forskningen drivits både av det teoretiska målet att förstå det mänskliga språket och av praktiska tillämpningar såsom system för automatisk översättning, informationssökning och människa-dator-dialog. För närvarande påverkas området starkt av framväxten av stora språkmodeller och generativ AI.

Datorlingvistikgruppen vid Uppsala universitet bedriver forskning inom ett brett fält med två fokusområden: digital filologi och flerspråkig språkteknologi. Digital filologi handlar om datormetoder för tolkning av text, med tillämpningar som historisk textanalys, historisk kryptografi, digitala litteraturstudier och handskriftsigenkänning. Flerspråkig språkteknologi handlar både om inherent flerspråkiga tillämpningar som maskinöversättning och om användningen av flerspråkiga resurser för att stödja resurssvaga språk exempelvis för grammatisk dependensanalys. Gruppen har bidragit till utvecklingen av ett antal språkresurser och verktyg, såsom Universal Dependencies (morfosyntaktiskt annoterade korpusar), PARSEME (korpusar med annotering av flerordsuttryck), Swedish Diachronic Corpus, UUParser (datadriven grammatisk dependensanalys).