computerlinguïstiek 1.0
(ICT; taal en taalkunde; wetenschap)
Semagram (extra betekenisinformatie)
Computerlinguïstiek…
is linguïstiek; is een vakgebied
- [Doel of bestemming] wordt o.a. ingezet voor natuurlijke taalverwerving (NLP, bv. automatische vertaling, spraakherkenning, tekstsamenvatting en sentimentanalyse), syntactische en semantische analyse, machinelearning en corpuslinguïstiek
- [Functie] overbrugt de kloof tussen menselijke taal en computertechnologie; combineert elementen van taalkunde, informatica en kunstmatige intelligentie (AI) om de manier waarop mensen taal gebruiken te begrijpen en deze kennis toe te passen bij het ontwikkelen van technologieën die menselijke taal kunnen verwerken en genereren
- [Handelende persoon] wordt beoefend door computerlinguïsten
Algemene voorbeelden
Wij mensen weten meteen of het is om op te zítten, of dat het het werkwoord stoelen is. Maar programmeer maar eens een machine die dat zo netjes doet als wij. Dat is ons werk in de computerlinguïstiek: het ontwikkelen van software die een computer de taalvaardigheid van een mens geeft. En misschien nog wel meer. De droom is een technologie waardoor ieder mens ieder ander kan verstaan en begrijpen. 'Iedereen denkt bij taaltechnologie aan spraakherkenning. Veel spannender is keyword retrieval: het opdiepen van de essentie in een geschreven tekst. Voor automatische tekstanalyses, samenvattingen, het doorzoeken van grote bestanden vakliteratuur. En het leggen van verbanden.
Het Instituut voor de Nederlandse Taal (INT) doet veel aan computerlinguïstiek. We beschrijven de woordenschat op basis van corpora die met behulp van verschillende computerprogramma's worden geanalyseerd en verrijkt. Dit gebeurt zowel voor hedendaags Nederlands als voor historische teksten. Er zijn bijvoorbeeld programma's die woordsoorten bij woorden zoeken ('part-of-speech tagging'), die namen herkennen ('named entity recognition') en die de opbouw van woorden analyseren (morfologie).
De toepassingen van de alfawetenschappen worden onderschat. Terwijl inzichten uit de logica, musicologie en taalkunde hebben geleid tot toepassingen zoals automatisch redeneren, muzikale begeleidingsystemen, spraakherkenning en machinaal vertalen. Zo is de computerlinguïstiek een schoolvoorbeeld van toegepaste taalkundige kennis, en wordt aan alle Nederlandse letterenfaculteiten gedoceerd.
Busa was de eerste maar zeker niet de enige die computertechnologie inzette ten behoeve van de geesteswetenschappen. Minstens zo belangrijk was de inzet van computertechnologie in de taalkunde waaruit in de jaren zestig het vakgebied computerlinguïstiek werd geboren.
'Schokkend goed', worden de prestaties van GPT-3 omschreven in de MIT Technology Review. Het hele internet in een AI-systeem pompen, heeft ook nadelen: het systeem kan erg racistisch uit de hoek komen, is al aangetoond. Walter Daelemans, professor computerlinguïstiek aan de Universiteit Antwerpen, vindt de hype wat overdreven. 'Het blijft een papegaai die reconstrueert wat hij geleerd heeft', zegt hij. 'GPT-3 is exact dezelfde architectuur als GPT-2, alleen véél groter', zegt Daelemans.
Woordfamilie
Als deel van een afleiding
Overige woordfamilieleden
Etymologie
Samenhangende woorden (betekenis) | natuurlijketaalverwerking; NLP |
---|