Het merendeel van de artikelen in het ANW bestaat uit “gewone artikelen”, d.w.z. artikelen waarin u alle betekenissen van een woord opgesomd vindt, liefst in een zo eenvoudig mogelijke structuur, met twee structuurlagen: kernbetekenissen en subbetekenissen.
Het ANW is een synchroon woordenboek. Dat betekent dat woorden met dezelfde vorm, maar een verschillende etymologische herkomst samen in één artikel behandeld worden, ongeacht of ze etymologisch gezien dezelfde herkomst hebben.
Soms is het vormelijke of semantische verschil tussen de woorden echter zo groot dat de behandelde woorden in één artikel wél onderscheiden worden door zogeheten “koepels”. De redacteur kan een ‘overkoepeling’ aanbrengen, waarbij hij globaal betekenis en/of woordsoort kan aangeven. Onder die ‘koepel’ bevat het formulier bij een koepelartikel verder dezelfde categorieën en subcategorieën als bij het normale artikel. Het koepelartikel wordt bijvoorbeeld benut als woorden een verschillende woordsoort hebben (bv. bij = substantief (dier), voorzetsel en bijwoord; do = substantief (muzieknoot) en afkorting (voor o.a. donderdag)) of als eigennamen en soortnamen in één artikel behandeld worden (bv. Pers/pers).
In het ANW zijn de verschillende onderdelen van een koepelartikel gemarkeerd door hoofdletters: A, B, C enz.
Een artikel in het Algemeen Nederlands Woordenboek (ANW) bestaat uit de volgende onderdelen:
en een kadertje rechts op het scherm met informatie over:
Als eerste wordt de lemmavorm getoond. Als er meerdere lemmavormen zijn, worden deze door een slash (/) gescheiden. Voorbeeld: ma/MA/Ma/mA.
Het onderdeel betekenis en gebruik vormt het hart van een ANW-artikel. Betekenissen zijn verdeeld in hoofd- en subbetekenissen die genummerd zijn. Per betekenis worden de volgende informatiecategorieën onderscheiden:
Het veld definitie bevat de definitie van het behandelde trefwoord. In afwijking van wat in de lexicografie gebruikelijk was, wordt in het ANW in de definitie van een overgankelijk werkwoord het object meegedefinieerd.
Restricties
Bij de definitie kunnen aanvullende gegevens staan over de betekenis of het gebruik van het trefwoord: restricties als Gezegd van meisjes (bv. giechelen) of Met betrekking tot boeken (bv. inbinden), opmerkingen over de betekenis die niet in de definitie thuishoren en verwijzingen naar andere woordenboekartikelen. Opgegeven restricties staan direct voor de definitie (tussen haakjes), terwijl opmerkingen en verwijzingen direct onder de definitie staan.
Onder de genummerde betekenissen van het lemma kunnen gegevens over bijzonderheden gebruik vermeld worden, zoals taalvariëteit, stijl, houding, domein, frequentie, tijd en medium van het betreffende woord.
Naast de definitie kan een afbeelding getoond worden en/of is een geluidsbestand of een video beschikbaar.
De betekenisrelaties tussen verschillende betekenissen worden getoond in het veld betekenisbetrekking. De waardes zijn: metafoor; metonymie; specialisering; generalisering; onduidelijk.
Het ANW onderscheidt zich van alle andere woordenboeken door de opname van een semagram. De geestelijke vader van het semagram, oud-hoofdredacteur prof. dr. Fons Moerdijk, heeft het semagram als volgt omschreven:
“Een semagram is de weergave van met een woord te verbinden kennisgegevens in een frame met ‘slots’ en ‘fillers’. ‘Slots’ zijn conceptuele-structuurelementen die kenmerken en relaties noemen die gelden voor de betekenisklasse waartoe een woord behoort (bv. KLEUR, GEUR, SMAAK, SAMENSTELLING, GRONDSTOFFEN, BEREIDING voor de klasse van de drankbenamingen)."
Het semagram bevat dus alle voor de woordklasse relevante (vaak ook encyclopedische) gegevens over het beschreven woord. Het semagram is eigenlijk een uitvoerige biografie van het woord in kwestie en biedt veel meer informatie dan een definitie kan doen.
Bovenin het semagram wordt met een aanloopzinnetje ingevuld tot welke klasse het betreffende woord wordt gerekend. Bv. bij ambtenaar wordt vermeld: is een persoon; bij modereren staat: is een handeling of een gebeurtenis. Eventuele bovenliggende klassen worden ook gegeven. Zo staat bij bier: is een drank; is een vloeistof; is een stof.
Onder het semagram kan een link staan naar een gerelateerd semagram. Bv. bij synoniemen van alcoholicus naar alcoholist en bij hyperoniemen van belastingambtenaar naar ambtenaar. Bij hyperoniemen worden de algemene kenmerken in het semagram van het hyperoniem vermeld en worden alleen de afwijkende kenmerken vermeld bij het hyponiem.
Het belangrijkste onderdeel van het semagram zijn de kenmerken. In het ANW wordt een zeer gedetailleerde set van kenmerken gebruikt, o.a. afmeting, dimensie; geluid; geur; gevoelsindruk; kleur; lichtreflectie; omvang concreet; smaak; transparantie; uiterlijk; vorm; waarneembaarheid.
Semagrammen worden vooral gegeven bij substantieven: vooral woorden met een relatief hoge frequentie en bij voorkeur grondwoorden. Naar bevind van zaken kan van deze richtlijn afgeweken worden.
Naast de hierboven beschreven kenmerken is er voor wetenschappelijke, technische termen en woorden uit de flora en fauna een aparte categorie wetenschap, waarin de volgende kenmerken kunnen worden ingevuld (en waarbij geen “aanloopzinnetjes" worden gebruikt): wetenschappelijke naam; rijk; stam; klasse; orde; familie; geslacht; soort; atoomnummer; formule; geheel; groep; symbool.
In het ANW worden bijna altijd voorbeelden opgenomen van het woord, in vrij gebruik of in combinaties, vaste verbindingen e.d. Dat zijn in de regel voorbeelden uit het eigen ANW-corpus, maar het kunnen ook voorbeelden zijn die op internet of, een heel enkele keer, in niet-digitale bronnen gevonden zijn.
In het ANW worden de oorspronkelijke bronteksten zoveel mogelijk intact gelaten, d.w.z. ook als de spelling niet conform de huidige voorschriften is, wordt dat niet verbeterd. Wel wordt er ingegrepen bij “storende” taalfouten (bv. dt-fouten). Alle voorbeeldzinnen eindigen met een punt, en vraagteken, een uitroepteken of met aanhalingstekens sluiten. Uit een aantal voorbeeldzinnen zijn stukjes weggelaten. De reden daarvoor kan zijn:
Uitgangspunt bij de weglatingen was het intact laten van de voorbeeldfunctie van het citaat. Weglatingen worden weergegeven door vierkante haken met drie puntjes ertussen ([…]) gevolgd door het leesteken dat voor het vervolg van de voorbeeldzin staat.
Krantenkoppen in een voorbeeldzin zijn voorzien van een slotpunt en plaatsnamen (die vaak volgen na de krantenkop) zijn weggelaten zonder […]. De tekstopmaak van de bron is niet gehandhaafd.
De datering van een voorbeeldzin kent drie vormen:
Veel voorbeeldzinnen zijn ongedateerd. Dit betreft dan vooral internetbronnen. Namen van auteurs en de brontitels zijn gebaseerd op de ANW-bronnenlijst.
Het ANW onderscheidt zich niet alleen van andere woordenboeken door zijn semagrammen, maar ook door zijn aandacht voor de combinatiemogelijkheden van woorden. Er wordt onderscheid gemaakt tussen combinatiemogelijkheden en vaste verbindingen. Bij combinatiemogelijkheden gaat het erom de patronen vast te leggen en te presenteren, de syntactische combinatiemogelijkheden te tonen die zich bij een woord voordoen. In de praktijk gaat het hier vooral om zeer vertrouwde/conventionele vrije verbindingen en (lexicale en grammaticale) collocaties. Bij verbindingen draait het om twee hoofdgroepen: vaste, idiomatische verbindingen (de betekenis van een gehele combinatie is niet uit zijn bestanddelen te herleiden) of combinatiemogelijkheden die in hun vorm een gevestigd formuleachtig karakter hebben (met genoegen, tot ziens).
Combinatiemogelijkheden worden onderscheiden naar type: substantief; werkwoord; adjectief; bijwoord; voornaamwoord; telwoord; overig.
Bij substantief: als object bij een werkwoord; als subject bij een werkwoord; met adjectief ervoor; met adjectivisch tegenwoordig deelwoord; met adjectivisch voltooid deelwoord; met voorzetselgroep; in voorzetselgroep; in voorzetselgroep met werkwoord; in voorzetselgroep met werkwoord gevolgd door voorzetselgroep; als object bij werkwoord met vast voorzetsel; in voorzetselgroep met werkwoord en vast voorzetsel; met substantief ervoor; met substantief erachter; met telwoord ervoor; met telwoord erachter; met adjectief erachter; met infinitief met te; met infinitief met om te; met dat-zin; met vraagzin; met of-zin; met alsof-zin; met aanwijzend voornaamwoord; met bezittelijk voornaamwoord; met onbepaald voornaamwoord; met persoonlijk voornaamwoord; voorafgegaan door naamvalsgenitief; gevolgd door naamvalsgenitief; met eigennaam; met lidwoord; met ander nevengeschikt substantief; overige.
Bij werkwoord: met subject; met object; met object en substantief; met object en adjectief; met object en bijwoord; met object en substantief indirect object; met object en indirect object met aan; met object en vast voorzetsel; met object en als-bepaling; met indirect object; met indirect object met aan; met voorzetselgroep; met bijwoord; met ondervindend voorwerp; met adjectief; met infinitief; met een infinitief met te; met een infinitief met om te; met een dat-zin; met een vraagzin; met een of-zin; met een alsof-zin; met een als-bepaling; in voorzetselgroep met aan het; in voorzetselgroep met uit; met directe rede; met substantief = inherent object; met ander, nevengeschikt werkwoord; overig.
Bij adjectief: met substantief; met bijwoord; met werkwoord; met voorzetselgroep; met infinitief met te; met infinitief met om te; met dat-zin; met of-zin; met verplicht object; met ander, nevengeschikt adjectief; overig.
Bij bijwoord, voornaamwoord en telwoord: met substantief ervoor: met substantief erachter; met adjectief ervoor; met adjectief erachter; met bijwoord; met werkwoord; met voorzetselgroep; met telwoord; met voornaamwoord; met voltooid deelwoord; met tegenwoordig deelwoord; met infinitief met te; met infinitief met om te; met dat-zin; overig.
Per combinatietype worden een of meerdere voorbeelden gegeven.
Onder vaste verbindingen verstaat het ANW vaste, idiomatische verbindingen (de betekenis van een gehele combinatie is niet uit zijn bestanddelen te herleiden) of combinaties die in hun vorm een gevestigd formuleachtig karakter hebben (met genoegen, tot ziens). Er wordt dus onderscheid gemaakt tussen combinatiemogelijkheden en vaste verbindingen. In tegenstelling tot combinatiemogelijkheden hebben vaste verbindingen wel een betekenisomschrijving.
Bij spreekwoorden gaat het om volledige zinnen in een min of meer vaste vorm die een bepaalde levenswijsheid verkondigen. Net als bij vaste verbindingen wordt bij spreekwoorden een betekenis gegeven.
In het veld Woordfamilie worden de woorden opgesomd die tot de woordfamilie van het trefwoord behoren, waarbij de volgende velden onderscheiden worden:
Daarnaast zijn er de velden ‘Uitheemse woordreeks’ voor woorden met dezelfde wortel en ‘Reekshoofd’, voor het uitgangswoord in zo’n reeks (bv. demonstreren, demonstratie, demonstrant, demonstrante, demonstratief, reekshoofd: demonstreren).
Eventueel kunnen ook overige woordfamilieleden worden vermeld.
Omdat het ANW een synchroon woordenboek is, wordt bij de opgenomen woorden in beginsel geen etymologie gegeven. Wel kan de herkomst van een woord d.m.v. een link in het linkerframe opgezocht worden in de woordenboeken van het Instituut voor de Nederlandse Taal: het Oudnederlands Woordenboek (ONW), het Vroegmiddelnederlands Woordenboek (VMNW), het Middelnederlandsch Woordenboek (MNW) en het Woordenboek der Nederlandsche Taal (WNT). In het kader rechts kan in de Etymologiebank nagezocht worden of het betreffende woord behandeld is in de etymologische woordenboeken.
Etymologische en encyclopedische informatie kan ook nagezocht worden in de internetencyclopedie Wikipedia. Als een artikel uit het ANW eenmaal geopend is, volstaat klikken op de link naar Wikipedia om direct in het betreffende artikel terecht te komen. Hetzelfde geldt voor de link naar Google: als een ANW-artikel eenmaal geopend is, kan met een klik met de zoekmachine Google gezocht worden met het betreffende woord als trefwoord.
Voor neologismen wordt in het ANW een uitzondering gemaakt. Deze worden voorzien van etymologische informatie omdat we ze bij wijze van spreken onder onze ogen zien ontstaan en de gegevens ervan zo zonder veel moeite zo nauwgezet mogelijk vast zijn te leggen. De categorie etymologie bevat de volgende velden en subvelden:
Voor iedere betekenis wordt rechts op het scherm in een kadertje de volgende informatie getoond:
De volgende woordsoorttypes worden onderscheiden: substantief, werkwoord, adjectief, lidwoord, voornaamwoord, telwoord, bijwoord, voorzetsel, voegwoord, tussenwerpsel. De verschillende types hebben ieder een eigen structuur:
a) bij substantief worden gegevens vermeld over:
b) bij werkwoord worden gegevens vermeld over:
c) bij adjectief worden gegevens vermeld over:
d) bij lidwoord worden gegevens vermeld over:
e) bij voornaamwoord worden gegevens vermeld over:
f) bij telwoord worden gegevens vermeld over:
g) als bijwoord is ingevuld, wordt een structuur zichtbaar met de volgende velden:
h) bij voorzetsel worden gegevens vermeld over:
i) bij voegwoord worden gegevens vermeld over:
* als “nevenschikkend” is ingevuld, kan een keuze worden gemaakt uit de waardes: aaneenschakelend; tegenstellend; causaliteit aanduidend; gevolgaanduidend
* als “onderschikkend” is ingevuld, kan een keuze worden gemaakt uit de waardes: grammatisch verbindend; van tijd; van causaliteit; van gevolg; van graadaanduidend gevolg; van doel; voorwaardelijk; van toegeving; van omstandigheid; beperkend; uitbreidend; van verhouding; van vergelijking; van modaliteit
j) bij tussenwerpsel worden geen aanvullende gegevens vermeld.
Onder spelling worden vermeld: de afbreking van de lemmavorm, de afbreking van de flexievormen (bv. de verbogen vorm van het bijvoeglijk naamwoord, het meervoud van een zelfstandig naamwoord, het voltooid deelwoord van een werkwoord), en, indien van toepassing, de gangbare afkorting of het gangbare grafische symbool en al dan niet erkende varianten.
Het blok woordrelaties bevat de volgende categorieën:
- Een hyperoniem is een woord dat de betekenis van een ander woord insluit, d.w.z. het is het naastgelegen, hogere begrip. Bv.: de biersoorten flessenbier en geuze hebben als hyperoniem bier; het woord bier heeft als hyperoniem drank. De eigennaam Arabier ‘iemand uit Arabië’ heeft als hyperoniemen: persoon; inwoner; bewoner. De soortnaam arabier ‘Arabisch volbloedpaard’ heeft als hyperoniem paard.
- Een synoniem is een woord dat hetzelfde of vrijwel hetzelfde betekent als een ander woord. Sommige taalkundigen betwijfelen of echte synoniemen wel bestaan. Anderen maken onderscheid tussen volsynoniemen (= woorden die precies hetzelfde betekenen) en halfsynoniemen (= woorden die vrijwel hetzelfde betekenen). In het ANW worden in het veld Synoniem in ieder geval de volsynoniemen opgenomen, maar kunnen ook halfsynoniemen vermeld worden. Bv.: absent heeft als synoniem afwezig.
- Een antoniem is een woord met een tegengestelde betekenis. Bv. absent heeft als antoniemen: present en aanwezig; amateurfotograaf heeft als antoniem: beroepsfotograaf.
- Een feminiem is de vrouwelijke variant van een woord. Bv.: alcoholiste is het feminiem van alcoholist, Belgische is het feminiem van Belg, dichteres is het feminiem van dichter, promovenda is het feminiem van promovendus.
- Een androniem is de mannelijk variant van een woord. Bv.: alcoholist is het androniem van alcoholiste, Belg is het androniem van Belgische, dichter is het androniem van dichteres, promovendus is het androniem van promovenda.
Onder woordvorming wordt aangegeven hoe het lemma gevormd is. De volgende gevallen worden onderscheiden:
Het is mogelijk dat een lemmawoord een meervoudige woordvorming toegekend krijgt, bijvoorbeeld wanneer iets zowel een samenstelling als een samenstellende afleiding kan zijn of wanneer niet uit te maken valt of een woord samengesteld is uit substantief + substantief of werkwoordstam + substantief. Ook als een woord in het Nederlands ongeleed is, maar in de brontaal geleed, kan het lemma een meervoudige woordvorming krijgen, in dit geval zowel het predicaat “ongeleed” als “in brontaal geleed”.
Onder uitspraak wordt aangegeven hoeveel lettergrepen de lemmavorm heeft, waar de hoofdklemtoon ligt, hoe het woord wordt uitgesproken (Engels, Frans, Duits, Italiaans, Spaans, Nederlands en Engels, Nederlands en Frans, Nederlands en Duits, Nederlands en Italiaans, Nederlands en Spaans).
Daarnaast is er een veld voor de fonetische schrijfwijze.
In juni 2015 zijn ruim 94.000 woorden in de ANW-database voorzien van een fonetische transcriptie, waarvan een groot aantal nu al online te zien is. De transcripties zijn automatisch gegenereerd door ReadSpeaker en waar nodig handmatig gecorrigeerd. De gebruikte foneemset is een afleiding van IPA (International Phonetic Alphabet).
Medeklinkers | Klinkers/tweeklanken | Niet-inheems | |||
---|---|---|---|---|---|
Symbool | Voorbeeld | Symbool | Voorbeeld | Symbool | Voorbeeld |
p | pen | ɪ | pit | ɑː | far |
b | biet | i | vier | æ | cat |
t | tak | i: | analyse/creep | θ | think |
d | dak | ʏ | put | ð | these |
k | kat | y | fuut | ɹ | right |
ɡ | goal | ɛ | pet | aɪ | right |
m | mens | eː | beet | ɜː | player |
n | nek | ə | de | u: | you |
ŋ | eng | øː | neus | ɔ̃ | bon |
n j | oranje | ɑ | pat/van | ɑ̃ | vivant |
f | fiets | aː | baad | ɛ̃ | l(i)ngerie |
v | oven | ɔ | rosse | w | water |
s | sok | oː | boot | ɔɪ | boy |
z | zeep | u | hoed | ʁ | tres bien |
ʃ | chef | ɛɪ | bijt | ʌ | nut |
ʒ | jury | œy | buit | eɪ | lay |
x | acht | ɑu | nauw | aʊ | power |
ɣ | gaan | ʏ: | shirt | ||
r | rat | ɛː | barrière | ||
h | hoed | ɔː | roze | ||
w | wang | ɪ | pit | ||
j | ja | ||||
l | land | ||||
t͡ʃ | Tsjechisch | ||||
d͡ʒ | John |
Symbool | Voorbeeld | |
---|---|---|
Hoofdklemtoon | * | [ *d r oː x ] |
Nevenklemtoon | ' | [ *d r oː x - b u . 'k ɛ t ] |
Samenstellingsgrens | - | [ *d r oː x - 'b l u m ] |
Syllabegrens | . | [ *d r oː . m ə n ] |
Woordgrens | | | [ *n ɑ . t j ə | *ɛ n | *d r oː x . j ə ] |
De transcripties geven een voorbeeld van de uitspraak van het woord. Er zijn vaak meerdere varianten mogelijk, bijvoorbeeld [ *ɑu . t oː ] en [ *oː . t oː ]. In het ANW wordt vooralsnog in ieder geval één van de uitspraakmogelijkheden weergegeven.
ReadSpeaker maakt tekst-naar-spraaktoepassingen en werkt daarom pragmatisch: de woorden zijn zo getranscribeerd dat de uitspraak van de tekst-naar-spraaktoepassing goed klinkt. Het kan daarom voorkomen dat uitspraakprocessen zoals assimilatie niet overal consequent zijn weergegeven in de transcripties. Enkele andere opmerkingen: