Are there just WordNets or also SignNets?

Ineke SchuurmanThierry DeclerckCaro BrosensMargot JanssensVincent Vandeghinste, Bram Vanroy

Het centrum voor computerlinguistiek aan de KULeuven is in samenwerking met het VGTC  bezig met het maken van een SignNet. Een SignNet is een netwerk waarin gebaren met elkaar worden verbonden op basis van hun betekenis. Het is met andere woorden een manier om gebaren te structureren en de gebarenschat van een gebarentaal te visualiseren. 

Bijvoorbeeld:

  • DAG en DAG worden aan elkaar gelinkt, want dat zijn synoniemen. Het zijn andere gebaren met dezelfde betekenis,
  • ALLES en NIETS worden aan elkaar gelinkt omdat het antoniemen zijn, ze hebben een tegenovergestelde betekenis.
  • KAT, HOND en PAARD worden allemaal gelinkt aan het overkoepelende DIER.

Zo’n netwerk is geen nieuw idee, het bestaat al jaren voor gesproken talen, genaamd WordNets. WordNets zijn betekenisnetwerken van natuurlijke gesproken talen.

Waarom willen we dit bestaande concept nu toepassen op gebarentalen? De laatste jaren zien we een stijgende interesse voor machinevertalingen / automatische vertalingen tussen gesproken talen en gebarentalen, en gebarentalen en andere gebarentalen. We onderzoeken nu welke rol WordNet in deze vertalingen kan spelen. Het grote voordeel van WordNet is namelijk dat elk concept een unieke code krijgt, het is de bedoeling dat elke taal dezelfde code gebruikt voor hetzelfde concept en dat zo ook woorden uit verschillende talen aan elkaar gelinkt worden. Bijvoorbeeld “bloem”, “flower”, “fleur”, “Blume”, “flor” krijgen allemaal dezelfde code in het WordNet van hun taal. Op die manier kan je kijken hoe een bepaald concept wordt uitgedrukt in een bepaalde taal en kan je gemakkelijker conceptueel vertalen. 

Een belangrijke vraag hierbij is of we gebaren gewoon aan een bestaand WordNet voor een gesproken taal kunnen koppelen of er een andere aanpak vereist wordt voor gebarentalen, dus een SignNet. In principe is een WordNet gewoon een groot semantisch netwerk dat bewaard wordt in een databank. De bedoeling is om aan onze VGT-databank zoveel mogelijk beschikbare informatie toe te voegen: 

  • gebaren (in video)
  • fonologische kenmerken (parameters)
  • glossen
  • fonetische transcriptie
  • gebruiksvoorbeelden
  • definities
  • waar en wanneer ze voorkomen in het corpus

Onder andere dit zorgt ervoor dat de databank geen WordNet maar een SignNet wordt. Zo kan er rekening gehouden worden met de specifieke en visuele eigenschappen van gebarentalen. Dit wil zeggen dat SignNets een eigen semantisch netwerk vormen, vertrekkend vanuit visueel gestuele data, en die daarna gelinkt worden aan WordNets in plaats van dat ze geïntegreerd worden in een WordNet. Zo kaderen we gebarentalen als volwaardige natuurlijke talen, en niet als een nagedachte van een gesproken taal. Dit zorgt vermoedelijk ook voor een betere link met WordNets. 

Deze informatie komt uit bijgevoegd artikel dat voortkwam uit de 12de Global WordNet Conference. Het artikel heet “Zijn er enkel WordNets of ook SignNets?”, auteurs waren: Ineke Schuurman, Thierry Declerck, Vincent Vandeghinste, Bram Vanroy, Margot Janssens en Caro Brosens.

Meer weten over dit onderzoek? Lees dan zeker het artikel of contacteer ons via mail of videocall.