Semalt: hoe werkt Wiki in verschillende talen?

Oliver King, de Semalt Customer Success Manager, zegt dat Wikipedia een uitgebreide reeks gegevens, artikelen en inhoud in verschillende talen heeft, en de redacteuren worden aangemoedigd om de ontbrekende artikelen over deze gigantische encyclopedie te maken. Het is veilig om te zeggen dat Wikipedia in meer dan driehonderd talen bestaat, maar de meeste zijn onvolledig en relatief klein. Mensen uit alle delen van de wereld bezoeken Wikipedia dagelijks en lezen de meer dan 300 taaledities. Sommigen van hen zoeken naar specifieke artikelen en inhoud die zijn geschreven door honderden tot duizenden vrijwillige schrijvers die verantwoordelijk zijn voor het bouwen en onderhouden van deze beroemde en gratis encyclopedie. Bezoekers van Wikipedia doorzoeken de artikelen meestal in de Engelse taal en de andere talen zijn goed voor Wiki 30 miljoen inzendingen.

Democratiseer de toegang tot de kennis

Om schrijvers en redacteuren van verschillende taalgemeenschappen te helpen de ontbrekende artikelen te evalueren, hebben de computerexperts van de Wikimedia Foundation en Stanford met succes een aantal tools gemaakt. Een daarvan helpt bij het identificeren van de belangrijke artikelen die nog niet beschikbaar zijn in een bepaalde taal. Editors gebruiken deze aanbevelingen vervolgens om nieuwe artikelen te maken. Als de redacteuren en schrijvers meertalig zijn, is het heel eenvoudig om artikelen in een tweede taal te vinden en deze naar de lokale taal te vertalen voor Wikipedia-lezers.

Dit systeem identificeert dus eerst de redacteur van Madagaskar die in de Franse taal wil schrijven en vraagt de redacteur om de ontbrekende delen van een artikel te voltooien en het in de Malagasy Wikipedia te publiceren. Op deze manier kunnen de redacteurs artikelen maken voor verschillende mensen in de wereld, die op hun beurt de algehele gebruikerservaring kunnen beïnvloeden.

Onderzoekers van de Wikimedia Foundation, Leila Zia en Ellery Wulczyn, hebben samengewerkt met Stanford University-student Robert West om een rapport te presenteren op de International World Wide Web Conference in Montreal. Volgens hen heeft Wikipedia een uitgebreide hoeveelheid gegevens en is er een sterke relatie tussen de artikelen.

De wetenschappers zijn begonnen met het maken van lijsten met artikelen in verschillende talen en verwijzen naar de lijsten om erachter te komen welke artikelen in welke talen ontbreken. Vervolgens schatten ze het belang van alle ontbrekende artikelen op basis van de geografische en culturele relevantie. Ze streven ernaar de ontbrekende artikelen zo snel mogelijk te publiceren en ze een betere rangorde te geven.

De gaten dichten

Onderzoekers hebben het uitgangspunt getest met een reeks experimenten. Ze begonnen het project met meer dan 4 miljoen artikelen die in het Engels waren geschreven en ontdekten dat er meer dan 1,5 miljoen artikelen ontbraken in de Franse Wikipedia-sectie. De experts selecteerden vervolgens de 300.000 belangrijke Engelstalige artikelen en vertaalden deze naar de Franse taal. De artikelen waren verdeeld in drie hoofdgroepen van elk meer dan 100.000 artikelen en werden overhandigd aan de beste en meest ervaren redacteuren. De kern van het experiment bestond uit twee hoofdgroepen van zesduizend redacteuren en schrijvers die binnen twaalf maanden voordat het experiment voorbij was, meerdere bewerkingen in zowel de Franse als de Engelse taal uitvoerden. In juni 2015 ontvingen alle redacteuren een e-mail waarin werd gewezen op de unieke ontbrekende artikelen en hen werd gevraagd de volledige lijst met artikelen te vertalen van de Engelse naar de Franse taal. Een maand later hadden de experts toegang tot het maken van ontbrekende artikelen en ontdekten dat ze de percentages voor het maken van organische artikelen konden verhogen. Op basis van al deze resultaten heeft de Wikipedia Foundation enkele experimentele tools ontwikkeld waarbij redacteuren en schrijvers hiaten in hun lokale taal kunnen vinden en naar specifieke vermeldingen kunnen worden verwezen.