Titokban egymással harcolnak a Wikipedia algoritmusai

Viszonylag keveset tudtunk eddig arról, hogy mit kezdenek egymással a különféle internetre szabadított algoritmusok. Egy most véget érő kutatás viszont sok érdekes részletre hívta fel a figyelmet.

Az, hogy tele az internet botokkal, nem új dolog: információkat gyűjtenek, spameket küldenek ki, reklámokra kattintanak (egyes becslések szerint a reklámkattintások felét már botok hozzák össze), sőt, még a Wikipedia szócikkeiben elkövetett trollkodásokat és úgynevezett rongálásokat is kijavítják.

Az Oxford Egyetem kutatója, Taha Yasseri ez utóbbi funkciót vizsgálta: azt nézte meg, mit kezdenek egymással a Wikipedián a botok. És egy egészen meglepő dologra bukkant: egyes szócikkeknél évek óta tartó botháborúk zajlanak: egy algoritmus rendszeresen átír egy információt, majd jön egy másik bot, és visszaírja.

A Wikipedia régóta használ botokat, hogy a szócikkeket ellenőrizze: ezek összevetik a fordításokat, javítják a helyesírási hibákat és törlik a trollkodásokat. Becslések szerint 2014-ben az összes szerkesztés 15 százalékát botok végezték az online enciklopédiában.

Az összes ilyen algoritmust a Wikipedia szerkesztői engedik be a rendszerbe, ezért ártó szándékú botok megjelenésre nincs esély. Yasseri mégis azt találta, hogy a botok néha konstans háborúba sodródnak egymással.

Ennek mérőszámát a szócikkek korábbi szerkesztett változataira történő visszaváltásból vette. Azaz megnézte, hogy egy-egy szócikk korábbi változatát hányszor állította vissza az adott felhasználó. Azt találta, hogy 10 éves időtartamon belül emberek átlagosan háromszor állítottak vissza egy szócikket korábbi verzióra. De a robotok sokkal aktívabbak voltak: tíz év alatt átlagosan 105 alkalommal tértek vissza a korábbi állapothoz.

Azaz az történik, hogy van egy csomó szócikk, ahol egy bot beállít egy javítást vagy változtatást, majd jön egy másik, ami visszavált a korábbi verzióra, mert nem ért egyet az új verzióval. Idővel megjelenik újra a változtatást eszközölő bot, és visszacsinálja az egészet. És ez így megy tovább.

Yasseri és kutatótársai szerint a magyarázat a Wikipedia kaotikus munkaszervezésében van: a szerkesztők által beállított botok között nincs központi koordináció, és ez vezet a félreértésekhez. A legtöbb botok közötti vitás eset a szócikkek különféle nyelvű változataiban lévő nyelvi eltérések miatt van: mivel az egyes szerkesztők más-más nyelvet beszélnek, az általuk elindított botok is néha eltérő nyelvi szabályokat követnek, és ahol nem ehhez hasonló megoldást találnak, korrigálnak.

Van is erős nyelvi eltérés a változtatások gyakorisága között: míg például a német nyelvű szócikkeket csak átlagosan 24 alkalommal állították vissza a korábbi verzióra, addig a portugál nyelvűeket 185 alkalommal. (Technology Review)