Ezt a 6 kérdést kell feltenned magadnak, amikor mesterséges intelligenciáról olvasol

Nemrég jelent meg a Rebooting AI című könyv, amiben a terület két vezetője arról ír, milyen lépések szükségesek ahhoz, hogy egy biztonságos mesterséges intelligenciát hozhassunk létre, ugyanis az AI-t körülvevő hype ellenére sokkal bonyolultabb olyan intelligenciát létrehozni, ami meghaladja az emberit, mint hinnénk.

A könyvből Quartz közölt egy rövid részletet, ami arról szól, hogy manapság olyan szintű habverés folyik az AI körül, hogy nem árt észnél lennünk, amikor a témában szenzációs hírek érkeznek, hiszen hetente jönnek fontos új felfedezések vagy figyelmeztetések arról, hogy mindjárt elveszítjük a munkánkat még okosabb gépekkel szemben.

Például a Newsweek és a CNN is lehozta tavaly, hogy a számítógépek már jobban olvasnak, mint az emberek, és ezzel milliók állása került veszélybe. Mindezt egy Miscrosoft-közleményre alapozták, ami egy apróbb előmenetelről számolt be egy közleményben, ami szerint egy AI ugyanolyan jól el tud olvasni egy dokumentumot és képes válaszolni az arról felmerült kérdésekre, mint egy ember.

Csakhogy ez forradalmibbnak hangzik annál, ami történt: egy algoritmus egy végtelenül egyszerű szöveget kapott, amiben a kérdésre adott válaszok mind szó szerint szerepeltek, és a teszt arról szólt, hogy a releváns szavakat ki tudja-e szúrni a gép, nem kellett értelmeznie a szöveget.

Vegyük például ezt a szöveget:

Sétálni ment két gyerek, Cecília és Antal. Mindketten láttak egy kutyát és egy fát. Antal egy macskát is látott, és rámutatott Cecília kedvéért. Cecília odament, és megsimogatta a macskát.

A Microsoft rendszerét úgy építették fel, hogy válaszoljon arra a kérdésre, hogy: „Ki ment el sétálni?” A válasz („Cecília és Antal”) ott szerepel leírva a szövegben. De ha mondjuk feltesszük azt az egyszerű kérdést, hogy Cecília észrevette-e a macskát (amire a válasz igen, hiszen enélkül nem tudott volna odamenni megsimogatni), akkor a gép nem tudja a választ, hiszen nincsen leírva a szövegben. A le nem írt dolgokra való következtetés alapvető fontosságú az olvasásban, és ezt még nem tesztelték. Ezt sem a Microsoft, sem a Newsweek, sem a CNN nem tisztázta.

Szinte mindig, amikor egy technológiai óriáscég közleményt ad ki, hasonló jelenségről van szó, egy apróbb lépésről, amit forradalomként adnak el. Két éve például a Facebook csinált egy programot, ami el tudott olvasni egy 5 soros összefoglalót a Gyűrűk urából, és arról szóló egyszerű kérdésekre, hogy ki vagy mi hol van, választ tudott adni (“Meddig jutott el Frodó? A Végzet Hegyéig.”). Erről is nagyon lelkes cikkek születtek, mondván: fantasyirodalmat olvasva tanulnak meg olvasni az AI-k. (Nem.)

Az ilyen túlzó jelentések miatt viszont sokan azt érezhetik, hogy a ténylegesnél sokkal közelebb vagyunk a mesterséges intelligenciához. Amikor pedig az elvárások túl nagyra nőnek, és sokáig nem váltják be a hozzájuk fűzött reményeket, akkor elfogyhat az érdeklődés az AI iránt, vagyis beköszönthet az AI-tél, ami hosszú évekig tartó stagnálást jelent.

Úgyhogy érdemes minden új felfedezésről szóló hírt egészséges szkepticizmussal kezelni. Nem árthat mindig feltenni és megválaszolni ezt a 6 kérdést, ha nem akarjuk, hogy hülyére vegyenek:

1. A retorikát félretéve, mit tett az adott esetben a gyakorlatban az AI?

Például tényleg olvasott az „olvasórendszer”, vagy csak kiemelte a releváns szövegrészeket?

2. Mennyire általános az eredmény?

Például az állítólagos olvasási feladat az olvasás minden aspektusát méri, vagy azoknak csak egy apró részét? Ha regényen gyakorolt, el tudja olvasni a híreket is?

3. Van egy bemutató, ahol ki tudom próbálni a saját példáimmal?

Ha nem, akkor máris felmerülhetnek kérdések azzal kapcsolatban, mennyire erős az eredmény.

4. Ha a kutatók vagy sajtósaik azt állítják, hogy az új AI-rendszer jobb, mint az emberek, akkor milyen emberekről van szó, és mennyivel jobb náluk?

A bérüket olvasásért kapó egyetemi professzorokkal hasonlították össze a gépet, vagy unatkozó munkásokkal, akik a minimálbér alatt keresnek?

5. Egy adott feladat elvégzése valójában mennyire vitt közelebb egy valódi AI építéséhez?

Lehet használni bármi értelmesre, vagy csak egy tudományos gyakorlat volt?

6. Mennyire erős, életképes a rendszer?

Működhet-e ugyanilyen jól más adatkészletekkel anélkül, hogy lényegesen át kellene írni? Például egy önvezető autó, amit nappali viszonyokra képeztek ki, képes lenne-e éjszaka vagy hóban közlekedni, vagy olyan útvonalon, ami nem szerepelt a térképén?