Unatkozol? Csináld meg a következő Google-t!

INTERNET
2015 április 22., 05:24

Megdöbbentő tény: a világ legnépszerűbb keresői, köztük a szinte egyeduralkodó Google, a Microsoft-féle Bing és a Yahoo-féle Yahoo az interneten elérhető tartalom mindössze 5 százalékában keresnek. A maradék 95 százalék, a deep web az átlagos internetező előtt örökre rejtve marad, pedig ott zajlanak csak az igazán különös dolgok: ember-, drog- és fegyverkereskedelem, prostitúció, zsoldosközvetítés, bérgyilkosbérlés és terrorista szervezkedés, hogy csak a legkülönösebbeket említsük.

Az amerikai bűnüldöző szervek viszonylag hamar rájöttek, hogy amire kíváncsiak, az jórészt ott van a neten, csak képtelenség megtalálni, mert hiába írják be a Google-be, hogy “bűnöző”, az istennek nem dobja ki, merre bujkálnak a legkörözöttebb mexikói drogbárók.

Az amerikai hadügyminisztérium kutatóintézete, a DARPA, aminek az internet ősét, az Arpanetet köszönhetjük, ezen a felismerésen felbuzdulva hozta létre 2014 elején a Memex nevű projektet: a cél egy olyan szuperkereső kifejlesztése, ami nemcsak a nyilvánosan elérhető, a Google és a többi ismert kereső által indexelt oldalakat találja meg, hanem a deep weben fellelhető adatokat is, amik az anonim Tor hálózaton érhetők el, és a Chrome, az Explorer vagy a Safari már a címükkel sem tud mit kezdeni.

photo_camera Ez még nem a Memex, ez a Grams, a tiltott dolgok keresője. Kell hozzá egy Tor browser, egy onion address (grams7enufi7jmdl.onion), és már működik is.

A DARPA nem egyedül állt neki az új szuperkereső létrehozásának, hanem olyan külső partnereket gyűjtött össze, akik kereséssel vagy azzal kapcsolatos technológiával foglalkoznak. Amikor a Wired idén februárban megkereste a Memex projekt vezetőjét, Dr. Chris White-ot, ő csak nyolc résztvevőt emlegetett, de a kilétüket nem volt hajlandó elárulni.

Ehhez képest múlt pénteken a DARPA nemcsak hogy nyilvánosságra hozta a Memex projektben közreműködők listáját (összesen 17-en vannak), hanem a Githubon nyílt forráskóddal közzé is tett több tucat olyan programot, amin a résztvevők dolgoznak. Kiderült, hogy a 10-20 millió dollárosra saccolt költésgvetésű Memex létrehozásában közreműködik több nagy amerikai egyetem (MIT, Carnegie Mellon, NYU, Stanford), a NASA és kisebb-nagyobb, a DARPA által ígéretesnek tartott ötleteken munkálkodó magáncégek is.

Az MIT Lincoln Labje például különböző természetesnyelv-felismerő szoftverekkel járul hozzá a Memexhez; a Carnegie Mellon programja neveket és címeket tud kiszedni hirdetésekből; a NASA Jet Propulsion Laboratoryjának négy programja, az Imagecat, a Facetspace a Legisgate és az Imagespace nagy mennyiségű kép és szöveg elemzésére és módosítására szolgál; az ArrayFire grafikus processzorok számítási kapacitásának bevetésével növeli a keresések sebességét.

A Memex-modulok közzétételének nyilvánvaló célja, hogy a fejlesztésbe bevonják a független programozókat, mert hogy több szem többet lát, illetve sok kicsi sokra megy. De a DARPA egyrészt nem hozta nyilvánosságra a Memex összes lehetséges modulját (a legtitkosabbak nyilván maradnak a műhelyben), másrészt az irányítás, a projekt összefogása továbbra is az intézet dolga: független programozó legyen a talpán, aki ezekből a részegységekből egyik napról a másikra összerak egy keresőt, ami ha nem is jobb, mint a Google, legalább valamennyire használható. Pedig a világ hálás lenne érte.

Ez lesz az új Google?

„Méretét tekintve a Memex olyan ambiciózus, hogy fel akarja rázni a beállt keresőpiacot, amit egy maroknyi vállalat, a Google, a Microsoft és a Yahoo irányít” – mondta a projektet vezető White a Forbesnak, korábban pedig a Wirednek azt nyilatkozta: „Elsősorban azt az internethez való univerzális hozzáállást igyekszünk célba venni, ami szerint a keresési eredmények a hirdetéseken és az oldalak osztályozásán alapulnak.”

Kétségtelen, hogy a Memex bűnüldözésben betöltött esetleges szerepe elhanyagolható ahhoz képest, hogy ha már az emberiségnek lett egy internetje, akkor lehetne végre egy normális keresője, aminek hozományaiból nemcsak a rendőrök, hanem a civilek is részesülhetnének – a Google ugyanis korántsem tökéletes. Nem csak azért, mert az interneten lévő adatok 95 százalékát figyelmen kívül hagyja, hanem mert működése egyáltalán nem átlátható, a találatokat a hirdetők és saját üzleti érdekei szerint rangsorolja, és nem ritka, hogy a konkurens termékeket, szolgáltatásokat vagy akár a cégre nézve kedvezőtlen híreket egyszerűen eltemeti. És még ez sem lenne akkora baj, ha nem lenne gyakorlatilag egyeduralkodó a piacon:

photo_camera Keresők világpiaci részesedése az elmúlt öt évben. A versenytársak ki se látszanak a Google alól. Forrás: Statista

Mivel a Google mostanra valódi versenytárs híján szinte közműként működik, mint a vízvezeték, az a helyzet állt elő, hogy mindig jön ugyan valami a csapból, de hogy mikor mi, és milyen elvek alapján, azt csak sejteni lehet. Ennek a helyzetnek a megváltoztatására tesz most kísérletet az Európai Bizottság, ami ötéves vizsgálat után jutott arra a nem túl meglepő megállapításra, miszerint a Google visszaél hatalamas piaci fölényével.

A gazdasági szereplőkre nézve bénító szabályozás és pereskedés helyett az USA-ban azt az utat választották, hogy a DARPA gyakorlatilag közpénzen, az üzleti és tudományos élet szereplőinek bevonásával épít egy keresőt, ami előbb-utóbb a Google konkurenciájává válhat.

És ha a DARPA-nak az internet alapjait sikerült letennie, még az sem kizárt, hogy az internetes keresés alapjait is le tudja tenni.

Kommentek

Közösségünk messze túlnyomó többségének jószándéka és minden moderációs igyekezetünk ellenére cikkeink alatt időről-időre a kollégáinkat durván sértő, bántó megjegyzések jelentek meg.
Hosszas mérlegelés és a lehetőségeink alapos vizsgálata után úgy döntöttünk, hogy a jövőben a közösségépítés más útjait támogatjuk, és a cikkek alatti kommentelés lehetőségét megszüntetjük. Közösség és Belső kör csomaggal rendelkező előfizetőinket továbbra is várjuk zárt Facebook csoportunkba, a Közértbe, ahol hozzászólhatnak a cikkeinkhez, és kérdezhetnek a szerzőinktől is.