Unatkozol? Csináld meg a következő Google-t!

INTERNET

Megdöbbentő tény: a világ legnépszerűbb keresői, köztük a szinte egyeduralkodó Google, a Microsoft-féle Bing és a Yahoo-féle Yahoo az interneten elérhető tartalom mindössze 5 százalékában keresnek. A maradék 95 százalék, a deep web az átlagos internetező előtt örökre rejtve marad, pedig ott zajlanak csak az igazán különös dolgok: ember-, drog- és fegyverkereskedelem, prostitúció, zsoldosközvetítés, bérgyilkosbérlés és terrorista szervezkedés, hogy csak a legkülönösebbeket említsük.

Az amerikai bűnüldöző szervek viszonylag hamar rájöttek, hogy amire kíváncsiak, az jórészt ott van a neten, csak képtelenség megtalálni, mert hiába írják be a Google-be, hogy “bűnöző”, az istennek nem dobja ki, merre bujkálnak a legkörözöttebb mexikói drogbárók.

Az amerikai hadügyminisztérium kutatóintézete, a DARPA, aminek az internet ősét, az Arpanetet köszönhetjük, ezen a felismerésen felbuzdulva hozta létre 2014 elején a Memex nevű projektet: a cél egy olyan szuperkereső kifejlesztése, ami nemcsak a nyilvánosan elérhető, a Google és a többi ismert kereső által indexelt oldalakat találja meg, hanem a deep weben fellelhető adatokat is, amik az anonim Tor hálózaton érhetők el, és a Chrome, az Explorer vagy a Safari már a címükkel sem tud mit kezdeni.

Ez még nem a Memex, ez a Grams, a tiltott dolgok keresője. Kell hozzá egy Tor browser, egy onion address (grams7enufi7jmdl.onion), és már működik is.

A DARPA nem egyedül állt neki az új szuperkereső létrehozásának, hanem olyan külső partnereket gyűjtött össze, akik kereséssel vagy azzal kapcsolatos technológiával foglalkoznak. Amikor a Wired idén februárban megkereste a Memex projekt vezetőjét, Dr. Chris White-ot, ő csak nyolc résztvevőt emlegetett, de a kilétüket nem volt hajlandó elárulni.

Ehhez képest múlt pénteken a DARPA nemcsak hogy nyilvánosságra hozta a Memex projektben közreműködők listáját (összesen 17-en vannak), hanem a Githubon nyílt forráskóddal közzé is tett több tucat olyan programot, amin a résztvevők dolgoznak. Kiderült, hogy a 10-20 millió dollárosra saccolt költésgvetésű Memex létrehozásában közreműködik több nagy amerikai egyetem (MIT, Carnegie Mellon, NYU, Stanford), a NASA és kisebb-nagyobb, a DARPA által ígéretesnek tartott ötleteken munkálkodó magáncégek is.

Az MIT Lincoln Labje például különböző természetesnyelv-felismerő szoftverekkel járul hozzá a Memexhez; a Carnegie Mellon programja neveket és címeket tud kiszedni hirdetésekből; a NASA Jet Propulsion Laboratoryjának négy programja, az Imagecat, a Facetspace a Legisgate és az Imagespace nagy mennyiségű kép és szöveg elemzésére és módosítására szolgál; az ArrayFire grafikus processzorok számítási kapacitásának bevetésével növeli a keresések sebességét.

A Memex-modulok közzétételének nyilvánvaló célja, hogy a fejlesztésbe bevonják a független programozókat, mert hogy több szem többet lát, illetve sok kicsi sokra megy. De a DARPA egyrészt nem hozta nyilvánosságra a Memex összes lehetséges modulját (a legtitkosabbak nyilván maradnak a műhelyben), másrészt az irányítás, a projekt összefogása továbbra is az intézet dolga: független programozó legyen a talpán, aki ezekből a részegységekből egyik napról a másikra összerak egy keresőt, ami ha nem is jobb, mint a Google, legalább valamennyire használható. Pedig a világ hálás lenne érte.

Ez lesz az új Google?

„Méretét tekintve a Memex olyan ambiciózus, hogy fel akarja rázni a beállt keresőpiacot, amit egy maroknyi vállalat, a Google, a Microsoft és a Yahoo irányít” – mondta a projektet vezető White a Forbesnak, korábban pedig a Wirednek azt nyilatkozta: „Elsősorban azt az internethez való univerzális hozzáállást igyekszünk célba venni, ami szerint a keresési eredmények a hirdetéseken és az oldalak osztályozásán alapulnak.”

Kétségtelen, hogy a Memex bűnüldözésben betöltött esetleges szerepe elhanyagolható ahhoz képest, hogy ha már az emberiségnek lett egy internetje, akkor lehetne végre egy normális keresője, aminek hozományaiból nemcsak a rendőrök, hanem a civilek is részesülhetnének – a Google ugyanis korántsem tökéletes. Nem csak azért, mert az interneten lévő adatok 95 százalékát figyelmen kívül hagyja, hanem mert működése egyáltalán nem átlátható, a találatokat a hirdetők és saját üzleti érdekei szerint rangsorolja, és nem ritka, hogy a konkurens termékeket, szolgáltatásokat vagy akár a cégre nézve kedvezőtlen híreket egyszerűen eltemeti. És még ez sem lenne akkora baj, ha nem lenne gyakorlatilag egyeduralkodó a piacon:

Keresők világpiaci részesedése az elmúlt öt évben. A versenytársak ki se látszanak a Google alól. Forrás: Statista

Mivel a Google mostanra valódi versenytárs híján szinte közműként működik, mint a vízvezeték, az a helyzet állt elő, hogy mindig jön ugyan valami a csapból, de hogy mikor mi, és milyen elvek alapján, azt csak sejteni lehet. Ennek a helyzetnek a megváltoztatására tesz most kísérletet az Európai Bizottság, ami ötéves vizsgálat után jutott arra a nem túl meglepő megállapításra, miszerint a Google visszaél hatalamas piaci fölényével.

A gazdasági szereplőkre nézve bénító szabályozás és pereskedés helyett az USA-ban azt az utat választották, hogy a DARPA gyakorlatilag közpénzen, az üzleti és tudományos élet szereplőinek bevonásával épít egy keresőt, ami előbb-utóbb a Google konkurenciájává válhat.

És ha a DARPA-nak az internet alapjait sikerült letennie, még az sem kizárt, hogy az internetes keresés alapjait is le tudja tenni.

Kapcsolódó cikkek