Google Katili >> DARPA‬’dan internetin derinliklerini arayacak arama motoru Memex

memex-deep-web-search-engine

Google arama ve reklam dünyasının büyük gücü, ama ABD ordusunun araştırma kolu DARPA karanlık web’i taramak için geliştirdiği Memex arama motorunu Nisan ayında açık kaynak olarak kullanıma sundu. Google’dan daha gelişmiş bir arama motoru olan Memex uyuşturucu kaçakçılarını, teröristleri ve çocuk pornosu sitelerini gözetlemek için tasarlandı.

Henüz geliştirme aşamasında olan Memex sokaktaki vatandaşın ve genel internetin gözetlenmesine de yarıyor. Anlaşılan ABD ordusu ile NSA, 2008’den beri kullandıkları gözetleme teknolojilerini bizi daha iyi gözetlemeleri için özel şirketlere devrediyor. Peki Memex, Google’ı işsiz bırakabilir mi?

 

 

memex-darpa-darknet-620x445Karanlık web arama motoru

ABD İleri Savunma Araştırmaları Projeler Dairesi (DARPA), derin web’deki suçluları araştırmak için geliştirdiği karanlık web arama motoru Memex’i açık kaynak kod olarak özel sektörün hizmetine sundu. Memex, Google’dan daha gelişmiş bir arama motoru ve daha kompleks algoritmalar kullanıyor.

Geliştirme aşaması tamamlandıktan sonra avukatlık firmaları, mali müşavirler, detektiflik büroları ve hatta beyaz eşya markaları suçluları bulmak veya vatandaşı internetten gözetleyerek büyük veri ile rekabet gücünü artırmak için Memex’i kullanacaklar.

 

 

New-search-engine-“Memex”-will-expose-the-Dark-Web-Wagennews-Advanced-Research-Projects-Agency-DARPA-memex-search-engine-Dark-Web-child-pornography-drug-deals-Cyber-crime-human-traffickingNSA’den yeni gözetleme teknolojileri

Google son zamanlarda unutulma hakkına saygı göstermesi açısından Avrupa Birliği tarafından soruşturuluyor. Buna ek olarak Google’ın Avrupa’da bant genişliğinin büyük kısmını kullanması nedeniyle telekom şirketleri ile medya kuruluşları Google’a kendilerine online reklamlar üzerinden kâr payı ödemesi için baskı yapıyor.

Öte yandan Facebook da yayıncıların haberlerini kendi sitesinde barındırma uygulaması Instant Articles, beacon hizmeti Place Tips, uygulama içi açılan mobil web sayfaları, Youtube linklerinin zaman tünelinde kısıtlanması ve son olarak da e-ticarete yönelik yeni satın alma düğmesiyle Google’a rakip oldu.

Şimdi de Memex geldi ve uzmanlar, şirketlerin Google Analytics yerine açık kaynak kodlu Memex’e yönelerek Google arama motorunu kullanmaktan vazgeçip geçmeyeceğini merak ediyor.

 

 

darpa-releases-memex-to-surf-dark-web-google-yahoo-bingNeden Memex?

Bugüne kadar devletler vatandaşa, “Güvenli bir toplum yaratmak ve sizi suçlulardan korumak için özel hayatınızı gözetlememize kızmayın” dedi. Ancak, vatandaşı gözetleyip mahremiyet verilerini siyasi ve ekonomik çıkarlar için kullanmak devletlerle şirketlere her zaman tatlı geldi. Memex’in de interneti daha iyi gözetlemek amacıyla geliştirilen yeni bir araç olarak görebiliriz.

Ancak bu konuya safça bakmak olur. Memex her ne kadar kötüye kullanılabilecek bir arama motoru olsa da yurttaşların güvenliğini sağlamak için güvenlik güçlerine yardım ediyor. Memex’i kullanarak karanlık webi, derin webi gözetlemek ve uyuşturucu kaçakçılarını yakalamak mümkün.

 

 

Kötü yanına gelince

Derin web’i yalnızca suçlular kullanmıyor. VPN, I2P, Tor ve Freenet gibi hizmetleri devletler ve şirketler tarafından gözetlenmek isteyemeyen vatandaşlar da kullanıyor. Memex onları da gözetlemeye yarıyor.

Bu noktada derin web’in ne olduğuna da kısaca değinelim: Derin web Google, Yandex, Bing gibi arama motorları tarafından endekslenmeyen web sitelerinden oluşuyor. Bunun asıl sebebi ise Google’ın çocukları suçlulardan korumak istemesi filan değil. Asıl sebebi derin webdeki web sitelerini endekslemenin Google’a para kazandırmaması.

Sonuç olarak arama motorları bu siteleri endekslemiyor ve biz de söz konusu siteleri Google’ı kullanarak bulamıyoruz. Bu sitelerden oluşan internet ağına derin web, karanlık web denmesinin sebebi bu.

 

 

imagesPolisler, askerler ve ajanlar Memex’i sevdi

Güvenlik güçleri ve istihbarat kurumları şimdiden açık kaynak kodlu karanlık web arama motoru Memex’e büyük ilgi gösteriyor. Anlaşılan Memex hem adli suçlar dünyasında hem de iş dünyasında ünlü olacak.

Memex algoritmaları Google gibi bir dünya devine nasıl rakip olabilir derseniz bunu Memex’in iş ortakları ekibini yöneten Christopher White söylesin. Ancak White’a geçmeden önce, vatandaşın nasıl gözetleneceği açısından olayın boyutlarını görmek için Memex iş ortaklarına bakalım.

 

Memex’i geliştiren yazılımcılar arasında Tor Projesi’ni geliştiren uzmanlar, üniversite profesörleri, NASA ve özel araştırma firmaları var. Ben de bu yüzden Memex öcü değil diyorum, ama şirketlerin suçlular bahanesiyle sol gösterip sağ vuracağından ve Memex’le vatandaşı gözetleyeceğinden eminim.

Christopher White, Memex’in çok iddialı bir proje olduğunu söylüyor; amacımız Google, Microsoft, Yahoo, Yandex ve Baidu gibi bir avuç şirket tarafından kontrol edilen web arama sektörünü ele geçirmek diyor.

 

 

google_lupaGoogle’dan farkı ne?

Memex öncelikle internette siteleri ve sayfaları değil, kişileri arıyor. Müşteri davranışını izleyen pazarlama kampanyaları gibi Memex de kullanıcıların internetteki davranışlarını izliyor. Bu açıdan Google Analytics ile Google arama motorunun özelliklerini içeren tek bir entegre yazılım kullanıyor.

Karanlık web’de kullanıcılar gerçek adını kullanmadan dolaştığı için Memex’in web siteleri yerine kullanıcı davranışına odaklanarak gizli kullanıcıları açığa çıkarması gerekiyor.

 

 

aüütKişisel arama motoru

DARPA program müdürü Christopher White konuyla ilgili açıklamasında şunları söyledi: “Memex bugün genel kullanımda olan teknolojilerden çok daha gelişmiş online arama yazılımları tasarlamayı amaçlıyor. Amacımız enformasyona ulaşmak ve bilgiyi paylaşmak için daha iyi yöntemler geliştirmek. Böylece kullanıcılar ilgi alanlarına yönelik bilgileri daha iyi arayabilecekler.”

Aslında bütün bilgi teknolojileri şirketleri kariyerlerinin doruğunda bu şekilde davranıyor ve piyasanın kontrolünü ele geçiriyor. Örneğin bir zamanlar internet ile şirket hayatını IBM ve Microsof olmadan düşünemezdik. Bu iki şirketin geliştirdiği bireysel ve kurumsal teknolojiler bilgisayar dünyasının ayrılmaz parçasını oluşturuyordu. Şimdi arama devi Google ve sosyal ağ devi Facebook aynı konumda.

 

 

bing-logo-with-google-colors-question-markYıkıcı teknolojiler

Bu tür şirketler yerini rakiplerine kolayca teslim etmezler, çünkü bu kuruluşlar rakiplerine teslim olmayacak kadar büyüktür. Ancak pazar şartları değişebilir, dünya şartları değişebilir ve halıyı ayaklarının altından çekerler. Yeni bir teknoloji gelişip oyunun kuralları değiştiğinde başımıza gelecek olan budur.

Linux ve Microsoft rekabetini düşünelim: Her yıl Linux kullanıcıları Linux bu yıl Windows’u geçecek dediler ama olmadı. Örneğin Türkiye’nin 2004’te bir Pardus projesi vardı. Linux türevi bu işletim sistemi sayesinde ABD, Türk ordusunu ve devlet dairelerini kolayca gözetleyemeyecekti; ama politikacılarla arası iyi olan Microsoft kamu sektörüne toplu Windows satışı yaparak projeyi engelledi.

Peki ne oldu? Bu kez mobil dünya geldi ve iPhone, iOS, Android çıktı. Masaüstü sistemler mobile teslim oldu. Pazar şartları değişince klasik Windows geriledi. Şimdi Microsoft mobilde ve masaüstünde aynı kullanıcı deneyimini sunan çok platformlu yeni Windows 10 ile eski gücünü kazanmaya çalışıyor.

 

 

aeüçaAynı şey Google’ın başına gelir mi?

Google Batı dünyasının arama motoru kralı. Çin’de Baidu var ve Google bu pazara girmek için çok uğraştı ama Çin, Google’a teslim olmanın ülkeyi Amerika’ya teslim etmek olduğunu biliyordu. Bu yüzden interneti sansürledi, siber saldırılar düzenledi ve sonuçta Google’ı engelledi. Elbette bu Google’ın Batı dünyasında arama motoru lideri olmasını engellemedi.

Ancak, Memex yıkıcı bir teknoloji getirerek arama motoru pazarının şartlarını değiştirebilir. Nasıl olur bu? Örneğin web’de siteleri değil, anahtar kelimeleri değil, resimleri değil de kişileri, davranışları ve bağlamları arayan bir kişisel arama motoru tasarlayarak:

 

 

İstihbarat dünyasının gözetleme teknolojilerini Siri veya Viv gibi bir dijital asistanla birleştirerek ortaya yeni bir süper Cortana çıkardığınızı düşünün. İşte o zaman Facebook ve AB’nin sıkıştırmasıyla görünüşte sarsıntı geçiren ama aslında pazarı paylaşmak için Microsoft, Facebook ve NSA ile çoktan anlaşmış olan Google’ı sarsabilirsiniz.

Tabii burada Google’ın bütün bu yazdıklarımı en az iki yıl önceden görecek istihbarat kaynaklarına sahip olduğunu unutmamak gerekiyor. Çok kızarsa parası bol; Facebook’un Whatsapp’i satın alması gibi rakip startupları birkaç milyar dolara satın alır ve işi bitirir.

 

 

nnwz1dgzwl1tpwtp3mgvYalnız bu kez durum farklı

Farklı çünkü bir devlet kurumu olan DARPA, Google’dan daha gelişmiş bir arama motoru tasarladı ve Memex’i açık kaynak kod olarak kullanıma sundu. Sonuçta Google, Amerika Birleşik Devletleri’nin toplam gücünün yanında küçük kalır. Tıpkı ABD’nin dünyanın en büyük 130 ailesinin kısmen güdümünde olması gibi.

Demek istediğim, yeni değişim ABD’nin devlet kurumu DARPA tarafından yönlendiriliyor. Karanlık web’in insan gözetlemeyi zorlaştırdığını anlayan ve dünyadaki en değerli şeyin istihbarat olduğunu iyi bilen ABD piyasayı canlandırmak için Memex’i kullanıma soktu.

 

 

darpa-builds-memex-deep-web-search-engine-to-track-sex-traffickersGoogle’ın büyük hatası?

Google özünde bir online ve mobil reklamcılık şirketi. Arama motoru sektörünü hep vatandaşı reklam göstermek için gözetlemek olarak gördü. Elindeki büyük veriyi, NSA’in zorla el koyması hariç, başka şeyler için pek kullanmadı. Bu konuda asıl Facebook atılgan çıktı, satın alma düğmesi ve instant articles ile ciddi atılımlar yaptı.

Google arama motoru insanlara reklam göstermek üzere tasarlandığı için kullanıma girdiği yıldan bu yana öncelikle web sitelerini aramaya yarıyor. Örneğin, Google Analytics anonim TOR kullanıcılarını internette takip etmeye uygun değil. Ne Google, ne Bing, ne de Yandex gerçek bir kişisel arama motoru değil. Bunlar global online reklam kanalları.

İşte bu zihniyet günümüzün VPN, TOR, I2P, Safe Network dünyasında istihbarat toplamaya ve Batı devletlerinin rekabet gücünü artırmaya yetmeyebilir. Amerika baktı ki Google pazar lideri olarak uykuya dalmış görünüyor, işleri yolunda ve yeni alanlara sadece şöyle bir göz atmak için yatırım yapıyor; en büyük tutkusu ise millete balonla internet yayını yapıp medya tekeli olmak, “Memex’i şirketlere açayım da Google, Bing ile Yahoo biraz rekabet görsün” dedi.

 

 

dark-web-5Memex şifreli arama yapıyor

Memex, Tor ve I2P gibi karanlık web sitelerinde, anonim ve şifreli ağlarda arama yapabiliyor. Derin web denilen ve internetin yüzde 70’şini oluşturan bu sitelere Google’da adını yazarak ulaşamazsanız. Bu sitelerin linklerini sıradan sayfalarda bulamazsınız.

İnternet çağında bile kast sisteminin nasıl çalıştığını görebiliyoruz: Karanlık web’e girmenin yolunu bilmiyorsanız TOR kullanarak bile gizli sitelere ulaşamıyorsunuz. Önünüzde görünmez bir duvar olduğunu ve bu duvarı nasıl aşacağınızı bilmediğinizi düşünün.

Sıradan bir kullanıcı için TOR da böyle. TOR da anonim Google arama motoru olan Startpage’i kullanıyor. Bu arama motoru, arayanın kimliğini açık etmeden Google’da arama yaptığını söylüyor (inanırsanız).

 

 

privacy-lockNeden karanlık?

Yukarıda belirttiğimiz gibi derin web’in Google’da endekslenmemesinin sebebi, karanlık web’in sihirli bir teknoloji kullanarak Google’ın örümceklerini engellemesi değil. Google ticari bir şirket olarak bu siteleri endekslemeyi kârlı görmüyor o kadar.

Google’ı da suçlamamak lazım: Kim uyuşturucu kaçakçısı sitesine online tost makinesi reklamı vermek ister? Öyleyse Google sunucularında bu sitelere neden yer ayırsın?

 

 

online-privacy-united-states-of-surveillanceSıradan kullanıcıya Google yeter

Ben de sıradan kullanıcıyım. Öyle TOR’a girip bugün hangi ülkede ihtilal yapayım diye gizli planlar yapmıyorum. TOR kullanıcılarının çok büyük bir kısmı da sıradan kullanıcı. Onlar da suç işlemek için TOR’a girmiyor. Sadece gözetlenmemek için TOR kullanıyor. Bu yüzden normal web bize yetiyor.

Öte yandan, Memex suçluları bulmak için de tasarlandığı için sadece alan adlarına odaklanan standart web araması kullanmıyor. Memex’in şu andaki amacı reklam göstermek değil, uyuşturucu kaçakçılarını yakalamak.

Elbette gelecekte dijital asistanlar bizi bizden iyi tanımak için karanlık web’de ve normal web’de doğrudan kullanıcı davranışlarını izleyerek kişisel arama da yapacak. O zaman Memex teknolojisinden yararlanacak. Yine de…

 

 

Memex-Darpa…Memex kısmen gizli kod

Çünkü Memex’in çekirdek kodu ticari sır. Sistem tümüyle açık kaynak kod olarak sunulmadı ve bu açıdan biraz da Android’e benziyor ve biz de Memex’in tam olarak neler yapabildiğini bilmiyoruz.

Ayrıca Memex projesinin özel sektör ve kamu sektöründen istihbarat örgütlerine kadar 17 iş ortağı var. Bunlar önümüzdeki 2 yıl boyunca ne geliştirecekler ve ne kadarını halka açıklayacaklar belli değil.

 

 

nextgov-mediumAncak bir şey kesin: MaidSafe şirketi internette sunucu, istemci ve IP adresi kullanmayan, üstelik kişisel dosyaları o dosyalardaki bilgilerle şifreleyerek dünyadaki milyonlarca akıllı telefon kullanıcısına binlerce dosya parçacığı halinde rastgele dağıtan Safe Network teknolojisini geliştiriyor.

Meshnet’in ardılı olan bu projeyi NSA’in bile gözetlemesi imkansız. Dolayısıyla bizi gözetlemek için Memex gibi kullanıcı davranışını izleyen ve anonim şahısları internette teşhis eden arama motorları gerekiyor. İşte Memex’in hedeflerinden biri bu.

 

 

Memex’in açıklanan teknik özellikleri

Kişisel arama motorundaki yazılımları geliştiren ekiplerden biri olan Hyperion Gray, DARPA’nın Open Catalog linkinde bulunan Memex’in teknik özelliklerini kısaca şöyle açıklıyor:

  • Yapay zeka kullanan gelişmiş arama ve tarama teknolojileri.
  • Bilgisayar öğrenme teknolojisi.
  • İnternetteki tüm içeriği otomatik olarak çekme.

“Yakın gelecekte sistemimiz robot stajyerler gibi çalışacak ve siz kedi videoları izlemek gibi önemli işlerle uğraşırken web’de aradıklarınızı bulacak. Biz de Aralık ayında yeni bileşenler kullanıma sunacağız ve Memex’i daha detaylı açıklamak üzere bir genel amaçlı teknoloji sunumu yapacağız.”

 

 

privacyAynası iştir kişinin, lafa bakılmaz

Memex’in gerçekten neler yapabileceğini anlamak için biraz da iş ortaklarına bakalım. Bu projeye 17 kuruluş, 40 farklı yazılım aracıyla destek veriyor. Bunların arasındaki başlıca şirketler ve çalışma gruplarını şöyle sayabiliriz:

Diffeo (Cambridge, Massachusetts), Dossier Stack adlı bir bilgisayar öğrenme projesi başlattı. Dossier Stack akıllı bir yazılım olarak kendi kendini eğitiyor ve kullanıcıların davranışlarını izleyerek onlar hakkında gerçek veriler toplamayı öğreniyor. Ardından akıllı arama uygulamaları için kitaplık bileşenleri üretiyor.

 

 

peplamb-privacy-300x199Hyperion Gray (Arlington, Virginia), veri toplamayla ilgili yedi proje geliştirdi ve bunların arasında insanların web’de nasıl davrandığını taklit eden Source Pin aracı var. Source Pin kullanıcıların özellikle ilgilendiği web sitelerini arayıp bulmakta uzmanlaşıyor. Örneğin ben arama kutusuna bilim yazsam, astronomiye meraklı olduğum için önce uzay sitelerini gösterecek. Google gibi bilim kelimesinin geçtiği en popüler siteleri göstermeyecek (Memex’in en önemli farkı).

Source Pin’in diğer özelliği sıradan kullanıcıları veri tarama uzmanı yapması. Çünkü elle bir şey yazdığınız zaman sanki gelişmiş arama yapmışsınız gibi size kişiselleştirilmiş arama sonuçları gösteriyor. Örneğin teknoloji editörü olarak işim internette aradığımı hızlı bulmak. Memex elimin altında olsa uçarım (bu sistem gelecekte Viv gibi akıllı dijital asistanlara eklenecek).

 

 

online-privacy-google-surveillanceMIT Lincoln Laboratuarı, Text.jl doğal dil işleme aracını geliştirdi. Text.jl, Julia dili için optimize edilen metin işleme süreçlerine uygun çok sayıda araç sağlıyor. Bunların arasında özellik çıkarma, metin sınıflandırma ve dil tanıma gibi algoritmalar var (örneğin Türkçe tencere ara diyeceksiniz, İngilizce tencere arayacak veya ev robotuna yemek yapmayı öğren diyeceksiniz, o da özel programlama gerektirmeden size bakıp yemek yapmayı öğrenecek. Doğal dili anlamak bu).

Stanford Üniversitesi, DeepDive altyapı aracını geliştirdi. DeepDive, alan adı bilgileri toplayan ve daha iyi büyük veri analizi yapmak için kullanıcı geribildirimlerine bakarak kendi kendini eğiten bir bilgisayar öğrenme sistemi. DeepDive bulanık bilgiden net sonuçlar çıkarıyor (20 yıl sonra Türkiye üzerinde bugün oynanan oyunları çözmek o kadar kolay olacak ki! Örneğin şu bombalı saldırının amacı ne diyeceksiniz, sistem sizin için en gerçekçi komplo teorisini üretecek, tabii yalan söylemezse. :p).

 

 

online-privacy-google-big-brotherSRI International (Menlo Park, California), kâr amaçlı olmayan bir araştırma enstitüsü ve ABD’nin dünyanın teknoloji lideri olmayı nasıl başardığını göstermek açısından iyi bir örnek. Biz devlet eliyle şirket batırırken, Stanford Üniversitesi mütevelli heyeti tarafından 1946 yılında kurulan SRI International, 2007 yılında Siri Inc iştirakini kurdu. Apple, Siri’yi 2010’da satın aldı ve dünyanın ilk dijital asistanı Siri’yi 2011 yılında duyurdu. Ardından eski Siri çalışanları Viv adlı yeni bir dijital asistan geliştirmeye başladı.

SRI International iki altyapı aracı geliştirdi. Bunlardan biri kuruluş aşamasında ABD Deniz Kuvvetleri, DARPA ve diğer şirketlerin desteğini alan TOR Project ile ortak geliştirilen HSProbe.

HSProbe aracı TOR’un .onion adresli gizli servislerinin önceden belirlenen aralıklardaki bağlantı noktalarından birini dinleyip dinlemediğine bakıyor (örneğin NSA şu TOR düğümü terörist hücre derse sistemin kırmızı bayrakla işaretlediği düğümü kullananları karanlık web’de buluyor). Ayrıca bağlantı noktalarının hangi iletişim protokolleriyle anlaştığına da bakıyor.

 

 

Geleceğe bakış

Şahsen Memex’i Google Mühendislik Direktörü Ray Kurtzweil’ın öncülüğünü yaptığı teknolojik tekilliğin ayak sesleri olarak görüyorum. Bu konuda iş dünyasından (!) somut bir örnek de verebilirim.

Memex’i kullananlardan biri Manhattan bölge savcısı Cyrus Vance Jr. ve genç savcı diyor ki “Memex soruşturma araçlarımızın önemli bir parçası oldu. Ona steroitli Google da diyebiliriz.”

Not: Bu yazı Türkiye’de özgür internet, kişi hakları, dijital haklar, mahremiyet ve özel hayatın gizliliği için önemli mücadeleler veren değerli sanat felsefesi hocam Dr. Özgür Uçkan’ın anısına adanmıştır. Kendisini vakitsiz bir zamanda kaybettik.

Add a Comment

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir