Son yıllarda popülerleşen “büyük veri” kavramı, tanımı ve uygulama alanları itibariyle henüz genel olarak kabul edilen bir kavramsallaştırma safhasına erişememiş durumda. Mevcut dijital jargonda, büyük veri üç ana süreç ekseninde tanımlanıyor: Geleneksel veri işleme tekniklerinin yetersiz kalacağı büyüklükte ve karmaşıklıkta (çoğunlukla gerçek zamanlı) veri; ekseriyetle insan ilişkileri, tercihleri ve davranışlarına ait bilgi içeren veri ve hem yapılandırılmış, hem de yapılandırılmamış (ham) veri. Bu denli büyük ve karmaşık insan odaklı veri gruplarının yeni teknik ve araçlarla işlenmesi, siyaset, uluslararası ilişkiler ve temsil konusunda çok büyük değişiklikler getirmekte. Bu değişikliklerin büyük bir bölümü toplum ve insan için faydalı olsa da (ekonomik ihtiyaçların tetkiki, sağlık/kamu hizmetleri, asayiş ve emniyet süreçleri v.b. gibi), büyük veri devriminin getirdiği bazı diğer yenilikler de olumsuz veya öngörülemez olmakta.
Günümüzde toplumlar, akıllı telefonlar, bilgisayarlar ve internet-bağlantılı araçlar üzerinden daha önce eşi benzeri görülmemiş büyüklük ve detayda dijital veri üretmektedir. Seçmen, sağlık, banka kayıtları, internet alışverişi gibi bir dizi dijital veri toplama platformunda sadece binlerce kişinin değil, bütün toplumların verileri kaydedilmekte, bu denli büyük verilerin işlenmesi ve depolanması da dijital meşrutiyet, egemenlik ve milliyetçilik gibi kavranılan siyasi tartışmaların merkezine oturtmaktadır. Örneğin Venezüela’da faal olan bir Fransız sigorta kuruluşu, sigorta sattığı kişilerin sağlık, adres, banka ve kişisel bilgilerini nerede depolamalıdır? Bu veriler Venezüela’da siber alanda çok iyi korunmayan ulusal veri işleme birimlerinde mi, Fransa’da daha iyi korunan, ama fiziksel olarak Venezüela’da bulunmayan depolama tesislerinde mi, yoksa üçüncü bir ülkede mi muhafaza edilmelidir? Şayet bu bilgiler üçüncü bir ülkede depolanacaksa, bu veriler hukuken Venezüela’nın mı, Fransa’nın mı, yoksa üçüncü ülkenin mülkiyetinde midir? Her ne kadar bu sorular hukuk soruları gibi dursa da aslında siyasi meşrutiyet-egemenlik ve küresel dijital diplomasi-istihbarat meseleleridir.
Akademik literatürde devam eden siyaset-büyük veri tartışması iki alanda gruplanmaktadır. Bu analitik gruptan ilki, büyük veri uygulamalarının sosyal ve siyasal sorunları ne şekilde çözebileceği ve vatandaşların dijital dünya üzerinden ne şekilde daha bilinçli, aktif ve verimli siyasal öznelere dönüşebileceğini kavramsallaştırmaktadır. Bu bağlamda büyük veri etiği, algoritmaların sosyal-siyasal değişimlere karşı nasıl daha hassas hale getirilebileceği gibi konular istatistiksel ve bilişimsel metotların öncelikli ilgi alanıdır. Büyük veri, enformasyon etiği ve dijital psikoloji gibi yeni gelişen alanlar da bu açıdan son derece önemlidir. Akademik literatürdeki ikinci önemli yaklaşım da bir özne olarak verinin kendisine dönük tartışmaları içerir: veri üretimi, işlemesi ve depolanması gibi konuların siyaset, diplomasi, psikoloji ve hukuk gibi alanlara etkileri bu bağlamda çalışılmaktadır. Aynı şekilde, “eleştirel algoritma çalışmaları” olarak yeni beliren bir alt çalışma disiplini de “objektif” olarak kabul edilen otomasyon ve programlama süreçlerindeki gizli önyargılar ve sübjektiviteler üzerine yoğunlaşmaktadır. Aynı şekilde “eleştirel makine öğrenmesi çalışmaları” (critical machine learning studies) da otomasyonun farklı süreçlerinin insan ve siyaset üzerindeki etkilerini kavramsallaştırır. Bu konuda DARPA’nın Celalabad projesi ve Black Sage Technologies’in hava alanlarının korunmasına dönük projeleri iki kısa ve önemli örnek olarak gösterilebilir.
ABD’nin Afganistan’da başlattığı “veri karşılığı bira” programı, büyük verinin stratejik ve askeri olarak ne şekilde kullanılabileceği konusunda önemli bir ilk vakadır. Amerikan İleri Savunma Araştırma Projeleri Ajansı (DARPA), 2009’da Afganistan’da kitle-kaynaklı (crowdsourced) bir istihbarat projesi başlattı. Bu projenin amacı bölgede faal olan ve her ülkeden gelen insani yardım çalışanları, özel güvenlik taşeronları ve inşaat firmaları işçilerinin, çalıştıkları bölgeyle ilgili insani, iktisadi ve operasyonel bilgileri tek bir internet kafede (Celalabad’dald Taj Mahal konukevi) toplamaları, bunun karşılığında da bedava birayla ödüllendirilmeleriydi. İlk başta tek tük toplanan veriler, birkaç ay içerisinde terabytelar dolusu görsel, video ve yazılı enformasyonla birlikte geniş bir büyük veri istihbarat platformuna dönmüştü. Bu büyüklükte bir veri akışı, Amerikan veya NATO ordularının kullandıkları Nexus 7 sisteminden bile daha büyük ve yerel bilgileri sisteme aktardığından, Amerikan ordusu da çok kısa bir süre sonra bu kitle kaynaklı açık istihbarat sistemine geçti. Artık yeni istihbarat rejiminde gizlilik değil, açıklık önemliydi ve enformasyonu bulmak kadar paylaşmak da istihbarata katma değer sağlayan bir faktördü.
Ancak kitle kaynaklı istihbarat sadece bir başlangıç noktasıydı. Büyük veri tartışmaları hızla makine öğrenmesi (machine learning) gelişmeleri eksenine girerek otomatik veri toplama, gerçek zamanlı veri işleme ve istihbarat içeren bilginin ne olduğuna dair kararın bilgisayarlar tarafından verilmesi gibi konuları içermeye başlamıştır. Örneğin Amerikan Black Sage Technologies şirketi, bir havaalanında bulunan 50 kameranın aynı anda yüz tanıma algoritmaları yoluyla, daha önce sisteme yüklenen Interpol veritabanında aranan kişileri bulabilecek yeterliliğe gelebileceği bir proje başlatmıştır. Aynı şirket, ABD’deki bütün havaalanlarını, eşzamanlı uydu tetkik sistemi yoluyla, tehlikeli mesafede yaklaşan insansız hava araçlarına karşı otomatik olarak uyarma ve koruma sistemini de test etmiştir. Her iki sistem de makine öğrenmesi yoluyla havaalanlarına karşı yapılabilecek terör saldırılarını öngörme, modelleme ve engelleme gibi konularda öncü kabul edilmektedir.
Bu gelişmeler gözetim, denetleme ve mahremiyet gibi konuları da ilgilendirmektedir. Privacy International örgütünün bir araştırmasına göre dünyada bugün 80 milyondan fazla izleme kamerası bulunmaktadır. Bu kameraların sadece %6’sı polis ve özel güvenlik elemanı gibi gerçek kişiler tarafından takip edilmekte, kameraların geri kalanı yalnızca kayıt almaktadır. Tartışmanın güvenlik tarafından gelen kişiler, bu kameraların ancak bir suç işlendikten sonra hukuki delil olarak kullanılabildiğini, ancak öngörü veya gerçek zamanlı suç engelleme konularında yetersiz kaldığını iddia etmektedir. Bu görüşe göre gözetleme kameraları makine öğrenmesi yoluyla suçu tanıyan ve güvenlik birimlerini uyaran bir merkezi otomasyon sistemine bağlanmalı ve bu yolla gerçek kişiler tarafından gözetlenmeyen kameralar da suç teşhis ve engellenmesine dönük kullanılmalıdır. Tartışmanın öbür tarafında ise mahremiyet konusu yer almaktadır. Suç engelleme isteği öne sürülerek kişisel bilgilerin ve davranışların gerçek zamanlı olarak analizi, mahremiyet konularına dönük bir dizi etik problemi de beraberinde getirmektedir. Bu problemlerin başında sürekli gözetim, kişisel bilgilerin korunması ve bu gözetim teknolojilerinin ne gibi bir hukuksal çerçeve içerisinde kullanılacağı gelmektedir.
Sonuç olarak büyük verinin siyasi boyutu, hâlâ büyük tartışmaların devam ettiği ve etik kurallarının sürekti tekrardan belirlendiği bir alan olmaya devam edecektir. Büyük veri, algoritma ve otomasyon konuları, öngörülebilir bir süre içerisinde son derece büyük tartışmalara ve sosyal değişimlere gebedir. Büyük veri gelişmelerini destekleyenler, yeni teknolojilerin, tarihte hiçbir zaman olmadığı kadar geniş ve detaylı sosyal veri üretmesi sebebiyle olumlu olduğunu ve toplumsal sorunların çözümünde bu verilerin çok önemli olduğunu önermeye devam edecektir. Bu teknolojik devrime karşı daha temkinli yaklaşanlarsa veri toplama süreçlerinin etik, mahremiyet ve hürriyetler ekseninde devam eden büyük sorunlarına dikkat çekmektedir. Her ne kadar büyük veri ve dijital teknolojiler dünya çapında tartışmaların ortasında yer alsa da, mevcut teknolojik devrim duraksamadan, daha da büyük bir hızla gelişerek mevcut siyasal ve toplumsal kabulleri temelinden değiştirecektir. Bu değişimlerin daha insan odaklı ve yapıcı gelişmesi için bilgisayar mühendisliği içerisinde yer alan programlama, otomasyon ve algoritma gibi konuların giderek daha fazla sosyal bitimler alanına kayması ve objektif olarak kabul edilegelen bu konuların, sosyokültürel sübjektivitelerinin daha net bir şekilde kavramsallaşması gerekmektedir.