Ana içeriğe atla

Fuzzy Hash Yöntemi Nedir? Nerelerde ve Ne İçin Kullanılır?

Bu makalemizde Hash algoritmalarının hukuk alanında kullanımını açıklamaya çalışacağım. Makaleye giriş yapmadan önce kısaca özetlemeye çalışırsak delil olarak alınmış bir elektronik belgenin üzerinde değişiklik yapılmamasını garanti etmek için kullanılan yöntemler Fuzzy Hash Yöntemi olarak adlandırılır. İsterseniz makalenin devamında biraz daha altyapı bilgisi ile birlikte konunun detayına inmeye çalışalım.



Hash algoritmaları kendilere girdi olarak verilen bir değeri işleyerek tekil bir değer üreten algoritmalardır. (Bu işlemin bilimsel adı cheksum'dır. Makalenin sonunda yer alan linkten konu ile ilgili bilgi sahibi olabilirsiniz)  

En temel anlamda birbirinden farklı dosyaların hash değerleri de farklı olacaktır. Bu farklılık tek bir byte bile olsa sağlanacaktır. Yani iki dosya arasında tek bir byte’lık bir fark bile varsa bu dosyalara ilişkin hash fonksiyonlarının çıktıları tamamen birbirinden farklı olacaktır. 

Adli bilişim incelemelerinde sıkça kullanılan bu hash fonksiyonlarının bazı durumlarda çözüme ulaşılması noktasında ihtiyacı karşılamadığını söyleyebiliriz. Örneğin birbirinin kopyası olan iki dokümandan birinde kullanıcı tarafından bu hash fonksiyonlarını bertaraf etmek adına çok ufak bir değişiklik yapılmışsa ve biz elimizdeki dokümanın bir kopyasının kullanıcının bilgisayarında olup olmadığını araştırıyorsak ne yapacağız?



Klasik hash fonksiyonları bu sorunun çözümünde yetersiz kalmaktadır. İşte bu noktada fuzzy hashing olarak adlandırılan yöntem devreye girmektedir.

Fuzzy hashing, iki dosya arasındaki benzerliği tespit etmek için kullanılır. Bu sayede üzerinde oynama yapılmış dokümanları yada bir dosyadan alınmış kısımları tespit etmek mümkündür. Fuzzy hashing için kullanılan algoritma “Context Triggered Piecewise Hashing (CTPH)” algoritmasıdır. Tipik hash fonksiyonları dosyayı bütün olarak işleme sokarken, fuzzy hashing işleminde dosya parçalara bölünerek işleme sokulur.

Ssdeep uygulaması , Piecewise Hashing algoritmasını kullanarak benzerlik oranını tespit etmek için kullanılır. Uygulamanın son sürümüne buradan ulaşılabilir. Dosyalar arasında benzerlik karşılaştırması yapmadan önce kaynak olarak kullanılacak dosyaların piecewise hash değerleri ssdeep ile çıkartılmalıdır. ssdeep ile kendi dosyalarınızın fuzzy hash değerlerini hespalayabileceğiniz gibi NIST tarafından oluşturulan ssdeep hash dosyasını da kullanabilirsiniz. NSRL tarafından oluşturulmuş ssdeep uyumlu hash setine buradan ulaşılabilir.

Konuyla alakalı olduğu için aşağıdaki iki makaleyi de mutlaka okumanızı tavsiye ediyorum:


Bu makalede Halil ÖZTÜRKCİ tarafından yazılan "Adli Bilişim İncelemelerinde Fuzzy Hashing Kullanımı" isimli makaleden faydalanılmıştır.

Yorumlar

Bu blogdaki popüler yayınlar

Azərbaycan Dilində Vurğu Qəbul Etmeyen Şekilçiler

Sözlərdə hecalardan birinin digərlərinə nisbətən daha qüvvətli deyilməsinə heca vurğusu deyilir. Üzərinə vurğu düşən hecaya isə vurğulu heca deyilir. Azərbaycan dilində vurğu adətən söz sonuna düşür. Söz şəkilçi qəbul ederkən vurğu adətən şəkilçinin üzərinə keçir. Məsələn: çiç ə k - çiçəkl ə r - çiçəklərd ə n məkt ə b - məktəbl i - məktəblil ə r - məktəblilərd ə n Buna baxmayaraq dilimizdə bir sıra şəkilçilər var ki onlar vurğu qebul etmirlər. Bu məqalədə Azərbaycan dilində vurğu qebul etməyən şəkilçilər incələnəcək ve bu şekilçilərin hansı hallarda vurğu qebul edib hansı hallarda vurğu qebul etmediyi araşdırılacaqdır. Eyni zamanda bildirmək istəyirəm ki vurğu ilə bağlı daha geniş və ətraflı məlumat üçün Azərbaycan Dilində Vurğunun Praktik Məsələləri adlı məqaləyə də nəzər yetirə bilərsiniz.  1. İsimlərdəki şəxs(xəbərlik) şəkilçiləri Məsələn: müəli'məm müəli'msən müəli'mdir müəli'mik müəli'msiniz müəli'mdirlər Qeyd: -dır4 ...

Ağaçlar Kireçle veya Badana İle Neden Boyanır?

Ağaçlar kireçle boyanmasının veya badana yapılmasının hem çevreye hem de doğaya, ağaçlara faydası var. Bu makalede bu geleneği enine boyuna tartışmaya çalıştık. Ağaca zarar veren mikrop ve bakterileri öldürür. Ağacı çok aşarı soğuk havalarda ve çok aşırı sıcak havalarda korur. Ağacın çürümesini ve kurtlanmasını önler. Ağacın gövdesinin alabileceği zararları en az düzeyde düşürmeyi sağlar. Hoş, güzel, hijyenik, temiz pırıl pırıl bir görüntü oluşturur. Ayrıca çok sıcak havalarda da ağacı yanmaya karşı korumak. En büyük etkisi soğuk havalarda ağacı don vurmalarına karşı korumak . Küresel ısınma göz önüne alındığında mevsim değişiklikleri ani don, ani ısı artışları ve azalışları sonucunun doğuracağı etkenler için yararlı etkin bir yöntem. Gövdeden obur dalların çıkmasını azaltmak için sürülür. Kireçleme ağaçları güneş yanığından korumak için yapılıyor. Ağaçlar da güneşten yanabiliyorlar. Bu arada odun dokudaki gözenekleri doldurarak kapattığı için, zararlıların yuv...

Medyan (Ortanca) Nedir? Nasıl Hesaplanır? Nerelerde Kullanılır?

Medyan işlemi olasılık hesaplamalarında sıkça kullanılan bir sayı dizisinin ortalamasını hesaplamak için alternatif yöntemlerden bir tanesidir. Ortanca medyan işleminin diğer adıdır. Matematiksel olarak medyan işlemi bir sayı dizisi küçükten büyüğe sıralayarak ortada kalan elemanı medyan değeri olarak belirleme işlemidir. Örnek verecek olursak: 2, 1, 5, 4, 5, 1, 2, 3, 5 serisi sıralanırsa 1, 1, 2, 2, 3, 4, 5, 5, 5 serisi elde edilir. Bu seri 9 elemanlı olduğundan ortadaki, yani 5. eleman (medyan) olacaktır. 5. eleman 3 sayısıdır. Yani ortanca değeri 3'dür Eleman sayısı tek sayı olan bir seride medyan değerin sırasının hesaplaması şu şekilde formüle edilir. Medyanın Sırası = (Eleman Sayısı + 1) / 2 Bu formülü yukarıdaki örneği uygulayacak olursak; Medyanın Sırası = (9 + 1) / 2 = 5 Veri serisi eleman sayısı bir çift sayı ise bu durumda serinin 2 medyanı olacaktır. Örneğin 2, 1, 5, 4, 5, 1, 2, 3, 5, 4 serisi sıralandığında 1, 1, 2, 2, 3, 4, 4, 5, 5, 5 s...