世界上不可能有比布爾代數運算更簡單的計算方式了,它只有“0”和“1”兩個數字組成。搜索引擎是世界上最復雜的系統之一,而其最重要文獻檢索卻不能離開最簡單的布爾代數運算!
布爾代數運算元素只有兩個:1(TURE,真)和0(FALSE,假)。基本的運算只有“與”(AND)、“或”(OR)、“非” (NOT)。在“與”(AND)運算中,當且只有兩個“1”(真)時,其結果才為“1”(真),即:1 and 1 =1 , 0 and 1 =0, 0 and 0 = 0。在“或”(OR)運算中,只要有一個為“1”時,其結果即為“1”,即:1 or 1 =1 ,0 or 1 = 1 , 0 or 0 = 0。在“非”(NOT)運算中,“1”取非后即為“0”,“0”取非后為“1”。
現在看看文獻檢索和布爾運算的關系。對于一個用戶輸入的關鍵詞,搜索引擎要判斷每篇文獻是否含有這個關鍵詞,如果一篇文章含有這個詞,我們就給這篇文獻一個邏輯詞——真(TRUE 或 1),否則,給這這篇文章一個邏輯詞——假(FALSE 或者 0)。
比如要找關于”原子能應用的文獻,但是不想知道如何制造原子彈。搜索引擎將從通過以下查詢語句 “原子能 AND 應用 AND (NOT 原子彈)”,表示符合要求的文獻必須同時滿足三個條件:包含原子能,包含應用,不包含原子彈。
一個文獻對應上面的每個條件都會得到一個TURE 或者 FALSE結果,根據上述真值表就能判斷每篇文獻是否是要找的。
布爾代數的主要作用是把連續的信息轉換成離散信息,從而能對這些信息進行深度處理。搜索引擎在文獻檢索中同樣應用了布爾代數的這個特征把一個個具體的句子拆分成可供參考分析的關鍵詞序列。