全文搜索技術已經被廣泛應用,但對于使用圖片頁面的電子樣本卻無能為力--當前的搜索基本上只局限于電子樣本的名稱、目錄和關鍵字上。OCR技術的應用使電子樣本全文搜索成為可能。OCR(Optical Character Recognition ),光學字符識別的簡稱,簡言之就是用電子計算機自動辨別寫或印在紙(或其他介質)上的文字。電子樣本上的文字信息經過OCR技術處理后被記錄下來,這樣搜索結果就可以精確到以頁面為單位,而你不用再對著電子樣本一本一本從頭查到尾,這對于時間極其寶貴的工程行業人員來說絕對是一個福音。