作者:黃玫瑋 / 計算機及資訊網路中心程式設計組副理
想迅速打造專屬於您自己的搜尋引擎嗎?Google自訂搜尋功能可免費客製化您的需求,不僅提供更精確多元的搜尋結果,亦提供圖片搜尋、熱門關鍵字與統計管理等進階功能。您還在等甚麼,立即幫自己的網站訂作一個吧!
從目錄到搜尋
在網站剛興起的年代,可以放在網站的資料並不多。網站管理者可以自己將資料依特性加以分類、建立階層式目錄來提供訪客使用。這種目錄通常只提供網站本身資料的分類與連結,卻查不到其它網站的資料。
對於跨網站尋找資料的需求日增,Yahoo、Google等網路服務先驅們提出了解決之道,他們將所有網站的資料加以整理分類,產生了聯合目錄服務的應用,例如:Yahoo Directory(dir.yahoo.com)Google Directory(已經在2011年中止服務)等目錄網站。
這種資料提供方式,使用者首先遇到的問題是:想找的資料到底屬於哪一類?對於埋藏在目錄深處的資料,使用者還得從分類階層下的目錄反覆猜測尋找下去。如果網站管理者或目錄服務提供者分類方式和網站的訪客的分類模式有很大的差別的話,使用者花很多時間也不一定可以找到那份存放目錄結構某處的資料。
當然後續的演變大家都很清楚:搜尋引擎取代了一切。接著搜尋霸主Google幾乎變成了所有人的搜尋引擎。假設我們所感興趣的是「臺灣大學」這個主題,現在,我們再也不會從「分類首頁/教育單位/大學院校/公立大學/臺灣大學」找到「臺灣大學」(Figure 1),而是從搜尋列直接輸入「臺灣大學」,取得「臺灣大學」的相關資料。
Figure 1 Yahoo 分類目錄
使用者愛用「搜尋」勝於「目錄」的演變,回過頭來再影響到各個網站的設計:網站管理者不約而同地在自己網站上加了個搜尋的控制項。當然我們不希望這個搜尋功能查回來的資料都沒有自己網站的資料,客製化搜尋引擎變成大家共通的需求,提供訪客搜尋自己的網站的資料。
自訂搜尋的服務建置方式,除了採購商業軟體或下載免費軟體Lucene等安裝在自己的伺服器之外,也可以用Google 或Microsoft提供的雲端搜尋服務。自行建置除了要採購相關軟硬體、看懂安裝文件之外,搜尋引擎常常會耗掉不少運算資源與儲存空間,幾年下來還會有吃掉伺服器運算時間或爆掉硬碟空間的問題。
如果要真的省事,筆者建議還是利用免費、免安裝、免維護的自訂搜尋功能。當然除了Google 有提供自訂搜尋(CSE: Custom Search Engine)的功能(Figure 2)之外,Microsoft Bing 也有相對的服務。限於篇幅,Microsoft Bing的部分就請讀者自行參考了。
Figure 2 Google搜尋引擎
利用Google CSE自訂搜尋
請先登入Google,並請在網址列輸入http://www.google.com/cse/,以連線到Google 自訂搜尋(CSE: Custome Search Engine)。在這個網頁(Figure 3)點選「建立自訂搜尋引擎」的按鍵,就可以新增一個自訂搜尋引擎;完成新的搜尋引擎設定後,可以再回來修改,這時就是點選下方的「管理您現有的搜尋引擎」。
Figure 3 新增或管理現有搜尋引擎
設定您的搜尋引擎
(Figure 4 )這一頁設定(姓名)及(說明)的翻譯與管理頁有點出入,(姓名)指的是搜尋引擎名稱,(說明)指的是搜尋引擎說明。請輸入搜尋引擎名稱(姓名)、搜尋引擎說明(說明)、語言以及要搜尋的網站後,並勾選同意服務條款,要注意的是要選擇標準版。接下來就可以選擇樣式並試用你的搜尋引擎(Figure 5 試用 )。不過這個時候的搜尋結果是包含廣告的(Figure 8 )。
Figure 4 設定您的搜尋引擎
Figure 5 試用
Figure 6 管理搜尋引擎
Google CSE自訂搜尋版本
Google 自訂搜尋服務主要有兩個版本:標準版跟Site Search。標準版不用付費,但會在搜尋結果頁顯示廣告;Site Search 則是依照搜尋量收費,但不會出現任何廣告。雖然標準版預設顯示廣告,但還是可以透過設定隱藏廣告(Figure 7),前提是你的網站必須符合Google的條件(詳見公司設定頁之說明)。
Figure 7 進入公司設定選擇廣告狀態
設定隱藏廣告並儲存變更後,再回到原本加上搜尋列的網頁,就可以看到在搜尋結果頁面(請見Figure 8與Figure 9比較),廣告消失了,這樣是不是清爽多了?
Figure 8 搜尋結果頁面(有廣告)
Figure 9 搜尋結果頁面(無廣告)
Google CSE功能說明
雖然Site Search 有更強的功能,標準版也已經有了許多好用的功能:
- 搜尋引擎關鍵字:在基本資訊中設定,可以提升包含這個關鍵字的網頁在搜尋結果上的排序。例如:限制條件設定「程式設計組」時,訪客輸入「黃玫瑋」搜尋時,程式設計組的網頁會排在優先順位。(Figure 13)
- 自動查詢建議:提供關鍵字自動完成功能,例如輸入c,系統就會出現ceiba等相關字彙供使用者快速點選。
Figure 10 自動完成功能設定與關鍵字新增
- 統計學習:除了可統計搜尋關鍵字使用次數外,訪客常用的這些關鍵字還會自動成為查詢建議的字庫。
Figure 11 統計功能、熱門關鍵字與自建字庫等功能
- 熱門關鍵字:可利用統計資訊功能,制定熱門查詢的功能,讓瀏覽者可直接點選最近熱門的查詢字彙進行查詢。(Figure 11)
- 自建字庫:可利用統計資訊功能,建立自己網站常用的字彙(例如單位名稱、人名)等,不用等到統計學習彙整字庫。(Figure 11)
- 擴充搜尋:搜尋指定網站外的網站。
Figure 12 擴充搜尋功能
Figure 14 限制條件之功能可縮小搜尋範圍
Figure 15 共同管理功能
- 稽核:可記錄所有管理者何時改了那些設定。
- 進階功能:提供將搜尋引擎設定下載/上傳的功能。
- 關鍵字同義字:可以讓搜尋結果包含關鍵字的同義字。例如我們將「台大」設定有「臺灣大學、台灣大學、臺大」等同義字;使用者輸入「台大」搜尋時,搜尋結果將包含有「臺灣大學、台灣大學、臺大」等關鍵字的網頁。
Figure 16 同義字功能
結論
簡單的幾個設定,就有如此強大的管理與搜尋功能,對於不善寫程式的網頁設計師來說,實在是一大福音。但Google自訂搜尋的最後一個設定程序是產生一段程式碼供網站管理者使用,所以想使用自訂搜尋的人,還是必須多少懂一些HTML/CSS/JavaScript的語法,比較能順利跟自己的網站首頁整合。
小秘訣
有時候中文的界面或說明因為翻譯的關係有點難懂,這個時候,只要在原來的網址後面附加「&hl=en」就可以看到同一篇說明的原文。
參考資料
Bing Webmaster
https://ssl.bing.com/webmaster/developers/appids.aspx?rfp=7
http://jeez.eu/2009/10/14/using-bings-api-to-create-a-custom-search-engine.html
http://weblogs.asp.net/hajan/archive/2011/03/07/bing-search-using-asp-net-and-jquery-ajax.aspx
免費開放原始碼搜尋引擎 Lucene簡介, 曾保彰
http://www.cc.ntu.edu.tw/chinese/epaper/0010/20090920_1009.htm