作者:唐瑤瑤 / 臺灣大學計算機及資訊網路中心教學研究組
前言
在經營電子報平台的過程中,我們經常收到來自發刊者及訂閱戶的疑惑:如何推廣我的電子報?我時間有限,告訴我哪些是適合我、優質並值得推薦的刊物?有鑑於此,我們將平台訂閱資料作為資料庫知識發掘KDD(Knowledge Discovery in Database)的來源,於平台網頁上提供有意義的資訊。未來希望資料探勘的結果能達到更高層次的顧客關係管理。
電子報平台及推薦系統發展現況
由臺灣大學各系所及服務單位撰寫、編輯並經由臺灣大學電子報平台發行的電子刊物,截至2007年6月已達55份,發出總期數為607期。 刊物內容性質涵蓋定期與不定期之訊息通告、生活資訊、學習教育、文學藝術及社團活動等,令人驚喜的是陸陸續續會有更多的院系即將加入發刊的行列中。
那麼新舊訂閱戶該如何在這寶庫中找尋有興趣的刊物呢?首先我們於電子報平台的首頁右方加入搜尋及日曆查詢當日出刊的功能,以提供近期內發行的刊物連結。由於本電子報平台會為每份刊物維護歷史報區,所以訂閱戶可以從歷史報區一窺該刊物的內容型態及發刊頻率。
另外,為提供更優質的服務,我們從過去一年約六萬九千多筆的訂閱資料中,發掘出最佳推薦刊物,此推薦名單位於電子報平台首頁的左方,希望這些資料探勘結果可以為訂閱戶及發刊者提供有意義的資訊。也就是說,經由此訂閱資料導向的推薦機制,我們希望能吸引更多的新訂戶,同時也能提升舊訂戶對本網站平台的向心力和滿意度;另一方面,也希望能刺激發刊者,經由觀摩推薦刊物的內容製作,來充實其刊物內容的豐富性及精美度。
現在我們就來簡單說明此系統是如何產生推薦名單,並以計中電子報舉例說明如下:
我們的演算法第一步:以本平台訂閱資料為探勘的資料來源,並利用關聯規則(Association Rules) 發掘資料來源,計算出本平台中已發行之任意兩刊物之支持度(support)與信賴度(confidence)。演算法第二步:使每份刊物推舉與其關聯性(支持度+信賴度)最高的三份刊物作為候選人(訂閱本刊物者也訂閱了這三份刊物),這部份的推薦名單,目前已貼在每份刊物的網頁內容中,可經由點選任一期刊物內容連結進入察看。我們以台大視聽教育館英語學習報第017期為例說明如下:訂閱台大視聽教育館英語學習報者也訂閱了生活報報、圖書館電子報、國際學術交流中心電子報。
演算法第三步:經由運算結果得知有 4 種其他發行刊物都將計中電子報列為前三名的候選人。再將每份已發行刊物被其他刊物推舉的數量多寡作排序,結果即為目前電子報平台首頁上的資料探勘推薦名單。
未來研究
我們會繼續將所有客戶(含訂閱戶及發刊者)的建議納入新功能,務必使本平台符合使用者需求。在推薦系統部份,除了希望能加速資料探勘的運算,並能提供即時性的運算結果;另一比較深入的部份則是希望能再經由資料探勘的結果,發掘出訂閱戶個人的最適性推薦。
因此,不管是電子報平台的未來發展方向,或是推薦系統的再深入研究,我們都希望能豐富此網頁資源,使此平台成為一個校內外的電子訊息資源重點。