構建雲端模式的圖書館一站式數位資源探索與取得平台

1 引言

雲端運算在許多方面只是網際網路的一個比喻詞,意指將計算和資料資源移轉到Web上的比喻詞。雲端運算代表網路運算價值的一個新的臨界點,它提供更高的效率、巨大的可擴展性和更快、更容易的軟體發展[1]。圖書館擁有大量的紙本與數位資源,數位資源如何更優化地呈現給讀者是圖書館的核心工作,但大量資源保存在不同的系統上,致使讀者非得透過各個原有系統去查找不同資料庫資源,這種現象長期存在於圖書館的資源查找與取得服務中。讀者和圖書館都希望擺脫這種離散的、無規律的服務。為了滿足長期以來的需求,上海交通大學圖書館引進Primo[2]系統,並對其進行大量的二次開發,強化了本地化、客製化和集成融匯,並將其稱作“思源探索”[3],為讀者提供一項雲端模式為基底的一站式數位資源探索與取得平台。

2 總體思路

Primo的系統架構包括前端的表現層(Presentation Layer)、應用服務層(Application Layer)、搜尋引擎(Discovery Engine)、出版平台(Publishing Platform)、底層的來源知識庫(Source Repository 以及後端的後台管理系統(Primo Back office)和Primo資料庫(Primo Database),以直觀的表示可分為資料資源中心、資料處理中心以及資源呈現層(如圖1所示)。


1 系統服務架構

3 系統功能與特性

Primo是一個圖書館資源獲取與發現的完整解決方案,它將前端讀者服務和後端各類圖書館資源管理連成一體,具有標準的技術規範和安全的管理體系,同時Primo還具有靈活和開放的系統架構,圖書館在此架構之上可以添加各類資源,根據各館的需求進行功能開發,從而搭建具有自身特色的數位資源探索與取得平台。上海交通大學圖書館即在此架構基礎上進行了多個二次開發與功能拓展,更大潛力的發揮了Primo的功能。

3.1 資料資源中心

資料資源中心的資料是Primo系統服務的基礎,圖書館可以根據讀者的需求定義不同的資料資源,這些資源可以來自各方,可以在Primo資料庫中,亦可以保存在網路上的任何物理空間中。資料資源中心總體上可分為網路資源、圖書館服務資源、圖書館館藏資源、商用資料庫以及自建資料庫。
(1)      網際網路資源
網際網路的資訊資源量以幾何倍數形式膨脹,而圖書館的資源量等級無法與網路資源相比,如何充分利用網路資源將是未來圖書館資源服務體系的重要一環。越來越多的網路平台開放其資源介面,透過這些介面可以將網路資源與Primo中的資源進行結合,提供更立體的資源服務。
(2)      圖書館服務資源
圖書館的服務亦可視為資源提供給讀者,它是智慧資源,也是不可或缺的一種資源。在Primo系統中,圖書館可以將服務項目、服務內容、服務方式以及服務人員和物件等都用資料的形式保存至資源中心,當讀者檢索資源的時候,不僅僅只是檢索學術資源或網路資源,圖書館的服務也應該是重要的一部分。例如:將小組討論室的預約系統與Primo相結合,讀者可以檢索到圖書館的小組討論室房間情況,並進行預約操作;在讀者檢索時遇到困難或檢索結果不滿意的情況下,系統可提供參考諮詢或館際互借與文獻傳遞服務,為讀者尋找其他獲取資源的途徑。
(3)      圖書館館藏資源
主要是指圖書館管理系統中的書目資料、電子資源等,這些資源也是圖書館的傳統資源,Primo可以定期從圖書館管理系統資料庫中取得相關資料,滿足讀者對館藏資料的檢索需求,而擁有館藏資源的Primo則完全可以替代傳統的圖書館OPAC系統,成為新型的目錄檢索系統。
(4)      商用資料庫資源
圖書館提供的學術資源服務大多來源於圖書館購買的各類商用學術資料庫,這些資料庫均提供了自有的檢索平台,讀者必須透過不同的檢索平台獲取多方資源。Primo作為一站式檢索平台,它與Metalib[4]相結合,將Metalib作為Primo的檢索引擎之一,實現了所有商用資料庫的整合雲端檢索,而這些資料庫資源即作為Primo資料資源中心的一部分。
此外Primo Central[4]提供大多數的外文期刊資料,Primo可以將Primo Central作為資料資源中心的雲端服務。
(5)      自建資料庫資源
圖書館一直以來都重視自身機構特色資料庫的建設,擁有大量的自建資料。圖書館可以將自建資料進行選擇性的獲取至Primo後台資料庫中,將有助於自建資源更充分的利用。

3.2 資料處理中心

Primo的資料資源中心包含了各類數位化資源,如何將這些資源有序並合理的呈現給讀者,將取決於資料處理中心的一系列工作。Primo將對所有資源進行獲取、正規化處理、分類聚合以及資料挖掘,透過處理後的資料將符合的分群顯示其屬性。
(1)      數據獲取
擁有詮釋資料的各個資源,例如:圖書館書目資料、自建數位資源等,可以採用Primo後台資料層提供的OAIFTPcopy等多種方式進行資料取得,資料獲取後可直接保存至Primo資料庫中;而如網路資源、商用資料資源等這類即時獲取的資料,則直接在表現層呈現,可以利用Metalib或開放的JSONWebServiceOpenURL等方式將資料獲取並處理和展示。
(2)      資料正規化
不同來源的資料若不經過統一規範作正規化處理,將無法在一個系統中整合顯示。在Primo後台管理系統中,可以對不同的資料資源進行不同的正規化定義,待取得資料後,Primo即會對資料進行正規化處理,處理後的資料將可以成功實現跨平台的多種資料類型的檢索。
(3)      資料分類聚合
多種形式的資料聚合將有利於資源的重塑,Primo提供了FRBR功能,圖書館可以透過FRBR的管理進行規則配置。在聚合各種資源、實現單一資源管理(Unify Resource Managemenet)時,圖書館可本著FRBR思想去分層次地表現相關作品,將所有與某一特殊文獻、某一文獻的多種表示形式、基於同一文本的不同版本以及特殊的單項相關的記錄集合組織在一起[6]。系統要向資源使用者展現作品、內容表達、載體表現或單件之間的關係,使同一個作品與其相連接的內容表達載體、載體表現和單件之間的層次關係清晰可見,實現實體的屬性和關係對用戶任務之間的對應。
(4)      數據挖掘
讀者的檢索行為和內容點擊行為可以代表讀者對資源的側重點和偏好,對此進行分析,可以根據讀者的行為以提供讀者不同層次的服務,為智慧服務提供依據。

3.3 資源呈現

友善的資源呈現將吸引讀者使用系統。在資源呈現層,Primo採用了讀者習慣的類似於Google的簡單檢索方式,而在檢索結果上比Google更為豐富,更符合圖書館學術資源檢索平台的定位。
(1)      智慧化檢索服務
智慧化將是未來檢索的發展趨勢,Primo採用Lucence的全文檢索引擎的架構,實現了簡單的智慧檢索,可以進行中文切詞、英文拼寫糾錯以及簡繁體的混合檢索等。
(2)      智能化資源推薦
在資料正規化處理後,系統即可以對資料進行挖掘分析。在分析資料方面,當讀者檢索某一個關鍵字的時候,系統可以對其進行擴展檢索建議,例如Primo檢索結果頁中的“進一步檢索”功能;在分析行為方面,當讀者的檢索行為與其他讀者有相似之處,系統將進行學術推薦,例如bx服務[7]
(3)      個人化資源定製
越來越多的讀者習慣于將感興趣的資源設定至個人的網路空間,Primo系統也提供了相關的服務,例如讀者可以透過E-mailRSS訂閱檢索的資訊,並將其推送至個人空間,以便跟蹤所保存的檢索收到最新結果;可以將檢索結果列表中需要的記錄保存在電子書架中,或發送到系統支援的第三方線上參考資料管理工具Endnotedelicious書籤中。
(4)      集成融匯
Primo的系統表現層,圖書館可以對其進行個人化的服務開發。讀者在檢索資源時,為其提供知識融匯服務,並充分利用第三方已有的資源服務,提高讀者需求滿足率,因為圖書館很難單靠一己資源滿足讀者全部需求。
上海交通大學圖書館在Primo系統上進行二次開發,將取得的百科、書評、目次、封面、網摘等網路資訊嵌入至資源的呈現介面,為讀者提供多維一體的資源服務。
(5)      知識共用社區
Primo系統為所有的資源提供了評論、評分以及標籤功能,也為讀者提供了一個知識交流的平台,將每位讀者的隱性知識在平台上顯性化,變成知識,從而達到分享知識的目的。

2  組織知識創新模型[8]
如圖2所示,個人的隱性知識經過社會化、外化、組合和內化四個階段,實現了個人之間、個人與組織之間知識的傳遞,最終又能產生新的隱性知識。在此過程中,知識的轉化,傳遞和創造是一種動態的遞進過程,被稱為知識螺旋。此模型將焦點聚集在隱性知識上,也聚集在人和人對技術的使用上。

3.4 統一身份認證

統一認證和授權機制是指用戶只需要在網路認證系統中登錄一次,透過一次用戶安全驗證後,再造訪其他應用中的受保護資源時,不再需要重新登錄驗證,而這些網路資源包括分佈在整個校園網路中不同應用系統的一切資料資源。上海交通大學網路資訊中心為每個註冊的網路用戶提供了一個統一的網路帳戶,目標是使用戶透過同一個帳號/密碼,可以訪問所有網路資訊中心提供的網路應用,包括email,代理服務,撥號服務,網路儲存,IP位址申請和使用等等,以及為校內第三方應用提供統一認證和單一登錄服務。
在基於Primo的“思源探索”平台上的所有個人化服務均遵循統一身份認證體系,即為讀者打通圖書館各系統以及學校各系統間的資料溝通障礙,讀者可以透過Primo獲取其他系統平台的個人資訊資源,真正實現個人化資源的多平台交換功能。

4 結語

我們以雲端理念開發和實現“思源探索”平台,使其為讀者提供能適應不同場景和需求且豐富的相關資訊。基於Primo的“思源探索”釋放了圖書館的潛力,為讀者提供一個傳統和數位化資源的發現與傳遞的完整解決方案,實現了雲端運算的服務模式,不管這些資源是什麼格式,儲存在何地,利用網路從各地獲取而統一展現給讀者。透過資源的獲取與推送,整個網路架構即向雲端遷移,所有的資源都猶如平台上的“雲”,讀者登錄平台即被眾多的雲端資源所包圍,圖書館正需要這樣一朵雲。(孫翌)

參考文獻
[1]      SUN公司.雲端運算[EB/OL].[2011-06-07].http://kenai.com/projects/suncloudapis
[2]      Ex Libris.Primo.[2011-06-20].http://www.exlibrisgroup.com/cn/category/PrimoOverview
[3]      上海交通大學圖書館.思源探索[2011-04-20].http://ourex.lib.sjtu.edu.cn
[4]      Ex Libris.Metalib.[2011-06-20].http://www.exlibrisgroup.com/cn/category/MetaLibOverview
[5]      Ex Libris.Promo Central.[2011-06-20].http://www.exlibrisgroup.com/cn/category/primocentral
[6]      Rethinking How We Provide Bibliographic Services for the University of California.[EB/OL][2011-6-25].http://libraries.universityofcalifornia.edu/sopag/BSTF/Final.pdf
[7]      Ex Libris. bX Recommender Service .[2011-06-20]. http://www.exlibrisgroup.com/category/bXOverview
[8]      []/野中郁次郎, 勝見明. 創新的本質[M]. 北京:知識產權出版社, 2006.6