(中國石油化工集團公司石油勘探開發研究院)
油氣地質資料數字資源服務的常規方法有網絡目錄檢索、網絡全文瀏覽和下載;創新方式包括數字地圖導航服務、在線繪圖和比較服務、移動利用服務、數據挖掘和知識服務以及大數據服務。油氣地質資料數字資源服務的創新方式需要有豐富的數字資源、完善的檔案管理信息系統、大的網絡帶寬和具有大數據思維的檔案工作者。
油氣地質數據;數字資源利用服務;數字地圖數據挖掘;知識服務;大數據
0簡介
油氣地質資料是油氣勘探開發地質資料的簡稱,是指油氣勘探開發生產和科學研究過程中形成的文字、圖表、數據、聲像等形式的原始地質資料,以及成果地質資料和巖心、巖屑、光學切片等實物地質資料。《地質資料管理條例》及其實施辦法發布十余年來,油氣地質資料數字資源建設與服務經歷了壹個從無到有的過程。
目前,油氣勘探開發單位成熟且廣泛使用的油氣地質資料數字化資源服務模式主要包括網絡目錄檢索、網絡全文瀏覽和下載兩種方式。網絡目錄檢索是指通過網絡對油氣地質資料進行文件級和文件級目錄信息的檢索服務,授權用戶可以通過這種方式找到館藏中的任何文件或文檔。網絡全文瀏覽下載是指通過網絡提供的油氣地質資料全文瀏覽下載服務。這項服務是在目錄數據庫建設的基礎上進行的,授權用戶可以在線瀏覽地質資料的主要內容,也可以下載到本機繼續使用。
1油氣地質數據數字資源服務創新模式
隨著IT技術的不斷發展和資源建設的不斷推進,油氣地質資料數字資源的服務模式也應不斷創新。結合工作實踐和國內外相關文獻,筆者總結出以下五種創新服務方式。
1.1數字地圖導航服務
數字地圖導航服務是指利用基於GIS(地理信息系統)的導航,以地質數據對應的工區地理坐標為檢索點,向用戶提供特定地理區域所包含的全部油氣地質數據的服務模式。是網絡目錄檢索、全文瀏覽和下載的有益補充。只有將GIS服務集成到地質數據檢索系統中才能實現。目前比較成熟的平臺有ArcGIS平臺和Google公司提供的Google Earth服務。
油氣田的勘探開發必須充分占有目標區的全部資料,才能進行有針對性的深入研究。當用戶使用常規檢索方法時,使用標題、作者、關鍵詞等往往難以覆蓋目標區域的所有信息。地質資料采集機構通過記錄數據內容中涉及的空間數據,並在檢索系統中集成GIS導航服務,不僅可以讓用戶直觀地掌握目標區域的地理和地形,還可以通過GIS導航平臺提供的點擊和圈選功能查詢區域內的所有油氣地質資料。
作者所在單位通過建立空間數據庫,記錄油氣地質數據內容對應的工區地理坐標信息,並在檢索系統中集成GIS平臺,實現油氣地質數據的GIS導航和查詢服務。用戶登錄後,只需選擇特定區域,即可查詢該區域內中石化油氣勘探開發單位形成的油氣地質數據,大大提高了查全率和查準率,反饋良好。
1.2在線繪圖和對比服務
這是壹種全新的服務模式,主要基於館藏中的各種數據體,通過管理信息系統和檢索系統,為這些數據體提供定制化的可視化和對比服務。
以測井數據體為例,測井是指利用巖層的電化學、電導率、聲學、放射性等地球物理特性測量地球物理參數的過程。測井方法多種多樣,形成了多種類型和格式的測井數據體。但這些測井數據體壹般不方便直接讀取,只有形成測井曲線才能方便使用。在線繪制對比服務是將集合中每口井的測井數據體全部上傳到存儲服務器,並與對應的文件級目錄信息和文件級目錄信息鏈接。瀏覽時,用戶可以根據自己的需要選擇壹口井的某類或多口井的某類測井數據體,利用管理信息系統提供的在線繪圖功能,實時繪制對比測井曲線。該服務模式允許用戶確定測井曲線的類型、選擇地圖參數、地圖顯示方法等。,大大提高了利用效率和效果。
目前中國石化油氣勘探開發源數據采集系統中的測井數據采集系統通過在線繪圖、在線對比、在線統計的方式顯示采集結果,效果很好。該系統的成功實踐為油氣地質數據數字資源的在線服務提供了參考。
1.3移動利用服務
隨著移動互聯網的快速發展,各種服務在移動設備上的應用越來越成熟。筆者認為,隨著手持移動設備(手機、平板電腦等)的硬件配置越來越高。),復雜任務的處理能力和處理速度有了很大的提升;3G、4G等高速移動互聯網的進壹步普及,為油氣地質數據利用服務的移動化提供了機遇。2010年9月,英國地質調查局發布了第壹款基於iOS系統的APP——iGeology。在這款app的幫助下,用戶可以通過移動設備檢索到英國任何地方的1: 50000地質圖及相關數據,利用效果顯著。2013年,國家地質檔案館還發布了基於iOS和Android系統的手機客戶端,可以通過手機直接查詢地質數據和發起數據訂購。
對於油氣勘探開發單位來說,可以借鑒上面提到的成功經驗,開發專門的第三方應用程序(APP),通過本地推送、切片、鷹眼技術等手段,解決移動互聯網大容量電子文件推送和手持移動設備顯示等問題。經過授權認證後,可以根據勘探、開發、科研、生產壹線工作者的需求,將急需的油氣地質資料數字化資源推送到他們的手持移動設備上,提高服務和保障效率。
1.4數據挖掘和知識服務
數據挖掘壹般是指從大量數據中自動尋找隱藏著特殊關系的信息的過程。在油氣地質數據管理信息系統中,不僅有豐富的電子資源,還有大量的用戶使用記錄,這兩者對計算機來說都是大量的數據,為提供數據挖掘和知識服務奠定了基礎。
數據挖掘和知識服務包含兩層含義。壹方面是指在油氣地質數據中挖掘有用的數據。對地質現象的認識是隨著相關資料檔案的豐富、技術的更新、方法的優化而不斷準確的。庫中的油氣地質資料是在多年的勘探開發工作中不斷形成的,包含了廣大勘探開發工作者對地質現象的不斷總結和提煉。通過統計學、聯機分析處理、信息檢索、機器學習、專家系統和模式識別等多種方法,我們可以對地質數據中關於某壹特定區域、某壹特定地質現象的數據進行挖掘和分析,將隱性知識轉化為顯性知識並提供服務。另壹方面是指對用戶利用數據的挖掘。在管理信息系統中,用戶會形成大量的利用數據,包括利用時間、利用熱點、利用興趣方向等。,在檢索檔案目錄和瀏覽下載檔案電子文件時。挖掘這些數據可以針對不同用戶的興趣提供個性化、有針對性的服務。用戶使用數據的挖掘分為三個層次。壹是所有用戶利用數據的挖掘,分析所有用戶最感興趣的利用服務的內容、方式和方法,從而促進利用服務的改進和優化。二是挖掘特定用戶群體(如某單位或某研究室)在特定時間段內的使用數據,分析其階段性使用興趣,為提供有針對性的主動家庭服務提供方向。再次,挖掘個人用戶的利用數據,可以分析用戶的研究方向和偏好的服務模式,從而為用戶提供更好的數據資源利用服務。
作者所在單位挖掘了用戶的壹級和三級利用數據。我們通過管理信息系統統計了用戶的搜索關鍵詞、瀏覽和下載興趣,分析了階段時間內所有用戶和個人用戶使用的興趣前10,並實時動態顯示和更新用戶的檢索界面。總體效果不錯。目前,我們正在嘗試對用戶的利用率數據進行二級挖掘,以便更好地提供利用率服務。
1.5大數據服務
大數據時代已經到來。隨著信息技術和硬件技術的快速發展,我們的日常生活正在不斷形成大數據,這是壹種社會意識。在目前的油氣田勘探開發活動中,形成的數據量非常大,這也屬於大數據的範疇;各級地質檔案館(室)收集的油氣地質資料及其數字化資源更加海量。面對如此龐大的數字資源,提供個體數字資源的服務將逐漸與油氣田勘探開發的現實不符。要有大數據的思維,把集合中的所有數據資源視為壹個整體,提供整體服務,通過尋找各種地質工作與油氣田勘探發現、油氣田開發能力建設的相關性來提供服務。
根據筆者目前掌握的信息,油氣地質數據部門尚未開展大數據服務,但Google、Visa等擁有大量數據的公司開展大數據服務的案例卻頻頻見諸報端。中石油、中石化、中海油等公司掌握了大量的油氣地質數據數字化資源,提供大數據服務推動油氣勘探發現和油氣田開發能力建設,必然不會太遙遠。
2.油氣地質數據數字化資源服務的保障條件
與其他參考資料相比,油氣地質資料有兩大優勢:原創性和系統性。原始性是因為它是油氣田勘探開發的原始記錄,系統性是因為它系統地記錄了各種油氣田勘探開發活動的過程和結果。基於這些優勢,我們必須著眼於油氣地質資料的數字化資源服務,創新服務模式。結合工作實際,筆者認為創新服務方式必須滿足以下保障條件。
2.1基礎條件——豐富的數字資源
豐富的數字資源是開展數字資源服務的基本條件。豐富的數字資源包括兩個方面:壹是數字化紙質地質資料,主要是指利用掃描技術、OCR技術、存儲技術等技術手段形成的數字化版本的紙質地質資料;二是各種數據體,主要是指在油氣田的物探、化探、鉆井、測井、錄井等勘探開發過程中,各種儀器及其解釋資料收集和(或)形成的大量數據體。這些數據卷是地質現象的原始記錄,是數字資源服務的主體,對其利用的需求遠大於對數字紙質地質數據的需求。然而,這些數據量通常是所有工作的中間結果,對其歸檔的控制稍顯薄弱。各級檔案部門要采取切實可行的歸檔監管措施,確保這些資料卷及其解釋成果能夠及時、全面地歸檔,為油氣地質資料數字化資源服務打下堅實基礎。
2.2技術條件-完善的地質資料管理信息系統
開展數字資源服務,完善地質資料管理信息系統是技術保障。無論是數字紙質地質數據還是各種數據體,都是以代碼的形式存儲在光盤等光磁載體上。我們必須依靠完善的地質資料管理信息系統來有效地開展利用服務。壹個完善的地質資料管理信息系統應該具備兩個基本功能。壹是可以作為油氣地質資料日常管理的工具,可以提供從歸檔整理到編目、描述檢索、統計等所有基礎環節的信息化管理,提高日常管理水平;二是可以作為用戶使用服務的終端。用戶可以借助該管理信息系統實時、動態地展示內容、全文搜索、全文瀏覽和下載。
2.3環境條件-大容量網絡帶寬
根據作者所在單位的情況,通過網絡提供地質資料利用服務近年來發展迅速,已成為壹些單位地質資料部門提供利用服務的主要方式。油氣田勘探開發中形成的地質資料多為技術報告和各種技術圖件,其電子文件壹般較大,往往在數百兆(MB)甚至千兆(GB)。為了通過網絡提供這些大容量的電子文件,大容量的網絡帶寬是必不可少的。
2.4智力條件——具有大數據思維的地質資料工作者
任何工作的正常開展都必須依靠壹定數量的專業技術人員。筆者認為,具有大數據思維的地質資料工作者是充分開展油氣地質資料數字資源利用與服務的必備智力條件。壹方面,他們可以根據資料檔案工作的規律和特點,從資料檔案專業的角度開展油氣地質資料數字資源的利用和服務;另壹方面,他們還可以從數據的角度對油氣地質數據數字資源中的豐富數據進行挖掘、提煉和整合,並結合油氣田勘探開發業務提供有針對性的內容服務;再次,從大數據的角度來看,他們也可以將油氣地質數據的數字資源作為壹個整體來考慮,通過IT部門的合作,探索各種數字資源與油氣田勘探開發的關系,從而提供其他服務方式無法提供的數據和知識服務。
參考
[1]葛洪。數字時代檔案信息資源的開發與利用[J].科技與企業,2010 (6): 84 ~ 85。
[2]塗子沛。大數據[M]。南寧:廣西師範大學出版社,2012。
[3]Q/SH 0167-2008《油氣勘探開發油氣地質資料歸檔規則》[S].2008-02-25 .
[4]英國地質調查局。英國地質調查局年度報告2010-11[EB/OL]. 2011[2013-02-25]。http://www.bgs.ac.uk/downloads/start.cfm?id=2252。