查文庫>論文> 雲計算環境下的資料探勘研究論文

雲計算環境下的資料探勘研究論文

雲計算環境下的資料探勘研究論文

  摘要:文章首先對雲計算的特點進行簡要分析, 在此基礎上對雲計算環境下的資料探勘進行研究。期望透過本文的論述能夠對資料探勘效率的提高有所幫助。

  關鍵詞:雲計算; 資料探勘; 服務;

  1 雲計算的特點分析

  1.1 超大規模

  國內外大型網際網路企業紛紛建立起雲平臺, 開啟一大批伺服器, 如Google公司、亞馬遜公司、微軟公司等公司都建立了雲平臺, 大幅度提升了網路平臺數據運算效率、儲存效率和互動效率, 使雲計算具備超大規模特點。

  1.2 虛擬化

  雲平臺是向網路平臺提供資源的平臺, 網路使用者可藉助雲計算技術在任意位置獲取應用服務, 這種應用服務不是固定實體, 而是虛擬化的。在雲平臺上, 需要執行虛擬化的搜尋、儲存、上傳下載操作, 網路使用者無需瞭解資源的獲取渠道, 只要透過終端裝置就可以獲取網路服務資訊, 實現資料快速互傳。

  1.3 可靠性高

  雲平臺可提高資料互傳、儲存的可靠性, 其採用計算節點同構可互傳、資料多副本容錯等措施增強服務的可靠性, 即使在資料傳輸或儲存丟失的情況下, 也可以找回渠道恢復資料, 與計算機自帶硬碟相比, 網路雲計算平臺的可靠性更高。

  1.4 通用性強

  雲計算技術的針對性不強, 對其他裝置沒有過高的要求, 只需在網路平臺上建設平臺, 配備足夠的伺服器, 就可以實現雲計算技術的應用。在同一雲平臺的支撐下, 可滿足不同裝置的執行要求。

  1.5 擴充套件性好

  雲平臺既可以滿足不同型別企業的需求, 也可以滿足個人使用者需求, 其本身帶有動態伸縮性。使用者可根據自身需求對空間、功能進行定製, 滿足個性化的應用要求, 使雲平臺具備良好的擴充套件性。

  1.6 按需服務

  雲平臺可提供充足的空間, 便於使用者在雲平臺上儲存、呼叫、傳輸資料資源。為了避免使用者過度佔用雲平臺資源, 雲平臺一般設定了計費標準, 要求使用者按需購入佔用量, 促使雲平臺成為可交易的資源。

  2 雲計算環境下的資料探勘

  2.1 資料探勘服務層次結構

  2.1.1 基礎設施層

  該層主要為整個資料探勘服務提供儲存和計算資源, 在基礎設施層執行中, 透過介面可連線網路資源與物理資源, 實現不同型別資源的`高度共享。該層還提供資料探勘服務的虛擬化介面, 滿足資源對接要求, 為資源儲存、共享提供技術支撐。

  2.1.2 虛擬化層

  在雲計算技術上建立資料探勘服務模式, 利用虛擬化層快速處理大量資源。在結構體系中, 虛擬化層根據雲計算技術虛擬化匯聚分散式資源, 在封裝處理虛擬資源的基礎上, 分類和管理不同資源, 從而提高挖掘服務執行效率。在對資源進行封裝後, 透過開發和利用平臺層實現資源共享。虛擬化技術是資源封裝的重要技術, 既可以提高資源執行效率, 也可以實現對資源的合理調動, 提高服務模式的便捷性。

  2.1.3 平臺層

  在資料探勘服務模式中, 平臺層作為資料核心服務部分, 負責管理不同資料及其功能, 實現不同服務目錄的高效管理。使用者可根據服務內容和使用需求組合不同服務目錄, 發揮資料功能性管理作用。在平臺層中, 可有效排程計算資源, 提高計算資源的執行效率, 這使得平臺層在資料探勘服務中佔據著不可替代的地位。

  2.1.4 應用層

  該層由終端層和介面層組成, 其中介面層為使用者提供服務等級, 滿足各種服務請求, 終端層將服務請求顯示出來, 並且可根據請求的服務內容作出評價。在終端層的內容訪問中, 根據使用者訪問請求、訪問內容對訪問接入作出不同選擇, 再結合使用者訪問情況, 藉助終端裝置實現資料探勘服務。

  2.2 體系的建模流程

  2.2.1 對服務進行自定義

  在資料探勘服務執行時, 可透過自定義完成相關資料的蒐集, 從而快速找到與之相關的資源。由此可以使資料探勘人員開展工作時, 對候選加以充分利用, 進而形成服務目錄, 為使用者使用提供方便。

  2.2.2 元件構建

  在對資料探勘服務元件進行構建時, 應當確保呼叫服務介面的統一性, 同時在構建其它服務元件時, 需要繫結服務和資料, 從而構建起數量更多的元件, 為使用者提供所需的資料探勘服務模式。

  2.3 資料探勘體系的服務過程

  2.3.1 分析階段

  該階段主要負責分析資料探勘內容, 確定需要挖掘的資料, 根據對應的資料服務內容設定相應的服務模式, 並對服務模式作出定義。為保證資料探勘與實際需求相符, 在資料探勘時需先進行資料分析, 深入到外部環境中調查市場發展趨勢和市場需求情況, 以市場為導向開發大資料探勘模式, 使雲計算下的資料探勘服務更具備高效性、實用性和針對性。

  2.3.2 設計階段

  該階段要根據前期市場調查情況對資料探勘服務方案進行設計, 最終確定符合使用者使用習慣的資料處理模式。資料探勘服務模式設計不僅關係到使用者體驗的滿意程度, 而且還影響著資料探勘服務執行效率。在某些特定的情況下, 甚至可能對供應商與消費者帶來利益衝突, 阻礙資料探勘服務在資訊化環境中的有效應用, 為了解決上述問題, 必須以市場調查為前提開展資料探勘服務模式設計, 避免不必要的矛盾。

  2.3.3 開發階段

  在該階段, 一套相對完整的資料探勘服務體系會隨著設計得以呈現, 各種服務內容與方法在該階段中得到合理應用。體系開發時, 應對各項功能進行定義, 並將所有的功能整合到一起, 以此來實現多種不同的服務目標, 確保資料探勘服務模式的高效執行。對體系進行開發的過程中, 可基於服務介面的實現, 對相關的功能進行有效地協調, 從而使開發出來的功能更符合使用者的使用需要, 由此可使資料探勘服務的價值得以充分體現, 有利於推動資料探勘服務市場的持續、穩定發展。

  3 結論

  綜上所述, 雲計算以其自身所具備的諸多特點, 在諸多領域中得到越來越廣泛的應用。本文在簡要闡述雲計算特點的基礎上, 對雲計算環境下的資料探勘進行分析研究, 提出資料探勘服務模式的構建方法, 以期能夠對資料探勘效率的進一步提升有所幫助。

  參考文獻

  [1]孫亮.資料探勘服務模式應用雲計算的最佳化策略探究[J].黑河學院學報, 2018 (01) :23-25.

  [2]王勃, 徐靜.基於雲計算的Web資料探勘Hadoop模擬平臺研究[J].電子設計工程, 2018 (01) :43-44.

  [3]包科, 蔡明.高速接入網雲計算平臺的大資料探勘演算法研究[J].機床與液壓, 2017 (12) :143-144.

  [4]馮麗慧.雲計算和挖掘服務融合下的大資料探勘體系架構設計及應用[J].電腦程式設計技巧與維護, 2017 (12) :132-133.