查文庫>心得體會> 資料分析心得體會

資料分析心得體會

資料分析心得體會

  在平日裡,心中難免會有一些新的想法,寫心得體會是一個不錯的選擇,這樣能夠讓人頭腦更加清醒,目標更加明確。那麼要如何寫呢?下面是小編收集整理的資料分析心得體會,歡迎閱讀與收藏。

  在資料分析這門課程當中主要學習了numpy和pandas和資料探勘的知識,學習過程很充實,也不是很難。

  首先學習了Numpy, NumPy(Numerical Python)是Python語言的一個擴充套件程式庫,主要學習了

  1、矩陣生成,

  2、矩陣切片,

  3、軸對換、相乘,

  4、條件填入(where),

  5、資料處理。NumPy是一個執行速度非常快的數學庫,主要用於陣列計算。

  在pandas中有兩類非常重要的.資料結構,即序列Series和資料DataFrame。Series類似於numpy中的一維陣列,除了通吃一維陣列可用的函式或方法,而且其可透過索引標籤的方式獲取資料,還具有索引的自動對齊功能;DataFrame類似於numpy中的二維陣列,同樣可以通用numpy陣列的函式和方法,而且還具有其他靈活應用。之後學習了資料索引index,包括了透過索引值或索引標籤獲取資料以及自動化對齊;此外,pandas模組為我們提供了非常多的描述性統計分析的指標函式,如總和、均值、最小值、最大值等,我們來具體看看這些函式;在SQL中常見的操作主要是增、刪、改、查幾個動作,那麼pandas能否實現對資料的這幾項操作呢?答案是Of Course!我們發現,不論是刪除行還是刪除列,都可以透過drop方法實現,只需要設定好刪除的軸即可,即調整drop方法中的

  axis引數。預設該引數為0,表示刪除行觀測,如果需要刪除列變數,則需設定為1。在Excel中有一個非常強大

  的功能就是資料透視表,透過托拉拽的方式可以迅速的檢視資料的聚合情況,這裡的聚合可以是計數、求和、均值、標準差等。pandas為我們提供了非常強大的函式

  pivot_table(),該函式就是實現資料透視表功能的。

  資料探勘的技術與方法相關知識包括:資料探勘的方法分為描述性與預測性兩種。其中描述性資料探勘指的是分析具有多個屬性的資料集,找出潛在的模式和規律,沒有因變數。要採用的演算法:聚類、關聯分析、因子分析、主成分分析等。預測性資料探勘指的是用一個或多個自變數預測因變數的值。主要演算法:決策樹、線性迴歸Logistic迴歸、支援向量機、神經網路、判別分析。

  透過這幾天的學習我瞭解到資料分析的複雜性和難度,想要學好的它,還需要我花費很長時間。