查文庫>心得體會> 資料分析心得體會

資料分析心得體會

　　在平日裡，心中難免會有一些新的想法，寫心得體會是一個不錯的選擇，這樣能夠讓人頭腦更加清醒，目標更加明確。那麼要如何寫呢？下面是小編收集整理的資料分析心得體會，歡迎閱讀與收藏。

　　在資料分析這門課程當中主要學習了numpy和pandas和資料探勘的知識，學習過程很充實，也不是很難。

　　首先學習了Numpy, NumPy(Numerical Python)是Python語言的一個擴充套件程式庫，主要學習了

　　1、矩陣生成，

　　2、矩陣切片，

　　3、軸對換、相乘，

　　4、條件填入（where），

　　5、資料處理。NumPy是一個執行速度非常快的數學庫，主要用於陣列計算。

　　在pandas中有兩類非常重要的.資料結構，即序列Series和資料DataFrame。Series類似於numpy中的一維陣列，除了通吃一維陣列可用的函式或方法，而且其可透過索引標籤的方式獲取資料，還具有索引的自動對齊功能；DataFrame類似於numpy中的二維陣列，同樣可以通用numpy陣列的函式和方法，而且還具有其他靈活應用。之後學習了資料索引index，包括了透過索引值或索引標籤獲取資料以及自動化對齊；此外，pandas模組為我們提供了非常多的描述性統計分析的指標函式，如總和、均值、最小值、最大值等，我們來具體看看這些函式；在SQL中常見的操作主要是增、刪、改、查幾個動作，那麼pandas能否實現對資料的這幾項操作呢？答案是Of Course!我們發現，不論是刪除行還是刪除列，都可以透過drop方法實現，只需要設定好刪除的軸即可，即調整drop方法中的

　　axis引數。預設該引數為0，表示刪除行觀測，如果需要刪除列變數，則需設定為1。在Excel中有一個非常強大

　　的功能就是資料透視表，透過托拉拽的方式可以迅速的檢視資料的聚合情況，這裡的聚合可以是計數、求和、均值、標準差等。pandas為我們提供了非常強大的函式

　　pivot_table()，該函式就是實現資料透視表功能的。

　　資料探勘的技術與方法相關知識包括：資料探勘的方法分為描述性與預測性兩種。其中描述性資料探勘指的是分析具有多個屬性的資料集，找出潛在的模式和規律，沒有因變數。要採用的演算法：聚類、關聯分析、因子分析、主成分分析等。預測性資料探勘指的是用一個或多個自變數預測因變數的值。主要演算法：決策樹、線性迴歸Logistic迴歸、支援向量機、神經網路、判別分析。

　　透過這幾天的學習我瞭解到資料分析的複雜性和難度，想要學好的它，還需要我花費很長時間。