資料探勘技術在線上考試系統中的應用研究論文
摘 要:資料探勘技術在各行業都有廣泛運用,是一種新興資訊科技。而線上考試系統中存在著很多的資料資訊,資料探勘技在線上考試系統有著重要的意義,和良好的應用前景,從而在眾多技術中脫穎而出。本文從對資料探勘技術的初步瞭解,簡述資料探勘技術在線上考試系統中成績分析,以及配合成績分析,完善教學。
關鍵詞:資料探勘技術;線上考試;成績分析 ;完善教學
隨著計算機網路技術的快速發展,計算機輔助教育的不斷普及,線上考試是一種利用網路技術的重要輔助教育手段,其改革有著重要的意義。資料探勘技術作為一種新興的資訊科技,其包括了人工智慧、資料庫、統計學等學科的內容,是一門綜合性的技術。這種技術的主要特點是對資料庫中大量的資料進行抽取、轉換和分析,從中提取出能夠對教師有作用的關鍵性資料。將其運用於線上考試系統中,能夠很好的處理線上考試中涉及到的資料,讓線上考試的實用性和高效性得到進一步的增強,幫助教師更加快速、完整的統計考試資訊,完善教學。
1.初步瞭解資料探勘技術
資料探勘技術是從大量資料中"挖掘"出對使用者有用的知識,即從大量的、隨機的、有噪聲的、模糊的、不完全的實際應用資料中,"挖掘"出隱含在其中但人們事先卻不知道的,而又是對人們潛在有用的資訊與知識的整個過程。
目前主要的商業資料探勘系統有SAS公司的Enterprise Miner,SPSS公司的Clementine,Sybas公司的Warehouse Studio,MinerSGI公司的Mineset,RuleQuest Research公司的See5,IBM公司的Intelligent,還有 CoverStory, Knowledge Discovery,Quest,EXPLORA, DBMiner,Workbench等。
2.資料探勘在線上考試中的主要任務
2.1資料分類
資料探勘技術透過對資料庫中的資料進行分析,把資料按照相似性歸納成若干類別,然後做出分類,並能夠為每一個類別都做出一個準確的描述,挖掘出分類的規則或建立一個分類模型。
2.2資料關聯分析
資料庫中的資料關聯是一項非常重要,並可以發現的知識。資料關聯就是兩組或兩組以上的資料之間有著某種規律性的聯絡。資料關聯分析的作用就是找出資料庫中隱藏的聯絡,從中得到一些對學校教學工作管理者有用的資訊。就像是在購物中,就可以透過顧客的購買物品的聯絡,從中得到顧客的購買習慣。
2.3預測
預測是根據已經得到的資料,從而對未來的情況做出一個可能性的分析。資料探勘技術能自動在大型的資料庫中做出一個較為準確的分析。就像是在市場投資中,可以透過各種商品促銷的資料來做出一個未來商品的促銷走勢。從而在投資中得到最大的回報。
3.資料探勘的方法
資料探勘技術融合了多個學科、多個領域的知識與技術,因此資料探勘的方法也呈現出很多種類的形式。就目前的統計分析類的資料探勘技術的角度來講,光統計分析技術中所用到的資料探勘模型就回歸分析、邏輯迴歸分析、有線性分析、非線性分析、單變數分析、多變數分析、最近鄰演算法、最近序列分析、聚類分析和時間序列分析等多種方法。資料探勘技術利用這些方法對那些異常形式的資料進行檢查,然後透過各種資料模型和統計模型對這些資料來進行解釋,並從這些資料中找出隱藏在其中的商業機會和市場規律。另外還有知識發現類資料探勘技術,這種和統計分析類的資料探勘技術完全不同,其中包括了支援向量機、人工神經元網路、遺傳演算法、決策樹、粗糙集、關聯順序和規則發現等多種方法。
4.資料探勘在考試成績分析中的幾點應用
4.1運用關聯規則分析教師的年齡對學生考試成績的影響
資料探勘技術中的關聯分析在教學分析中,是一種使用頻繁,行之有效的方法,它能挖掘出大量資料中項集之間之間有意義的關聯聯絡,幫助知道教師的教學過程。例如在如今的一些高職院校中,就往往會把學生的英語四六級過級率,計算機等級等,以這些為依據來評價教師的教學效果。將資料探勘技術中的關聯規則運用於考試的成績分析當中,就能夠挖掘出一些對學生過級率產生影響的因素,對教師的教學過程進行重要的指導,讓教師的教學效率更高,作用更強。
還可以透過關聯規則演算法,先設定一個最小可信度和支援度,得到初步的關聯規則,根據相關規則,分析出教師的組成結構和過級率的.影響,從來進行教師隊伍的結構調整,讓教師隊伍更加合理。
4.2採用分類演算法探討對考試成績有影響的因素
資料探勘技術中的分類演算法就是對一組物件或一個事件進行歸類,然後透過這些資料,可以進行分類模型的建立和未來的預測。分類演算法可以進行考試中得到的資料進行分類,然後透過學生的一些基本情況進行探討一些對考試成績有影響的因素。分類演算法可以用一下步驟實施:
4.2.1資料採集
這種方法首先要進行資料採集,需要這幾方面的資料,學生基本資訊(姓名、性別、學號、籍貫、所屬院系、專業、班級等)、學生調查資訊(比如學習前的知識掌握情況、學習興趣、課堂學習效果、課後複習時間量等)、成績(學生平常學習成績,平常考試成績,各種大型考試成績等)、學生多次考試中出現的易錯點(本次考試中出現的易錯點,以往考試中出現的易錯點)
4.2.2資料預處理
(1)資料整合。把資料採集過程中得到的多種資訊,利用資料探勘技術中的資料庫技術生產相應的學生考試成績分析基本資料庫。(2)資料清理。在學生成績分析資料庫中,肯定會出現一些情況缺失,對於這些空缺處,就需要使用資料清理技術來進行這些資料庫中資料的填補遺漏。例如,可以採用忽略元組的方法來刪除那些沒有參加考試的學生考試資料已經在學生填寫的調查資料中村中的空缺項。(3)資料轉換。資料轉換主要功能是進行進行資料的離散化操作。在這個過程中可以根據實際需要進行分類,比如把考試成績從0~59的分到較差的一類,將60到80分為中等類,81到100分為優秀等。(4)資料消減。資料消減的功能就是把所需挖掘的資料庫,在消減的過程又不能影響到最終的資料探勘結果。比如在分析學生的基本學習情況的影響因素情況中,學生資訊表中中出現的欄位很多,可以選擇性的刪除班別、籍貫等引述,形成一份新的學生基本成績分析資料表。
4.2.3利用資料探勘技術,得出結論
透過資料探勘技術在線上考試中的應用,得出這些學生資料的相關分析,比如說學生考試中的易錯點在什麼地方,學生考試成績的自身原因,學生考試成績的環境原因,教師隊伍的搭配情況等等,從中得出如何調整學校教學資源,教師的教學方案調整等等,從而完善學校對學生的教學。
5.結語
資料探勘技術在社會各行各業中都有一定程度的使用,基於其在資料組織、分析能力、知識發現和資訊深層次挖掘的能力,在使用中取得了顯著的成效,但資料探勘技術中還存在著一些問題,例如資料的挖掘演算法、預處理、視覺化問題、模式識別和解釋等等。對於這些問題,學校教學管理工作者要清醒的認識,在線上考試系統中對資料探勘資訊做出合理的使用,讓數字挖掘技術在線上考試系統中能夠更加有效的發揮其長處,避免其在線上考試系統中的的缺陷。
參考文獻:
[1]胡玉榮.基於粗糙集理論的資料探勘技術在高校學生成績分析中的作用[J].荊門職業技術學院學報,2007,12(22):12.
[2][加]韓家煒,堪博(Kam ber M.) .資料探勘:概念與技術(第2版)[M]範明,譯.北京:機械工業出版社,2007.
[3]王潔.《線上考試系統的設計與開發》[J].山西師範大學學報,2006(2).
[4] 王長娥.資料探勘技術在教育中的應用[J].計算機與資訊科技,2007(11)