Page 10 - 實中園地 第廿七卷第二期
P. 10
實中園地 The Newsletter of NEHS 111年第 27卷第 2期
R軟體的統計輸出檔內容包含殘差(residual)、自由度(degree of freedom)和決定係數(Multiple
R-squared)等等,課程內容會說明這些相關輸出,讓學生進一步了解其統計意義與模型的適配度。
根據樣本數據建構出的迴歸模型,必須滿足那些前提才可以推論至母體,是統計學裡一個很重要的
概念。學生學會了線性迴歸的基本技能後,課程後段會進一步提及推論統計(statistical inference)
和機器學習(machine learning)的概念。我們試著把大數據以不同比例區分為訓練集(training
data)和測試集(test data),將依據訓練集的數據建構出的迴歸模型套用至測試集,判斷模型適配
度(參考下圖)。或者,我們也試著依據某幾個年度的數據建構迴歸模型,再將其套用至其他年度
的數據,判斷模型適配度。
資料分析是一個與數學相關但比較貼近生活的課程。學生透過分析課本的簡易數據習得基礎知
識,再透過分析真實世界的大數據理解其應用層面,並可進一步進行跨領域學習。學生若想進行自
主學習,網路上的開放式課程如 Edx、Cosurea 等均有資料分析的相關課程,修課後甚至可以進一步
取得相關學分證明。是個值得一試的選擇。
10 Data Analysis and R Programming 選修課介紹