Page 10 - 實中園地 第廿七卷第二期
P. 10

實中園地       The Newsletter of NEHS 111年第 27卷第 2期
















                   R軟體的統計輸出檔內容包含殘差(residual)、自由度(degree of freedom)和決定係數(Multiple
              R-squared)等等,課程內容會說明這些相關輸出,讓學生進一步了解其統計意義與模型的適配度。
              根據樣本數據建構出的迴歸模型,必須滿足那些前提才可以推論至母體,是統計學裡一個很重要的
              概念。學生學會了線性迴歸的基本技能後,課程後段會進一步提及推論統計(statistical inference)
              和機器學習(machine learning)的概念。我們試著把大數據以不同比例區分為訓練集(training
              data)和測試集(test data),將依據訓練集的數據建構出的迴歸模型套用至測試集,判斷模型適配
              度(參考下圖)。或者,我們也試著依據某幾個年度的數據建構迴歸模型,再將其套用至其他年度
              的數據,判斷模型適配度。


                   資料分析是一個與數學相關但比較貼近生活的課程。學生透過分析課本的簡易數據習得基礎知
              識,再透過分析真實世界的大數據理解其應用層面,並可進一步進行跨領域學習。學生若想進行自
              主學習,網路上的開放式課程如 Edx、Cosurea 等均有資料分析的相關課程,修課後甚至可以進一步
              取得相關學分證明。是個值得一試的選擇。

















































              10   Data Analysis and R Programming 選修課介紹
   5   6   7   8   9   10   11   12   13   14   15