時間:2023-06-05 09:57:17
開篇:寫作不僅是一種記錄,更是一種創造,它讓我們能夠捕捉那些稍縱即逝的靈感,將它們永久地定格在紙上。下面是小編精心整理的12篇應用統計學,希望這些內容能成為您創作過程中的良師益友,陪伴您不斷探索和進步。
魅力無限的花園學府
我是浙江工商大學2003屆的學生。是下沙新校區的第一屆學生,我們常常戲稱自己是這里的開拓者,新校區在下沙高教園東區,東臨錢塘江,遠眺蕭山觀潮城。風景怡人,雖然最初條件不是很好,但到處是一片新氣象。開拓者的感覺很讓人精神振奮,
隨著建設的快馬加鞭,學校的設施也逐漸完善,如今呈現在眼前的,是青灰色的統一建筑,整齊、干凈、大氣而美麗,小河像血脈一樣連通著校園,一片片草坪綠得耀眼,點綴著年輕的小樹――在和煦的陽光下,杭州細膩的美景中?;蚩磿蛄奶?,非常愜意;如今再一次從設計精美的求知泉、藍天碧水的月亮灣、大氣的啟航廣場走過,看著三五成群的學弟學妹,一臉笑容,一臉朝氣,讓已經失去校園滋補的我滿是羨慕,不知不覺,我走到了校園最遠處的鴿房,這是我最喜歡的地方,草坪上設計了幾個專供鴿子休憩的木頭房子,鴿子優雅地在草坪上踱步、飛揚,這種場景讓人感到高貴而純潔。
快離開教學區的時候,我又去瞻仰了一下學校的飛翔門,飛翔門――顧名思義,門的形狀像展翅飛翔的鳥,氣勢磅礴,象征著莘莘學子即將起航飛揚神州大地。
浙商大的培養方法很獨特,施行“子女戰略”,視學生為子女,讓學生在嚴格要求與熱情關愛中健康成長,學校給新生寄教材。讓他們早日開始大學的學習;實行早讀和晚自習制度,這造就了學校良好的學風;在全校學生中聘任校長書記聯絡員,讓學生直接和校領導交流,這些使得整個學校就像一個大家庭一樣溫暖。
枯燥而有趣的統計學
我學的是統計學,這是一個老牌專業,主要包括一般統計和經濟統計兩類專業方向,需要學習數學基礎課(分析、代數、幾何)、概率論、數理統計、運籌學、計算機基礎、應用隨機過程、實用回歸分析、時間序列分析、多元統計分析、抽樣調查、非參數統計、統計預測與決策、風險管理等,統計學是一個枯燥的專業,我們要和大量的數據打交道,堆積如山的各式表格看了都讓人害怕,更別說還要去整理和分析這一堆堆冷冰冰的數字了,不過,統計學又是一個有趣的專業,畢竟它是和生活緊密聯系在一起的。
你知道美女是怎么來的嗎?美女都是被“統計”出來的。比如某一天你在街上閑逛,迎面走來一位女生,這時你就統計她出現在你面前時的心率,如果高于120次,就絕對可以稱之為美女了,如果某一天你遇到一位讓你心跳超過140次的女孩子。那在你看來,沉魚落雁、絕代佳人都不足以形容這位美女,當然。你此刻的心情也無語言表。
你想知道你心儀的女孩子對你的態度嗎?要看一個女孩子對你的態度究竟怎樣。那你就統計去找她時,有多少次她會說自己忙、抽不出空來。或者不巧、沒有辦法、抱歉,如果這樣的比例高于某個百分比,那你就該知道,再死纏爛打下去,也不會有好的結果。
你看,統計學是多么的有趣,居然關系到同學們的終身大事,當然這僅僅是一個玩笑而已,不過,它在現實生活中確實是很重要的,在現代,我們很難找到不會利用統計學的領域了,太陽每天從東方升起,但天安門廣場上與太陽同時升起的國旗,其升旗時間卻每天不同;冬天過去,春天就要來臨,但今年的春色比去年更加明媚;物體失去支撐就會墜落,但受風速、風向、地心引力等很多細小因素的影響。兩個同樣重的物體墜落速度和落點會有差別;“神舟五號”飛船按設計的軌跡運轉,但每次經過我國領空的時間都略有差距;經濟按市場規則運行,但今年的GDP比去年增長8%;奔波的人們按自己的哲學度日,但一年又一年我們的生活逐漸發生了改變。
充滿希望的就業前景
如前所述,現代統計學的應用是很廣泛的,理、工、農、醫、文、經,沒有不用到統計學的,所以,它的出路不再尷尬。前途充滿光明。
畢業后,你可以選擇工作,去政府統計部門,銀行、證券公司、保險公司等金融機構。信息咨詢公司等,整體而言,如果英語比較好,統計分析能力強,并且具備一定的社會實踐經驗,就能夠進入跨國公司與大牌的咨詢公司,薪酬會非常高,在8000元左右,如果沒有這方面的優勢,薪酬就會比較一般,北京、上海、深圳等一線城市,普遍薪酬在4000元左右。
醫學統計學是根據概率論和數理統計的原理, 結合醫藥衛生工作的實際情況, 研究實驗設計和數字資料的搜集、整理、分析和推斷的一門科學, 廣泛應用于基礎醫學、臨床醫學、預防醫學、藥學和衛生事業管理等諸多領域。它是人們認識客觀世界的一種重要手段, 現代科技工作者做科學研究或撰寫論文, 很少看到不用統計學。
與此同時,如果統計學方法應用不當,不僅不能準確地反映科研結果,而且還可能帶來錯誤的結淪。Rosenfeld 等比較了不同年表的文章,在20 世紀90年代以后有更多的文章使用了統計推斷,而且比較復雜的統計分析方法如多因素分析等也更多的應用于臨床研究中,但同時也存在使用統計方法欠妥或敘述不清的情況。
因此本文將對醫學科技論文常見統計學方法的正確應用進行討論,希望加強作者的統計思維,進而提高期刊論文的統計質量及學術水平。
2、統計學方法的內容
統計軟件包、統計分析方法及檢驗水準是統計學方法必須描述的3 方面內容。SPSS (statistics package for social science) 和SAS(statistical analysis system ) 是全世界學術界公認且最常用的兩大統計軟件包[6]。檢驗水準即A,表示組間實際無差別而統計結果判斷為有差別,犯這類錯誤的概率[1]。實際工作中常取 A=0.05,表示本次研究計算所得P 值必須小于0.05,才能認為組間差異有統計學意義。統計分析方法的準確描述是科技論文科學性的關鍵所在。統計學方法一般包括統計描述和組間差異性檢驗(即:假設檢驗) 兩部分內容。
3、統計學方法的正確選用
統計方法的選擇取決于研究設計、數據資料類型和變量值的分布。計量資料常用u檢驗、t檢驗(.配對t檢驗)、 F檢驗;計數資料用 檢驗;等級資料、偏態資料或不明分布的資料可用秩和檢驗等。每種顯著性檢驗方法均有其適用范圍, 如方差分析(F檢驗).要求數據服從正態分布, 且各總體方差齊, 否則不宜作方差分析, 若改用非參數統計方法, 則會降低統計效率, 故常在可能情況下, 通過變量變換(如對數變換、平方根變換、反正弦函數變換、例數變換等)使資料轉換為正態分布, 以滿足方差分析或t檢驗的應用條件。醫學期刊中最常見的是t檢驗和 檢驗, 這兩種方法誤用也較為多見。
3.1重復t檢驗
多個樣本均數間的兩兩比較(又稱多重比較)不宜用t檢驗, 因為重復數次,t檢驗將增加第一類錯誤的概率, 使檢驗效率降低。此時宜用方差分析, 并在此基礎上用兩兩比較方法..(如.SNK、LSD、Duncan法等)。對于同一對均數間的差異, 用t檢驗無顯著性, 而兩兩比較可能有顯著性, 可見錯誤選用統計方法將推出錯誤結論。
3.2行列標 檢驗誤用
行列表 檢驗用于2個或多個樣本率(或構成比).比較, 它要求行列表中不宜有1/5以上格子的理論頻數T
3.3需要注意的統計學問題
3.3.1無足夠的統計學信息
論文中未說明統計方法和 取值, 無均數、標準差或率及t值、 值等統計量, 甚至未作假設檢驗直接下結論。不少臨床醫學論文作者只在文中提及P值大小并據此推斷結果的顯著性。實際上, 臨床醫學研究關心的是各組之間結局(如療效)的差別大小, 而不單純是統計學顯著性, 因此應同時說明檢驗方法、 水平、統計量值、P值和可信區間, 以便讓讀者了解所用的方法和結論是否適當及其臨床的實際意義。
3.3.2統計圖、表
統計圖、表是統計描述的重要工具。統計圖宜少而精, 應按資料性質和分析目的選用適合的統計圖形, 統計圖雖直觀但不能代替精確的數據或統計量同。統計表宜簡單明了, 層次清楚, 一般采用三線表。常見的統計表運用不當有.. 標題復雜或過于簡略甚至無標題, 輔助線過多, 標目繁雜, 層次不清。另外, 表內不宜留空格, 暫缺或未記錄可用“…” 表示, 無數字用“一”表示, 數字若是“0”則填明“0”。
3.3.3統計軟件使用的誤區
目前計算機應用已十分普及, 統計軟件的使用也非常方便, 但軟件只能解決計算問題, 并不能替代人腦的統計思維。根據資料的分布特征和數據特點選擇統計方法, 正確地解釋分析結果并推導出正確的結論, 這是科研工作者在做統計分析時必須首先掌握的, 計算只是一種工具。有了諸如SASA、SPSS等高級統計軟件包, 復雜了多元分析如多重回歸、多因素方差分析等已變得十分容易, 于是一些作者片面追求使用高深的多元統計方法且多種方法一起用, 誤以為統計方法用得越高級, 文章水平越高。實際上如果使用不當, 多元統計方法使用得越多, 錯誤可能也越多。一個精心設計的臨床研究, 資料可能用簡單的t檢驗或 檢驗就足以說明問題, 若濫用多元分析、結果會適得其反。
4.結語
通過上面的分析,在醫學研究中必須正確運用統計學,這是科研工作的科學性所決定的。搞科研,首先必須尊重科學。借助統計學這個有用的工具,可以去探索未知事物,揭示和闡明客觀事物變化的規律性。
參考文獻:
[1]于國藝, 周曉彬, 王俊. 醫學論文常見統計方法誤用分析.編輯學報, 1998;10(3):132.
[2]楊樹勤, 主編.衛生統計學.第3版.北京: 人民衛生出版社, 1995;145-147.
主干學科:應用統計學。主要課程:數學基礎課(分析、代數、幾何)、概率論、數理統計、運籌學、計算機基礎、應用隨機過程、實用回歸分析、時間序列分析、多元統計分析、抽樣調查、參數統計、統計預測與決策、風險管理等,以及根據應用方向選擇的基本課程等。
應用統計學專業主要包括一般統計和經濟統計兩類專業方向,培養具有良好的數學或數學與經濟學素養,掌握統計學的基本理論和方法,能熟練地運用計算機分析數據,能在企業、事業單位和經濟、管理部門從事統計調查、統計信息管理、數量分析等開發、應用和管理工作,或在科研、教育部門從事研究和教學工作的高級專門化應用型人才。
(來源:文章屋網 )
一、地質統計學的概述
地質統計學是1962年,法國著名統計學家G.Matheron在Traitédegéostatistiqueappliquée一文最早提出的,之后其他科學家大量理論研究的基礎上逐漸形成的一門新的統計學與地質學的交叉學科。地質統計學所利用的是應用統計學。地質統計學因為具有空間的分布特點,而且是利用區域變量理論作為理論基礎,因此地質統計學在礦產開發、資源開發、動植物研究、地質地貌方面都有著很突出的作用。之所以將它稱作地質統計學是因為,它最早只是應用在地理科學當中。地質統計學的創立最初是由G.Matheron創造的,經過長時間的改造與發展,現在的地質統計學已經成為一門非常完善的數學工具了,而且它的應用也變得越來越廣泛,由最初單純的地理研究,發展到今天在地球物理、地質、生態、土壤等領域的廣泛應用。
二、地質統計學在礦山儲量分析當中的應用
地質統計學是以研究區域化變量為基礎的,以變異函數為研究工具,研究在空間上具有隨機性和結構性的自然現象的科學。地質統計學在礦山儲量分析當中的應用中的原理大致分為以下幾種:1.區域化變量區域化變量是地質統計學理論體系的核心基礎,在實踐中,鉆孔的位置。在絕大多數情況下是不隨機的。當兩個樣品在空間的距離很小時,樣品間會存在較強的相似性,而當距離很大時,相似性就會減弱或不存在。也就是說,樣品之間存在著某種聯系,這種聯系的強弱是與樣品的相對位置有關的,樣品之間的聯系在空間上既具有隨機性又具有位置之間的聯系。2.半變異函數的數學模型通常情況下樣品由于取樣、化驗誤差和礦化作用在短距離內的變化,在絕大多數情況下半變異函數在原點不等于零。也就是會存在塊金效應。但是地質統計學在礦山儲量分析當中的應用在實際工作中區域化變量的變化性很復雜,通常要計算幾個具有代表性的方向,然后通過結構分析,得到一個能代表其空間變異性的模型函數,由于區域化變量往往存在各向異性,不同方向上的半變異函數具有不同的變程,影響范圍是一橢球體,即各向異性橢球體。在確定空間搜索橢球體時,不僅需要指出塊金常數、基臺、變程,還需要指定一些參數:圓錐體的容差角、容差限、滯后距等,各個參數的意義用幾何圖形表示。當然應用地質統計學法對礦山儲量分析,被大部分人認為是一種較好的品位估值方法,尤其適用于品位變化大,礦巖界線由品位控制的礦床。在估值計算過程中,當有了足夠的地質鉆孔數據時,對礦床進行正式可行性評價時,選用地質統計學法是一種較好的方法,而在對礦床進行初步評價或是數據量不足時,就要首選較簡單的方法?;诘刭|統計學原理和礦體三維可視化建模技術的DIMINE礦業軟件,實現了按照不同的邊界品位動態圈定礦體,能夠以市場經濟為向導,快速計算出礦體范圍內的礦石量,并進行儲量分級,在此過程中所得到的各中間參數,可以為投資決策和日常管理提供必要的參考依據。
三、地質統計學在勘探網度優化方面的應用
地質統計學在勘探網度優化中的應用主要要注意以下的兩個個因素,其一是:構造復雜程度;二是煤層的穩定性。當勘探區的構造已經經過,詳細的勘探,構造問題基本解決之后,勘探網度優化主要的問題就是煤層的穩定性。當一個煤田有兩種或者是兩種以上的煤層穩定結構時、應該按照儲量和厚度占有優勢的那一個煤層類型選擇勘探網度的優化。應用地質統計學的方法對露天的在勘探網度進行優化,主要要分為兩個步驟:其一是建立地質變量的最佳理論變差函數;其二是應用地質變量的估計方差評價勘探過程對礦床的控制程度。
四、結語
本文詳細論述了地質統計學的概述、地質統計學在礦山儲量分析當中的應用、以及地質統計學在勘探網度優化方面的應用,通過對以上問題的論述,我們更加清晰的認清了地質統計學以及地質統計學在固體礦山中的應用。就目前的情況而言,我國對地質統計學的認識還是不夠充分的,大多數都將地質統計學看做一門非常復雜的科目,所以沒有去進行深入的研究,所以,我國的地質統計學還處在一個非常初級的階段,地質統計學的作用也難以在我國發揮出來。由于我國的地質狀況非常復雜,與外國的地質狀況非常不同,主要體現在:地質類型多、地質結構復雜、多高山、少平原、礦產資源豐富。因此地質統計學在我國的發展既有機遇同時也存在著挑戰??偠灾刭|統計學在我國的研究是非常有意義的,但是因為各種條件的限制,我國在地質統計學上的發展還是不夠完善,而且現在的地質統計學的應用不單單只限于地理科學方面的研究,它在各個領域都是有所涉及的,如環境科學、農田水利、氣象、林業、海洋等領域均已涉及,因此,發展我國的地質統計學是現在非常重要的任務,因為地質統計學的高速發展有利于我國國民經濟的快速發展,也有利于解決我國資源緊缺的問題。隨著應用領域的不斷擴大和方法本身的不斷完善,地質統計學已逐步方展成一個通用的工具性科學。也希望我國能夠通過地質統計學固體礦山中的應用中有很大的進步。
作者:馮艷娟 單位:河北省地質礦產勘查開發局第四地質大隊
摘 要:隨著我國經濟發展水平的不斷提高,各行各業得到了顯著發展,數據統計學方法也變得日趨多樣,數據挖掘是建立在數據庫與人工智能基礎上發展起來的一種高新技術,其功能是從眾多的數據當中挖掘到最有價值的信息,進而實現對數據資源的高效利用。聚類分析能夠被當成一種數據分析工具,能真實反映出數據分布情況,本文主要對統計學在數據挖掘中的應用進行了探討,從而表現統計學在數據挖掘應用中的重要性。
關鍵詞:統計學方法;數據挖掘;應用分析
數據挖掘就是指從眾多實際應用數據中獲取批量大、有噪聲、且隨機性強的數據,將潛在的信息與數據提取出來,就是從數據中挖掘有價值的知識,而大多數原始數據具有一定的結構化特征,比如,關系數據庫中的數據;也可以通過文本、圖形、圖像等半結構化發掘有用知識,這些知識可以是數學的也可以是非數學形式的;數據挖掘能以歸納形式存在,能夠被廣泛應用到信息查詢、信息管理、信息決策控制中,方便數據的維護與管理。由此可見,數據挖掘是一門交叉性強的學科,加強對其的研究非常有意義,下面將對統計方法在數據挖掘中的具體應用進行分析。
一、數據挖掘與統計學的關系
(一)數據挖掘的內涵
通常來說,數據挖掘的定義較為模糊,沒有明確界定,大部分對其的定義只是停留在其背景與觀點的內容上。通過對不同觀點的統一整理,人們最終將其描述為:從大量多樣化的信息中發現隱晦性、規律性等潛在信息,并對這些信息進行創造、加工的過程。數據挖掘作為一門重要的交叉學科,能夠將數據庫、人工智能、機器學習、統計學等眾多的科學融入到一起,從而實現技術與理論的創新與發展[1]。其中,數據庫、人工智能與統計學是數據挖掘當中的三大支柱理論。數據挖掘的目的是從數據庫當中發掘各種隱含的知識與信息,此過程的方法非常多,有統計學知識、遺傳算法、粗集方法、決策法、模糊邏輯法等,還可以應用向鄰近的可視技術、模式識別技術等,在以上所有技術的支持上能夠使數據挖掘更為科學、有序。
(二)數據挖掘與統計學間的關系
通常來說,統計學的主要功能是對統計原理與統計方法進行研究的科學。具體來說就是指對數字資料進行的收集、整理、排序、分析、利用的過程,數字資料是各種信息的歸納與總結,可以將其作為特性原理的認知、推理方法[2]。而統計學則表示的是使用專業的統計學、概率理論原理等對各種屬性關系的統計與分析過程,通過分析成功找到屬性間的關聯與發展的規律。在此過程中,統計分析方法是數據挖掘最為重要的手段之一。
在數據挖掘這一課題被提出來之前,統計分析技術對于人們來說更熟悉,也是人們日常開展工作、尋找數據間規律最常使用的方法。但是不能簡單的將數據挖掘作為統計學的延伸與替代工具,而是要將兩者的區別認識到位,再結合兩者間的不同特點分析其應用特點[3]。大部分的統計學分析技術都是建立在數學理論與技巧上的,預測通常較為準確,效果能夠讓大部分人滿意。數據挖掘能夠充分借鑒并吸收統計學技術,在融入到自身特點以后成為一種數據挖掘技術。
統計學與數據挖掘存在的目標都是一致的,就是不斷對數據結構進行發掘。鑒于統計學與數據挖掘在目標上的一致性,致使很多研究學者與專家將數據挖掘作為了統計學的一個分支機構[4]。但是這種認知非常不正確,因為數據挖掘不僅體現在與統計學的關系上還體現在思想、工具與方法上,尤其是在計算機科學領域對數據挖掘起到的作用非常大。比如,通過借助數據庫技術與人工智能的學習,能夠關注到更多統計學與數據挖掘上的共通點,但是兩者存在的差異依然非常大。數據挖掘就是指對大量的數據信息不斷挖掘的過程,DM能夠對數據模式內的數據關系進行充分挖掘,并對觀測到的數據庫處理有著極高的關注度。
二、數據挖掘的主要過程
從數據本身出發探討數據挖掘過程,數據挖掘的過程分為信息的收集、數據集成、數據處理、數據變換、數據挖掘實施等過程。
首先,要將業務對象確定下來,明確不同業務定義,并認清數據挖掘的目的,這是做好數據挖掘最關鍵的一步,也是最重要的一步,雖然挖掘的結果不能被準確預測到,但卻需要對問題的可預見性進行探索[5]。其次,還要做好數據準備工作,包含數據清理、數據變換等工作,數據清理的實際意義是將噪聲與空缺值補全,針對這一問題,可以使用平滑技術,而空缺值的處理則是屬性中最常見的,可以將統計中最可能出現的值作為一個空缺值[6]。
信息收集指的是按照特定的數據分析對象,可以將分析中需要的特征信息抽象出來,并在此基礎上選擇出較為科學、適合的信息收集方法,將全部的信息全部錄入到特定的數據庫中。如果數據量較大,則可以選擇一個專門的管理數據的倉庫,實現對信息的有效保護與管理;數據集成就是指將來源不同、格式不同、性質不同、特點不同的數據集成到一起,進而為企業提供更為全面、系統的數據共享平臺;數據變換就是通過聚集、概化、規范化等方式對數據進行挖掘,對于一些實用數據,則可以通過分層與分離方式實現對數據的轉換;數據挖掘就是結合數據倉庫中的數據信息點,并選擇正確的分析方法實現對有價值數據的挖掘,事例推理、規則推理、遺傳算法等都是應用較多的方法[7]。
三、統計學方法中的聚類分析
在統計學聚類方法基礎上能夠構建出潛在的概率分布假設,可以使用試圖優化的方法構建數據與統計模型的擬合效果?;诮y計學聚類方法當中,Cobweb方法是在1987年由Fisher提出的,能夠以分類樹作為層次聚類創建的方法,在分類樹上,每一個節點都能代表著一個概念,該方法就是對節點概率描述的過程。Cobweb方法還使用了啟發式估算方式,使用分類效用對分類樹的構建進行指導,從而實現對最高分類的劃分目的,能夠將不同分類對象全部歸類到一個類別中,并依據這些內容創建出一個新的類別。但是這種方法也存在一定局限性,局限性在于假設的屬性概率分布都是獨立的,并不能始終處于成立狀態中。
只有在掌握了Cobweb算法以后才能對概念聚類算法的特點進行探究。Cobweb算法能夠以分類樹方式創建層次聚類,可以將概率表現為p(Ai=Vii/Ck)條件概率,其中,Ai=Vij是一個類別下的,同屬于一個值對,Ck是概念類中的一種。在給出一個特定的對象以后,Cobweb能夠將全部對象整合到一個節點上,從而計算出分類效應,分數最高的效用就是對象所在的節點位置[8]。如果對象構建失去節點,則Cobweb能夠給出一個新的節點,并對其進行分類使用,這種節點計算方法起步較晚,能夠對現有的節點與計算相互對比,從而劃分出最高的分類指標,將全部對象統一到已有的分類中,從而構建出一個新的類別。
Classitci是Cobw eb方法的一種延伸與發展,能夠使用其完成聚類數據的處理,在該方法下,節點中的每一個存儲屬性都是處于連續分布狀態中,能夠將其作為分類效果修正的方法,并以度量的形式表現出來,這種度量基礎上能夠實現連續性的積分,從而降低分散發生率,該方法是積分過程而不是對屬性的求和過程。
Auto Class方法也是一種應用較為普遍的聚類方法,該方法主要采用統計分析對結果類的數目進行估算,還可以通過模型搜索方式分析空間中各種分類的可能性,還能夠自動對模型數量與模型形態進行描述。在一定類別空間中,不同的類別內屬性存在關聯性,不同的類別間具有相互繼承性,在層次結構當中,共享模型參數是非常重要的。
還有一種使用較為普遍的模型是混合模型,混合模型在統計學聚類方法上使用也非常普遍。該方法最為基本的思想就是概率分布決定著每一種聚類狀態,并且模型中的每一個數據都是由多個概率在分布狀態下產生的?;旌夏P瓦€能夠作為一種半參數密度評估方法,其能夠將參數估計與非參數估計的優點全部集中到一起,并將參數估計法與非參數估價法的諸多優點融合到一起,因為模型具有一定復雜性,為此,不能將其限制在概率密度函數表達形式上,這種復雜性決定了模型與求解存在關聯,與樣本集合的聯系非常少。通過以上的研究可以了解到,數據發掘中應用聚類方法非常有效,并且較為常見。比如,構建出Cobweb模型與混合模型,采用Clara與Clarans方法中的抽樣技術,將Denclue方法用在概率密度函數中。
結束語
統計學方法自產生開始已經有非常久遠的歷史,將嚴謹的數學邏輯作為基礎,將分類算法假定作為獨立條件,屬性值之前能夠相互保持獨立,對假定進行計算,當假定成立時,可以再與其他分類算法進行對比,這種分類算法準確性非常高。為此,其不僅能夠對連續值進行預測,還可以通過線性回歸方程對系數進行比較,從而歸納出結果。
(作者單位:中國人民大學)
參考文獻:
[1] 張愛菊.基于數據挖掘技術的瓦斯氣體紅外光譜定量分析方法的研究[J].光譜學與光譜分析,2013,33(10):2646-2650.
[2] 許長福,李雄炎,譚鋒奇等.任務驅動數據挖掘方法的提出及在低阻油層識別中的應用[J].吉林大學學報(地球科學版),2012,42(1):39-46.
[3] 鄭曉峰,王曙.基于粗糙集與關聯規則的道路運輸管理信息數據挖掘方法[J].華南理工大學學報(自然科學版),2014(2):132-138.
[4] 周復之.固定收益決策支持系統機理建模與數據挖掘的協同研究[J].系統工程理論與實踐,2010,29(12):38-45.
[5] 張繼福,張素蘭,蔣義勇等.基于約束概念格的天體光譜局部離群數據挖掘系統[J].光譜學與光譜分析,2011,29(2):551-555.
[6] 張欣欣,繆弈洲,張月紅等.CrossRef文本和數據挖掘服務――《浙江大學學報(英文版)》的實踐[J].中國科技期刊研究,2015,26(6):594-599.
關鍵詞 Excel;生物統計學;t分布;TINV函數;TDIST函數
中圖分類號 G642 文獻標識碼 A 文章編號 1007-5739(2016)23-0271-02
生物統計學是研究數據資料的收集、整理、分析、解釋的一門科學[1],也是畜牧、獸醫、農學、微生物、醫學等領域中不可缺少的統計工具,越來越多的數據分析離不開生物統計學的原理。隨著計算機技術的發展,已經有更多的軟件或操作系統被應用于生物統計學,如Excel[2]、SAS[3]、SPSS[4-6]等,但是不同的統計軟件具有不同的統計特點,如Excel統計功能更為簡單,適合生物統計學的初學者。SAS統計功能比較寬廣,因其統計模塊的限制,所以更適合能夠自己編寫程序的學者。SPSS的統計功能更為強大,幾乎具備了所有的統計分析功能,操作相對簡單、直觀。雖然從統計分析上來看,SAS和SPSS的統計分析功能略勝于Excel,但是Excel也具有其獨特的地方,如對一些常用分布的概率計算來說Excel就顯得更簡單。本文則針對Excel在生物統計學 t分布中的一些應用進行探討。
1 t分布
2 Excel在t分布計算的應用
2.1 t分布的概率計算
例1:如果一個t分布的自由度(df)等于60,臨界值(或者分位數)是2,求t分布的兩尾概率是多少?求t分布的單尾概率是多少?
t分布的雙尾概率是指在其分布的2個尾部(左尾和右尾部)概率之和,Excel中選定空格―插入―fx函數―統計―TDIST,在其對話框中從上至下依次輸入2、60、2,具體見圖2,其概率為0.050 0。
t分布的單尾概率是指在其分布的左尾部概率或右尾部概率,因為t分布是左右對稱分布,所以單側的左尾概率與右尾概率相等。Excel中選定空格―插入―fx函數―統計―TDIST,在其對話框中從上至下依次輸入2、60、1。
2.2 t分布的R界值計算
例2:如果一個t分布的兩尾概率為0.05,自由度(df)為10時,則其臨界值是多少?
Excel中選定空格―插入―fx函數―統計―TINV,在其對話框中從上至下依次輸入0.05、10,具體見圖3,其臨界值為2.228 2。
3 結語
在本科生的教學改革與實踐中,已經把各種分布的概率計算納入生物統計學的實踐教學中,而且在概率計算這方面,Excel比較方便快捷。本文主要介紹了用Excel中 的TDIST和TINV函數在t分布中的應用,在用TDIST函數模塊時,雙尾概率和單尾概率的不同之處在于提示框中“Tails”的填寫數字不同,雙尾填“2”,單尾填“1”。而TINV函數只能提供雙尾概率的臨界值,如果要計算單尾概率的臨界值,如單尾概率為0.01的臨界值,則可以事先變換成雙尾概率即 0.02,然后即可利用TINV函數計算出其臨界值[7-8]。
4 參考文獻
[1] 張勤.生物統計學[M].北京:中國農業大學出版社,2009.
[2] 王香萍,王文凱,李俊凱,等.EXCEL中關于生物統計中兩組平均數的應用方法及探討[J].考試周刊,2011(6):180-181.
[3] 黃中文,張丹.生物統計與SAS教學中大學生自主學習能力的培養[J].新鄉學院學報(社會科學版),2013,27(5):140-142.
[4] 白俊艷,徐廷生,張小輝.《生物統計附試驗設計》上機實驗改革與實踐[J].教育教學論壇,2015(18):247-248.
[5] 白俊艷,賈小平,張小輝,等.生物統計學課程改革與實踐[J].畜牧與飼料科學,2013,34(10):57-58.
[6] 白俊艷,武曉紅,張小輝,等.生物統計附試驗設計課程考核方式的改革與實踐[J].安徽農業科學,2015,43(5):369-370.
本文較系統地介紹了統計學在證券期貨市場中的應用,其中包括作者的一些最新成果,如:證券期貨市場指標體系的研究;新華財經指數的編制;證券投資組合的研究與應用等。
關鍵詞:統計學 證券市場 期貨市場
分類號:O212 C8 F832.5 標識碼:A
文章編號:1002-1566(2000)01-0054-04
Application of Statistics on Securities and Futures Markets
LI Cong-zhu,DING Shao-fang,WANG Ling-hua,SUN Da-ning
(North China University of Technology,100041)
Abstract:In this paper,the Application of Statistics on Securities and Futures Markets is introduced,author's many new achievements are included in it,such as study of index system on Securities and future markets;study of Xin Hua index number of securities;study and application of investment in bond and so on.
Key Words:statistics securities markets futures markets
一、序
言
我國自九十年代初建立證券期貨市場以來,短短幾年,得到了迅猛,方興未艾。僅拿股市來看(截至1999年07月13日),在滬深兩市上市的境內公司已達900家,滬深市場的A,B股股數是981只,上市公司900家,其中滬市501只(461家),深市480只(439家),滬深A股股數874只,B股股數107只。這與1991年滬市8家深市6家上市公司相比,可見發展速度之快。市價總值21083億元人民幣,占國內生產總值的比重超過25%;開辦證券90家,兼營證券業務的信托投資公司237家,下屬證券營業部2400多家;現有43家境內海外上市,累計籌集資金100多億美元;已有107家公司成功發行了B股,籌集資金近50億美元;股民已達4000多萬。自1999年五月十九日井噴式行情以來,滬深兩市的日成交量猛增,至六月二十五日高達800多億(1998年8月18日香港股市一天的成交量為790億港元),創下空前的天量。證券市場的作用愈來愈大,并逐漸成為國民的晴雨表。
統計學及其相關學科在證券期貨交易中有什么作用呢?我們先從世界范圍談起。
據有關報道,當今華爾街最搶手的不再是傳統的MBA,而是有統計背景、數理能力強的人才。一些在美國獲得統計或數學博士學位的留學生被華爾街錄用,轉眼間便當上了年薪百萬美元的“白領”貴族。如,1984年入中國技術大學少年班的黃沁于1988年提前畢業,赴美國麻省理工學院就讀研究生,畢業后受聘到華爾街某大型證券公司工作。在這個世界上證券業最發達的地方,他以統計和數學為基礎,建立了自己的投資,現已升任該公司副總裁,主管對外投資工作。年僅27歲的黃沁是進入華爾街金融界高層領導的少數華人之一。
華爾街取才原則的轉向,從一個側面反映出證券期貨等金融業發展面臨的挑戰和未來的潮流。證券金融交易是信息量最大,信息敏感度最強、信息變化頻度最高的領域。隨著市場日趨復雜,數字已成為傳遞信息最直接的裁體,加上未來的經濟是被覆蓋與籠罩的數字化經濟,大量的數學與統計工具將在研究中發揮不可或缺的重要。能否把握那看似枯燥無味的數字所隱含的精微變化,成為決定未來競爭成敗的關鍵因素之一。
前年諾貝爾經濟學獎授予在期權定價方面做出開拓性貢獻的經濟學家和統計學家。他們在二十多年前就探索出具有劃意義的定價模型——布萊克.斯科爾期定價公式。本世紀20年代開設了股票期權品種,由于采用柜臺交易方式和缺乏標準化的設計合約,很難轉讓對沖,交易量不足稱道。1973年美國經濟學家布萊克和斯科爾斯,引進概率統計上隨機變量函數的一些定理和積分求值,推導出不支付紅利的股票期權定價公式,從此期權有了明確科學的價格定位依據,很快形成一個完整的市場,并迅速推廣到全世界,直至現在,期權占據著金融王國的重要位置。定價公式成為整個市場運轉的基礎。這個期權公式的定價思想所引發的金融革命表現在,預測遠期價格成為可能,不僅使期權為指數、貨幣、利率、期貨交易提供了全新的保值,投資手段,極大地豐富了金融市場,而且進一步推動了對各種金融產品的價值研究,提高了操作的理論水平。由此可以推斷,沒有布萊克.斯科爾斯定價模型,期權就不可能發展這么快,全球金融衍生品市場也就不可能有今天的高度發達,如今國外大型金融機構在金融交易失利原因時,總是首先追究最初的定價是否存在漏洞和錯誤
建立一個模型就摘取領域的桂冠這一事實,體現了經濟與統計數學密不可分的關系。據不完全統計,自1969年設立諾貝爾經濟學獎以來的40多位獲獎者中,著名的計量經濟學家有23位,10位擔任過世界計量經濟學會會長,有六位直接靠計量經濟的和成果獲獎。借用統計數學,將經濟數學公式化,將經濟行為定量化,已成為當今世界經濟的熱門課題。
有關專家指出,統計學,經濟理論和數學這三者對于真正了解經濟生活中的數量關系來說,都是必要的,但本身并非充分條件。三者結合起來,就是力量。數學給經濟界帶來新的視角,新的觀念。抽象的數學工具一旦準確地切入市場,就顯得非常實用和有價值。二十多年來,指導期權交易的理論—定價模型得到廣大投資者的一貫遵循。沒有統計基礎、不懂定價公式含義的人要想在市場有出色表現將是十分困難的。
證券金融市場的風險管理是個永恒的話題,投資者都想尋求收益回報,但又必須面對各種各樣的損失可能。市場到底存在哪些風險,如何確定風險的大小,如何才能實現收益最大化和風險最小化,歷來都是受人關注的焦點和難點。自從1952年美國學者馬柯威茨運用數量創立證券組合理論以來,市場風險的神秘色彩逐漸淡化,不再變得那么可怕和不可駕馭。
馬柯威茨組合理論的立足點是全面考慮“期望收益最大”和“不確定性(即風險)最小”。它通過投資損失的概率分布和可能收益與預期收益的偏離程度(即我們統計學上的方差),發現投資者應該同時按適當比例購買各種證券而不是一種證券,進行分散化投資,其收益才盡可能是確定的。通過數量得出的這種結論,迎合了投資者避風險的需要。風險管理能力的提高促進了基金的蓬勃。在短短的幾十年間,隨著量化研究的不斷深入,組合理論及其實際運用方法越來越完善,成為現資學中的主流工具。由于馬哥威茨證券組合選擇理論給金融投資和管理思想帶來革新,1990年他獲得了諾貝爾經濟學獎。
眾所周知,量變引起質變。數量關系的背后,牽扯著市場的穩定與發展。金融業的現代化推動了統計與數理方法的應用研究,反過來,當今世界的金融管理特別是防范金融風險,也越來越要量化研究。早在1995年9月,美國斯但福大學經濟學教授劉遵義就通過實證比較,數量分析和模糊評價等方興,預測出菲律賓、韓國、泰國、印尼和馬來西亞有可能發生金融危機。后來的事實果然如此。這從一個側面提醒我們,沒有完整、的分析預測工具,就可能在國際金融競爭中蒙受重大損失。只有加強對作為金融信息的各種變量的研究,才能提高對金融運行的認識,才能把握市場的發展動向。
經濟理論的數學化和統計分析,使各種經濟行為也越來越數量化。在金融領域也不例外。定價公式和組合理論地位的確立,就證明數量工具已發揮了不可磨滅的作用。有統計顯示,在西方金融市場,三分之一的人運用組合理論來投資,三分之一的人靠技術分析管理頭寸,另外三分之一的人仍在堅守基礎分析。雖然運用何種手段來指導決策是投資者個人偏好、觀念的,但組合理論和技術分析所運用的統計工具逐漸被認同,說明理性投資將成為市場的寵兒。由此我們不難理解華爾街選才的動機。
主觀意見和直覺判斷有很大的隨意性,顯然與現資決策的要求相去甚遠。對市場和價格進行定量研究,從而揭示客觀存在的數量依存關系,成為投資和管理決策的一項基礎工作。用統計工具處理各種證券金融數據,可以比較全面地分析各種因素的力度。其主要表現在:
1 結構分析:證券市場與匯率、利率變動和國民經濟發展有多大的關聯度;單一證券與整個市場之間如何相互影響,市場指數設計是否合理;證券與期貨價格走勢是否相互制約;同一類證券有沒有一定的連動關系。
2 價值預測:分析未來證券發行和上市價格的理論定位,確定金融衍生證券的價格,分析預測證券期貨的價格走勢,進行投資決策等。
3 政策評價:市場系統風險的預警及控制,探討不同的組合投資效果。
4 檢驗:證券價格能否反映所有的信息,市場的有效性實證檢驗;各種技術指標的適用性和優化處理,周期效應的對比。
從以上可看出,量化研究有助于搞好風驗管理,設計投資組合,選擇交易時機,評估市場特性。統計工具在證券市場的大量,對交易技術的升級換代,管理水平的提高做出了特殊貢獻。現在,電腦交易系統在國外大行其道,依據不同要求設計的模型軟件層出不窮,只要把數據輸入電腦中,投資者根據分析結果隨時制訂和調整投資計劃。
投資者競爭的優勢不再停留在信息的收集上,而是綜合處理信息的能力。誰的模型從總量上與趨勢上能更合理、地分析市場,誰就能掌握主動。
雖然統計學是一門基于數學的學科,但是它實在很枯燥!嚴格地說——如果你曾經不得不大量地研究雙邊置信區間、學生T檢驗以及卡方分布測試,有時你會覺得很難消化這些知識點。
一般來說,我是喜歡物理學和力學的,因為很多時候只需簡單地分析一個事例,你就能核實現狀。當你計算蘋果從樹上落下的速度及方向時,如果你的結果是蘋果應以每小時1224英里垂直向上拋出,也就是實際上你已經在頭腦中核實過結果了。
統計學的優勢在于易理解且具合理性;而劣勢在于它的奇特性。無論如何,這篇文章的話題不會讓你覺得枯燥。因為大部分的話題都是有形的、屬于重要的數據資料,你應有精力去慢慢摸索。
statistics(from wired.com)
統計學:黑暗的科學
統計學是所有學科領域中最易被邪惡勢力濫用的科學。
統計學可以同邪惡行徑相比較是因為在使用不當時,這門學科的分支就會被推斷出各種無意義或者不真實的裙帶關系(參見本文末尾的實例)。如果政治家或其它非專業人士掌控了統計學,那么他們就可以操縱一些重要決定。一般來說,基于錯誤總結的壞決策從來不受好評。
也就是說,使用得當時,統計學無疑非常有用且有益。而對于強權勢力者來說,他們會將統計學應用于一些非法途徑,甚至是一些純粹無用的渠道。
統計學——所謂的爭議
我已準備好作一個緊湊的總結,然而我注意到維基百科已經對統計學作了定義,而且語言幾近詩歌體系。如下:
統計學是應用數學的一個分支,主要通過收集數據進行分析、解釋及呈現。它被廣泛應用于各個學科領域,從物理學到社會科學到人類科學;甚至用于工商業及政府的情報決策上。(Courtesy Wikipedia.org)
這真的是一段很感人的文章。特別是最后那句“用于情報決策上”。
當然,作者忘記添上“在游戲設計領域”,但是我們原諒他對這一蓬勃發展的新興行業的無知。
以下為我自己撰寫:
統計學是應用數學的一個分支,它涉及收集及分析數據,以此確定過去的發展趨勢、預測未來的發展結果,獲得更多我們需了解的事物。(Courtesy Tylerpedia)
如果將此修改為適用游戲設計領域,那可以如此陳述:
統計學為你那破損的機制及破碎的設計夢指引了一條光明大道。它為你有意義的設計決策提供了穩定且具有科學性的數據。
須知的事實
統計學同其它硬科學一樣深奧且復雜。如同第一部分的內容一樣,本文只涉及一些精選的話題,我自認為只要掌握這些就足夠了。
再次突擊測驗
很抱歉我要采取另一項測試了。別討厭出題目的人,討厭測試吧。
Q1a)假設有20名測試員剛剛完成新蝸牛賽跑游戲《S-car GO!》中的一個關卡。你得知完成一圈的時間最少為1分24秒,最多為2分32秒。你期望的平均時間為2分鐘左右。請問這個測試會成功嗎?
Q1b)在同一關卡中你收集了過多的數據,在分析后得出這樣的結果:平均值=2分5秒;標準差=45秒。請問你會滿意這個答案嗎?
Q2)你設計了一款休閑游戲,不久就要發行。在最后的QA階段,你分布了一個測試版本,然后收集了所有的數據作為試驗對象。你記錄了1000多位玩家的分數,還有100多位特殊的玩家的分數(有些玩家允許重復玩游戲)。運算這些數據可知平均分為52000pts,標準差為500pts。請問這游戲可以發行了嗎?
Q3)你設計了一款RPG游戲,然后收集數據分析新的玩家從關卡1到關卡5的游戲進程會有多快。收集的數據如下所示:4.6小時、3.9小時、5.6小時、0.2小時、5.5小時、4.4小時、4.2小時、5.3小時。請問你可以計算出平均值和標準差嗎?
總體和樣本
統計學的基礎為分析數據。在分析數據的時候,你需要了解兩個概念:
1.總體:
總體是指某一領域中所有需要測量的對象??傮w是抽象的,只在你需要測量時候才會具體化。比如,你想了解人們對某一特定問題的看法。那你就可以選擇地球上所有的人,或者愛荷華州所有的人或者只是你街道附近所有的人作為一個總體。
2.樣本:
樣本實際上就是指抽取總體中部分用于測量的對象。原因很明顯,因為我們很難收集到所有總體的數據。相對來說,你可以收集部分總體的數據。這些就是你的樣本了。
正確性及樣本容量
統計學結果的可靠性通常由樣本容量的大小決定。
我們完美的想法是希望樣本容量就是我們的總體——也就是說,你想整個收集全部涉及到的數據!因為樣本越少,你就需要估計可能的趨勢(這是一種數學性的推斷)。而且,數據點越多越好;你最好能建立一個大型的總體而不是小型的。
例如,相對于調查10000個初中生對《Fruit Roll-Ups》的感想,試想下調查人員能否詢問到每一個學生。100萬個的數目過于龐大,做不到的話,10萬個也不錯。仍然做不到,好吧,10000個剛剛好。
由于時間和費用的關系,通常呈現出的研究結果都是基于樣本所做的調查。
1.統計學的常識性規則:
你無法通過一個數據點來預測整個趨勢。如果你知道我喜歡巧克力冰淇淋,你不能總結所有的Sigmans都喜歡巧克力冰淇淋。如果現在你詢問我家庭中的許多成員,然后你可能會得出關于他們的想法這類比較合理的結論,或者你至少知道是否能總結出一個合理的推斷。
廣泛的分布圖(重點!)
由于種種原因,只有《The Big Guy》可以解釋生活中的許多事情傾向于同一模式發展或者分布。
最普遍的分布也有一個合理的名稱——“正態分布”。是的,無法匹配這一分布圖的都為非正態,所以有點怪異(需要適當避免)。
正態分布也稱“高斯分布”,主要因為“正態”一詞聽起來不夠科學。
正態分布也稱為“鐘形曲線”(又稱貝爾曲線),因為其曲線呈鐘形。
bell curve(from gamasutra)
鐘形曲線的突出特點是大多數的總體均分布在平均值周圍,只有個別數據散落在一些極限位置(主要指那些偏高或偏低的數據)。中間成群的數據構成了鐘的外形;而那些偏高數據或偏低數據分布在鐘的邊緣。
我們周圍有上百萬的不同事例呈現出正態分布的景象。如果你測量了你所生活的城市中所有人的身高,結果可能呈現正態分布。這表明,只有少數個體屬于非正常的矮,少數個體屬于姚明那樣的身高,而大多數人會比平均身高多幾英寸或者矮幾英寸。
鐘形曲線同樣極典型地適用于調查人們的技能水平。以運動為例——極少部分人在這一領域為專業人士,大多數的人都還過得去,只有少部分的人實在不擅長,所以沒有被選為隊員(比如我)。
其它分布圖
盡管正態分布圖很完美,但它并非我們周圍唯一的一種分布圖。只是它比較普遍地存在。
比如有些其它的分布圖直接與賭博及游戲設計有關,只要看下扔骰子的概率分布圖,這種情況下出現了如下的d6情形及2d6情形:
D6 distribution(from gamasutra)
2d6 distribution(from gamasutra)
現在我想說的是第一個分布圖看起來一點也不像鐘形曲線,而第二幅圖開始呈現出了鐘的形狀。
平均值
這一小塊內容可以說是這篇冗長的文章中的一個小插曲。這塊自我指涉的小內容的存在只有一個目的:提醒你什么是“平均值”。這塊自我指涉且迂腐的小內容將被動地提醒你平均值是指一整套的數學平均數據。
方差和標準偏差
我們必須理解什么是方差和標準偏差,并且它們也具有許多有形的價值。除了能夠幫助我們做出有價值的數據總結外,這兩個術語還能夠幫助我們更明智地陳述分布問題。比起說“中間聚集了大量的數據點”,我們可以換個說法,即“68.2%的樣本是一個平均值的標準偏差”。
sigman(from gamasutra)
方差和標準偏差是相互聯系的,它們都能夠測量一個元素,即分散數據。直觀地說,較高的方差和標準偏差也就意味著你的數據分散于四處。當我在投擲飛鏢時,我便會獲得一個較高的方差。
我們可以通過任何數據集去估算方差和標準偏差。我本來應該在此列出一個方程式的,但是這似乎將違背“聽起來不像是一本教科書”的規則。所以我這里不引用公式,而是采用以下描述:
標準偏差:樣本或人口統計的平均數值偏離平均值的程度。由希臘之母σ(sigma)表示。
舉個例子來說吧,你挑選了100個人并測試他們完成你的新游戲第一個關卡分別用了多長時間。讓我們假設所有數據的平均值是2分鐘30秒而標準偏差則是15秒。這一標準偏差表明游戲過程中出現了集聚的情況。也就是平均來看,每個游戲過程是維持在平均值2.5分鐘中的±0.25分鐘內。從中看來這一數值是非常一致的。
這意味著什么以及為何你如此在乎這一數值?答案很簡單。假設你不是獲得上述結果,而是如下結果:
平均值=2.5分鐘(如上)
σ=90秒=1.5分鐘
所以我們現在擁有相同的平均值以及不同的標準偏差。這套數值表明玩家所用的游戲時間差別較大。90秒鐘的游戲時間背離了平均游戲時間。而因為游戲時間是2.5分鐘,所以這種偏差過大了!基于各種設計目的,出現這種較大的差值都不是設計師想看到的結果。
而如果我們所說的游戲時間是15分鐘而標準偏差是90秒(1.5分鐘)的話差別變更大了。
通過一個小小的標準偏差便能夠衡量一致性。標準偏差比率除以平均值便能夠獲得相關數值。就像在第一個例子中,15秒/150秒=10%,而在第二個例子中,90秒/150秒=60%。很明顯,60%的標準偏差真是過大了!
但是并不是說較大的標準偏差“總是”糟糕的。有時候設計師在進行測量時反而希望看到較大的標準偏差。不過大多數情況下還是糟糕的,因為這就意味著數值的差異性和變化性較大。
更重要的是,標準偏差的計算將告訴你更多有關游戲/機制/關卡等內容。以下便是通過測量標準偏差能夠獲得的有用的數據:
1.玩家玩每個關卡的游戲時間
2.玩家玩整款游戲的游戲時間
3.玩家打敗一個經典的敵人需要經歷幾次戰斗
4.玩家收集到的貨幣數量(游戲中有一個意大利水管工)
5.玩家收集到的吊環數量(游戲中有一個快速奔跑的藍色刺猬)
6.在教程期間時間控制器出現在屏幕上
誤差
誤差與統計結論具有密切的關系。就像在每一次的蓋洛普民意測驗(游戲邦注:美國輿論研究所進行的調查項目之一)中也總是會出現誤差,如±2.0%的誤差。因為民意調查總是會使用樣本去估算人口數量,所以不可能達到100%精準。零誤差便意味著結果極其精確。當你所說的人口數量大于你所采取的樣本數量,你便需要考慮到誤差的可能性。
如果你是利用全部人口作為相關數據來源,你便不需要考慮到誤差——因為你已經擁有了所有的數據!就像我問街上的任何一個人是喜歡象棋還是圍棋,我便不需要考慮誤差,因為這些人便是我所報告的全部數據來源。但是如果我想基于這些來自街上行人的數據而對鎮上的每個人的答案做出總結,我便需要估算誤差值了。
你的樣本數量越大,最終出現的誤差值便會越小。Mo data is bettuh(越多數據越好)。
置信區間
你可以使用推論統計為未來數據做出總結。一個非常有效的方法便是估算置信區間。理論上來看,置信區間與標準偏差密切相關,即通過一種數學模式去表示我們多么確定某一特定數據是位于一個特定范圍內。
置信區間:即通過一種數學方法傳達“我們帶著A%的置信保證B%的數據將處于C和D價值區間?!?/p>
雖然這個定義很繞口,但是我們必須知道,只要具有一定的自信,我們便能夠造就任何價值。讓我以之前愉快但卻缺乏滿足感的工作為例:
我過去是從事應力分析和飛機零部件的設計工作。如果你知道,或者說你必須知道,飛機,特別是商業飛機的建造采用的是現代交通工具中最嚴格的一種形式。人們總是會擔心機翼從機身上脫落下來。
作為飛機建造工程師,我們所采取的一種方法便是基于材料優勢屬性設置一個高置信區間。關機設計的傳統置信區間便是“A基值許可”,即我們必須95%地確信裝運任何一種特殊材料都有99%的價值落在一個特定的價值區間內。然后我們將根據這一價值與可能發生的最糟糕的空氣條件進行設計,并最終確立一個最佳安全元素。
當你真正想了解某種數據值時,置信區間便是一種非常有幫助的方法。幸運的是在游戲中我們并不會扯到生死,但是如果你想要平衡一款主機游戲,你便需要在設計過程中融入更多情感和直覺。計算置信區間能夠幫助你更清楚地掌握玩家是如何玩你的游戲,并更好地判斷游戲設置是否可行。
不管你何時想要計算置信區間,備用統計規則都是有效的:越多數據越好。你的樣本中擁有越多數據點,你的置信區間也就越棒!
你不可能做到100%的肯定
這便引出了另一個統計規則:
并不存在100%之說:你永遠不可能創造一個100%的置信區間。你不可能保證通過推論統計便能夠預測一個數據點具有一個特定的價值。
當玩家在《魔獸世界》中挑戰任務時,唯一可以確定的只有死亡,稅金以及不可能找到最后的Yeti Hide。所以玩家只需要接受這些事實并勇往直前便可。
濫用
我在之前提過,統計是一種邪惡的技能。為了更好地解釋原因,我寫下了這篇彈頭式愛情詩:
十四行詩1325:美好的統計,讓我細數下我濫用你的每種方式:
1.誤解
2.未明確置信區間
3.只因為不喜歡而丟棄了有效的結論
4.基于有缺陷的數據而做出總結
5.體育實況轉播員的失誤——混淆了概率和統計錯誤
6.基于一些不相干元素做出總結
誤解
人們一直在誤解統計報表。我知道,這一點讓人難以置信。
未明確置信區間或誤差
置信區間和誤差是信息中非常重要的組成部分。在過去30天內有43%的PC擁有者購買了一款可下載的游戲(誤差為40%)與同樣的陳述但存在2%的誤差具有巨大的差別。而如果遺漏了誤差,便只會出現最糟糕的情況。我們需要始終牢記,小樣本=高誤差。
只因為偏見而丟棄了有效的結論
操作得當的話,統計數據是不會撒謊的。但是人們卻一直在欺騙自己。我們經常在政治領域看到這類情況的出現,人們總是因為結論不符合自己預期的要求而忽視統計數據。在焦點小組中亦是如此。當然了,政治領域中也常常出現濫用統計結論的現象。
基于有缺陷的數據而做出總結
這種情況真是屢見不鮮,特別是在市場調查領域。你的統計結果總是會受到你所獲得的數據的影響。如果你的數據存在缺陷,那么你所獲得的結果便不會有多少價值。得到有缺陷的數據的原因多種多樣,包括失誤和嚴重的操作問題等。提出含沙射影式問題便是引出能夠支持各種結論(就像你所希望的那樣)的缺陷數據的一種簡單方法。“你比較喜歡產品X,還是糟糕的產品Y?”將快速引出反彈式回答,如“95%的費者會選擇產品X!”
體育實況轉播員的失誤
體育實況轉播員可以說是當今時代的巫醫。他們會收集各種統計,概率以及情感,然后將其混合在一起而創造出一些糟糕的結果。如果你想看一些圍繞著沒有根據的結論的統計,你只要去觀看一款足球比賽便可。
例如一個廣播員會說“A隊在最后5局游戲中并未阻止B隊的進攻?!边@種模糊的結論是關于A隊不大可能阻止B隊的進攻,而不是他們在最后5局游戲中成功阻攔了B隊。但是你也可以反過來說——也許他們將會這么做,因為他們之前從未阻擋過任何對手。
但是事實卻在于根本不存在足夠的信息能夠支持任何一種說法。也許這更多地取決于一種概率。阻擋進攻的機會是否就取決于一方在之前的游戲中是否這么做過?它們也許是兩種相互獨立事件,除非彼此間存在著互相影響的因素。
但是這并不是說所有體育運動的結論都存在著缺陷。就像對于棒球來說統計數據便非常重要。有時候統計分析也將影響著球的投射線或者擊球點等元素。
最終還是取決于數據:當你擁有足夠的數據時,你便能夠獲得更好的統計結論。棒球便能夠提供各種數據:每一賽季大約會進行2百多場比賽。但是足球比賽的場次卻相對地少了很多。所以我們最終所獲得的誤差也會較大。但是我并不會說統計對于足球來說一點用處都沒有,只是我們很難去挖掘一些與背景相關的有用數據。
基于一些不相干元素做出總結
人們始終都在誤解統計報表。比起使用對照關系,我們總是更容易推斷出一些并不存在的深層次的關系。我最喜歡的一個例子便是著名的飛行面條怪物信仰(游戲邦注:是諷刺性的虛構宗教)的《Open Letter to the Kansas School Board》中的“海盜vs.全球變暖”圖表:
venganza.org/about/open-letter/
我們是否能夠開始解答問題了?
問題1的答案—-關卡時間
這一問題的答案很簡單:你未能獲得足夠的信息去估算平均值。因為在1:24與2:32范圍中波動的價值并不意味著它們的平均值就是2分鐘。(單看這兩個數值的平均值是1.97分鐘,但是我們卻不能忽視其它18個結果!)你必須掌握了所有的20個結果才能估算平均值,除此之外你還需要估算標準偏差值。
問題2的答案—-后續關卡時間
這時候你可能不會感到滿足,因為標準偏差值過高了,超過平均值的40%。如此看來你的關卡中存在著過多變量。同時這里也存在著一些可利用的潛在元素,并且技能型玩家能夠發揮其優勢而造福自己?;蛘撸阋部梢試绤枒土P那些缺少技能的玩家。而作為游戲設計師,你最終需要做的便是判斷這些結果(居于高度變量)是否符合預期要求。
問題2的答案—-標準偏差值
統計只是你所采用的一種方法,你同時還需要懂得如何進行游戲設計。如此,過于接近的計數分組使得我們總是能夠獲得一個較低的標準偏差值(500/52000=1%),這就意味著你所獲得的分數幾乎沒有任何差別,也就是說在最終游戲結果中玩家的不同技能并不會起到任何影響作用。而當玩家發現自己技能的提高并不會影響游戲分數的發展時,便會選擇退出游戲。
所以在這種情況下你更希望看到較高的標準偏差,如此游戲分數才能隨著技能的提高而提高。
問題3的答案—-游戲時間
可以說這是一個很難獲取的數值,不過它卻說明了數據收集中的一個要點:你需要警惕那些看起來是錯誤的數據。就像0.2小時看起來就有問題。也許這是排印錯誤,或者是設備故障所造成的,誰知道呢。但是不管怎樣在進行各種計算之前你都需要堅定不移地說服自己0.2小時是一個有效數據,或者你也可以選擇將其丟棄而基于剩下的數據點進行估算。
其它有趣的內容
為了控制本文篇幅,我不得不略過許多有趣的主題。我只要在此強調理解統計不僅能夠幫助你更好地進行游戲設計,同時也能夠幫助你做出消費者決策,投票決策或者財政決策等。我敢下23.4%的賭注保證我所說的內容中至少有40%的內容是正確的。
對于設計師而言,統計能夠幫助他們獲取來自有記錄的游戲過程(樣本)的相關數據,并幫助他們為更大的未記錄的游戲過程(人口統計)做出總結。
在實踐中學習
例如在我剛完成的游戲中,我便是通過記錄游戲過程的相關數據,并圍繞著源自這些數據的平均值和標準偏差去設定游戲挑戰關卡。我們將中等難度等同于平均值,較容易的等同于平均值減去一定量的標準偏差,而較困難的等同于平均值加上一定量的標準偏差。如果我們能夠收集到盡可能多的數據,我們的統計便會越精準。
就像概率論一樣,當你的項目范圍變得越來越大時,統計也會變得越來越有幫助。很多時候你可以通過自己的方法進行摸索,而無需使用任何形式理論。但是隨著游戲變大,用戶群體的壯大以及預算的擴大,你便需要做好面對一個不平衡,且完全憑直覺的游戲設計中存在固有缺陷的準備。
關鍵詞: 醫學碩士;學位論文;數理統計;調查
摘 要:目的 分析醫學碩士研究生學位論文中數理統計應用情況. 方法 隨機抽取2000/2001年100位河南醫科大學應屆醫學碩士學位論文初稿,對其中數理統計應用情況進行統計分析. 結果 論文中采用單因素設計者占94.0%,多因素設計占6.0%,應用正確率為96.6%;論文中使用經典基本數理統計方法為97.9%,統計學方法的正確應用率為75.7%;應用參數統計時出現的主要問題是未進行適用條件判斷,而應用非參數統計時出現的主要問題則是推斷結論有誤. 結論 應加強碩士學位論文的數理統計設計和審查工作.
Keywords:medical master graduates;thesis;statistics;in-vestigation
Abstract:AIM Analysis case of using statistical theory in the thesis of2000~2001master graduates.METHODS 100thesis of this year’s medical master graduates in Henan Medi-cal University were taken out randomly.Their theoretical scores and practical application of health statistics in their thesis were analyzed.RESULTS Master graduate has grasped the theory of health statistics preferably.The abso-lute majority,namely97.9%of the total students,have used the basic statistic method in their thesis,75.7percent could use statistic method correctly.The main problem arising in using parametric test is that they hadn’t judged the applying condition,while in non-parametric test is that the conclusion is wrong.CONCLUSION Ought to strengthen checkup health statistical in the thesis of master graduates.
0 引言
數理統計的應用正確與否是論文科學性的重要標志.近年在醫學學術期刊(包括國內著名的核心期刊)上發表的論著,數理統計方面還存在問題,甚至導出錯誤的結論[1-4] .數理統計作為一門應用學科已成為醫學碩士研究生學位課程的主要內容之一,越來越受到碩士研究生的重視.為了解醫學碩士生學位論文中數理統計的應用情況,為課題的統計設計和論文審查提供科學依據,為教學改革提供參考,作者隨機抽取河南醫科大學應屆碩士學位論文100篇,對其數理統計應用情況進行分析.
1 材料和方法
2000/2001年河南醫科大學共有醫學碩士研究畢業生222人,應用隨機數表隨機抽取100名碩士研究生學位論文的初稿作為研究對象,對實驗設計類型、使用的統計學分析方法及使用的統計學工具,存在的問題等進行調查.結果推斷利用SAS(6.12)統計分析系統進行分析.
2 結果
2.1 實驗設計類型 碩士學位論文中采用單因素設計的比重較大,占94.0%,統計學設計正確率較高(Tab1).
2.2 統計學方法 論文中使用經典的基本統計學方法的占絕對多數,為97.9%(856/874),統計學方法的正確應用率為75.7%,且不同的統計學方法之間的正確應用率存在著差別.應用參數統計方法者518次,應用正確者357次,正確應用率為68.9%;應用非參數統計方法者346次,應用正確者305次,正確應用率為88.1%.對參數統計方法的正確應用率低于非參數統計方法(χ2 =35.8,P
表1 碩士論文的實驗設計類型及正確應用情況 略
表2 論文中應用的統計學方法分布及正確應用情況 略
表3 獲取結果時使用的計算工具 略
2.3 數理統計問題 論文中存在的問題在參數統計與非參數統計中的構成不同,應用參數統計時出現的問題是未進行使用條件判斷者159次,未正確應用統計方法者9次,推斷結論有誤者19次;而應用非參數統計時出現問題是未進行使用條件判斷者8次,未正確應用統計方法者14次,推斷結論有誤者21次(兩者相比χ2 =48.31,P
3 討論
在碩士研究生的基礎理論教學中,開設數理統計學的主要目的是為了指導研究生正確地應用統計學的原理與方法,解決醫學研究中如何科學地進行科研資料的搜集、整理和分析推斷問題.傳統的經典的和基本的統計學理論與方法仍然是當前碩士研究生進 行科研工作的統計學方面的主要工具.論文中采用的完全隨機、配對及配伍等單因素設計的比重較大占94.0%,多因素設計占的比重較少為6.0%,總的來說,其統計學設計的正確率是比較高的.說明學生對統計學設計理論比較重視并能正確應用.論文中使用經典的基本統計學方法占絕對多數為97.9%(856/874),主要為t檢驗、F檢驗、χ2 檢驗及秩和檢驗等,這與這些方法成熟、簡單明了且實用性極強有很大關系,而近些年來新發展的比較前沿的統計學分析方法[5-12] ,由于對設計要求嚴格,使用過程復雜,非專業人員在短時間內難以掌握而實際應用較少.這提示在今后的研究生教學過程中,除應繼續進行基礎部分內容的學習外,還應加強新的統計學方法和使用條件的教學力度.
論文中以基本的經典的統計學方法為主,但實際應用時的正確應用率僅為75.7%,且不同的統計學方法之間的正確應用率存在著差別,對參數統計方法的正確應用率低于非參數統計方法.經進一步分析,應用參數統計時出現的主要問題是未進行適用條件判斷,而應用非參數統計時出現的主要問題則是推斷結論有誤.作為一門應用學科,數理統計學有著其獨特的邏輯性,概念多、公式多且連貫性強,眾多的公式和分析方法既有聯系又有區別,同時有著嚴格的適用條件.傳統的教材編寫和教學重點是統計學方法的計算技巧,其結果容易將學生引導到僅注重學習統計計算方法上,忽略了各種方法的適用條件和對資料的綜合分析.所以t檢驗、F檢驗等經典的統計方法雖看似簡單,但要正確應用到實際工作中,對學生來說仍有相當難度.秩和檢驗等非參數統計由于其適用條件較參數統計寬松,使得其正確應用率高于參數檢驗,而并非學生對非參數檢驗掌握的比參數檢驗更好.
隨著計算機技術和統計軟件的完善與普及,各種復雜的統計計算不必再用手工計算.本次研究表明大部分人(91.0%)通過應用著名的統計分析軟件SPSS及SAS獲取結果,這些結果比手工計算的更準確、更規范,所以各種統計方法的計算過程大可不必細致介紹,而要重點介紹各種數理統計方法的使用條件,加強資料分析實踐,提高碩士生解決實際問題的能力.
參考文獻
[1]Wang GS,Qian GS,Yang XJ,Huang CJ,Wei H.The statis-tics of application of laboratory animals in clinical research pa-pers in China [J].Di-san Junyi Daxue Xuebao(Acta Acad Med Militaris Tertiae),1997;19(2):163-165.
[2]Chen P,Zu SX.The analysis of statistical techniques used in the Chinese journal of clinical medicine [J].Anhui Yike Daxue Xue-bao(Acta Univ Med Anhui),1998;33(2):108-110.
[3]Fang JQ,Ling L,Zhang MR.Frequently appearing statistical mistakes in recent medical articles and relevant suggestions [J].Zhongshan Yike Daxue Xuebao(Acad J Sun Yat-sen Univ Med Sci),1999;20(4):314-318.
[4]Wang Q,Zhang BH.Current use of statistical methods in five core Chinese medical journals [J].Zhonghua Yixue Zazhi(Natl Med J China),1998;78(3):230-233.
[5]Zhang GK,Yao C,Xu YY.Contrast between two schools of thought on hypothesis test [J].Zhongguo Weisheng Tongji(Chin J Health Statist),1999;16(2):85-87.
[6]Shang L,Xu YY,Hou RL,Zhang SP,Zhou YR,Chen CS.Comparison of different approaches of fitting centile curves for growth standard [J].Di-si Junyi Daxue Xuebao(J Fourth Mil Med Univ),2000;21(6):676-678.
[7]Li XS,Ni ZZ.On the problems of fitting linear regression mo-dels for hierachically structured data in medical research [J].Huaxi YikeDaxueXuebao(J WestChina Univ Med Sci),1999;30(1):59-62.
[8]Li XS,Zhang WT,Ni ZZ.Multilevel models in analysis of crossover design [J].Zhongguo Weisheng Tongji(Chin J Health Statist),1999;16(5):273-275.
[9]Li XS,Liu QY,Ni ZZ.Meta analysis using multilevel models [J].Zhongguo Weisheng Tongji(Chin J Health Statist),1999:16(3):133-135.
[10]Sun XW,Fang JQ,Yang XF.Number-theoretic method for pa-rameters estimation in multivariate nonlinear regression with ap-plication [J].Zhongguo Weisheng Tongji(Chin J Health Statist),1999;16(1):6-7.
1.統計學與管理的作用
統計在經濟與管理領域的作用,主要表現在以下幾個方面:一是能夠反映社會發展的基本狀況,通常反映的是國家或地區的資源狀況、發展階段、主要的經濟成果等等指標;二是揭示了社會和經濟發展的性質,通過分配關系和所有制關系的統計資料來說明;三是反映社會、經濟現象的發展規律,比如兩個現象間的依存關系、比例關系、結構變化以及因果關系。統計信息的充分利用,不僅能對事物本身進行定量和定性的分析,還可以針對不同事物之間的聯系進行比較的分析,無論從縱向還是橫向,統計學都有用武之地。
這些企業的營銷管理中無處不滲透這統計學的知識。統計學作為收集信息、處理信息的一門科學,恰能在市場營銷中的市場策劃階段的各個方面發揮科學決策的關鍵作用。
在市場營銷活動中,要想做到策劃準確,必須要廣泛的收集信息,科學的處理信息,以便結果準確、決策科學。統計學作為一門收集信息、處理信息的科學,無論是在收集信息階段的市場調查之調查問卷設計與調查樣本的確定,還是在處理信息階段的數據甄別和數據分析,都可起到十分重要的作用。在市場分析實際操作中,主要包括統計整理與統計分析。
2.統計分析
"統計分析"是將統計調查和統計整理的結果通過各種對比,通過動態數列,指數指標分析等方法進行深入的總結,分析。形象的顯露事物變化的規律。從質的角度剖析事物數量的變動方向和變動程度。通過分析,與既定的指標指數相對照,從而得出內在聯系或結論。以此為依據進行工作調整,達到統計的最終目的。在市場本文由收集整理營銷之市場策劃活動中,要想做到策劃準確,必須要廣泛的收集信息,科學的處理信息,以便結果準確、決策科學。統計學作為一門收集信息、處理信息的科學,無論是在收集信息階段的市場調查之調查問卷設計與調查樣本的確定,還是在處理信息階段的數據甄別和數據分析,都可起到十分重要的作用。
3.當今的經濟管理發展
當代的經濟管理中,提倡以人為本的導向使管理方法進一步由定性向定量方向發展,而這一切都離不開統計方法的使用。根據我國的實際情況調查,我國稅制的綠色化程度近年來是后退的,這就需要國家加大對生態經濟的投入、對環境的保護也要加強。一個國家的經濟發展和管理是件龐大的事情,國家也不可能把全部的調查報告放在一起查看,那么如何更清晰、直觀的表達出很長一段時間內的經濟情況,就需要統計學的加入。經濟管理不是單一程序,這個過程中需要很多不同的因素來共同完成,統計經濟學可以簡潔、清楚的表達出經濟的現況,統計分析也是統計學在經濟中的一個很大作用。然而統計科學就它的實質來說,應該是應用數學的一個分支,并且可以認為是被應用于觀察資料上的數學。同一公式可以同樣地適用于絕對不同類型的具體對象,這是統計學的一個特征。經濟應用統計學研究社會經濟現象的數量特征和數量關系,必然要利用數學方法。
在經濟管理中,經濟現狀的分析、隨即現象的概率、每個變量 總體的影響等都與數學不可分割。把數學有的、嚴密性的特性結合到統計中,為經濟管理提供論證和計量方法。運用好數學知識,在一定條件下,對大量事物的觀察數據加以綜合匯總、計算各種綜合指標,從而較好的反映出現象的規律性,可以把管理工作做的更好。隨著經濟的發展,統計學將會在經濟與管理方面發揮著十分重要的作用。無論是國民經濟管理,還是企業管理以至于個人的生產、經營和決策,都要依賴于統計分析的應用。經濟、管理類在現實中更注重于實際應用能力。在工作中通過列表、圖示和加減乘除等初等方法對數據進行分析,可以對數據表達的總體有直觀的了解,幫助人們解決問題。根據不同的位置,需要統計的事物也并不相同,所以我們也要靈活的運用統計學。
[關鍵詞]應用統計學;課堂教學組織;方差分析
[中圖分類號] G642 [文獻標識碼] A [文章編號] 2095-3437(2016)07-0103-02
隨著新知識經濟和網絡時代的到來,筆者在教學科研的實踐中,深切地感受到,無論是自然科學、社會科學領域的研究,還是國家宏觀管理和企業生產經營管理,甚至人們的日常生活,信息需求量日益增多,信息處理技術更加復雜,作為信息技術支柱的統計方法,越來越廣泛地應用于各個領域。[1] [2]應用統計學作為一門應用基礎課,其內容豐富,應用廣泛,幾乎涉及自然科學和社會科學的各個領域。對于在校大學生,無論其學習什么專業,這門課程的重要性不言而喻。課堂教學組織是教師通過協調課堂內的各種教學因素以有效地實現預定教學目標的過程,積極探索應用統計學課堂教學組織有助于提高學生對統計理論與方法的掌握。
一、基本要求
要強調課程的重要性。統計學是研究不確定性現象數量規律性的一門學科。有關如何應用數理統計中的方差分析、回歸分析、多重回歸、過程控制等統計方法來解決實際問題,以及如何解決在實際應用中出現的統計計算的問題,對工程技術人員等實際工作人員來說是非常重要的。學生明白了該課程的重要性,也就認識到了學習的意義,自然就會認真對待這門課。
要培養良好的課堂習慣。在這一方面主要是通過輔導員課外開展學生工作、教師課上嚴格課堂紀律來規范群體行為,使學生能夠做到“不遲到、不早退、不開機、不耳語、不走動、不堂食”,通過課程開始的提醒、過程中的堅持不懈,逐步形成“課上主動積極求學,課下活潑互助互動”的良好班級學習文化。
要建立規范的教學流程。為了使每次課堂教學活動都能達到教學目標,應對每一次課堂教學流程進行一定的規范,使每次課堂教學都包括前講回顧、本講教學、本課總結、作業布置等環節。
要開發學生的學習興趣。為了使學生全身心投入課堂學習,除了規范的教學流程之外,還應采取教師講授式、師生互動式、學生主導式等教學方法,提高學生學習的興趣和參與的積極性,使學生在課堂中能快樂地學習。
要把控好課堂時間和教學內容。課堂的教學時間有限,教師必須在有限的時間內按教案完成既定教學內容。因此,教師必須突出教學重點,把握好教學節奏,嚴謹、圓滿完成課堂教學。
要強調與計算機的結合。為著力提高學生運用統計方法分析解決問題的能力,教材所涉及的統計計算,要求學生學會運用目前已有的軟件,如Excel、MINITAB等。尤其是MINITAB軟件,它是專門的質量統計軟件,一方面這一軟件包括了幾乎所有的統計方法和功能,另一方面掌握好這一軟件對于后續質量管理與可靠性課程也非常有幫助。[3] [4]
二、前講回顧
安排前講回顧這一環節的目的,一方面是為了督促學生及時復習和鞏固已學理論知識;另一方面是為了承上啟下,在回顧前期理論知識的基礎上引出本次課堂教學內容,使各次教學內容有連貫性和系統性。
為有效達到前講回顧的目的,可以采用不同方法。如可以事先出好每一章的測試題,包含填空和選擇題;也可以采用課堂上隨機抽取同學回答教師的提問方式;還可以采用課堂隨機提問與不定期測試相結合的方式。通過前講回顧,可以讓所有的學生檢查一下自己的知識掌握情況,教師也可以通過學生的回答和測試情況了解教學效果。
三、本期內容教學
本期內容教學環節是每次課堂教學的主體環節。每次上課教學內容必然有所不同,但教學過程存在著一定的共性。下面以應用統計學中“方差分析”一章為例說明課堂教學過程。
(一)提出問題激發興趣。興趣是最好的老師,如果能夠激發學生的學習興趣,那么教學已經成功了一大半。筆者所在學院工業工程專業本屆有四個班,大學擴招以來,高校對學生的管理非常重視,輔導員和教師都想了解不同班級之間有無差異,希望判斷不同班級對課程的平均成績是否有顯著影響。這就是多總體的均值比較問題,對這類多個正態總體均值的檢驗,是否可以采用先前學過的逐一兩兩檢驗總體均值是否相等呢?答案是否定的。因為比較過程將更加復雜,同時還會導致判定結果犯第一類錯誤的概率大大增加。而這正是“方差分析”所要解決的問題。通過對四個班級成績差異進行比較,激發了年輕的大學生們的競爭欲望和興趣。
(二)講授理論分析問題。在激發學生學習興趣后,教師可以采用各種教學方式和方法,通過將這一實際問題抽象成為理論問題,來引導學生學習相應的理論知識。很多時候,學生之所以反感學理論,一方面是因為不了解理論來自于生產實踐;另一方面是因為不知道這些理論在實踐中如何運用或不知道其適用的情景,從而導致在實踐中不會用或用錯。因此,教師要講清方差分析的理論觀點、假設前提、運用方法。
(三)實踐應用掌握知識。在講授了方差分析所要掌握的理論及前提后,教師這時就要進一步結合第一階段所提出的班級對成績影響問題,運用第二階段所講授的方差分析理論與方法,進行相應問題的分析和解決。在這里一定要結合質量統計軟件MINITAB[5],一方面提高運算效率,另一方面學生也要掌握MINITAB軟件的功能。筆者在課堂上以第一階段提出的四個班上學期八門課的平均成績為例在課堂上做了運算,平均成績數據如表1。把以上數據輸入MINITAB統計軟件,得出運算結果如表2
從輸出結果來看,由于值=0.933>0.05,因此無法拒絕原假設。結論:四個班級的平均成績沒有顯著差異,說明各水平間即四個班級之間并無顯著差異。如果值
在課堂上并不需要細致講解MINITAB軟件的每一步驟,因為此時重點在于學生對方差分析理論的掌握以及引起學生對自身的思考,至于具體的操作步驟需要學生在統計學實驗課上上機動手實踐。通過這個例子讓大家明白,對上學期八門課程平均成績而言,班級之間并無統計學意義上顯著差異。
實踐證明,用這個例子學生能較容易掌握方差分析的理論方法,同時也有效調動了大家學習統計學的興趣。
四、課堂教學注意事項
在主體內容的教學過程中,除根據教學大綱、教材和教案確定具體教學內容,注重教學環節和教學方法的運用外,為保證教學效果,還需要注意幾點。
第一要突出教學重點。針對大學生的實際情況,教師不應該也不可能將所有的課程內容都納入課堂教學中,所以在課堂教學過程中,要在系統展現該章知識體系的同時,突出重點教學內容。
第二要進行本講總結。課堂教學效果并不取決教師講了多少,而取決于學生學到了多少,因此課程內容寧少不要多,要講透學透。因此,在每一次課堂教學結束時,要及時地組織學生進行總結,以感知每次的進步,反思依然存在的不足。通過總結,可加強學生對本次課堂教學內容的印象,從而為課下繼續鉆研和后續學習奠定良好的基礎。
[ 注 釋 ]
[1] 賈俊平編著.統計學(第四版)[M].北京:中國人民大學出版社,2013.
[2] 王庚,管于華,孫瑞博,陶用之編著.現代工業統計與質量管理[M].北京:中國人民大學出版社,2011.
[3] Douglas C. Montgomery, George C.Runger, Norma Faris Hubele著,代金,魏科萍譯,張波校譯.工程統計學[M].北京:中國人民大學出版社,2005.
關鍵詞:市場經濟;統計學;經濟管理
中圖分類號:F83
文獻標識碼:A
doi:10.19311/ki.16723198.2016.26.071
統計學主要應用于經濟管理,在人力資源管理,財務管理等多個方面具有積極作用。其中,主要是用來反映經濟發展的基本情況,通過統計可以使管理者正確掌握某一區域或者某一企業的發展狀況與發展需求,從而制定合理的管理目標與管理方法。并且,統計學可以使企業的薪酬、人力分配更加合理??傊?,其在經濟發展中具有不可忽視的作用,而如何將其正確應用于市場經濟中,還需要進一步的探討。
1 統計學應用于企業市場營銷
市場營銷是企業獲得利潤的主要途徑,在企業發展中,營銷的核心問題就是分析市場需求,獲得真實有效的營銷策略。統計學中的因素分析與聚類分析等方法可以讓管理者對市場進行正確的劃分,并且統計特性還可以幫助企業獲得最新的產品需求,以及合理的產品價格定位。統計學主要以信息的收集和處理為主,在市場營銷的策劃階段,其作用不可忽視。
2 統計學應用于市場分析
市場分析核心為統計整理與統計分析。所謂統計整理就是對經濟調查的相關數據進行整理和分類,最終通過對數據的分析來獲得經濟發展的趨勢。統計學對于這一過程的數據科學分組以及最后的準確計算都具有積極作用。使復雜且大量的數據呈現出規律性,方便應用人員對其進行對比。通過對動態數據的分析,對經濟發展進行質的剖析,從而顯示出經濟發展的基本規律,有利于經濟市場的正確分析。在分析過程中,統計學通過既定的指標的對照來找到數據之間的聯系,對企業決策中不合理的發展進行調整。
3 統計學應用于市場互動
對于市場營銷的活動策劃來說,要使其具有準確性,不但要進行信息的收集,還要注重于市場的互動。統計學以其廣泛的理論覆蓋了經濟發展的多個方面,利用統計學,可以使樣本的設計與調查更加精確與科學,使管理者在經濟分析中能夠及時正確的把握經濟信息,從而實現與經濟的互動采取與市場步調一致的發展策略,促進企業的可持續發展。在當下,經濟發展處于新時期,如何用好統計學能夠幫助企業走向時代的前沿,能夠使管理者與決策者第一時間掌握最新的動態的市場信息。另外,對于國家對于企業的約束作用也十分明顯,相關數據顯示,在企業發展過程中,其多種因素是存在相互制約與共同發展轉態下的,在不同的政策下,企業的稅收、經濟的投入方式是會發生變化的。統計學可以對相關數據進行分析,從而得出生態發展對于現代企業的重要性,督促企業實施改革與轉型。
統計學的理論并不復雜,并且思路清晰,只有依賴于統計學,才能使政府和企業能夠進行合理的、有效的調查,并且使調查結果更清晰??梢?,統計學在經濟管理中的重要作用,統計學作為數學的分支之一,可以應用于不同的領域,以及同一領域的不同方面,同一公式甚至可以應用于企業經濟發展的不同方面。這與經濟學的特點相吻合,經濟學就是研究經濟現象之間的數量關系,因此統計學的應用就成為一種必然。利用統計學的嚴謹。綜合的特點,可以很好的反映經濟現象與經濟規律,促進經濟管理的高效化。其具體過程為,在經濟工作中通過簡單的計算方式獲得清晰的統計結果。在不同的統計事務中,科根據統計的目的來選擇不同的統計方法。目前,在經濟發展中,主要應用統計學的圖表統計。數據統計等,主要應用于營銷、顧客滿意質素以及市場的基本需求上。以圖表為例,在市場經濟發展中存在著顧客滿意度低或者是供大于求的現象,此時企業將處于銷售危機。企業此時所做的統計不僅要包括市場方面,還要對其人力資源結構進行分析,包括對其經濟的發展的多個影響要素的統計。例如通過統計圖表,顧客不滿意或供過于求時,那么企業收益會減少;人力資源管理中的統計。企業管理人員要對員工的滿足度進行分析,從而了解員工的真實需求,減少企業在發展中的其他不利因素。
4 統計應用于審計
現代企業離不開審計,審計可以使企業發展更加規范,可以促進企業的發展。統計學應用于審計,主要體現在其樣本統計上,審計具有輕重點之分,樣本的重要程度是不同的,在這一過程中,要針對不同程度的概率進行分析,尤其是要注意其抽中概率。審計決定了企業發展的合理性,但審計相對復雜,不通過一定的手段很難直接發現企業經濟數據中存在的問題。統計中的最優分層理論和最優樣本容量分配理論都能夠幫助審計,使審計的數據具有高準確性,從而更好的確保經濟審計的進行,促進企業的發展。
5 總結
統計學是現代企業應用的重要理論之一,統計學主要是通過對企業經濟現象,相關影響因素的數據整理、分析和處理,來實現通過現象看本質的目的。統計學不僅影響企業市場營銷,還對企業的管理與決策具有積極的推動作用,因此對于企業來說,如何進一步認識統計的意義,并且正確應用統計理論是十分重要的。
參考文獻