引論:我們為您整理了1篇醫學統計論文范文,供您借鑒以豐富您的創作。它們是您寫作時的寶貴資源,期望它們能夠激發您的創作靈感,讓您的文章更具深度。
醫學統計論文:醫學論文統計學方法應用的錯誤解析
摘 要:統計學方法應用正確與否直接關系到醫學科研結果的可信度和有效性,在研究設計時的錯誤應用會否決整個科研研究方案,基于錯誤統計學方法上產生的結果會浪費科研人員的時間和精力。編審人員應該高度重視醫學論文的統計學方法應用,提高單篇文獻的質量和學術水平。
關鍵詞:統計學方法;醫學論文;解析
一、引 言
醫學由于其研究的復雜性和系統性,常需要應用嚴謹的統計學方法,由于有些作者對醫學科研的統計學理論和方法的應用缺乏深刻了解,在醫學論文中錯誤應用統計學方法的現象時有發生。統計學方法應用的錯誤直接導致統計結果的錯誤。例如統計學圖表、統計學指標、統計學的顯著性檢驗等。因此,正確應用統計學方法,并將所獲得的結果進行正確的描述有助于單篇論著的質量提高,現將醫學論文中統計學方法應用及其常見結果的錯誤解析如下。
二、醫學論文統計學方法應用概況
醫學論文的摘要是全文的高度濃縮[1],主要由目的、方法、結果、結論組成。一般要求要寫明主要的統計學方法、統計學研究結果和p值。一篇醫學論文的質量往往通過摘要的統計學結果部分就能判斷。統計學方法的選擇和結果的表達直接影響單篇論著的科研水平。
(一)材料與方法部分
正文中,材料與方法部分必須對統計學方法的選擇、應用、統計學顯著性的設定進行明確說明。通過對統計學方法的描述,讀者應該清楚論著的統計學設計思路。材料部分要清楚說明樣本或病例的來源、入組和排除標準、樣本量大小、研究組和對照組的設定條件、回顧性或者前瞻性研究、調查或者實驗性研究、其他與研究有關的一般資料情況,其目的是表明統計學方法應用的合理性和性,他人作相關研究時具備可重復性。方法部分應詳細敘述研究組和對照組的不同處理過程、觀察的具體指標、采用的測量技術,要具備可比較性和科學性,
方法部分還要專門介紹統計分析方法及其采用的統計軟件。不同的數據處理要采用不同的方法,必須清楚的說明計數或者計量資料、兩組或者多組比較、不同處理因素的關聯性研究。常用的有兩組間計量資料的t檢驗,多組間計量資料的f檢驗,計數資料的卡方檢驗,不同因素之間的相關分析和回歸分析。有些遺傳學研究方法還有專門的統計學方法,要在這里簡要說明并給出參考文獻,還要簡單敘述統計方法的原理。統計學軟件要清楚的說明軟件的名稱和版本號,如基于家系資料研究的fbat1.7.3版本。
(二)論文結果部分
論文結果部分要顯示應用統計學方法得到的統計量[2],所采用的統計學指標較多時,往往分開敘述。分組比較多時還要借助統計圖表來表達統計結果。對于數據的度,除了與測量儀器的精密程度有關外,還與樣本本身的均數有關,所得值的單位一般采用緊鄰均數除以三為原則。均數和標準差的有效位數要和原始數據一致。標準差或標準誤差有時需要增加一個位數,百分比一般保留一個小數。在統計軟件中,分析結果往往度比較高,一般要采用四舍五入的方法使其靠近實驗的實際情況,否則還會降低論文的可信度和可讀性。
結果部分的統計表采用統一的“三線”表,表題中要注明均數、標準差等數據類型。表格中的數值要按照行和列進行順序放置,要求整齊美觀,不能出現錯行現象。要明確標注觀察的例數,得到的檢驗統計量。統計圖可以直觀的表達研究結果,如回歸和相關分析的散點圖可以顯示個體值的散布情況。曲線圖表達個體均值在不同組別隨時間變化的情況或者不同條件下重復測量的結果。誤差條圖由均數加減標準誤繪出,描述的是67%的置信區間,不是95%,提倡在誤差條圖采用95%的置信區間。
關于統計量,一般采用均數與標準差兩個指標,均數不宜單獨使用。使用均數的時候要明確變異指標標準差或者性指標標準誤。關于百分比,分母的確定必須要符合邏輯,過小的樣本會導致分母過小而出現百分比過大的情況。百分率的比較要寫清兩者中不同的變化,可以采用卡方檢驗。
1.假設檢驗的結果中,常見只寫p值的情況,有時候會誤導讀者,也會隱藏計算失誤的情況,因此寫出具體的統計值,如f值、t值,可以增強可信度。對于率、相關系數、均數這類描述統計量,要清楚寫明進行過統計學檢驗并將結果列出。p值一般取0.05與0.01作為檢驗顯著性,對于結果的計算要求具體的p值,如p=0.23或p=0.02。
2.在對論文進行討論時,作為統計學方法產生的結果往往要作為作者的主要觀點支持其科學假設,對統計結果的正確解釋至關重要。p值很大表明兩組間沒有差別屬于大概率事件,p值很小表明兩組間沒有差別的概率很小。當p<0.05,表明差異具有統計學意義。p值與觀察的樣本量的大小有關聯,當樣本量小的時候,數據之間的差別即使很大,p值也可能很大;當樣本量大時,數據之間的差別即使很小,p值也可能顯示有顯著性差異。相關系數統計學意義的顯著性也與相關系數的大小沒有的關聯,有統計學意義的樣本相關系數可能很小。因此,有統計學差異的描述并不一定意味著兩組間差別很大,錯判的危險性很大,顯著性的檢驗為定性的結果,結合統計量大小方可判斷是否具有專業意義。
變量間虛假的相關關系與變量隨時間變化而變化相關,統計學意義的關聯并不表示變量間一定存在因果關系。因果關系的確定要根據專業知識和采用的研究方法的不同來考量。使用回歸方程進行分析,當兩變量間具有顯著性關系,但是從自變量推測因變量仍然不會很。相關或回歸系數不能預測推測結果的程度,而只是預測一個可信區間。診斷性檢驗應用于人群發病率很低的疾病,靈敏度、特異度的高低對于明確疾病診斷并不能很肯定。“假陽性率”與“假陰性率”根據實際的需要不同要求并不一致,在疾病患病率很低時,出現假陽性也是正常的,要確診疾病必須要與臨床癥狀體征相結合。因此,這兩個率的計算方法必須交待清楚。
三、醫學論文統計學方法應用的常見錯誤分析
(一)“材料與方法”中的統計學方法應用的常見錯誤
“材料與方法”中統計學方法常見的問題主要為:對樣本的選擇或者研究對象的來源和分組描述很少或者過于簡單。例如,臨床入組病例分組只采用簡單的隨機分組,未描述隨機分組的方法,未描述是否雙盲雙模擬,未設置空白對照組,分組后對性別、年齡、文化程度的描述未進行統計學檢驗,對于特殊的統計學方法沒有詳細交代;動物實驗分組的隨機化原則描述過于簡單,沒有具體說清隨機、配對或分層隨機分組等;統計分析方法沒有任何說明采用的分析軟件,有的只說明采用的分析軟件而不交代在軟件中采用的統計方法;沒有說明原因的情況下出現樣本量過于小等情況。
(二)“結果”統計學方法應用的常見錯誤
1.應用正確的統計學方法出現的結果表達并不一定正確。例如前文所述數據的度要求。醫學論文常見錯誤中包括均數、標準差、標準誤等統計學指標與原始數據應保留的小數位數不同;對于率、例數、比值、比值比、相對危險度等統計學指標保留的小數點位數過多;罕見疾病的發病率、患病率、現患率等指標沒有選擇好基數,導致結果沒有整數位;相關系數、回歸系數等指標保留的小數位數過多或者過少;常用的一些檢驗統計量,如f值、t值保留的位數不符合要求。
2.對統計學指標進行分析和計算時,一般采用計數資料和計量資料進行區分。計量資料常用三線表,在近似服從正態分布的前提下采用均數、標準差進行說明,如果不符合正態分布時,可以采用加對數或其他的處理方式使其近似正態分布,否則只能采用中位數和四分位數間距等指標進行描述。醫學論文中常見未對數據進行正態分布檢驗的計算,影響統計結果的真實性和可信度。對于率、構成比等常用的計數資料指標,常見樣本量過小的問題,采用率進行描述會影響統計結果的性,采用數進行說明會顯得客觀一些。還有一些文獻將構成比誤用為率,也是不可取的。
3.在判斷臨床療效之一指標時,兩組平均療效有差別并不意味著兩組的每一個個體都有效或無效,必須通過計算有效率進行計算。如比較某藥物治療糖尿病的療效,服藥一周后,研究組和對照組的對血糖降低值分別為6.7 ±2.4 和1.2 ±0.6 ( p = 0.000 1) 。按空腹血糖值低于7.7mmol/l的療效判定有效率,研究組和對照組的有效率分別為75.6%和12.4% ,盡管平均療效相差較多,但也要注意到該藥物對部分患者無效(24.4%)。對假設檢驗結果的統計學分析結果,p 值的表達提倡報告p值,如p = 0.015或p = 0.321等。目前的統計學分析軟件均可自動計算的p 值。例如常用的sas,spss等,只要提供原始數據,就可以計算出t值、f值和相應的自由度,并可獲得的p值。
四、小 結
提高醫學論文中統計學方法的使用質量是編輯部值得重視的一項長期而又艱巨的工作[3],醫學論文中統計方法應用和統計結果的表達正確與否,不僅體現了論文的科學性和嚴謹性,而且對于提高期刊整體的學術質量,促進醫學科學的發展和傳播也有著重要作用[4]。
醫學統計論文:高職衛生統計醫學檢驗論文
1五年制高職醫學檢驗技術專業的學情和崗位需求
醫學檢驗技術專業對從業者的《衛生統計學》知識有較高要求,不僅包括常用統計圖表的繪制,常用統計原理、統計方法的理解,還包括檢測結果的質量控制和部分多因素分析等。因此《,衛生統計學》是醫學檢驗專業一門重要的必修課。
2高職醫學檢驗專業《衛生統計學》教學改革初探
2.1改革教學內容
2.1.1結合職業崗位需求,精選授課內容:不同的職業崗位對《衛生統計學》知識的需求存在較大差異,教師要對專業崗位需求有清晰的認識,認真研讀該專業的人才培養方案,明確該專業對《衛生統計學》知識的整體需求和知識結構。高職醫學檢驗技術專業對《衛生統計學》專業知識的需求主要包括常用統計圖表的制作、常用資料的統計描述和統計推斷、相關與回歸分析等,很少用到多元回歸分析、醫學科研設計等統計方法。因此,教師要結合專業特點對教材內容進行合理的梳理和篩選。
2.1.2強調對基本原理、概念的理解,形成統計思維,避免死記硬背:五年高職學生普遍存在邏輯思維能力差、喜歡死記硬背概念、生搬硬套公式等情況,課前不預習、課后不及時復習,很容易把各種統計分析方法張冠李戴。作為教師,應在講清《衛生統計學》基本原理和基本概念的基礎上,講清、講透幾種最基本的統計分析方法,逐步培養學生的邏輯思維和統計思維能力。引導學生把學習重點放在掌握統計方法的基本概念和有關公式的應用條件上,讓學生對統計內容進行對比、歸納,建立統計知識的整體觀。課后讓學生及時復習,以滿足將來職業崗位的需要。
2.1.3結合統計軟件,淡化公式的數理推導和記憶《:衛生統計學》具有理論深奧、概念抽象、數據枯燥的特點,但它不是數學,不像數學那樣著重公式的推導、證明、記憶,并通過大量的習題運算來強化公式《。衛生統計學》的主要特點是邏輯性和實踐應用性強,最終的教學目的是讓學生在理解統計學的基本原理和方法的基礎上學會分析問題、解決問題。合適的統計軟件能使復雜的統計過程簡單化,更容易激起學生學好《衛生統計學》的興趣。利用統計分析軟件,如SPSS等,使學生在學習統計學時不再拘泥于繁雜的計算過程,而是更加注重統計方法的實際應用,讓學生能根據資料的類型,利用軟件選擇合適的統計分析方法,熟練地進行數據分析,同時也培養了學生對統計軟件的操作使用能力。
2.2改革教學方法
2.2.1密切結合醫學實例,強調應用能力的培養《:衛生統計學》是一門教師難教、學生難學的應用型學科,多數同學由于對醫學檢驗技術專業的認識不夠,不能深刻認識《衛生統計學》的重要性,導致缺乏學習興趣。傳統的教學方法多以教師講授為主,輔以實習、案例討論。課堂上教師先講解基本概念、原理、公式和計算等,然后讓學生采用手工法計算相應的統計指標,結果是繁瑣的計算使學生對統計學這門課程越來越不感興趣,對所學的內容似懂非懂,遇到具體問題時無所適從《。衛生統計學》授課時應采用多種教學方法,如PBL教學法、實踐教學法、應用教學法等,通過應用統計軟件、分析案例避開繁瑣的運算,著重培養學生使用統計學這一工具分析問題、解決問題的能力。采用多種教學方法不僅課堂氣氛活躍,師生交流多,學生印象深刻,還能充分調動學生學習的積極性、主動性和創造性。
2.2.2適當拓展課本知識:適當拓展對數據量較大的資料的整理和分析能力訓練,如不同數據庫之間的數據如何相互轉換、導入,不同形式錄入的數據如何整理分析,如何選用正確的統計分析方法等。只有通過具體的資料分析、統計方法的應用訓練,才能讓學生充分掌握理論知識,形成統計思維。
2.3改革教學評價的方式
2.3.1注重從結果性評價到過程性評價:高等職業教育的目的主要體現在應用性和操作性上,為了考查學生的知識和能力,務必摒棄簡單的以期中或期末考試作為終結性評價的做法。應做到評價學生的學習過程和結果,調整考試結構,從基礎知識和基本能力兩個維度進行測試。基本能力的評價要覆蓋課堂考核、課后考核、課前預習、知識掌握、靈活應用程度等方面,以考查學生對《衛生統計學》基礎概念、基本原理和基本方法的掌握程度,以及對具體案例的統計分析能力。
2.3.2從知識評價的單一體系向知識、能力、應用分析等多元評價轉變:目前,多數《衛生統計學》教材和各院校開設的《衛生統計學》課程依然使用傳統的教學模式,注重理論知識、公式的推導、運算,很多時間花費在講解基本原理和具體公式上,導致最終的考核評價主要側重于理論知識的掌握程度,而較少側重對于統計思維的養成、具體案例分析能力的考核。為此,對于《衛生統計學》考核的具體評價應該包括課堂知識的掌握、課后的總結歸納、統計軟件的應用、具體的案例分析等多元評價。
2.3.3注重學生對老師的評價,反饋于教學(多元評價主體,多元評價客體):評價主體應多元化,不僅教師對學生進行評價,而且應該包括學生對教師授課內容、授課方法、授課過程中的亮點與不足等進行的定期評價,以期對教師改進教學方法、提高教學效果起到推動作用。
3結語
綜上所述,五年制高職醫學檢驗技術專業《衛生統計學》課程改革,應通過對教學內容的優化、教學方法的改進、教學評價的更新,使本課程更貼近醫學檢驗技術專業崗位能力的需求。學生在掌握了《衛生統計學》基本概念、基本原理和基本方法的基礎上,能夠根據實際問題選擇合適的統計方法,并提高他們對文獻的閱讀理解能力,形成嚴密的統計思維。
作者:張玉領 陳培 王季茹 許國瑩 單位:淮陰衛生高等職業技術學校
醫學統計論文:醫學科技論文統計學誤用分析
1統計學應用中存在的常見問題
1.1單因素方差分析(ANOVA)兩兩比較誤用獨立樣本t檢驗單因素方差分析設計3組以上的均數比較,如果總體比較有差異,需進行兩兩比較,一般用SNK法或LSD法。但部分研究者卻將資料進行拆分,應用獨立樣本t檢驗進行兩兩比較,導致第Ⅰ類統計學錯誤發生率(假陽性率)增加,從而掉進了一個常見的“統計陷阱”,使所得結論可信度大大降低甚至得出錯誤結論。SNK法與LSD法雖然并非等價,實質是一致的。SNK法一般用于經方差分析結果具有統計學意義時才決定進行的兩兩事后比較,而LSD法可用于方差分析不足以具有統計學意義時也能進行兩兩比較[1]。比較兩種方法在SPSS的輸出結果形式,SNK是“分堆”比較,一目了然,對于組別數較多的研究更為好用,但沒有具體P值,而LSD是在進行“兩兩”比較時,能給出具體的P值。
1.2兩兩比較時檢驗水準的重新調定χ2檢驗或秩和檢驗3組以上整體比較有差異時,需應用分割法進行兩兩比較,這時檢驗水準應由原0.05調定為0.0167,否則會增加第Ⅰ類統計學錯誤的發生率。特別當P值處于0.0167~0.05時,按照P<0.0167的標準,差異無統計學意義,而按照P<0.05的標準,卻有意義,與事實相悖,出現假陽性,很容易得出錯誤結論。這種分割法有時很保守,當行列表資料分組多且為有序時可用Mantel-Haenszel卡方檢驗,也稱線性趨勢檢驗(testforlineartrend)或定序檢驗(Linear-by-Lineartest)[2]。統計路徑:用SPSS進行計數資料的趨勢檢驗,在輸出結果中讀取線性關聯檢驗統計量(Linear-by-LinearAssociation,LLA),如P<0.05可得出隨著病種級別的升高,檢測指標逐漸升高的趨勢。
1.3臨床診斷試驗中的統計學方法應用在臨床診斷試驗研究中,經常選取單項計量指標或者聯合計量指標以診斷某種疾病,若僅用初級統計學方法如t檢驗、單因素方差分析等往往不能有效挖掘信息,此時應采用受試者工作特征曲線(ROC)對檢測結果進行分析評價。ROC曲線分析基本原理是通過診斷界點的移動[3],獲得多對靈敏度和誤診率(1-特異度),以靈敏度為縱軸、誤診率為橫軸,連接各點繪制曲線,然后計算曲線下的面積,面積越大診斷價值越高。ROC曲線很直觀,能根據敏感性與特異性之和較大化原則自動產生最有效的診斷臨界點。具體路徑可以參考相關統計專著[3]。統計學處理一般描述為:采用SPSS(版次)統計軟件分析數據,對單項及聯合檢測結果作圖繪成ROC曲線,計算曲線下面積(AUC)和標準誤,其中聯合檢測結果變量即預測概率由Logistic回歸產生(也可以用判別分析得出)。計量資料應用-x±s表示,運用獨立樣本t檢驗及單因素方差分析,兩兩比較采用SNK及LSD法,計數資料采用χ2檢驗。檢驗水準為0.05。具體內容可據情而定。
1.4重復測量資料的方差分析誤用拆分文件的t檢驗或方差分析如研究共設3組,每位患者在3個時間點均查某項血指標,部分作者在處理此類數據時,常誤將縱向(同一時間點3組的比較)與橫向(同組3個時間點的比較)數據均應用拆分文件的t檢驗或單因素方差分析來處理,結果導致統計學第Ⅰ類錯誤發生。此組數據實質是重復測量資料,應采用重復測量資料的方差分析。SPSS中的統計路徑:數據-分析-一般線性模型-重復度量。研究者可以參考相關書籍進行處理[3]。
1.52×2析因設計及析因方差分析實驗是2×2析因設計時,分組有兩個因素,A與B,故分組為A、B、O、A+B,這個設計在析因設計研究中很常用,但常會出現分組設計正確,卻沒有用析因設計方差分析。析因設計與單因素方差分析不同[4],它不但能分析治療效果中處理因素的單獨效應和主效應,還能分析因素間的交互效應,并能提高檢驗效能。非統計專業的研究者進行析因分析可能稍有難度,可參考相關統計學書籍提供的統計步驟進行此類分析[3]。
1.6Meta分析Meta分析是循證醫學系統評價常用的方法[5],應用時需注意統計學處理中計數資料采用比值比(OR)作為效應變量。具體路徑:先進行異質性檢驗,當P>0.05時,認為同質,選擇固定模型;P≤0.05時,不同質,此時可采用敏感性分析或分層分析等異質性處理,使之達到同質后再選擇固定模型;若采用異質性處理仍未達到同質,則采用隨機模型,以上統計路徑均需交代清楚。Meta分析的結果是以“森林樹”體現的,審校中我們經常遇到作者繪制的“森林樹”左上角“文獻、對比、結果名稱”等內容顯示為“?”,這是由于部分版本的RevMan軟件不能輸入中文,此時可以考慮省去,或用Photo-shop軟件添加相應中文。Meta分析作為一種高級統計方法,專業性要求較高,作者可參考循證醫學類雜志上的文章格式,如《中國循證醫學雜志》中“論著?二次研究”欄目的循證文章。
2科技論文中統計學處理的相關表述
2.1資料與方法中具體統計路徑的描述“統計學處理”的內容常位于論文資料與方法的一段,一般來說包括統計軟件名稱及版次、統計描述、統計方法、檢驗標準等內容,亦可細致交待每個表格的具體統計方法。經典例子如下,“統計學處理:采用SPSS(版次)統計軟件分析數據。計量資料用均數±標準差表示,采用單因素方差分析,兩兩比較采用SNK法及LSD法。檢驗水準為0.05”。上述內容包括了大致的統計方法,即具體的統計路徑。此部分內容,沒有統一的規定[6]。常見的問題有:統計學方法描述不全、內容過于簡單、存在粘貼抄寫痕跡等。如部分論文的統計學處理中提及“以α=0.05為檢驗水準,P<0.05為差異有統計學意義”這句話,這在統計學上實質是一個重復句,保留其一即可。
2.2結果中具體P值的標注現在的統計學處理手工計算的較少,一般均應用統計軟件,最常用的軟件如SPSS、SAS均能給出具體P值。但部分論文的結果表述中卻未標明具體P值,作為科技論文是不夠嚴謹的,建議作者在表述研究結果時注明具體P值,增加論文可信度的同時,可用于再次分析。
2.3表格制作統計表設計需規范,應體現統計設計內容。部分表格存在內容割裂、組別名稱違反表格簡潔化原則、表下注釋繁瑣、橫標目與縱標目顛倒等情況。建議作者寫作論文時參閱相關統計學教程及雜志稿約。醫學統計學教學在中國的醫學教育特別是高層次教育中舉足輕重。一項課題從一個好的創意開始到實施、結題,統計學方法始終貫徹其中。不管是臨床試驗研究、實驗性研究、觀察性研究,還是臨床測量誤差與診斷試驗,如果沒有規范性的統計設計、的統計分析、科學的統計學解釋與表述,很難獲得學術上的認可[1]。目前在統計學的具體應用中,研究課題開始設計時就有統計學專家參與已成為較流行的趨勢。許多專業統計學專家或研究者在不停的進行“統計基礎”的研究,以創造更多的數理統計方法。對于非統計專業的研究者來說,統計學的學習主要側重于應用。在應用統計學教學中,一般分為4個檔次或階段來進行,首先通過學習醫學統計學課本獲取統計學思想、原理和方法,其次學習統計軟件相關書籍掌握數據到統計結果的轉化,再學習統計表達與描述書籍達到書寫統計學報告能力,可以學習如何出具統計審閱報告。醫學科技工作者亦可按照這個順序學習以提高統計能力。
醫學統計論文:部分高校預防醫學與衛生學科技論文統計
利用文獻統計分析學對中國部分地區高校的預防醫學、衛生學二級學科科技論文的數量和質量進行逐年統計分析,客觀評價高校、學院、學科、個人的醫學科研產出的學術水平和影響力,旨在揭示2006-2010年我國相關高校的該學科科研動態,以及5年間全國高校該學科的科技學術水平;按照二級學科進行分析評價,旨在反映高校在各個學科的研究實力與水平,發現各高校的優勢學科和研究不足,以尋求穩步發展。
按照《教育部學科門類、一級學科、二級學科目錄》,公共衛生與預防醫學的二級學科為:流行病與衛生統計學、勞動衛生與環境衛生學、營養與食品衛生學、兒少衛生與婦幼保健學、衛生毒理學、軍事預防醫學等。筆者對2006年-2010年間我國部分地區高校公共衛生與預防醫學二級學科科技論文統計與分析的文獻簡要評述如下。
目前,國內外對于2006年-2010年期間,我國高校公共衛生與預防醫學二級學科的科技論文做的統計與分析比較少,僅有山西醫科大學孔瑞珍的學位論文《高等院校公共衛生與預防醫學科技論文產出的綜合評價》對篩選出的27所高校在2003年—2007年間產出的科技論文,經秩和比法逐年統計分析后得知,北京大學、四川大學、復旦大學、華中科技大學等高校具有較高的論文產出能力,提示這些高校在公共衛生與預防醫學學科方面具有較強的科研能力,成績突出。對27所高校預防醫學下屬二級學科的科技論文產出數量運用秩和比法統計評價后,得出了在各二級學科方面各大學的科研情況以及優勢所在:流行病與衛生統計學以第四軍醫大學和復旦大學為優,勞動衛生與環境衛生學方面復旦大學和華中科技大學表現突出,營養與食品衛生學是第三軍醫大學和中山大學名列前茅,兒少衛生和婦幼保健學以華中科技大學和安徽醫科大學最強,衛生毒理學突出的是第三軍醫大學和吉林大學[1]。在進行橫向比較后發現,各高校5年間每年的論文產出數量相對起伏不大,但高校在各學科的論文產出能力并不均衡,需要發揮所長,彌補不足,既要發展,也應重點突出。
其他文獻主要是對以某地區的衛生機構或某一高校的公共衛生與預防醫學進行研究,例如:溫州醫學院圖書館趙麗紅的《2002-2007年溫州醫學院醫藥衛生科技論文產出的計量分析》一文中應用文獻計量學的科學方法,對2002-2007年溫州醫學院(溫醫)教師在國內生物醫藥期刊上發表學術論文及SCIE收錄國際論文進行定量研究,提供各項指標的統計數據和測評結果。文中利用中國生物醫學文獻數據庫和美國《科學引文索引》按照論文機構分布、論文作者分布、載文期刊分布、基金資助項目產出論文情況統計分析等,得出2002-2007年間,溫州醫學院國內發文和SCIE論文量均呈現出顯著增長的趨勢,在數量上和質量上均有很大程度的提高,但就目前而言,與國內醫學院校尚存在一定的差距[2]。浙江省醫學情報所的舒暢和《移植雜志》編輯部的沈敏共同完成的《浙江省各地區醫學科技論文計量分析》一文中用中國生物醫學文獻光盤數據庫(CBMdisc)對浙江省11個省轄市在2002-2007年發表的生物醫學文獻進行統計,按照11個省轄市的總量、省轄市在核心期刊上發表的文獻量、11個省轄市排名前五位的學科等進行統計,根據統計結果對浙江省各地區的生物醫學水平進行分析,發現浙江省生物醫學水平有長足的進步,但地區發展不均衡的現象十分明顯,尤其是省屬單位占居了主導地位,市級醫療單位難以與他們競爭,該文對以后這些地區的發展提出了建議。
還有部分文獻是僅僅研究公共衛生與預防醫學領域的文獻計量指標的有關情況,中華預防醫學會的劉瑋完成的《從期刊的文獻計量指標變化看預防醫學和衛生學期刊的進步》一文中,從選取的7個主要文獻計量指標:總被引頻次、影響因子、即年指標、他引總引比、源文獻量、基金論文數比、平均引文率等來對2005和2006年全國科技期刊、醫藥類期刊及預防醫學期刊進行了比較。結果表明:78種預防醫學期刊的平均指標值稍低于全國期刊和醫藥期刊。但增長率大部分高于全國和醫藥期刊,表明預防醫學期刊的發展勢頭較好[3]。
也有不少文獻是介紹如何采用文獻計量學的方法來應用于醫學信息研究,北京協和醫學院張雪燕在其碩士論文《醫療機構科研績效評價研究》中,利用阜外心血管病醫院1999-2008年科研活動統計數據庫,調查中標課題、獲得成果、發表SCI論文、著作、專利等方面的基本情況及發展趨勢。采用SAS8.2統計軟件描述課題、成果、論文在時間分布、專業分布、人員分布上的變化趨勢和特征,并通過建立科研績效評價體系,運用綜合指數法對醫院及各專業進行科研績效評價,、客觀地評價醫院科研工作的發展態勢、潛力,為醫院制定中、長期科研發展規劃提供參考依據,并促進科研管理更加科學化、規范化、合理化。其中的研究方法:一是數據庫的建立。(1)科研處建立的課題、SCI論文的Excel數據庫:在日常工作中形成。課題庫入選的指標有姓名、基金名稱、經費、項目類別、科室,入選標準為1999-2008年承擔的縱向課題。SCI論文庫入選的指標有:姓名、影響因子、科室,入選標準為1999-2008年及時作者發表的文章。(2)人事處的人員信息Excel數據庫:在日常工作中采集形成。另有中國醫學科學院碩士研究生學位論文入選指標:為姓名、性別、年齡、學位、職稱。二是統計分析方法。利用SAS8.2軟件進行分析,用描述性統計方法描述研究變量:課題、成果、論文的時間分布、專業分布、人員分布上的變化趨勢和特征。三是建立評價體系:通過查閱文獻和專家咨詢法,以科研績效考核為總目標;課題、成果、論文、著作、專利為一級指標;課題、成果、專利、論文的類別為二級指標;以課題的級別、成果的級別、論文的形式為三級指標。四是評價方法即綜合指數法。綜合指數法是將一組指標值運用統計學方法處理轉化為綜合指數值,以便對不同類別、不同結構、不同計量單位的指標進行綜合比較[4]。無論是不同醫院同類科室間的橫向比較還是同一科室不同時間的縱向比較,多指標綜合評價都是一個很重要的方法。指標指數化(f):當各個指標值的數量、性質、單位不同時,不能直接比較,必須將指標值標準化,即指標值指數化(f)。廣東省疾病預防控制中心胥秋華在《醫學文獻計量分析應用的研究》一文中,提及醫學文獻計量分析的情報功能時,提到文獻計量分析為讀者提供了一種簡便可行的情報信息獲取途徑;文獻計量分析的結果客觀地展示了主體事物的發展情況及規律,具有較高的可信度,為管理者的決策提供科學客觀的依據;通過對分析結果進行縱向及橫向的比較,從對自身的科技產出能力、科研水平進行整體評價,并尋找出影響科研論文數量和質量的主客觀因素,與此同時,利用計量指標對一個學科或專業發展以及一個國家、地區、單位甚至個人的科研成果進行評價的需求也迅速增長;文獻計量分析的結果可以、完整、地反映主體事物的真實性,不僅具備有說服力的論點和論據,也顯示和揭示了客觀事物的發展規律,對科學研究素材的選擇具有較高的度,主要作用是對這些事物進行客觀認知,同時進行前瞻性預測,為科學決策或科學規劃提供參考依據。
醫學統計論文:醫學院校醫藥數理統計論文
一、當代大學生心理特點以及醫藥數理統計課程的特點
1.當代大學生的心理特點。大學生在生理上進一步發育趨于成熟,心理上趨向主動和獨立,思維能力迅速提高,抽象思維能力與邏輯推斷思維能力獲得顯著地發展,追求新意,對問題和事物有著獨特的見解和認識,從而使他們在精神方面的獨立意識較之一般青年更為突出。而且當代大學生的這種強烈的自我意識,迫切需要同學、老師、社會以及自身的肯定,馬斯洛的自我實現的需求在當代大學生身上表現得尤為突出。另一方面,當代大學生處在一個社會迅速變遷,科技日新月異,信息高度發達的階段,使得他們探索問題的好奇心更加強烈,希望能夠探索萬事萬物的真相,但大多數大學生怕吃苦,自制力和耐挫力較差。
2.醫藥數理統計課程的特點。雖然醫藥數理統計相對于高等數學等傳統數學類課程具有更強的應用性和趣味性,但醫藥數理統計是建立在隨機理論基礎上的,對習慣了確定性思維的大學生,如何轉換思維模式是一個挑戰;醫藥數理統計方法的應用一方面需要結合學生的學科專業知識,另一方面需要結合軟件實現,如何做到數理統計方法、醫藥專業知識和應用軟件三方面的有機結合是醫藥數理統計教學過程中迫切需要解決的問題;醫藥數理統計方法的實際應用涉及的知識面較廣,難度較大,如何將利用數理統計方法解決實際問題的完整過程簡潔又不失生動地展現在學生面前也是一個關鍵問題。結合當代大學生心理特點和醫藥數理統計課程的學科特點,急需從教學內容、教學方法及教學激勵和評價機制等方面改革當前醫藥院校醫藥數理統計教學。
二、醫藥數理統計教學改革的內容和措施
1.教學內容的改革是《醫藥數理統計方法》教學改革的基礎。認真研究和理解醫藥院校各專業學生的培養目標,在不破壞學科知識體系的情況下,在突出醫藥學特色和增加應用性這兩個原則的指導下調整知識點,刪減陳舊知識,弱化公式推導,增加結合醫藥學應用的新方法,增加應用型、研究性案例比重,將重點、難點放在醫藥特色實際應用的案例教學及科學思維方法的培養上,以應用需求為先導,以案例教學為媒介,以實驗軟件實現為輔助,實現教材內容與企業實際需求以及醫藥科研的同步更新,提高學生的學習興趣和積極性。同時教學內容改革是龍頭,必將帶動其教學方法、考核方法等一系列的改革,為醫藥特色創新型、應用型人才的培養打下堅實的基礎。
2.教學方法改革是《醫藥數理統計方法》教學改革的核心。通過教學內容的改革,可以使得教學內容能引起學生興趣,但如何使學生對醫藥數理統計保持持久興趣是較大的難題。如何將一時好奇升化為持久的興趣、理想及自我價值的實現,必須結合當代大學生心理特點,采用實用有效的課堂教學方法。根據當代大學生的心理特點以及醫藥數理統計課程的特點,案例教學法是非常合適的教學方法。首先教師可以從較新的學術期刊,甚至是教師的科研課題里面尋找案例,或者以產學研合作項目為契機,深入了解企業現今近期需求,根據企業提供的基礎資料,提煉經典案例。在案例教學過程中由教師把精選的案例展現在學生面前,讓他們帶著問題去學習相關知識和方法,接下來需要經過思考和討論提出解決問題的方案,這使課堂變得生動活潑,有利于激發學生的學習興趣,培養創新能力及分析、解決問題的能力。每個同學都可以提出自己的見解,相互交流,取長補短,教師通過引導、點撥、啟迪等方式對學生進行指導。通過案例教學可以增強學生自身對整個案例解決過程的切身體會,讓學生精神層面充分感受到參與案例解決的愉悅感和克服困難、解決問題后的成就感,鞏固與提高學生個體對醫藥數理統計持久的興趣。特別需要強調的是數學概念和方法也要通過案例引入,數學知識產生時,總是伴隨著數學家“火熱的思考”,但是數學知識以論文、教材的方式呈現出來時,卻往往只剩下了“冰冷的美麗”。通過案例引入可以揭示并引導學生去發掘和領會那些“火熱的思考”。而學生發掘和領會那些“火熱的思考”的能力,就是學習能力的核心,也是創新能力的源泉。
3.教學激勵和評價機制改革是《醫藥數理統計方法》教學改革成功的保障。要達到好的課堂教學效果必須構建新型人性化學生激勵和評價機制。合理完善的激勵和評價機制能夠更好地激發行為主體的積極性和創造力,體現以人為本。傳統的教學評價機制,往往都是通過課后作業及考試來進行的,存在時間上的滯后,雖然在一定程度上能夠反映課堂學習的情況,但是對于課堂上學生主體的參與、思考、創新的程度無法做出判斷,有可能挫傷學生創造性思維成長的積極性;而獎學金等傳統的激勵機制往往周期更長,無法及時滿足當代大學生急切盼望社會認同和自我實現的心理需求,一定程度上影響了其學習動力。
4.數學建模競賽等大實踐教學是《醫藥數理統計方法》教學改革的有益補充。把全國大學生數學建模競賽作為鍛煉同學們實際應用能力的第二課堂。數學建模是數學知識和方法與實際問題之間溝通的橋梁,因此數學建模是對學生將數學的知識和方法轉化為用數學的能力的檢驗。可以說數學建模對學生能力的培養是多方位的:它體現在查閱文獻資料、分析綜合、抽象概括能力的培養,應用能力和評價能力的培養,運用數學工具和計算機以及實踐能力的培養,創新精神和創新能力的培養以及組織協調能力培養等。參與數學建模競賽活動,會極大地拓展學生應用數理統計知識的空間,并會對課堂教學產生良好反饋。要鼓勵和指導學生積極參加全國大學生數學建模競賽和美國大學生數學建模競賽。除此之外,還要讓學生走出去,去做與專業相關的社會調查,去醫藥企業直接感受醫藥企業對數理統計知識和方法的需求,并在實際應用之后內化為自身的實踐能力!以學生的實際需求優化《醫藥數理統計》教學內容,以學生為主體設計教學方法,并設計及時、科學的激勵和評價機制,以提高當前醫藥院校《醫藥數理統計》課程的教學質量!
作者:王秀鳳張磊唐小婭黃榕波單位:廣東藥學院 基礎學院數學系基礎學院物理系
醫學統計論文:基于運用分析的醫學統計論文
一、試驗設計中的統計學原理
合理的試驗設計與統計處理的可信度存在直接聯系,研究者在編寫醫學論文時應對醫學研究設計方法進行說明。在進行試驗設計時應遵循隨機、對照、均衡和重復四大原則。在進行試驗設計的時候通常會涉及到研究對象的選擇,研究對象的分組及選擇合理的檢測指標三個方面的內容。醫學論文就是通過對樣本的研究來進行推斷總體,找出其共性,得出結論。因此研究者在選擇研究對象時應注意選擇樣本應具有一定數量,能反映出該事物的規律性特征,但又應注意例數不能太多,以免造成不必要的浪費。其選擇的原則就是在保障試驗結果性的前提下選擇最少的樣本例數。研究者在選擇樣本對象后應對其基本特征進行詳細的描述,比如患者的年齡、性別、病理分期、疾病診斷的標準等。此外在試驗中所用到的試劑、儀器的型號、規格等都應作出說明,以供讀者借鑒和做出判斷。選定好研究對象后就要對其進行分組。在進行分組時研究者一般遵循統計學中的“隨機分配”、“設立對照”以及“均衡”、“重復”的原則。隨機化原則是提高組間均衡性的一個重要手段,也是資料分析時進行統計推斷的前提。有對照才有比較,在進行組間比較時,應確定好處理因素與實驗效應的關系。均衡性則是要使得對結果產生影響的非處理因素盡可能保持一致,這樣才能保障對照的結果讓人信服。觀察實驗效應的指標主要有主觀指標與客觀指標。正所謂主觀指標就是通過問答的方式調查受試者自己判斷的主觀感受;而客觀指標則是通過儀器來檢驗和測量所得出的結果。在進行試驗設計時應選擇客觀性較強、高靈敏性和性的指標。
二、統計學方法的選擇
統計學方法的正確選擇是直接影響到論文結論可信度的重要依據,因此研究者在編寫論文時應注意選擇合適的統計學方法。不同的統計學方法應用的范圍不同。研究者在編寫醫學論文時常根據論文研究的目的、資料類型、試驗設計的方案、樣品大小、水平數、特定條件、數據分布特征以及綜合分析等來選擇對應的統計方法,同時還要根據專業知識與資料的實際情況,結合統計學原則,靈活地選擇。當定性資料正態分布時,研究者一般用均數和標準差來表示統計描述指標;當定性資料不符合正態分布時,則可選用中位數及級差來表示;當定量資料正態分布且組間方差齊時一般選用參數法,反之則選用非參數法。t檢驗一般適用于小樣本(n<50)的定量資料且方差齊的兩組數據之間的比較。其特點是在均方差不知道的情況下,可以檢驗樣本平均數的顯著性,大樣本(n≥50)采用u檢驗;多個樣本均數兩兩比較則用方差分析,如差異有統計學意義,可采用q檢驗;Dunnett檢驗則適用于多個實驗組與一個對照組均數的比較。定性資料中,表現為互不相容的類別或屬性,分為二分類和多類反應,如治療結果為顯著和好轉的人數等,該種資料可選用字檢驗,大樣本(n≥50)時采用u檢驗。如:患者的治療結果評定為痊愈、顯著有效、好轉、無效或死亡。該種資料可選用秩和檢驗或u檢驗。總之,不論論文中選用的是哪種統計學方法,都要計算出檢驗值,然后再根據統計量值來判定P值的大小,結論一般描述為“差異有(無)統計學意義”。
三、常見統計學方法的誤用分析及對策
1.統計方法誤用。
最常見統計方法誤用是對等級資料進行比較時應用秩和檢驗而誤用卡方檢驗。例如:在評價采取不同治療方法的兩組急性腦血管病患者療效中,治療組顯著有效、有效、無效三種分型分別為15例、10例、8例,對照組分別為14例、11例、9例。本資料例數較少,應選用等級比較的秩和檢驗,而有些作者卻認為只要是率的比較就可以采用字檢驗。研究者在選擇統計學方法時應根據相應的原則,對文章研究目的、資料類型、樣品大小、水平數、數據分布特征等進行綜合分析后,再來選擇對應的統計方法。
2.選用檢驗方法錯誤。
在有些論文中,作者常將本應用方差分析和q檢驗的誤用t檢驗。t檢驗一般適用于小樣本(n<50)定量資料且方差齊的兩組數據之間的比較,而方差分析及q檢驗主要用于對多個樣本均數進行比較,幾種不同治療或處理方法等的同時比較。例如:在討論中、西以及中西醫結合治療急性腦血管病時,兩組患者的年齡、病程、病情嚴重程度等差別均無統計學意義,比較三組患者的一些指標變化。組間多重比較應用q檢驗,但文中作者采用的是t檢驗,對三組均數進行兩兩比較。這不僅造成了資料的利用率低,也增加了假陽性的概率,降低了試驗結果的可信度。
四、結論表述中的統計學應用
在對統計資料進行分析后應把握統計學術語,對結論做出科學的分析跟解釋。在根據統計結果得出專業結論時研究者應遵循一個重要原則,就是統計結論都是概率性的,不能地肯定或否定。研究者習慣上將“P<0.05”稱為顯著性,不應誤解為差別很大或者在醫學上有顯著的價值。統計推斷是以一定的概率界值為依據,說明來自同一總體的可能性大小。“差異有統計學意義”說明在試驗中的差異不能用抽象誤差進行解釋;“差異無統計學意義”表明在試驗既定的條件下,差異可能是因抽象誤差引起的,在增加樣本數量的情況下,差異可能變成“有統計學意義”。
作者:李盛榮單位:玉林市醫學情報所
醫學統計論文:基于教學模式的醫學統計論文
1調查對象和抽樣方法
采用隨機整群抽樣的方式,以預防醫學系預防醫學專業2007級全體學生共101人為研究對象,自行設計問卷對其進行調查,根據計算機產生的偽隨機數隨機抽取1、2班為實驗組,3、4班為對照組。
2教學方法
在理論課教學方式上,實驗班和對照班均采用多媒體傳統教學。而在實驗課程的教學方式上,對照組的實驗課程仍舊沿襲以往傳統教學模式,即“回顧理論課知識點練習教科書中對應的思考練習題課后復習”,學生被動參與。實驗組在實驗課程中則以案例討論分析為核心,學生主動參與為主線的教學模式,即“課前復習理論知識提出案例互動交流分析案例解析教師總結”,通過對典型的案例進行分析,使得同學們有機會運用理論知識對文獻中的統計分析方法進行探討,達到從實踐層面上鍛煉學生解決問題和分析問題的能力。
3調查方法
教學效果主觀層面學生自我評價:根據研究對象和研究目的自行設計調查表,調查內容主要包括個人一般情況、學習效果自我評價、教學改革效果評價以及對實驗教學的建議和意見。經預調查后,調查表在實驗組與對照組同時統一發放,學生當場填完,經核實無漏項當場回收。本次調查發放問卷101份,回收有效問卷99份,有效回收率98%。教學效果客觀層面評價:為客觀評價教學改革效果,老師特意命制了具有調查目的的試卷,以期末考試的形式對學生的學習效果進行客觀評價。試卷分兩部分,前半部分為基礎知識部分,后半部分為綜合運用部分,滿分100分,由同學們在規定時間內獨立完成。除兩人緩考外,其他所有試卷當場收回,回收率98%。
4統計分析方法
資料經統一編碼后實用Epidata3.1軟件建立數據庫,采用雙錄入的方法,2人分別錄入再進行對比,對數據進行邏輯查錯后經整理形成最終數據庫,數據分析運用SPSS16.0統計軟件包進行包括算數平均數、標準差、等統計描述,以及統計推斷如t檢驗,卡方檢驗,秩和檢驗等。
5結果
5.1一般情況比較
本次調查回收有效問卷,實驗組49人,對照組50人。兩組同學入學前的性別、來源地、戶籍構成、和年齡差異均無統計學意義(p>0.05)。提示兩組資料人口特征上有可比性,均衡性好。
5.2理論知識認知情況
分析結果顯示,實驗組與對照組對理論知識的認識情況,包括T檢驗、方差分、統計圖表、直線相關回歸、多元線性回歸,差異均無統計學意義(P>0.05)。
5.3教學效果自我評價情況
實驗組與對照組對教學方法的評價中,交流能力、表達能力、獲取信息能力以及解決實際問題的能力方面,差異均有統計學意義(P<0.05),且實驗組優于對照組。而學習效率方面,差異無統計學意義(P>0.05)。
5.4期末成績客觀指標
為客觀評價教學改革效果,老師特意命制了具有調查目的的試卷。試卷分為兩部分,前50分為基礎題,題目涉及的知識點比較基礎;后50分為實際運用題,需要靈活運用書本知識,難度相對較大。實驗組與對照組基礎知識部分得分、綜合運用部分得分、總分方面,差異均無統計學意義(>0.05)。
6討論
隨著醫學科技以及衛生事業的發展,社會對以學生的知識、能力、素質提出了更高的要求,培養醫學生的科學素質和科研能力已成為現代醫學教育的主要內容,以案例問題分析為基礎的教學是順應教學改革潮流發展起來的一種新的教學方法。通過上述調查,結果顯示在不同的實驗教學模式下,通過對不同實驗教程的教學效果分析,實驗組與對照組在對統計學知識認知方面無差異無統計學意義(P>0.05);兩組同學在獲取知識的能力、表達能力以及交流能力方面,差異均有統計學差異(P<0.05),實驗組優于對照組。學習效率方面自我評價,差異無統計學差異(P>0.05);兩組同學期末考各方面得分方面,差異均無統計學意義(>0.05)。分析可能原因如下:
(1)學生缺乏學習主動性:
實驗教學課程改革的核心是進行案例分析。其前提是需要對書本理論知識要有一的理解。學生由于缺乏主動性,在上實驗課程之前,由于很大一部分學生缺乏主動性,沒有在實驗課之前做好充分的準備和預習,包括收集資料、查閱文獻、透徹的理解書本知識。致使在實驗課程中不能積極的投入到討論之中。同學們應在課下即使鞏固知識,在對書本知識理解的基礎上,再進行具體的案例分析,才能融會貫通地提高對書本知識的靈活運用。
(2)學生缺乏學習積極性:
醫學統計學理論和系統性較強,章節內容比較枯燥抽象,公式難以辨別和識記,同時同學們的數學演算和推理能力較弱,因此同學們對統計學的認同程度較低,普遍存在畏難和煩躁情緒,案例分析要求每個同學都積極加入到討論中,同時主動發言,回答相關問題。實驗組同學普遍反應壓力較大,學習負擔重,這樣更能激起同學們的排斥情緒。可見,同學們的不良情緒對本次調查結果存在一定的影響。
(3)實驗組缺乏課后的鞏固練習:
對照組的實驗教學模式以課后練習為重心,在理論課程之后,對具體的課后練習題進行解答,這有助于同學們對理解知識的鞏固和理解。實驗教學采取案例分析為核心的教學方式,但是僅僅通過課堂的短短幾十分鐘是遠遠步夠的。學好統計學除了需要識記理論知識外,更重要的是學以致用,而適量的課后練習則是通向融會貫通的橋梁。統計學是一門應用的學科,實驗教學組同學在案列分析之后,要做適量的練習題鞏固知識,這樣才能從本質上提高解決問題的綜合能力。
7結語
實驗教學課程的改革使得學生在交流、表達、獲取信息方面的能力得以提高。這主要歸功于案例分析給予了同學更多表達自己的機會。同學們暢所欲言,個人綜合能力得到鍛煉。但是在改革中還存在一定的問題,要想達到預期的目標,除了教學形式的改革,更重要的是要從老師的教學方式和學生的學習方式進行改革,提高學生的積極性、主動性、創造性。筆者認為可以著眼從以下方面進行調整:
(1)實施前老師應該多與學生交流,增強了學習動力和信心。同時同學應在老師的指導下,課前準備更充分些,多讓學生望參加現場數據收集工作,增加接觸實際工作的機會。在實際工作中帶著濃厚興趣去學習將有助于調動同學們的積極性和創造性。
(2)實施過程中,老師應該加強對學生課后的學習監督。努力把學生的觀念從“要我學轉變成我要學”,學生學習不夠主動,課堂討論吃力。老師可以定期抽查學生的分析筆記,鼓勵學生課外時間多做相關練習,即使深化所學知識。只有內容和形式都有了實質性的變化,學生能夠主動積極的投入到實驗教學改革中,才能真正從本質上提高學生的綜合分析問題,解決問題的能力,才能培養出符合社會需要的實用型人才。
作者:賈賢杰汪一心吳學森朋文佳羋靜周占偉單位:蚌埠醫學院預防醫學系流行病學與衛生統計學教研室
醫學統計論文:醫學期刊和基金論文比的統計分析
1樣本來源和統計方法
1.1樣本來源
樣本來源于《中國科技期刊引證報告(擴刊版)》(2011版)。由浙江省出版發行的醫學專業期刊共有25種,占浙江省科技期刊總數(115種)的1/5。涉及基礎醫學、內、外科等13個學科,數量最多的為綜合類(4種),其次為學報類(3種)。刊期以月刊為主(12種),其次為雙月刊(11種),半月刊和季刊各1種。
1.2統計方法
以中國科技期刊引證報告(擴刊版)》(2011版)為數據源,統計25種期刊的影響因子、總被引頻次、基金論文比等3項反映期刊影響力的指標進行文獻計量學分析。同時,為客觀評價期刊的水平,對以上指標用本期刊的指數/學科平均指數來進行縱向的比較,比值>1表明該指標高于學科平均水平。
2結果與分析
2.1浙江省醫學期刊影響因子與總被引頻次
影響因子是一個相對統計量,它表征期刊有用性或顯示度,與期刊影響力、論文質量和學術水平直接關聯,是目前公認的衡量期刊尤其是同類期刊影響力大小的最為重要的指標之一。表2顯示:浙江省醫學期刊總體的影響因子低于全國平均水平,影響因子/學科平均比值>1的期刊僅有5本:中國醫學高等教育(2.303),浙江大學學報(醫學版)(1.612),護理與康復(1.243),肝膽胰外科雜志(1.203))和中華眼視光學與視覺科學雜志(1.190),其余都在本學科的平均水平之下。從以上結果來看,除了浙江大學學報(醫學版)外,其余4本雜志均具有鮮明的專業學科特色,表明專業特色對提升雜志的影響因子具有較大的幫助;而浙江大學學報(醫學版)雖為綜合類期刊,但其依托浙江大學雄厚的科研背景,使雜志的成長有了有利的環境。總被引頻次可以顯示期刊被引用和受重視的程度,以及在科學交流中的地位和作用,是評價期刊學術水平的重要指標。浙江省醫學期刊中總被引頻次均值為1201次/刊,高于全國平均水平(882次/刊),說明浙江省醫學期刊在學術交流過程中有一定的地位。但是高于本學科平均水平的并不多,僅有4本期刊:中國高等醫學教育(3.659),浙江中醫藥大學學報(1.581)),浙江預防醫學(1.187)和中華急診醫學雜志(1.162)。有學者認為總被引頻次與載文量相關,本文總被引頻次/學科平均>0.6的13種期刊中只有2種是雙月刊,因此浙江省醫學期刊整體的總被引頻次較高是否與其載文量較多有關,有待探討。
2.2浙江省醫學期刊基金論文比情況
基金論文比在一定程度上體現了科技期刊吸收學科前沿和高質量論文的能力,因此也是衡量期刊論文學術質量的重要指標之一。浙江省醫學期刊的總的基金論文比低于全國平均水平,有8本期刊與學科平均比值>1,分別為:中華臨床感染病雜志,溫州醫學院學報,中華急診醫學雜志,浙江大學學報(醫學版),中國高等醫學教育,中華眼視光學與視覺科學雜志,浙江醫學和口腔材料器械雜志。一般來說,高校學報或者由高校主辦的雜志依托高等學府,基金來源豐富,擁有較高的基金論文比的幾率比較高,本文中除了《口腔材料器械雜志》和《浙江醫學》,其余6種雜志均由浙江大學或者溫州醫學院主辦,這2所大學均擁有較雄厚的科研實力。值得關注的是《浙江醫學》作為一本地方性的醫學雜志,擁有較高的基金論文比,充分說明其在浙江省醫務工作者中的地位。
3討論
3.1浙江省醫學期刊的總體評價
目前,期刊的評價指標有10余種,其中影響因子,總被引頻次和基金論文比是其中比較重要的指標,雖然這些指標各有局限,但還是能夠基本反映期刊的總體狀況。本文通過對浙江省醫學期刊以上3種指標的統計分析發現:浙江省醫學期刊的總體水平偏低,影響力較弱,雖然在學術交流中有一定的作用和地位,但是吸收前沿學科和高質量論文的能力與國內的期刊相比還有待提高,這與浙江省期刊的總體情況相似。但是也不乏亮點,一些期刊如《中國高等醫學教育》,浙江大學學報(醫學版)等在其自身的學科領域內名列前茅,具有較高的學術質量。
3.2提升浙江省醫學期刊影響力的建議
3.2.1找準定位,堅持專業化和特色化
隨著生物醫學的快速發展,要在國內的眾多雜志中占有一席之地,需要找準自身的定位,尋求鮮明的特色和學科優勢。從本文結果可以看出,有著自身特色或者學科優勢明顯的期刊影響力均較強,如《中國高等醫學教育》的各項指標名列前茅,這與其是為數不多的醫學領域中涉及高等教育的雜志密切相關,獨特性和稀缺性導致了高影響力。另外幾種具有較高影響力的期刊,除了浙江大學學報,其余幾種也都具有明顯的“小而精”專業特色。因此,找準適合自身的發展道路,才能在激烈的競爭中立于不敗之地,這不僅需要編輯部根據自身的特點制定發展方向,同時也需要管理部門在政策層面上給予引導和支持。
3.2.2探索集約化的發展之路
2011年,原新聞出版總署已明確科技期刊出版體制的改革的”路線圖”,期刊的集約化發展已勢在必行。國內外的實踐證明,集約化有助于提升期刊的核心競爭力,如國內中華醫學會的“中華”系列雜志,在醫學領域里有著強大的影響力,在浙江省主辦的3本“中華”系列雜志中,除了中華臨床感染病雜志因辦刊時間較短,一些指標略低之外,中華眼視光學與視覺科學雜志和中華急診醫學雜志在本學科領域中名列前茅,充分顯示出“中華”品牌較強的競爭力。因此,今后可以結合浙江省醫學期刊的特色或者學科特點,逐步整合橫向和縱向資源,通過靈活多樣的方式,建立具有鮮明特色的浙江醫學期刊集群,通過集團優勢提升期刊整體的影響力和競爭力,如刊名帶有“浙江”的地方性醫學期刊,因其強烈的地域特色,普遍存在影響力偏低的現象,而且一些雜志的學科和內容也趨于雷同,這些雜志是否可以嘗試聯合經營,優化配置,取長補短,通過團隊的力量形成有自身特色的品牌集群,進一步帶動期刊的整體發展。
3.2.3加快信息化建設,大力發展數字化出版
數字化出版已成為無法阻擋的發展趨勢,代表著未來期刊出版的方向。有調查表明:OA出版可切實提高期刊的學術影響力,特別對提高期刊當年的引用率有明顯效果。因此抓住了數字化出版的脈搏,也就是抓住了期刊發展的方向。據調查,浙江省科技期刊的數字化建設不容樂觀,從目前的情況來看,大多期刊的數字化建設仍依托于國內大型數據網站,均屬于淺層網絡化階段。要吸引讀者更多的關注,就需要期刊建立獨立的網站,或者幾個雜志社建立有專業特色的網絡平臺,進行深層次信息化服務,這樣不僅加強了與讀者、作者的互動,還可以提供給他們真正感興趣的、與期刊內容有較強相關性的信息。一個設計良好網站不僅是編輯部與作者、讀者良好溝通的平臺,同時還能增強作者、讀者的“黏性”,吸引他們的關注,提供高質量的論文,從而逐步地提升期刊的質量。
作者:舒暢馬凌飛奚萊蕾龔杰周紅兵侯翠香單位:國際流行病學傳染病學雜志編輯部浙江科技學院學報編輯部浙江氣象編輯部
醫學統計論文:醫學期刊論文常見統計學錯誤
1.統計表達和描述方面存在的錯誤:(1)統計表中數據的含義未表達清楚,令人費解。(2)統計圖方面的主要錯誤有2個,其一,橫坐標軸上的刻度值是隨意標上去的,等長的間隔代表的數量不等,在直角坐標系中,從任何一個數值開始作為橫軸或縱軸上的及時個刻度值;其二,用條圖或復式條圖表達連續性變量的變化趨勢;(3)運用相對數時,經常混淆“百分比”與“百分率”;(4)在表達多組定量資料時,即使定量資料偏離正態分布很遠,仍采用“x珋±s”表達(標準差S>x珋),特別當表中采用標準誤Sx珋取代標準差s時,前述的錯誤很難被察覺出來。
2.定量資料統計分析方面存在的錯誤:(1)當定量資料不滿足參數檢驗的前提條件時,盲目套用參數檢驗方法;(2)不管定量資料對應的實驗設計類型是什么,一律套用單因素2水平(或叫成組)設計定量資料的t檢驗或單因素多水平設計定量資料的方差分析。
3.定性資料統計分析方面存在的錯誤:(1)把χ2檢驗誤認為是處理定性資料的萬能工具;(2)忽視資料的前提條件而盲目套用某些定性資料的統計分析方法;(3)盲目套用秩和檢驗;(4)誤用χ2檢驗實現定性資料的相關分析。
4.簡單線性相關與回歸分析方面存在的錯誤:(1)缺乏專業知識,盲目研究某些變量之間的相互關系和依賴關系;(2)不繪制反映2個定量變量變化趨勢的散布圖,盲目進行簡單線性相關與回歸分析,常因某些異常點的存在而得出錯誤的結論;(3)常用直線取代2定量變量之間事實上呈“S形或倒S形”的曲線變化趨勢。
5.多因素或多自變量的實驗資料進行分析存在的錯誤:(1)將原本屬于多因素實驗研究,拆分成一系列單因素的研究來分析,這種“化繁為簡、化整為零”的處理,割裂了原先的整體設計,無法研究多因素之間的內在聯系或交互作用,容易得出片面、甚至錯誤的結論;(2)雖然將多個自變量都包括在一個多重線性回歸方程或多重Logistic回歸方程之中,但整個回歸方程沒有統計學意義或回歸方程中有很多無統計學意義的自變量,就依據這樣的回歸方程去下結論。
醫學統計論文:醫學科技期刊統計學論文
一、統計學方法的種類
醫學統計學常用三種類型的資料:計量資料、計數資料、等級資料。計量資料是指通過度量衡的方法,測量每一個觀察單位的某項研究指標的量的大小等一系列數據資料,如身高(cm)、體重(kg)、血壓(mmHg)等。計數資料是指將全體觀測單位按某種性質或特征分組,然后再分別清點各組觀察單位的個數。如性別、血型、職業等。等級資料是介于計量資料和計數資料間的一種資料,通過半定量的方法測量得到。如臨床療效、癌癥分期等。醫學論文中常用的統計學方法有計量資料用t檢驗、方差分析,計數資料常用卡方檢驗、確切概率法等,等級資料常用秩和檢驗、Ridit分析等。當然,有些資料可以相互轉換,數量變量可以轉換成等級資料,等級資料可以轉換成計量資料。那么醫學論文中統計學方法使用情況如何呢?王倩等人研究了五種中華醫學會系列雜志論著中十年來統計學的應用狀況,結果表明,1995年發表的論著較1985年有顯著進步,文章中統計分析的使用率從40%上升到60%,使用了更多較復雜的統計分析方法;t檢驗和聯列表分析均為最常用的統計分析方法。最近幾年調查顯示,近5年國內不同醫學核心期刊的統計學使用情況中,t檢驗占25.9%、方差分析占10%、卡方檢驗占21%、Fisher概率占1.1%、秩和檢驗占2.1%、Ridit分析占1.1%。滕洪松等對山東省醫學院校學報論著中統計學方法應用狀況調查發現,常用的方法是t檢驗、χ2檢驗、相關分析和方差分析。許小幸等對2005年1月至2009年12月《臨床兒科雜志》共發表的776篇論著統計學使用情況調查發現,方法中提到統計學分析者占73%~85%,實際使用者占87%~90%,兩種方法的使用比和多因素分析的使用比在2008~2009年有所上升。而賴娟等人對國內有較高水平兩種中華臨床醫學雜志(《中華心血管雜志》《中華消化雜志》)2005—2006年發表的643篇論著中統計學方法的使用情況進行調查,統計學方法的使用率為86.5%,正確率為82.7%,t檢驗和列聯表分析為常見的統計學方法。認為統計分析方法的使用率和正確率均有明顯提高,方法更加多元化,但統計學方法的未用、誤用現象仍然存在。
二、常見的統計學錯誤類型
統計學是衡量統計研究設計是否嚴謹、資料收集和表達是否正確、統計分析方法選用是否合理、計算和結果解釋是否的方法。正確應用醫學統計學方法是保障論文科學性的主要環節。然而很多調查顯示作者正確使用統計學的狀況并不樂觀,很多作者(特別是臨床一線的作者)對統計學知識了解不夠,不能正確使用統計學方法,導致論文中統計學的錯誤較多。有些是科研設計錯誤;有些是統計方法描述不清,結論欠科學,或統計檢驗方法應用不正確;還有些則是統計表圖不規范。王倩等人調查顯示,最常見的問題是文章中僅有P值而所用統計方法不明、用t檢驗代替方差分析進行多組間的比較。滕洪松等的調查也表明,較常見的統計問題有:只寫P值而未注明所用統計學方法,用t檢驗代替方差分析進行多組均數間的比較,等級資料比較用χ2檢驗等。沈進等人對8種醫學期刊544篇論著的統計學應用情況進行分析,發現136篇論著中有明顯的統計學錯誤,錯誤率為25.00%。主要錯誤類型及構成依次為:資料處理方法不當占61.76%,圖表錯誤占14.71%,未作統計學處理占8.82%,率、比混淆占8.82%,其他錯誤占5.88%。章新生等辨析醫學稿件中常見統計學方法誤用情況包括兩大類,χ2檢驗的常見誤用類型有誤用χ2檢驗替代秩和檢驗、誤用χ2檢驗替代四格表確切概率法、誤用χ2檢驗替代配對χ2檢驗、誤用χ2檢驗處理相關性分析;而t檢驗的常見誤用類型有誤用兩兩t檢驗替代方差分析和q檢驗、誤用t檢驗替代配對t檢驗,作者認為誤用χ2檢驗主要是未結合實際情況和統計分析的目的來正確選用統計學方法;誤用t檢驗主要是未充分理解研究資料是否滿足參數檢驗的條件,以及不能正確判斷計量資料所對應的實驗設計類型。因此,作為科研工作者,應加強學習和掌握最基本統計學分析方法的概念和經典統計學方法的使用要求。另外,有學者對比中文、外文醫學期刊論文各388篇在統計學方法使用上的差異,在10種統計學應用錯誤中,缺檢驗統計量、缺P值或P值不、配對t檢驗未給出差值的均數和標準差及生存分析未報告中位生存期,這4種錯誤中文論文的出錯率顯著高于外文文獻。
三、統計學方法的選擇
由于統計學對醫學科技論文的重要性,而其錯用率又比較高,那么該如何正確選擇統計學方法?梁明佩等通過自制的統計學審核線路圖對醫學文稿進行快速審核,首先把握資料的屬性,其次理順文稿的統計邏輯,根據統計學公式進行核算,這樣就可以較好地掌握三種資料(計量資料、計數資料、等級資料)的統計學問題。王曉瑜等認為在統計學方法的選擇上,應針對不同性質的資料,注意參數檢驗方法的使用范圍,選用合適的統計分析方法。對于定性資料分析,不能將χ2檢驗視為萬能工具,而對于定量資料分析也不能將t檢驗視為萬能工具。另外,各種檢驗方法均有特定的應用條件,應根據設計類型以及變量類型選擇相應的統計分析方法,否則將影響論文的學術價值和實用價值。而要選擇正確的統計學方法,必須要有一定的統計學理論知識,掌握一定的技巧,有些人雖然接受過系統的醫學統計學的學習,但由于傳統教學模式的缺陷,不能靈活應用、舉一反三,遇到相同問題會處理,稍有變化則束手無策。筆者在參閱相關文獻后發現,按照許小幸等的四步驟選擇統計學方法比較實用,即明確論文的統計學分析目標(統計描述或統計推斷)判斷指標性質(定量資料、定性資料或等級資料)判斷指標分布類型(正態分布或偏態分布)判斷研究設計類型(是兩組還是多組,配對還是成組),其所設計的統計學分析常用方法選擇樹形結構圖也讓人一目了然,無論是作者撰稿還是編輯審稿,都可以參照這四個步驟來選擇統計學方法。總之,以上資料說明醫學論文統計學應用總的趨勢是:統計學方法的使用率越來越高,使用的種類越來越多、越來越復雜,但誤用率也較高。對于作者而言,有必要更加重視統計學的掌握,正確應用統計學方法。而對于編輯而言,應為作者當好把關人,嚴格對待每一篇論文的統計學,保障論文的科學性、嚴謹性。
作者:潘明志唐毓金梁明佩凌瓊工作單位:廣西壯族自治區衛生廳自籌經費科研課題
醫學統計論文:醫學統計學課堂教學論文
一、概率分布
概率分布(probabilitydistribution)是醫學統計學中多種統計分析方法的理論基礎。授課內容一般包括:二項分布、Possion分布、正態分布、t分布、F分布等。
借助概率分布常常可以幫助我們了解生命指標的特征、醫學現象的發生規律等等。例如,臨床檢驗中計量實驗室指標的參考值范圍就是依據正態分布和t分布的原理計算得到;許多醫學試驗的“陽性”結果服從二項分布,因此它被廣泛用于化學毒性的生物鑒定、樣本中某疾病陽性率的區間估計等;而一定人群中諸如遺傳缺陷、癌癥等發病率很低的非傳染性疾病患病數或死亡數的分布,單位面積(或容積)內細菌數的分布等都服從Poisson分布,我們就可以借助Poisson分布的原理定量地對上述現象進行研究。
在生物信息學中概率分布也有一定應用。例如,Poisson分布可以用于基因(蛋白質)序列的相似性分析。被研究者廣泛使用的分析工具BLAST(BasicLocalAlignmentSearchTool)能迅速將研究者提交的蛋白質(或DNA)數據與公開數據庫進行相似性序列比對。對于序列a和b,BLAST發現的高得分匹配區稱為HSPs。而HSP得分超過閾值t的概率P(H(a,b)>t)可以依據Poisson分布的性質計算得到。
二、假設檢驗
假設檢驗(hypothesis)是醫學統計學中統計推斷部分的重要內容。假設檢驗根據反證法和小概率原理,首先依據資料性質和所需解決的問題,建立檢驗假設;在假設該檢驗假設成立的前提下,采用適當的檢驗方法,根據樣本算得相應的檢驗統計量;,依據概率分布的特點和算得的檢驗統計量的大小來判斷是否支持所建立的檢驗假設,進而推斷總體上該假設是否成立。其基本方法包括:u檢驗、t檢驗、方差分析(ANOVA)和非參數檢驗方法。
假設檢驗為醫學研究提供了一種很好的由樣本推斷總體的方法。例如,隨機抽取某市一定年齡段中100名兒童,將其平均身高(樣本均數)與該年齡段兒童應有的標準平均身高(總體均數)做u檢驗,其檢驗結果可以幫助我們推斷出該市該年齡段兒童身高是否與標準身高一致,為了解該市該年齡段兒童的生長發育水平提供參考。又如,醫學中常常可以采用t檢驗、秩和檢驗比較兩種藥物的療效有無差別;用?2檢驗比較不同治療方法的有效率是否相同等等。
這些假設檢驗的方法在生物實驗資料的分析前期應用較多,但由于研究目的和資料性質不同,一般會對某些方法進行適當調整和結合。
例如,基于基因芯片實驗數據尋找差異表達基因的問題。基因芯片(genechip)是近年來實驗分子生物學的技術突破之一,它允許研究者在一次實驗中獲得成千上萬條基因在設定實驗條件下的表達數據。為了從這海量的數據中尋找有意義的信息,在對基因表達數據進行分析的過程中,找到那些在若干實驗組中表達水平有明顯差異的基因是比較基礎和前期的方法。這些基因常常被稱為“差異表達基因”,或者“顯著性基因”。如果將不同實驗條件下某條基因表達水平的重復測量數據看作一個樣本,尋找差異表達基因的問題其實就可以采用假設檢驗方法加以解決。
如果表達數據服從正態分布,可以采用t-檢驗(或者方差分析)比較兩樣本(或多樣本)平均表達水平的差異。
但是,由于表達數據很難滿足正態性假定,目前常用的方法基于非參數檢驗的思想,并對其進行了改進。該方法分為兩步:首先,選擇一個統計量對基因排秩,用秩代替表達值本身;其次,為排秩統計量選擇一個判別值,在其之上的值判定為差異顯著。常用的排秩統計量有:任一特定基因在重復序列中表達水平M值的均值;考慮到基因在不同序列上變異程度的統計量,其中,s是M的標準差;以及用經驗Bayes方法修正后的t-統計量:,修正值a由M的方差s2的均數和標準差估計得到。三、一些高級統計方法在基因研究中的應用
(一)聚類分析
聚類分析(clusteringanalysis)是按照“物以類聚”的原則,根據聚類對象的某些性質與特征,運用統計分析的方法,將聚類對象比較相似或相近的歸并為同一類。使得各類內的差異相對較小,類與類間的差異相對較大1。聚類分析作為一種探索性的統計分析方法,其基本內容包括:相似性度量方法、系統聚類法(HierarchicalClustering)、K-means聚類法、SOM方法等。
聚類分析可以幫助我們解決醫學中諸如:人的體型分類,某種疾病從發生、發展到治愈不同階段的劃分,青少年生長發育分期的確定等問題。
近年來隨著基因表達譜數據的不斷積累,聚類分析已成為發掘基因信息的有效工具。在基因表達研究中,一項主要的任務是從基因表達數據中識別出基因的共同表達模式,由此將基因分成不同的種類,以便更為深入地了解其生物功能及關聯性。這種探索未知的數據特征的方法就是聚類分析,生物信息學中又稱為無監督的分析(UnsupervisedAnalysis)。常用方法是利用基因表達數據對基因(樣本)進行聚類,將具有相同表達模式的基因(樣本)聚為一類,根據聚類結果通過已知基因(樣本)的功能去認識那些未知功能的基因。對于基因表達數據而言,系統聚類法易于使用、應用廣泛,其結果——系統樹圖能提供一個可視化的數據結構,直觀具體,便于理解。而在幾種相似性的計算方法中,平均聯接法(AverageLinkageClustering)一般能給出較為合理的聚類結果2。
(二)判別分析
判別分析(discriminantanalysis)是根據觀測到的某些指標的數據對所研究的對象建立判別函數,并進行分類的一種多元統計分析方法。它與聚類分析都是研究分類問題,所不同的是判別分析是在已知分類的前提下,判定觀察對象的歸屬3。其基本方法包括:Fisher線性判別(FLD)、最鄰近分類法(k-NearestNeighborClassifiers)、分類樹算法(ClassificationTreeAlgorithm),人工神經網絡(ANNs)和支持向量機(SVMs)。
判別分析常用于臨床輔助鑒別診斷,計量診斷學就是以判別分析為主要基礎迅速發展起來的一門科學。如臨床醫生根據患者的主訴、體征及檢查結果作出診斷;根據各種癥狀的嚴重程度預測病人的預后或進行某些治療方法的療效評估;以及流行病學中某些疾病的早期預報,環境污染程度的堅定及環保措施、勞保措施的效果評估等。
在生物信息學針對基因的研究工作中,由于借助了的生物實驗,研究者通常能得到基因(樣本)的分類,如,基因的功能類、樣本歸結于疾病(正常)狀態等等。當利用了這些分類信息時,就可以采用判別分析的方法對基因進行分類,生物信息學中又稱為有監督的分析(SupervisedAnalysis)。例如,基因表達數據分析中,對于已經過濾的基因,前三種方法的應用較為簡單。而支持向量機(SVMs)和人工神經網絡(ANNs)是兩種較新,但很有應用前景的方法。
(三)相關分析
相關分析(correlationanalysis)是醫學統計學中研究兩變量間關系的重要方法。它借助相關系數來衡量兩變量之間的關系是否存在、關系的強弱,以及相互影響的方向。其基本內容包括:線性相關系數、秩相關系數、相關系數的檢驗、典型相關分析等。
我們常常可以借助相關分析判斷研究者所感興趣的兩個醫學現象之間是否存在聯系。例如,采用秩相關分析我們發現某種食物中黃曲霉毒素相對含量與肝癌死亡率間存在正相關關系;采用線性相關方法發現中年女性體重與血壓之間具有非常密切的正相關關系等等。
生物信息學中可以利用相關分析建立基因調控網絡。如果將兩個不同的基因在不同實驗條件下的表達看作是兩個變量,相關分析所研究的正是兩者之間的調控關系。如采用線性相關系數進行兩基因關系的分析時,其大小反應了基因調控關系的強弱,符號則反應了兩基因是協同關系(相關系數為正),還是抑制關系(相關系數為負)。
四、意義
生物信息學不僅是醫學統計學的研究前沿,更是醫學研究由宏觀向微觀拓展的重要領域,其研究內容已逐漸為多數醫學院校的學員了解和熟悉。而如何對新技術產生的生物實驗數據進行合理的分析,卻成為生物信息學研究的主要瓶頸之一。
在醫學統計學課堂教學中引入生物信息學實例,而不僅僅局限于常見的醫學、衛生領域的例子,將難以理解的統計理論和方法與前沿的生物實例相結合,拓寬了學員的視野,提高了學員的學習興趣,更可以加深對所學知識的理解;與此同時,使學員掌握了生物實驗數據的先進分析方法,擴大了學員的知識面,提高了他們今后開展醫學科研工作的能力。
還有一些醫學統計學方法目前也逐漸應用于生物信息學研究中,諸如:遺傳算法、熵理論等等。但這些方法已經超出了醫學統計學課堂教學的范圍,我們將嘗試在第二課堂或選修課中,作為補充知識進行講授,供那些學有余力的學員學習交流摘要:生物信息學的蓬勃發展已使醫學研究由宏觀逐步探索到微觀。醫學統計學作為一門醫學院校的基礎課程,其理論和方法在醫學研究的新要求下其理論和方法也有了新的發展與應用。將生物信息學知識帶入醫學統計學課堂教學,介紹醫學統計學的新發展,不但能使學員了解到本學科的前沿研究內容,有效地激發學員的學習興趣,還能使他們掌握生物信息學研究的工具,提高今后從事醫學科研工作的能力。
關鍵詞:生物信息學醫學統計學課堂教學
醫學統計論文:醫學論文中統計學問題分析論文
一、臨床療效觀察的實驗設計問題
在各種醫學期刊中,半數以上是療效觀察方面的論著。現擇其較普遍存在的統計學問題,結合實驗設計基本原則加以討論。
(一)對照與均衡性測定
國內醫學期刊有關臨床療效觀察的文章甚多,不少雜志刊登了一些事先未設計對照的文章,其結論難以令人信服。如《用柴葛解肌湯治療上呼吸感染》一文,報道治愈好轉率為97.7%,因無對照,無法斷定其效果如何,因此,治愈好轉率中含有假像。
對照的方法雖有多種,但對照的基本原則是與實驗組齊同可比,好作均衡性測定。
(二)安慰劑與盲法試驗
安慰劑與盲法試驗是醫研(主要是比較性研究)中常用的科研方法,結果、誤差性小。安慰劑在形、量、色、味等要與實驗藥物一樣,不能給受試者和執行者任何暗示。這種試驗就是雙盲法試驗。但近年來,尚有人用改良的雙盲法,此法分兩期:及時期(公開期)試驗有效者留,無效者棄。有效者進入第二期(雙盲試驗),以確定療效是否系安慰劑的作用。在預防效果觀察時可采用該法,臨床上應用諸多困難,應視具體情況而定。
(三)樣本含量與重復原則
沒有足夠樣本的研究結果,是經不起重復試驗的,有的論文憑少數病例觀實的結果下結論,是不慎重的。如《重癥肺炎并發DIC29例》一文,作者觀察腦型患者3例,其中死亡一例,就得出“一般腦型病死率高達57%,本組腦型病死率較低,看來及早用肝素阻斷DIC過程,對降低腦型病死率可能具有重要意義”的結論。因無對照,結論不。
(四)隨機分組與實驗設計類型
隨機化分組即每個實驗對象有同等機會被抽樣(分配)到各組去,而不受任何系統因素的影響。常用的實驗設計類型有隨機設計、自身對照設計、交義設計、配偶設計、隨機區組設計、拉丁方設計、正文(析因)設計、序貫設計、半數效量實驗設計(動物試驗),回顧性與前贍性調查研究設計等。科研設計時應根據研究目的要求選擇不同類型的實驗設計方法,進行相應的統計處理。
(五)診斷與療效標準——指標設計問題
觀察對象應確診無疑,事先要制訂好診斷標準,保障樣本的真實性與代表性。療效判斷要有科學的指標,有特異性和定量指標更好。研究記錄表格扣記錄要完整統一,儀器、試有等要核校,人員要相對穩定,操作及觀察方法要嚴格執行統一標準。
醫學統計論文:醫學統計學教學管理論文
教育是科技進步和經濟振興的基礎,在全國上下貫徹落實《中國教育發展改革和發展綱要》《中共中央國務院關于深化教育改革推進素質教育的決定》和全國教育工作會議精神的今天,高等教育為適應這一新形式,推進素質教育,培養大批高質量、高素質的各類專門人才已進行著多方面的改革。sO100
眾所周知,醫學是理論性、實踐性很強的學科。醫學統計學更是一門既有復雜理論知識,又有豐富應用技巧的醫學專業基礎課程。它是科研設計、資料的搜集、整理和分析的靈魂,應用于居民健康狀況評價、醫療衛生實踐和醫學科研,涉及基礎醫學、臨床醫學、預防醫學等多學科領域。其教學內容貫穿于研究設計到論文撰寫的全過程。如何適應新形勢,迅速推廣醫學統計學的基礎知識,在滿足醫學科研需要的同時實現醫學統計學的自身發展,是醫學統計教育面臨的重要課題。我國醫學統計教育面臨的主要問題是:①教學對象的數學基礎普遍較差,教學手段落后。②醫學研究進一步向宏觀和微觀發展,信息數據更加復雜化、多元化和大數量化。我們利用多媒體計算機輔助教學CAI系統具備較好的獨立性、可參與性與知識的、系統性,以及多媒體組合的高效性等諸多優點,解決了上述問題。利用多媒體技術,我們可以讓學生做到“所學即所見、所聞即所學”,適當拓寬內容的深度和廣度,提高靈活性,大大增強學生的參與感和實踐能力,以創造傳統教學手段所達不到的效果。同時,還可利用計算機對學生的學習進行評估并決定進度,實現因材施教。
進入21世紀以后,信息技術飛速發展,現代統計工具從計算器發展到計算機為主,能應用相關的統計軟件處理醫學科研數據已成為必備的能力。否則,一方面有人不懂得選用正確的統計方法,使大量的信息和統計數據得不到有效的利用;另一方面又盲目使用計算機和統計軟件,不管是什么研究類型的數據都簡單地交給計算機處理,用計算機取代統計,勢必造成大量統計方法的濫用和誤用。醫學研究的許多數據關系到病人的治療、轉歸,甚至生死,統計方法的誤用會導致嚴重的論理問題。我們利用計算機、統計軟件、多媒體教學課件相結合,使課堂教學擺脫大量的繁瑣演算的束縛,在單位時間內講授的信息量將會大幅度增加。統計學教學不再是數據的羅列和公式的堆砌,而是研究設計的藝術和數據表達的藝術,并使學生體會到統計思維和推理的樂趣。
近年來我們進行了一些改革措施,取得了相應的成果,現總結如下:
一、積極申報院級教學研究立項的課題:
(1)醫學統計學多媒體CAI教學系統的研究和應用(2001年)
(2)醫學研究生統計學課程教學模式的改革(2002年)
(3)《心理統計學》多媒體課件的制作及題庫的構建(2004年)
另外開了《醫學科研數據管理與統計分析》選修課
二、進行了一系列的教學改革措施:
(1)教學內容上所進行的改革,具體做到了“四增三減”:減少了目前已無必要講授的詳細手工計算步驟與技巧;減少了復雜的公式推導,改為公式內涵的剖析;減少了部分淺顯內容,改為自學或課堂討論;增加了“實驗設計和調查設計”;增加了“醫學統計學軟件使用”;增加了“多元統計分析”;增加了“醫學統計應用錯誤的診斷”。
(2)在教學手段上進行了以下幾方面的改革:建立了醫學統計學多媒體CAI教學系統;開設了統計學電腦實驗課;開設了“醫學統計應用錯誤的診斷”討論課。
(3)在考試內容和形式上的改革:著重考核醫學統計學綜合分析能力以及正確應用統計方法和糾正錯誤能力。不考死記硬背、公式和定理。
三、發表相關論文:
(1)醫學科研論文中t檢驗誤用分析皖南醫學院學報2002,21(2)
(2)醫學科研論文中x2檢驗誤用分析皖南醫學院學報(論文待發表)
(3)皖南地區中學生傷害危險因素的病例對照研究,中華流行病學雜志,2003,24(7)
(4)膽石病病因的臨床流行病學研究現代預防醫學2001,28(4)
四、編寫的教材:
(1)《醫學科研方法與臨床流行病學》(2003.8,安徽大學出版社)
(2)《預防醫學》(第2版)(2003.8,人民軍醫出版社)
(3)《心理統計學》(2004.8,安徽大學出版社與北京科學技術出版社)
(4)《心理評估學》(2004.5,安徽大學出版社與北京科學技術出版社)
(5)《衛生統計學實習指導》(2003.10,安徽大學出版社)
(6)《流行病學實習指導》(2002.8,中國科學技術大學出版社)
五、成果創新點:
(1)將統計學軟件、多媒體教學模式首次引入我院醫學統計學教學之中;
(2)將統計思維和科研創造性實踐相結合,注重學生科研能力的培養;
(3)改革了醫學統計學的教學內容、教學手段、考試方法;
(4)首次在我院學生中開設“醫學科研統計應用錯誤的診斷”討論形式的教學模式
(5)特別注重教師主導作用與學生能動性統一
(6)編寫“醫學統計學”相關教材
六、成果應用情況:
(1)已經將改革的內容應用于我院專科生、本科生和碩士生的“醫學統計學”;
(2)在本科生和碩士生的教學手段上采用“多媒體CAI教學”模式;
(3)在考試內容已作了相應的改革;
(4)已經將“醫學科研統計應用錯誤的診斷”應用于皖南醫學院學報的論文審閱之中。
以上是對近年來“醫學統計教學模式改革”的總結,我們突出了“醫學統計學教學課件、醫學統計學軟件和醫學統計應用錯誤的診斷”三方面的教學改革,敬請各位專家評審,不足之處,請多提寶貴意見,非常希望我們的教學成果能得到各位專家的肯定。
醫學統計論文:編輯審稿在醫學論文統計方法學中發揮重要作用
摘 要:醫學統計在醫學論文中占有重要的作用,貫穿論文的始終,決定論文的質量和水平。編輯在審閱醫學論文時,對論文的統計資料、統計方法、統計軟件、檢驗水準、統計符號及表達等方面的熟悉熟悉程度對最終論文質量具有較大的影響。本文從編輯角度,淺談作為編輯應該注意的統計學知識,以供參考。
醫學統計學是運用概率論和數理統計的原理、方法,結合醫學實際,研究數字資料的搜集、整理、分析和推斷的一門學科。醫學統計在醫學雜志中占有重要的作用,而考查稿件質量則主要從專業水平和統計學分析兩個方面進行評價。具有創新性、實用性和先進性是高質量論文的前提,而經統計學分析得出經得起時間考驗的結論才是保障。
醫學論文一般是三段式:及時部分為資料與方法,第二部分為結果,第三部分則是討論。一篇論文涉及到統計方法學方面的可有以下幾個部分:一、科研設計階段:除專業設計外,還需要統計學設計(即實驗設計)。二、數據的搜集、整理階段,此部分需要作者具有較強的統計學思維。三、數據的分析、推斷階段:需要根據統計資料選用統計學方法,根據統計結果挖掘有用信息。另外,在查閱參考文獻,閱讀國內外近期研究動態時,文章中也會涉及大量數據資料和統計學方法。因此,筆者將編輯對三段式論文審稿時需要注意的統計方法學知識總結如下。
一、資料與方法
1.1統計方法 統計方法一般是論文中最容易出錯的地方,統計學方法選擇正確與否直接影響論文結論的可信度。因此,研究者在編寫論文時應根據統計資料類型和研究目的選擇合適的統計方法。資料類型一般分為定性資料(計數或品質資料)、定量資料(計量資料)和等級資料(有序或半計量資料)。定性資料的統計方法一般用x2檢驗,定量資料用t檢驗,F檢驗和非參數檢驗,等級資料則用非參數檢驗和其它方法。根據分析的需要,統計資料類型是可以相互轉化的,如:血紅蛋白量原屬計量資料,可轉化為計數資料或等級資料。值得注意的是,很多研究者在選擇統計方法時,只注重統計資料類型,卻忽略了研究目的,因而導致分析結果無法解釋研究目的。因此,編輯在審稿時除了要注意統計方法是否,還應該注意得出的結論與研究目的是否相符。
1.2統計軟件 統計分析軟件類型及版本應清楚介紹,常用的統計軟件有SAS、SPSS和S-plus等。編輯在審稿中須注意不同版本的統計軟件擁有不同的功能,編輯須清楚知道研究者論文中所用的軟件版本是否能提供該統計方法。
1.3 統計數據的表達方式 數據的表達方式應根據數據的類型及是否符合正態分布的特點。計量資料是連續性分布的數據,此數據分布應通過集中趨勢和離散程度相結合來進行描述。描述數據集中趨勢的統計學指標有均數、中位數和眾數;描述數據離散程度的統計學指標有標準差、極差和四分位數間距。對于正態分布的資料適宜采用“x ± s”來表示,對于非正態分布的資料宜用中位數和四分位數間距來描述數據。分類資料是對受試者或觀察對象的每個類別的計數,通常用百分數或其他比值表示,常用的指標有率和構成比等。值得注意的是,研究者在描述數據時,通常只注重數據類型,而忽略數據是否符合正態分布,導致所有的計量資料都用x ± s來表示。為更地反映此數據年齡分布的集中位置,宜采用中位數而不是平均數。如:8例疾病患兒年齡(歲)為1、1.5、1.5、4、3、5、5、11,此組數據的平均數為4,中位數為2.75。
1.4 檢驗水準 絕大部分醫學論文都沒有標出檢驗水準,只在結果部分標出P0.05。檢驗水準一般設定為a=0.01或a=0.05。
二、結果
論文結果部分,一般用三線表格形式表示統計結果,并用文字對表格進行描述,或只用文字的形式對統計結果進行描述。結果描述不應面面俱到,而是根據研究目的側重描述。不論論文中選用的是何種統計學方法,建議都給出具體的P值,再根據檢驗水準來確定結論有無差異,結論一般描述為“差異有無統計學意義”。研究者習慣將“P0.05”描述為“差異無統計學意義”,表明在目前的實驗設計情況下,由于抽樣誤差的原因,如果在增加樣本數量,差異可能變成“有統計學意義”。結果解釋和表達方面,應清楚說明所用統計學方法的具體名稱(如:配對資料的t檢驗,兩因素析因設計資料的方差分析等)、統計量的具體值(如:t=3.04,x2=4.68)。
三、討論
討論也是論文的重要組成部分,討論部分寫作的好壞往往決定一篇文章的深度,也是其學術水平的標志。編輯在審閱討論部分時,應注意以研究結果為依據,根據統計推斷結果下結論,說明研究的價值和局限性。如果有把握,研究者可以提出新的假設和進一步研究的建議。值得注意的是,研究者根據統計結果得出專業的結論應遵循一個重要原則,即統計結論都是概率性的,因此不能地肯定或否定。
四、書寫格式及規范
作為醫學雜志編輯,審稿時,除了注意統計內容的性,還應該注意統計的書寫格式及規范。統計有統一的書寫格式及規范,統計學符號有英文、希臘文、大小寫、正斜體之分。按GB/T 3358.1―2009/ISO 3534―1:2006《統計學詞匯及符號》規定,常用的醫學統計符號應按下述要求表示:① 樣本的算術平均值表示為英文小寫“x”(中位數用M);② 樣本標準差表示為英文小寫“s”;③ t檢驗表示為英文小寫“t”;④卡方檢驗表示為希文小寫“x2”;⑤ F檢驗表示為英文大寫“F”;⑥ q檢驗表示為英文小寫“q”;⑦概率表示為英文大寫“P”;⑧相關系數表示為英文小寫“r”。以上符號均用斜體。
總之,每一類統計分析方法均有其適用的范圍和應用的條件,編輯審稿時應注意,研究者的論文設計及資料的類型是否選擇恰當的統計分析方法,是否存在盲目套用的情況。同時,還應注意得出的結果和結論是否滿足方法設計的要求。
醫學統計論文:體育類核心期刊中運動醫學論文的統計學應用錯誤案例分析
摘要:就近年來體育類核心期刊運動醫學科研論文撰寫中常見的統計學應用誤區進行分析,結果發現:①實驗分組不合理,受試對象的選取違背同質性原則;②統計方法不合理,多個樣本均數比較,錯誤應用多個t檢驗代替,誤用單因素方差分析處理多因素方差分析;③誤判資料類型,從而誤用定量資料統計分析方法,兩樣本率的檢驗錯誤用兩樣本的t檢驗來代替。
關鍵詞:統計學;運動醫學論文;體育類核心期刊
統計學是科學研究的基礎,是研究結果科學性、性的有力保障。而論文是研究成果的表達形式,通過論文可展示研究者的科研成果,也便于查閱者的了解、評價和引用。因此,在論文中要完整、地進行統計學內容的表述,以展示研究設計的合理性和研究結果的性。但運動醫學論文中存在的統計學錯誤仍相當嚴重,其中實驗設計和統計資料的應用上最為突出。本文介紹論文中出現錯誤的部分,并對其進行了正確的統計學內容表述,以便供廣大運動醫學科研工作者參考。
1實驗設計方面的問題
1)實驗分組不合理。
例1:《有氧健身操結合飲食控制改善代謝綜合征患者胰島素抵抗、血脂、血糖的實驗研究》[1]一文中研究對象為:西安市碑林區某社區代謝綜合征患者77人年齡40~65(55.35±7.26)歲。按照接診順序將入選MS患者隨機分為以下2組,綜合干預組和對照組。
該文作者所選取代謝綜合征患者年齡跨度較大(40~65歲),因為年齡的不同機能的代謝水平有很大的差異性,不能認為他們來自于同一個總體。把他們隨機分入綜合干預組和對照組參加試驗,兩組之間的可比性可能很差,其結論的可信度很低;如果,按年齡段分層隨機化,組間的均衡性要高得多。
2)受試對象的選取違背同質性原則。
例2:《不同類型休閑活動對老年女性身體機能影響的差異性研究》[2]一文中對成都市老年大學、錦江區老年活動中心,隨機選取離退休5年以上,年齡65~75歲之間老年女性為研究對象。并依據她們的年齡段將活動類型分為:為棋牌隊、曲藝隊、門球隊、舞蹈隊;測量指標為:血壓及脈率,肺活量,椎體骨密度。
從一般的常識可知,經常參加體育鍛煉的人有利于其血壓及脈率,肺活量、椎體骨密度指標向好的方向發展。原作者所選取的活動類型為:棋牌、曲藝隊、門球隊、舞蹈。其中棋牌是一種智力游戲和身體運動沒有什么關系,而曲藝,門球,舞蹈主要以身體運動為主(曲藝有利于人體的肺活量的提高)。所以原作者在試驗設計時違背同質性原則[3]。
在實驗設計時一定要遵守3大原則:對照、隨機、重復。對照原則:要確定處理因素對實驗指標的影響,如無對照是不能說明問題的。實驗分組時有處理組和對照組。對照原則要求處理組和對照組除處理因素以外的其他可能影響實驗的因素應力求一致(即齊同比較或有可比性)。隨機原則:是使每個實驗對象在接受分組處理時具有相等的機會,以減少偏性,使各種因素對各組的影響保持一致(均衡性好),通過隨機化可減少分組人為誤差。這是對資料分析時進行統計推斷的前提。重復原則:是指的實驗應能在相同條件下重復出來(重現性),這就要求實驗要有一定的例數(重復數)。因此,重復的含義是重現性與重復數。重現性可用統計學中顯著性檢驗的值來衡量其是否滿意[4]。
2定量資料統計分析存在的統計學錯誤
2.1多個樣本均數比較錯誤應用多個t檢驗
例3:《有氧運動對大鼠血糖、血脂和血液凝固功能的影響》[5]一文中,將30只大鼠隨機分為3組:對照組、小運動訓練組和大運動訓練組。對照組大鼠進行自由飲食和自由飲水;運動訓練組動物在此基礎上給予為期6周的游泳訓練。有氧運動(游泳)、運動后2周和運動后4周從眼眶后靜脈叢取血,以及實驗結束時(運動后6周)斷頭取血,分別做血糖、血脂和有關凝血指標的測定。用SPSS統計軟件對原始數據進行常規數理統計分析,計量資料用均數±標準差描述,顯著性檢驗用t檢驗,P
這類錯誤是定量資料分析中最常見的錯誤,而且是原則性錯誤,會增加犯及時類錯誤的概率[6]。案例(原)表1資料為對照組、小運動組、大運動組不同有氧運動時間對大鼠血清LDL水平的影響,原作者用t檢驗分別對各組均數逐一進行比較。對照組大鼠在實驗期間血清LDL水平沒有明顯變化P>0.05。與對照組相比,小運動組大鼠隨著有氧運動時間的延長,血清LDL濃度逐漸降低,至第6周時,差異具有統計學意義P0.05,但與同期(第4周和第6周)小運動組大鼠血清LDL相比,差異具有統計學意義P
在應用t檢驗和方差分析時要注意它們之間的共性與區別。t檢驗和方差分析都是對總體(樣本)均數的檢驗。當對兩個以上的總體(樣本)均數是否存在顯著性差異進行檢驗時,如果用t檢驗,4個總體(樣本)均數則需做c24=6次可能組合的檢驗。若在α=0.05的顯著性水平上檢驗,則將降低統計結論效度。所以,兩總體(樣本)均數的檢驗用t檢驗,兩個以上總體(樣本)均數的檢驗用方差分析。
2.2處理多因素設計定量資料誤用單因素設計定量資料的方差分析方法
例4:《不同營養干預對運動性貧血大鼠紅細胞及鐵代謝指標的影響》[7]一文中,實驗目的為:觀察補充復方阿膠中藥與補充鐵劑營養對運動性貧血大鼠紅細胞及鐵代謝指標的影響。方法:以32只健康雄性Wistar大鼠為研究對象,每只體重約300 g,隨機分為4組,C組為安靜對照組(n=8),E組為遞增負荷跑臺運動組(n=8),ENⅠ組為遞增負荷跑臺運動+阿膠營養補充組(n=8),ENⅡ組為遞增負荷跑臺運動+鐵劑營養補充組(n=8)。然后ENⅠ組和ENⅡ組營養補充4周。實驗結束后24h內處死。結論:9周遞增負荷跑臺運動導致大鼠紅細胞相關指標的顯著性下降,引起運動性貧血,但血液鐵代謝無顯著變化;補充4周復方阿膠中藥制劑或鐵制劑,提高紅細胞相關指標,改善大鼠運動性貧血狀況。數據統計方法實驗數據用SPSS13.0軟件中one-wayANOVA處理,結果用均數±標準差表示,顯著性水平為P
原文采用單因素設計定量資料的方差分析不合適,仔細考察各處理組之間的關系有:是否遞增負荷跑臺運動,是否補阿膠營養或補鐵劑營養(兩者都能促進RBC生成,增加Hb含量的物質,在本研究中可以認為它們是同一因素),原文在固定一個因素于某個水平下觀測另一個因素的作用,這種做法割裂了實驗設計的整體性。正確的做法是,先從專業角度上分析二個實驗因素之間是否存在交互作用、是否存在二個因素有主次之分、是否存在交互作用或交互作用可以忽略不計等情況。也就說對事物的影響只考慮施加了一個條件(因素)為單因素方差分析;如果施加了2個以上的條件(因素)為多因素方差分析。如果是多因素方差分析還要考慮施加的條件(因素)之間有沒有聯系、有沒有主次之分。具體看(原)表2資料,施加了兩個條例(因素)即遞增負荷跑臺運動和補阿膠營養或補鐵劑營養,然后考慮兩條件(因素)之間的聯系,通過分析2個因素間存在交互作用的可能性比較大,應采用交互作用多因素方差分析處理此定量資料為宜。
2.3統計方法不合理,每一種統計方法都有其適用條件
例5:《高脂飲食對大鼠脂肪組織脂解調節因素的影響》[8],原文中采用單因素方差分析的LSD方法對(原)表3各組FFA濃度進行分析,得出結論具有統計學意義。
多個總體均數比較的方差分析,要求方差齊性。方差齊性實際上是指要比較的各組數據分布是否一致,通俗的說就是各組是否適合比較,一般的經驗是如果在比較的各組中,如有一組的標準差是另一組的一倍時方差不齊性的概率較大。在做方差分析時,做方差齊性檢驗主要是確認數據的合理性(不具相關性)。對(原)表3數據進行方差齊性檢驗,可發現C組與OR組及OB組FFA濃度指標不能滿足方差齊性的要求,故不能采用單因素方差分析的LSD方法。可以先進行對數、倒數或函數的轉換,選擇適當的轉換形式,直到齊性檢驗變為不顯著(不相關)。如果還不行就只能用非參數的單因素分析。
3定性資料統計分析方面存在的統計學錯誤
3.1誤判資料類型,而誤用定量資料統計分析方法
例6:題目:《傳統體育對老年知識分子原發性高血壓患者臨床癥狀影響的觀察研究》[9]原作者對原發性高血壓,癥狀療效評定標準是:頭痛、眩暈、心悸、耳鳴、失眠、煩躁。各癥狀按癥狀輕重不同采用“半定量”計分法,按程度進行分級和計分,共分為4級:(“無”0分、“輕”1分、“中”2分、“重”3分),EH(原發性高血壓)患者經6個月的傳統體育鍛煉實驗,癥狀計分情況。治療前后組內比較,除A組心悸、耳鳴、失眠癥狀外,3組均能改善老年知識分子EH(原發性高血壓)患者臨床癥狀(P
統計資料常常分為定量資料和定性資料兩大類,所謂定量資料是指對每個觀察單位用計量方法測量某項指標所獲得的數值;如身高(cm)、血壓(mmHg)、脈搏(次/min)、紅細胞(104/mm-3)轉氨酶(酶活性)等,都屬于計量資料。而定性資料是指記錄每個觀察單位的某一方面的特征和性質[10]:如血型(A、B、O、AB)、職業(工人、農民、軍人、學生)、性別(男、女),等等。本資料觀察的是原發性高血壓癥狀療效,這里的0、1、2、3、4代表的是原發性高血壓患者癥狀的輕重程度,屬于定性資料中有序資料,(如:無、輕、中、重;治愈、顯效、好轉、無效、死亡),但原作者卻錯誤地將其判斷為定量資料,表的標題后括號內寫 ±s的形式,表中給出也是平均數和標準差的數據。一般來說,t檢驗僅適于分析來自“單組設計、配對設計和成組設計”的定量資料,用分析定量資料的方法分析定性資料,顯然是錯誤的。正確判定統計資料的類型是選用統計分析方法的首要前提[11]。本資料屬定性資料,應根據分析目的,合理選用適合此類資料統計分析方法(如Riditi分析或者非參數檢驗秩和檢驗)。
3.2兩樣本率的檢驗誤用兩樣本的t檢驗來代替
例7:《健身跑運動對中年人血脂異常者血脂、身體成分的影響》[12]一文中將所有受試者隨機分成低強度組(L組)、中等強度組(M組)和對照組(C組)。數據統計數據用平均值±標準差形式表示。相關指標數據用t檢驗和多因素方差分析進行分析,P
運動醫學研究離不開統計設計和統計學方法,如果選擇錯誤導致結果有偏倚或結果原則性的錯誤,對運動醫學的危害性較大。正確的統計分析是獲得正確的科研結論的要素之一。只有明確資料的性質、試驗設計類型、分析目的,掌握相關統計方法應用的前提條件,才能進行正確的統計分析。
醫學統計論文:醫學論文統計學方法應用的錯誤解析
摘 要:統計學方法應用正確與否直接關系到醫學科研結果的可信度和有效性,在研究設計時的錯誤應用會否決整個科研研究方案,基于錯誤統計學方法上產生的結果會浪費科研人員的時間和精力。編審人員應該高度重視醫學論文的統計學方法應用,提高單篇文獻的質量和學術水平。
關鍵詞:統計學方法;醫學論文;解析
一、引 言
醫學由于其研究的復雜性和系統性,常需要應用嚴謹的統計學方法,由于有些作者對醫學科研的統計學理論和方法的應用缺乏深刻了解,在醫學論文中錯誤應用統計學方法的現象時有發生。統計學方法應用的錯誤直接導致統計結果的錯誤。例如統計學圖表、統計學指標、統計學的顯著性檢驗等。因此,正確應用統計學方法,并將所獲得的結果進行正確的描述有助于單篇論著的質量提高,現將醫學論文中統計學方法應用及其常見結果的錯誤解析如下。
二、醫學論文統計學方法應用概況
醫學論文的摘要是全文的高度濃縮[1],主要由目的、方法、結果、結論組成。一般要求要寫明主要的統計學方法、統計學研究結果和P值。一篇醫學論文的質量往往通過摘要的統計學結果部分就能判斷。統計學方法的選擇和結果的表達直接影響單篇論著的科研水平。
(一)材料與方法部分
正文中,材料與方法部分必須對統計學方法的選擇、應用、統計學顯著性的設定進行明確說明。通過對統計學方法的描述,讀者應該清楚論著的統計學設計思路。材料部分要清楚說明樣本或病例的來源、入組和排除標準、樣本量大小、研究組和對照組的設定條件、回顧性或者前瞻性研究、調查或者實驗性研究、其他與研究有關的一般資料情況,其目的是表明統計學方法應用的合理性和性,他人作相關研究時具備可重復性。方法部分應詳細敘述研究組和對照組的不同處理過程、觀察的具體指標、采用的測量技術,要具備可比較性和科學性,
方法部分還要專門介紹統計分析方法及其采用的統計軟件。不同的數據處理要采用不同的方法,必須清楚的說明計數或者計量資料、兩組或者多組比較、不同處理因素的關聯性研究。常用的有兩組間計量資料的t檢驗,多組間計量資料的F檢驗,計數資料的卡方檢驗,不同因素之間的相關分析和回歸分析。有些遺傳學研究方法還有專門的統計學方法,要在這里簡要說明并給出參考文獻,還要簡單敘述統計方法的原理。統計學軟件要清楚的說明軟件的名稱和版本號,如基于家系資料研究的FBAT1.7.3版本。
(二)論文結果部分
論文結果部分要顯示應用統計學方法得到的統計量[2],所采用的統計學指標較多時,往往分開敘述。分組比較多時還要借助統計圖表來表達統計結果。對于數據的度,除了與測量儀器的精密程度有關外,還與樣本本身的均數有關,所得值的單位一般采用緊鄰均數除以三為原則。均數和標準差的有效位數要和原始數據一致。標準差或標準誤差有時需要增加一個位數,百分比一般保留一個小數。在統計軟件中,分析結果往往度比較高,一般要采用四舍五入的方法使其靠近實驗的實際情況,否則還會降低論文的可信度和可讀性。
結果部分的統計表采用統一的“三線”表,表題中要注明均數、標準差等數據類型。表格中的數值要按照行和列進行順序放置,要求整齊美觀,不能出現錯行現象。要明確標注觀察的例數,得到的檢驗統計量。統計圖可以直觀的表達研究結果,如回歸和相關分析的散點圖可以顯示個體值的散布情況。曲線圖表達個體均值在不同組別隨時間變化的情況或者不同條件下重復測量的結果。誤差條圖由均數加減標準誤繪出,描述的是67%的置信區間,不是95%,提倡在誤差條圖采用95%的置信區間。
關于統計量,一般采用均數與標準差兩個指標,均數不宜單獨使用。使用均數的時候要明確變異指標標準差或者性指標標準誤。關于百分比,分母的確定必須要符合邏輯,過小的樣本會導致分母過小而出現百分比過大的情況。百分率的比較要寫清兩者中不同的變化,可以采用卡方檢驗。
1.假設檢驗的結果中,常見只寫P值的情況,有時候會誤導讀者,也會隱藏計算失誤的情況,因此寫出具體的統計值,如F值、t值,可以增強可信度。對于率、相關系數、均數這類描述統計量,要清楚寫明進行過統計學檢驗并將結果列出。P值一般取0.05與0.01作為檢驗顯著性,對于結果的計算要求具體的P值,如P=0.23或P=0.02。
2.在對論文進行討論時,作為統計學方法產生的結果往往要作為作者的主要觀點支持其科學假設,對統計結果的正確解釋至關重要。P值很大表明兩組間沒有差別屬于大概率事件,P值很小表明兩組間沒有差別的概率很小。當P
變量間虛假的相關關系與變量隨時間變化而變化相關,統計學意義的關聯并不表示變量間一定存在因果關系。因果關系的確定要根據專業知識和采用的研究方法的不同來考量。使用回歸方程進行分析,當兩變量間具有顯著性關系,但是從自變量推測因變量仍然不會很。相關或回歸系數不能預測推測結果的程度,而只是預測一個可信區間。診斷性檢驗應用于人群發病率很低的疾病,靈敏度、特異度的高低對于明確疾病診斷并不能很肯定。“假陽性率”與“假陰性率”根據實際的需要不同要求并不一致,在疾病患病率很低時,出現假陽性也是正常的,要確診疾病必須要與臨床癥狀體征相結合。因此,這兩個率的計算方法必須交待清楚。
三、醫學論文統計學方法應用的常見錯誤分析
(一)“材料與方法”中的統計學方法應用的常見錯誤
“材料與方法”中統計學方法常見的問題主要為:對樣本的選擇或者研究對象的來源和分組描述很少或者過于簡單。例如,臨床入組病例分組只采用簡單的隨機分組,未描述隨機分組的方法,未描述是否雙盲雙模擬,未設置空白對照組,分組后對性別、年齡、文化程度的描述未進行統計學檢驗,對于特殊的統計學方法沒有詳細交代;動物實驗分組的隨機化原則描述過于簡單,沒有具體說清隨機、配對或分層隨機分組等;統計分析方法沒有任何說明采用的分析軟件,有的只說明采用的分析軟件而不交代在軟件中采用的統計方法;沒有說明原因的情況下出現樣本量過于小等情況。
(二)“結果”統計學方法應用的常見錯誤
1.應用正確的統計學方法出現的結果表達并不一定正確。例如前文所述數據的度要求。醫學論文常見錯誤中包括均數、標準差、標準誤等統計學指標與原始數據應保留的小數位數不同;對于率、例數、比值、比值比、相對危險度等統計學指標保留的小數點位數過多;罕見疾病的發病率、患病率、現患率等指標沒有選擇好基數,導致結果沒有整數位;相關系數、回歸系數等指標保留的小數位數過多或者過少;常用的一些檢驗統計量,如F值、t值保留的位數不符合要求。
2.對統計學指標進行分析和計算時,一般采用計數資料和計量資料進行區分。計量資料常用三線表,在近似服從正態分布的前提下采用均數、標準差進行說明,如果不符合正態分布時,可以采用加對數或其他的處理方式使其近似正態分布,否則只能采用中位數和四分位數間距等指標進行描述。醫學論文中常見未對數據進行正態分布檢驗的計算,影響統計結果的真實性和可信度。對于率、構成比等常用的計數資料指標,常見樣本量過小的問題,采用率進行描述會影響統計結果的性,采用數進行說明會顯得客觀一些。還有一些文獻將構成比誤用為率,也是不可取的。
3.在判斷臨床療效之一指標時,兩組平均療效有差別并不意味著兩組的每一個個體都有效或無效,必須通過計算有效率進行計算。如比較某藥物治療糖尿病的療效,服藥一周后,研究組和對照組的對血糖降低值分別為6.7 ±2.4 和1.2 ±0.6 ( P = 0.000 1) 。按空腹血糖值低于7.7mmol/L的療效判定有效率,研究組和對照組的有效率分別為75.6%和12.4% ,盡管平均療效相差較多,但也要注意到該藥物對部分患者無效(24.4%)。對假設檢驗結果的統計學分析結果,P 值的表達提倡報告P值,如P = 0.015或P = 0.321等。目前的統計學分析軟件均可自動計算的P 值。例如常用的SAS,SPSS等,只要提供原始數據,就可以計算出t值、F值和相應的自由度,并可獲得的P值。
四、小 結
提高醫學論文中統計學方法的使用質量是編輯部值得重視的一項長期而又艱巨的工作[3],醫學論文中統計方法應用和統計結果的表達正確與否,不僅體現了論文的科學性和嚴謹性,而且對于提高期刊整體的學術質量,促進醫學科學的發展和傳播也有著重要作用[4]。