?

質量回顧中的數據分析

2013-11-28 08:23王春濤黃小琴重慶科瑞制藥集團有限公司重慶400060
中國藥事 2013年11期
關鍵詞:成品率正態回歸方程

王春濤,黃小琴 (重慶科瑞制藥集團有限公司,重慶 400060)

產品質量回顧是制藥企業對藥品生產質量情況進行的總結分析,以評價工藝穩定性,發現不良趨勢,確定改進的方向。質量回顧要匯集大量的數據,但數據不等同于有用的信息,不對數據進行科學的分析,就不能保證結論的準確。數據分析是探索數據內在規律、將數據轉化為有用信息的過程,是質量回顧的關鍵,數理統計正是研究如何進行數據分析從而作出合理推斷的科學。本文運用數理統計方法并借助統計軟件,對質量回顧中的數據進行分析,探討正確的分析方法。

1 質量回顧中的數據類型

質量回顧要收集與藥品生產質量有關的各種數據,依照數據的來源和屬性分類:①產品質量分析數據:包括中間產品、成品質量檢驗及穩定性考察得到的各種數據,如含量、溶出度、水分等,主要為連續型數據,分析目的是為了發現不良趨勢,評價工藝穩定性。②物料相關數據:對物料的質量檢驗結果,供應商管理及采購中產生的數據等。③技術經濟指標數據:如制劑的成品率、原料藥收率、各工序的物料平衡,這些數據是對生產穩定性的反映,對之進行分析可以制定出更加科學合理的控制限,促進質量改進。④工藝執行類數據:如關鍵工藝參數、驗證數據、環境監測數據等,分析以反映工藝是否穩定可靠,并可推斷工藝參數與產品質量的關系,優化生產工藝。⑤反映藥品生產、流通和使用中非正常情況的數據:如偏差、變更、退貨、投訴、不良反應、市場抽檢信息等。此類數據信息明確,正常生產中較少出現,可不做復雜的統計分析;但若頻繁發生時,應做趨勢分析和因果分析。另有在生產過程中產生的各類缺陷數據,屬離散型數據,也反映了生產過程的穩定性。

2 數據分析方法與流程

2.1 評價工藝穩定性,發現不良趨勢

2.1.1超標數據首先分析

收集數據后,首先檢查是否有超標的情況,對超標現象直接分析原因,采取糾正措施。

2.1.2數據獨立性分析

數理統計是研究隨機現象數量化規律的學科,常用假設檢驗方法,使用這些方法的前提是數據是獨立的,其產生是隨機的,這是所有統計討論的基礎[1]。判斷數據獨立性可以采用游程檢驗,根據游程的總數和長度進行假設檢驗,在給定的顯著性水平判斷數據是否隨機。

通過分析,若發現數據不具獨立性,則不能直接進行統計假設判斷,需要重新審查數據的獲得過程,分析是否受到不正常因素的影響,將此因素的影響去除,重新收集數據。但若從機理上分析數據確有不獨立的成因,可以在收集足夠多數據的基礎上進行時間序列分析。

2.1.3數據正態性檢驗

經確認具有獨立性的連續型數據進行統計假設分析還有一個前提,就是要服從正態分布,對數據需進行正態性檢驗。正態性檢驗有多種方法,如正態概率紙法、D檢驗法、卡方檢驗法等,若數據較多時,這些方法頗為繁瑣?,F在運用統計軟件,可以快速完成分析過程,如使用統計軟件MINITAB,根據輸出結果p值可判斷是否拒絕正態分布的假設。

2.1.4過程穩定性評價

數據通過正態檢驗后,便可運用統計軟件制作質量控制圖,應用判異準則來判斷異常,發現不良趨勢[2]。同時,可計算能力指數判斷過程的穩定性,評價工藝控制水平,并可通過對短期能力指數(CP、CPK)和長期能力指數 (PP、PPK)的比較,分析過程潛在的問題:當CPK、PPK與CP、PP越接近,說明過程的實際中心離規格中心越近,但若數值都很小,說明問題的關鍵是過程的波動太大;若前后數值相差懸殊,說明過程中心偏離規格中心較遠,但若CP、PP值還算滿意,表明雖然過程比較穩定,但還需調整實際中心;若短期能力指數與長期能力指數相差不大,表明受特殊因素的影響小,但若短期能力指數比長期能力指數大很多,說明過程除受隨機誤差波動的影響外,組間差異的影響非常顯著,往往過程可能并未受控。當規格中心與目標值不重合時,則用考慮目標的指數Cpm來衡量。應用過程能力指數可以對工藝加工能力進行客觀量化的反映,但是,在使用能力指數時要慎重,要求過程必須是穩定的且符合正態分布[3],否則易作出錯誤判斷。

2.1.5非正態分布數據的穩定性評價

未通過正態檢驗的數據,不能直接計算能力指數,需先識別數據的分布形式,可使用分布擬合檢驗,根據推斷的經驗分布和假設的理論分布之間的吻合程度來判斷,然后以此分布類型進行穩定性評價,或是將數據轉換后再分析。

2.1.6離散型數據分析

離散型數據無需正態性檢驗,過程能力分析的估算方法有所不同,對于二項分布的過程績效指標主要用百萬機會缺陷數,評價西格碼水平 (Z值);對于Poisson分布有單位缺陷數、缺陷率和西格碼水平等評價指標。

2.1.7非典型數據分析

若數據不服從任何分布且無法轉換,可采用探索性數據分析,但需要較大樣本量。

2.2 合理推斷,工藝優化

對于本文 “1”項中第④類數據,還可用相關回歸分析探尋變量間的關系,比如研究工藝參數與產品質量的關系,進行工藝優化。由于在產品開發時數據往往不多,出于成本考慮,生產批量一般都不大,即使模擬實際生產,批次也不多,所得參數范圍在正式生產中未必是最佳選擇。質量回顧時會積累大量的數據,這時若以質量分析結果為導向分析工藝參數的合適范圍就非常有實用價值,有助于進一步優化工藝,彌補研發時批量小、數據少的不足。用相關與回歸分析質量回顧數據的流程是:①首先檢測變量間有無相關關系,可用散點圖觀察,也可做定量分析,計算變量間的相關系數r,r的絕對值越接近于1,相關性越強。但r值的大小并不是判斷相關性的全部依據,需檢驗確定是否確實相關。②建立線性回歸方程。③對回歸方程進行顯著性檢驗,確定方程是否有意義,可使用方差分析。并對回歸方程總效果進行測量,分析實際觀測值與擬合的回歸線是否貼近,越貼近,擬合得越好,回歸方程總效果越好。若是多元回歸方程,對回歸系數的顯著性也需檢驗,一元回歸方程只有一個自變量,與回歸方程顯著性檢驗相同。再進行殘差分析,殘差是實際觀測值與回歸方程擬合值之間的差異,采用最小二乘法擬合直線以使殘差平方和最小,對殘差進行分析以檢驗整個回歸分析的過程是否符合基本假定,是否有個別特殊點。

以上是數理分析的基本原理,實際計算過程比較復雜,現在電腦的普及解決了計算問題,可以很方便地應用統計軟件進行分析,但我們必須要明確其基本原理和意義。

3 數據分析示例

3.1 頭孢氨芐膠囊2011年質量回顧成品含量數據分析

2011年,頭孢氨芐膠囊質量回顧中成品含量的數據見表1。

表1 頭孢氨芐膠囊成品含量 %

含量是連續型數據,先用游程檢驗判斷獨立性:中位數98.2,關于中位數的游程個數R=17,n1=16,n2=17,給定顯著性水平α=0.05,查游程檢驗臨界值表,R1=11,R2=24,結果:R1<R<R2,不能拒絕原假設,可以認為數據是獨立的。

運用MINITAB軟件進行正態性檢驗,見圖1。

圖1 頭孢氨芐膠囊成品含量數據正態性檢驗

輸出結果p=0.698>0.05,沒有充分的證據拒絕原假設,接受數據服從正態分布的判斷。

制作質量控制圖,未發現不良趨勢;評價對成品含量的控制能力,CP=1.63,CPK=1.30,PP=1.54,PPK=1.22,過程能力比較滿意,成品含量穩定。

3.2 不正確的分析得出不準確的結論

3.2.1錯誤分析案例1—阿昔洛韋乳膏成品率數據分析

回顧期內生產阿昔洛韋乳膏51批,成品率見表2。

表2 阿昔洛韋乳膏成品率%

若不考慮假設檢驗的前提,直接計算能力指數:CP=2.15,CPK=1.55,PP=1.65,PPK=1.18,會認為過程控制很好。但這并不準確,因為此組數據不服從正態分布,不能直接按正態分布處理。擬合優度檢驗確定需對數據進行Johnson變換,變換后的過程能力評價見圖2。

圖2顯示PP=1.10,PPK=0.70,能力數值較低。事實上,從控制圖也可看出過程是不穩定的,見圖3。

檢查實際生產過程,有一個階段受輸料管道故障的影響,成品率發生波動,證明工藝控制水平仍需提高。排除故障并采取加強工藝穩定的系列措施,下一回顧期過程能力指數有顯著提高:CP=2.40,CPK=1.68,PP=2.51,PPK=1.76。

3.2.2錯誤分析案例2—羅紅霉素片成品溶出度數據分析

羅紅霉素片成品溶出度數據見表3。

數據符合正態分布 (p=0.157>0.05),對過程穩定性進行評價,見圖4。

表3 羅紅霉素片成品平均溶出度 %

圖4 羅紅霉素片成品平均溶出度過程能力分析

圖4顯示:PPK=0.72,PP=0.96,基準Z值2.16,過程能力較低。但實際上本品溶出度一直很好,上述分析也與數據表現明顯不符。問題根源在于假設檢驗邊界設置錯誤,溶出度應是單側檢驗,正確的計算結果為:CPK=1.48,PPK=1.21,Z=3.62,過程能力滿意。錯誤分析使過程控制水平被低估,導致不準確的結論。

3.3 數據分析優化工藝

質量回顧時收集了某產品干燥工序顆粒水分與溫度數據,見表4。

表4 干燥工序顆粒水分與溫度

對顆粒水分與溫度的相關性進行分析,相關系數r=-0.511,有弱相關。相關系數檢驗,=0.511,n-2=43,取α=0.05,臨 界 值 在0.2875~0.3044,大于臨界值,可認為二者是相關的。

建立回歸方程:y=7.803-0.08685x(式中:y-水分;x-溫度)

顆粒水分及溫度數據回歸方程擬合線具體見圖5。

對回歸方程進行檢驗:方差分析,F=15.18,p=0.000<0.05,判定回歸方程是顯著有效的;R-Sq(26.1%)與R-Sq(調整)(24.4%)接 近,回 歸的效果尚可;殘差分析結果見圖6。

殘差分析結果:殘差值隨機地在水平軸上下無規則波動,具有時間獨立性;殘差與擬合值圖形正常,殘差是等方差的;正態概率圖顯示,殘差符合正態分布??梢缘贸鼋Y論,線性回歸方程與數據擬合較好。

相關回歸分析可用于優化工藝參數,本例中,需要的最佳水分是3.8%~4.2%,分析知最佳溫度范圍是41.5℃~46.0℃,縮小了控制范圍,優化了生產工藝。

3.4 數據分析發現問題,促使質量改進

運用科學的數理統計分析后,質量回顧分析水平有了很大的提高,改變了以往僅羅列數據的狀況,規范了分析流程,發現了看似成熟的產品隱藏的問題[2],指出了質量改進的方向,工藝質量評價更具客觀性和可比性,產品質量有了明顯提高。如乳酸左氧氟沙星滴眼液的滲透壓摩爾濃度,雖然檢驗結果均合格,但經質量回顧分析,發現存在系統性偏差,查找原因系季節性因素影響,采取補償措施后,基準Z值達到4.20,產品質量獲得明顯改進。

圖6 相關回歸分析水分殘差圖

4 數據分析問題探討

4.1 多批次不連續過程的統計分析

統計過程分析常用于單一的過程,而藥品質量數據通常不是連續得來的,是一批批檢驗的結果,是否適合數理模型有人存疑。筆者認為多批不連續的過程可看作一個時間跨度更大的過程,數據能否進行統計分析的關鍵是看目標值是否被過度干擾,若在一個較長的時期內目標值是保持恒定的,如含量目標定為100%,在此基礎上隨機變化,就可進行統計研究。實際分析也表明,可以對間斷的多批的藥品數據進行穩定性評價。

4.2 數據類型問題

質量回顧數據分析時會遇到數據類型區分的問題,但有些數據類型并不是很清晰,如制劑產品的成品率,若以產品數量計屬于服從二項分布的離散型數據,但以之分析存在一些問題:因檢驗等原因成品率難免會出現超百的情形,不適合二項分布;即使非常穩定的成品率,計算出的西格碼水平也可能是負值,與實際嚴重不符。筆者認為,成品率作為連續型數據分析更合適,因制劑產品批量大,以產量計成品率可看作連續型數據,從單值數據特點上也可這樣認為,多例分析后發現這更接近于實際。本文中對成品率以連續型數據進行分析,對過程穩定性的評價與實際表現一致。

4.3 正態性檢驗

若使用統計學軟件對質量回顧數據進行正態性檢驗,當數據量較大、重復數據較多時,可能會得出不準確的結論,因正態檢驗針對的是連續型數據,數據量多時檢驗的敏感性會增加;若測量系統分辨率不足,重復數據會被誤認為數據不連續,影響到檢驗結果的準確性。產生懷疑時應分析數據的產生機理和影響因素,若在受到的諸多隨機影響因素中沒有任何一個因素能起主導作用,則數據很可能服從正態分布[4],可同時使用其它數理統計方法,如卡方擬合檢驗等進行綜合判斷。

[1]馬逢時,周暐,劉傳冰.六西格碼管理統計指南 [M].北京:中國人民大學出版社,2007:202-203.

[2]王春濤,唐靜,陳偉.MINITAB軟件在藥品生產質量控制中的應用 [J].中國執業藥師,2012,9 (11):42-46.

[3]Gitlowa HS,Oppenheim AJ,Oppenheim R,等.質量管理[M].張杰,譯.北京:機械工業出版社,2008:277-278.

[4]吳贛昌.概率論與數理統計 [M].北京:中國人民大學出版社,2009:51-53.

猜你喜歡
成品率正態回歸方程
采用直線回歸方程預測桑癭蚊防治適期
線性回歸方程的求解與應用
線性回歸方程要點導學
走進回歸分析,讓回歸方程不再是你高考的絆腳石
精益六西格瑪在改善藥品生產流程中的應用
雙冪變換下正態線性回歸模型參數的假設檢驗
薏苡仁多糖咀嚼片直接壓片法輔料配比的工藝研究
基于泛正態阻抗云的諧波發射水平估計
半參數EV模型二階段估計的漸近正態性
PCM參數在圓片制造中的影響
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合