“循證”時代，我們如何解讀醫學文獻？醫學論壇網-網聚醫學的力量

　　毫無疑問，嚴重全身性感染治療指南（Surviving Sepsis Campaign Guideline）是近年來危重病醫學領域的熱點話題之一。　

　　該指南依據循證醫學原則，總結了過去10年間嚴重全身性感染相關領域的多項臨床研究結果，就多項治療措施予以推薦，如早期目標指導治療(EGDT)、強化胰島素治療、肺保護性通氣策略、應激劑量糖皮質激素治療感染性休克、活化蛋白C、腎髒替代治療的劑量及每日中斷鎮靜等。　

　　然而，回顧上述治療措施的相關臨床試驗發現，不加選擇地盲目依從試驗結果往往導致臨床工作無所適從，其原因在於指南中推薦的措施均未經過兩項獨立的前瞻隨機對照臨床試驗證實（見下表）。　

　　臨床醫師是否應相信和（或）遵從所有臨床研究的結果？如何才能做到不為臨床研究結果所左右？是我們無法回避的問題。　

　　臨床醫師需要了解臨床流行病學和統計學知識。臨床試驗結果可能受各種因素影響。如果不了解這些因素，就會影響我們對試驗結果的解讀。　

　　對於臨床試驗結果，醫師應審慎分析而非盲從，從而避免循證原則(evidence-based)被證據偏倚(evidence-biased）所誤導。　

　　下麵我們就如何解讀臨床研究進行扼要討論。

試驗設計

研究人群

　　範登博格（van den Berghe）等的強化胰島素治療研究提示，對外科ICU患者，如果把血糖控製在110 mg/dl以下(80～110 mg/dl)，較180～ 200 mg/dl可顯著降低患者的ICU病死率及住院病死率(7.2% 對11%)，同時各種並發症如血行性感染(4.2% 對8%)、需要透析、需要輸血、發生多發性神經病等的患者比例也顯著降低。　

　　但是，該研究選擇的人群是收住外科ICU、接受機械通氣的患者，其中約60%為心髒外科手術患者，30%是其他手術患者，急性生理與慢性健康評分Ⅱ（APACHEⅡ）僅為9分。因此，該研究針對的人群多為高危外科手術後患者，而非嚴重全身性感染和（或）感染性休克患者。　

　　與此相反，得到陰性結果的VISEP研究以嚴重全身性感染或感染性休克患者為研究對象，其中40%為肺部感染，術後患者僅占50%，APACHEⅡ達20分。強化胰島素治療組與對照組患者28天死亡率分別為25%和26%。　

　　由此可見，上述兩項研究的人群完全不同，支持強化胰島素治療的臨床研究並非針對嚴重全身性感染患者。　

　　事實上，嚴重全身性感染治療指南引用的很多研究均非針對嚴重全身性感染患者。例如，保護性通氣策略研究入選急性呼吸窘迫綜合征(ARDS)患者，每日中斷鎮靜研究針對機械通氣患者。　

　　因此，上述研究的結論並不能理所當然地被推廣用於嚴重全身性感染患者。　

多中心與單中心

　　嚴重全身性感染治療指南中很多推薦意見依據單中心研究，如EGDT、強化胰島素治療、高容量血液濾過、每日中斷鎮靜等。　

　　單中心研究的優點包括組織工作和數據收集簡單、入選病例差異小、花費較低、容易得到一致結論，但結論可能無法得到外部證實(external validation)。　

　　例如，1999年德拉庫洛維奇（Drakulovic）的一項單中心研究表明，如果患者采取45°半臥位，呼吸機相關性肺炎(VAP)患病率由32%下降到8%，但2006年範奈文霍溫（van Neiwenhoven）的多中心研究並未證實上述結果。另外，2001年裏韋爾斯（Rivers）的單中心研究發現，EGDT治療組患者住院病死率顯著下降(31%對47%)。但此後的多中心前瞻性臨床觀察表明，嚴重全身性感染即使未接受EGDT，其病死率與Rivers的EGDT治療組並無差異。事實上，目前尚無多中心前瞻性平行對照研究證實EGDT的有效性。　

　　此外，很多單中心研究可能高估臨床療效。　

　　例如，van den Berghe的單中心研究顯示，強化胰島素治療可使患者的病死率由8.0%降至4.6%，相對病死率下降超過40%。但是，隨後的多中心研究NICE-SUGAR表明，強化胰島素治療組患者的病死率顯著升高(27.5% 對24.9%)。龍科（Ronco）等的單中心研究顯示，高容量血液濾過使急性腎功能衰竭患者的病死率由57%下降至41%，相對病死率下降近30%。但隨後的多中心研究如ATN和RENAL均未得出相同的結論。　

　　以上數據表明，對於單中心研究得到的結論，需要審慎判讀。　

隨機、對照與設盲

　　關於隨機與非隨機研究的對比，研究表明，非隨機臨床試驗顯著高估治療效果，其結果與隨機臨床試驗結果的一致性最低僅為30%。　

　　關於設盲，2001年德弗羅（Devereaux）等研究表明，教科書或臨床試驗中對於“設盲”可能有多重定義。例如，“單盲”的定義超過7種，75%的教科書或臨床試驗認為“單盲”即對受試者設盲；“雙盲”的定義超過12種，其中認為對受試者和醫師設盲者占40%；“三盲”的定義也超過12種，認知度最高者僅為18%。　

　　對於未設盲的臨床試驗，需要警惕霍索恩（Hawthorne）效應。該效應指由於未能設盲，研究實施者知曉研究分組情況，從而有意或無意給予受試者過多照顧，導致試驗結果受影響。例如，EGDT、高容量血液濾過、半臥位等研究均可能存在Hawthrone效應。　

　　關於對照組的設置，部分臨床試驗設置對照組時采用曆史對照而非平行對照。相關研究表明，采用平行對照的臨床試驗僅有20%得到陽性結果，而采用曆史對照則有80%的研究得到陽性結果。因此，采用曆史對照更容易高估療效。

結果解讀

方案及實施

　　了解臨床試驗方案及其實施情況對試驗結果的解讀是至關重要的。　

　　例如，根據EGDT的試驗方案，試驗組中心靜脈壓(CVP)目標值為8 ～12 mmHg，平均動脈壓(MAP)目標值為65～90 mmHg。但結果顯示，對照組CVP和MAP分別為12 mmHg和81 mmHg，而EGDT組分別為14 mmHg和95 mmHg。可見與EGDT組相比，對照組CVP和MAP更接近目標值，患者病死率也更高。　

　　因此，有學者認為，EGDT研究並不能證實將CVP維持在8～12 mmHg、MAP維持在65～90 mmHg能顯著降低嚴重全身性感染病死率。　

病例混雜

　　在2002年安內恩（Annane）有關糖皮質激素治療感染性休克的研究中，試驗組用氫化可的鬆50 mg q6h及氟氫可的鬆50 μg qd，療程7天，以28天病死率為主要終點。研究納入299例患者，根據是否存在相對腎上腺皮質功能不全(RAI)分2組，其中229例(77%)存在RAI。結果顯示，RAI患者應用糖皮質激素後病死率明顯下降（53% 對63%），非RAI患者病死率略有升高（61%對53%）。分析全部患者發現，糖皮質激素可降低病死率。其原因是77%的患者存在RAI，且糖皮質激素治療RAI患者有效。那麼，感染性休克患者中RAI比例是否可能不同？　

　　該研究估計樣本量時假設感染性休克患者約40%存在RAI。研究表明，感染性休克患者中RAI比例差異極大(30%～70%)。因此如果納入患者中RAI比例不同（如為研究預計的40%或為CORTICUS研究的47%），即便糖皮質激素對RAI患者療效相同，仍無法得到激素治療降低感染性休克病死率的結論。　

亞組分析

　　約70%的臨床試驗進行亞組分析，其結果為部分研究者津津樂道。例如SAFE研究證實，使用4%白蛋白和生理鹽水進行液體複蘇，ICU患者生存率並無顯著差異。但亞組分析提示，全身性感染患者使用白蛋白可降低病死率。應如何解讀亞組分析結果呢？　

　　一項研究可能包括多個亞組分析。1982年發表的一項研究使用β受體阻滯劑普萘洛爾治療急性心梗，包括146項亞組分析。亞組分析越多，得到假陽性結果的概率越高。統計學計算顯示，若進行20項亞組分析，假陽性率可高達60%。可以想見，若亞組分析多達146項，幾乎肯定可以得到統計學陽性結果。　

　　在上述前提下，亞組分析的陽性結果可能僅為偶然。例如，1988年發表的一項研究比較了阿司匹林和（或）鏈激酶治療急性心梗的療效。亞組分析顯示，若患者星座為雙子座或水瓶座，則阿司匹林療效顯著優於對照組。1997年發表的一項研究總結了50項臨床試驗，表明所有亞組分析的結果均未對此後10年的臨床工作產生任何影響。　

　　亞組分析的主要目的是明確不同亞組間療效是否有差異，而非證實某亞組中治療組是否優於對照組。　

提前終止

　　為符合倫理學原則，很多臨床試驗設定了提前終止標準。但對於因試驗組療效改善而提前終止的研究需要警惕。　

　　例如，在組織因子途徑抑製物(TFPI)治療感染性休克的臨床試驗中，中期分析表明，TFPI組與對照組病死率分別是29.1%和38.9%，P = 0.006，幾乎達到提前終止標準。但隨著試驗繼續，兩組患者病死率趨勢恰恰相反，最終結果並無顯著差異(P = 0.88)。該研究提示，提前終止的研究可能得出錯誤結論。　

　　在嚴重全身性感染治療指南中，強化胰島素治療及保護性通氣等研究均提前終止。　

　　2005年發表的係統回顧表明，因試驗組療效改善而提前終止的研究可能高估臨床療效，低估不良反應。　

樣本量　

　　Ronco的研究顯示，連續性靜脈-靜脈血液濾過（CVVH）劑量達到35 ml/（kg・h）可顯著降低急性腎衰病死率。　

　　有學者指出，該研究還表明，CVVH劑量達到45 ml/（kg・h）可顯著降低全身性感染病死率。但該研究中全身性感染僅占各組患者的11%～14%（即15～20例），如此小樣本量的研究難以得到令人信服的結論。　

　　與此相似，EGDT研究中治療組130例患者中僅有18例應用多巴酚丁胺，因此難以確切反映多巴酚丁胺的療效。　

統計學差異與臨床意義

　　盡管所有研究都根據P < 0.05判斷是否為陽性結果，但統計學意義與臨床意義之間並無必然聯係。　

　　2008年發表的一篇綜述表明，在重症醫學領域72項多中心隨機對照研究中，僅10項顯示治療措施明顯降低病死率，7項顯示病死率增加，其餘55項為陰性結果。作者認為可能需要其他替代指標而非病死率評估療效。但醫師需要理解替代指標與臨床預後的聯係。　

　　例如，2001年發表的一項重症胰腺炎動物試驗對腎髒替代治療清除炎性介質及降低病死率的作用進行了研究。結果表明，高容量血液濾過和（或）更換濾器雖然能明顯提高試驗動物的存活率，但其血漿腫瘤壞死因子（TNF）α水平卻明顯升高。該結果提示，炎症介質清除與臨床預後並不一致。　

　　研究表明，非感染與感染患者降鈣素原（PCT）水平存在顯著差異（0.47對5.3 ng/ml, P = 0.001）。但兩者PCT水平分布仍有相當程度重疊，因此若患者PCT為1.0 ng/ml，醫師仍無法據此鑒別是否存在感染。　

其他

　　2003年，發表於《英國醫學雜誌》的一項係統回顧表明，有企業讚助的研究更容易得到有利於讚助者的結果[比值比（OR） = 4.05, 95%可信區間（CI） = 2.98～5.51]。