預(yù)判模型 | 臨床預(yù)判模型的創(chuàng)建與驗(yàn)證

發(fā)布日期：2023-08-19 作者：康為點(diǎn)擊：

預(yù)判模型 | 臨床預(yù)判模型開(kāi)發(fā)checklist詳解

你的預(yù)判模型文章報(bào)表是標(biāo)準(zhǔn)的嗎？

既然前面咱們已然對(duì)臨床預(yù)判模型的概念有了根本了解后，那么它詳細(xì)怎樣建立以及驗(yàn)證呢？本節(jié)咱們就研討下這方面的內(nèi)容。臨床問(wèn)題決議研發(fā)型號(hào)：

首選咱們要明確詳細(xì)的臨床問(wèn)題決議研發(fā)型號(hào)的選取。臨床預(yù)判模型可以答復(fù)疾病的病因、診療、患者對(duì)醫(yī)治的反應(yīng)和預(yù)后等問(wèn)題。不同的問(wèn)題須要設(shè)計(jì)不同的研發(fā)型號(hào)。

比如，在病因?qū)W研發(fā)方面，隊(duì)列研發(fā)可以拿來(lái)依據(jù)潛在的原因來(lái)預(yù)判疾病能否爆發(fā)。對(duì)于診療確切性的臨床問(wèn)題，合適采取橫斷面研發(fā)設(shè)計(jì)，由于預(yù)判因子和結(jié)果能夠同時(shí)爆發(fā)或在短時(shí)間內(nèi)爆發(fā)。

為了預(yù)判患者對(duì)醫(yī)治的反應(yīng)，可以采取隊(duì)列研發(fā)或隨機(jī)對(duì)比實(shí)驗(yàn)(RCT)。針對(duì)預(yù)判類(lèi)臨床問(wèn)題，設(shè)計(jì)隊(duì)列研發(fā)是應(yīng)用的，由于預(yù)判因子和結(jié)局有縱向的時(shí)間邏輯關(guān)系。評(píng)價(jià)病因的隊(duì)列研發(fā)須要選取合理的研發(fā)目標(biāo)和操控混同原因。

在診療模型的研發(fā)中，須要1個(gè)“金規(guī)范”或考慮規(guī)范來(lái)獨(dú)立診療疾病，考慮規(guī)范的診療理應(yīng)在“盲法”狀況下進(jìn)行。也就是說(shuō)，考慮規(guī)范診療不可依托于預(yù)判模型中預(yù)判因子的數(shù)據(jù)，以以免顯現(xiàn)診療評(píng)價(jià)誤差。

評(píng)價(jià)患者對(duì)醫(yī)治的反應(yīng)是干預(yù)性研發(fā)的一類(lèi)型號(hào)。須要選取合理的研發(fā)目標(biāo)、操控非測(cè)驗(yàn)原因的攪擾。在預(yù)后模型中，預(yù)判因子與結(jié)局之間存在縱向關(guān)系，研發(fā)者往往希望獲得疾病在自然狀況下的結(jié)局，因而前瞻性隊(duì)列研發(fā)是最常見(jiàn)的預(yù)后模型，也是最好的研發(fā)設(shè)計(jì)型號(hào)。建立模型的數(shù)目：

首先須要回首文獻(xiàn)來(lái)確認(rèn)咱們要建立的預(yù)判模型的數(shù)目:

（一）對(duì)于詳細(xì)臨床問(wèn)題現(xiàn)在還沒(méi)有預(yù)判模型。為了建立1個(gè)新的模型，往往須要1個(gè)訓(xùn)練集來(lái)建立模型，并須要1個(gè)驗(yàn)證集來(lái)驗(yàn)證模型的預(yù)判本領(lǐng)。

（二）現(xiàn)在已有預(yù)判模型。為了建立新的模型，應(yīng)用驗(yàn)證集來(lái)建立新模型，并應(yīng)用相近的訓(xùn)練信息集來(lái)分別驗(yàn)證現(xiàn)有模型和新模型的預(yù)判本領(lǐng)。

（三）為了刷新現(xiàn)有模型，應(yīng)用相近的驗(yàn)證信息集來(lái)評(píng)價(jià)這2個(gè)模型的預(yù)判本領(lǐng)。

對(duì)于訓(xùn)練信息集和驗(yàn)證信息集的形成，可從前瞻性地或回首性地采集信息，此中前瞻性采集的信息擁有更高的品質(zhì)。針對(duì)建模人群，樣件量應(yīng)盡能夠大。

假設(shè)信息是回首性采集的，還理應(yīng)評(píng)價(jià)信息品質(zhì)，辨認(rèn)離群值，并對(duì)缺失值進(jìn)行恰當(dāng)處置，如填充或刪除。

最終，依據(jù)實(shí)際狀況確認(rèn)用來(lái)建模的訓(xùn)練信息集和用來(lái)驗(yàn)證的驗(yàn)證信息集。因?yàn)楝F(xiàn)實(shí)原因，偶爾只可在同一信息集中建模和驗(yàn)證，這是容許的，但模型的外部應(yīng)用性會(huì)遭到絕對(duì)程度的影響。模型的創(chuàng)建與展現(xiàn)：

在創(chuàng)建預(yù)判模型此前，有必須了解往常文獻(xiàn)報(bào)導(dǎo)中的預(yù)判因子，確認(rèn)選取預(yù)判因子的準(zhǔn)則和方式，并選取所需運(yùn)用的模型型號(hào)，如logistic回歸模型或Cox回歸模型。現(xiàn)在，預(yù)判模型常用有四種展現(xiàn)形態(tài):

（一）公式。直接應(yīng)用數(shù)學(xué)公式作為預(yù)判模型工具。

（二）列線圖Nomogram。通過(guò)恰當(dāng)?shù)臄?shù)學(xué)變換將回歸模型中的回歸系數(shù)轉(zhuǎn)換為分?jǐn)?shù)，并將其繪制為諾模圖作為預(yù)判模型工具。

(三) 網(wǎng)絡(luò)計(jì)算器。其實(shí)質(zhì)也是通過(guò)恰當(dāng)?shù)臄?shù)學(xué)運(yùn)算將回歸模型中的回歸系數(shù)轉(zhuǎn)換成份數(shù)，并將其制造成網(wǎng)站供在線應(yīng)用。

（四）評(píng)分體系。通過(guò)恰當(dāng)?shù)臄?shù)學(xué)運(yùn)算，將回歸模型的回歸系數(shù)轉(zhuǎn)變?yōu)?個(gè)可量化的評(píng)分體系。臨床預(yù)判模型的驗(yàn)證：

預(yù)判模型的成效會(huì)隨著運(yùn)用情景和人群的改變而改變。因而，對(duì)預(yù)判模型的完整研發(fā)理應(yīng)含蓋模型的驗(yàn)證。驗(yàn)證的內(nèi)容含蓋模型的內(nèi)部有效性和外部有效性。內(nèi)部有效性反映了模型的可反復(fù)性，可以用自身的研發(fā)信息通過(guò)交叉驗(yàn)證和Bootstrap方式來(lái)進(jìn)行驗(yàn)證。外部有效性反映了模型的廣泛性，須要應(yīng)用不是來(lái)自研發(fā)自身的信息集進(jìn)行驗(yàn)證，這類(lèi)信息集在時(shí)間或地理上是互相獨(dú)立的。

模型的內(nèi)部驗(yàn)證和外部驗(yàn)證是評(píng)價(jià)模型安穩(wěn)性和應(yīng)用性的必須方法。用來(lái)內(nèi)部驗(yàn)證和外部驗(yàn)證的信息集理應(yīng)是完全異質(zhì)的，不可只是在絕對(duì)程度上不同。通常狀況下，應(yīng)用原機(jī)構(gòu)的信息作為訓(xùn)練集來(lái)創(chuàng)建模型，并隨機(jī)抽取一部分內(nèi)部信息進(jìn)行內(nèi)部驗(yàn)證。選取來(lái)自其余機(jī)構(gòu)的信息作為外部驗(yàn)證信息集。固然，最佳是進(jìn)行外部信息集驗(yàn)證。以下簡(jiǎn)介幾種驗(yàn)證內(nèi)部有效性的方式。

（一）隨機(jī)拆分法。將現(xiàn)有信息隨機(jī)分成兩部分，一部分用來(lái)建立模型，另一部分用來(lái)驗(yàn)證模型。采取該方式將信息劃為兩部分進(jìn)行“內(nèi)部驗(yàn)證”。因?yàn)槲í?dú)一部分的信息用來(lái)建立模型，因而模型相對(duì)不安穩(wěn)。樣件量較小的研發(fā)往往不合適這類(lèi)方式。

（二）交叉驗(yàn)證方式。這類(lèi)方式是對(duì)隨機(jī)拆分法的的進(jìn)一步蔓延。常用的有半折交叉驗(yàn)證和十折交叉驗(yàn)證。半折交叉驗(yàn)證法是將起始信息分成兩部分，一部分用來(lái)創(chuàng)建模型，另一部分用來(lái)驗(yàn)證模型。接著替換兩部分的信息并互相驗(yàn)證。十折交叉驗(yàn)證法是將信息分成十部分，此中九部分用來(lái)建模，另一部分用來(lái)模型驗(yàn)證。用這類(lèi)方式創(chuàng)建和驗(yàn)證模型十次，就可以建立1個(gè)相對(duì)安穩(wěn)的模型。

（三）Bootstrap方式。傳統(tǒng)的Bootstrap內(nèi)部有效性驗(yàn)證方式是在起始信息集中有放回的隨機(jī)抽取絕對(duì)數(shù)目的樣件創(chuàng)建模型，接著應(yīng)用起始信息集對(duì)模型進(jìn)行驗(yàn)證。通過(guò)500-1000次的隨機(jī)抽樣、創(chuàng)建和驗(yàn)證，可以獲得500-1000個(gè)模型，并可以總結(jié)出模型的參數(shù)散布。因而，可以確認(rèn)模型的終極參數(shù)值。實(shí)踐證實(shí)，該方式獲得的模型比前兩類(lèi)方式擁有更高的安穩(wěn)性。可以揣測(cè)，Bootstrap方式將越來(lái)越多地運(yùn)用于驗(yàn)證模型的內(nèi)部有效性解析。固然，在具有條件的狀況下，應(yīng)盡快對(duì)預(yù)判模型進(jìn)行外部驗(yàn)證，提升模型的外部應(yīng)用性?，F(xiàn)在臨床預(yù)判模型的研發(fā)從臨床醫(yī)師的角度大概可劃為三大類(lèi)：

1.預(yù)判模型是依據(jù)傳統(tǒng)的臨床特點(diǎn)、病理特點(diǎn)、體檢結(jié)果、試驗(yàn)室檢驗(yàn)結(jié)果等建立起來(lái)的，這種模型中的預(yù)判變量愈加便于從臨床上獲得。

2.隨著影像組學(xué)研發(fā)方式的成熟，越來(lái)越多的學(xué)者意識(shí)到影像學(xué)的某類(lèi)體現(xiàn)或參數(shù)代表了特定的生物學(xué)特點(diǎn)。應(yīng)用彩色多普勒超聲、CT、MR以及PET的批量成像參數(shù)結(jié)合臨床特點(diǎn)來(lái)建立預(yù)判模型，通?？梢赃M(jìn)一步提升預(yù)判模型的確切性。此類(lèi)建?；谟跋窠M學(xué)信息。此類(lèi)建模的初期工作量比第一類(lèi)方式大得多，而且須要臨床和影像部門(mén)之間的慎密協(xié)作。

3.隨著基因組學(xué)和蛋白質(zhì)組學(xué)等高通量生物技術(shù)的全面運(yùn)用，臨床研發(fā)職員正企圖從這類(lèi)海量的生物數(shù)據(jù)中尋找某種特點(diǎn)生物標(biāo)志物來(lái)建立預(yù)判模型。這類(lèi)預(yù)判模型是將根基醫(yī)學(xué)轉(zhuǎn)變?yōu)榕R床醫(yī)學(xué)的1個(gè)較好的切入點(diǎn)，但因?yàn)轫氁獙?duì)臨床標(biāo)本進(jìn)行各類(lèi)組學(xué)測(cè)驗(yàn)，這種研發(fā)通常須要強(qiáng)有力的資金支持。一經(jīng)樂(lè)意投入資金進(jìn)行組學(xué)解析的研發(fā)，可以較好地轉(zhuǎn)變?yōu)榕R床研發(fā)，通常可以產(chǎn)出高分文章。另外，還必要要有生物樣件的支持。從臨床醫(yī)師的角度建立臨床預(yù)判模型的所需條件：

1.創(chuàng)建單一疾病的隨訪信息庫(kù)，盡能夠完整地采集患者數(shù)據(jù)，含蓋但不局限：人口統(tǒng)計(jì)學(xué)特點(diǎn)、既往病史、家族史、個(gè)體病史；與疾病有關(guān)的數(shù)據(jù)，如醫(yī)治前主要的生理和試驗(yàn)室檢驗(yàn)結(jié)果、疾病的嚴(yán)重程度、臨床分期、病理分期、組織學(xué)分級(jí)；醫(yī)治數(shù)據(jù)：如手術(shù)方式、放化療計(jì)劃、劑量和強(qiáng)度；患者的預(yù)后：針對(duì)癌癥患者，須要連續(xù)的隨訪才能獲取其結(jié)果，這是一項(xiàng)極其艱難和高難的任務(wù)。

2.從往?？堑念A(yù)判模型文章來(lái)看，大部分全是基于回首性的信息，也有一小部分是基于前瞻性的信息。與隨機(jī)對(duì)比研發(fā)相比，如此的研發(fā)更容易進(jìn)行，況且它們屬于咱們?nèi)缃癜l(fā)起的現(xiàn)實(shí)世界研發(fā)行業(yè)。在過(guò)去，咱們過(guò)度注重了隨機(jī)對(duì)比研發(fā)的主要性，而忽略了現(xiàn)實(shí)世界信息的較大價(jià)值。隨機(jī)對(duì)比研發(fā)的信息無(wú)疑是品質(zhì)最高的，但信息經(jīng)過(guò)了嚴(yán)密的篩選，因而證據(jù)的外推是有限的。真正信息來(lái)歷于咱們的平常臨床實(shí)踐，更廣泛地反映了臨床干預(yù)的有效性，證據(jù)擁有很好的外部應(yīng)用性。但是，現(xiàn)實(shí)世界研發(fā)的最大問(wèn)題是信息的品質(zhì)參差不齊，有太多難以辨認(rèn)的混同原因。因而，有必須用更高難的統(tǒng)計(jì)方式從高難的混同原因中找尋真象。

在這里，咱們須要解讀混同原因是客觀存在的，由于所有臨床結(jié)果的爆發(fā)都不是單一原因的結(jié)果。針對(duì)混同原因有2個(gè)級(jí)別的校正。一類(lèi)是試驗(yàn)設(shè)計(jì)階段的校正，即頂層校正，即通過(guò)隨機(jī)化和充足的樣件量來(lái)均衡組間的混同原因。這也是隨機(jī)對(duì)比研發(fā)盛行的原因：只需樣件量充足，隨機(jī)化準(zhǔn)確，就能一勞永逸地解決混同原因問(wèn)題。第二種狀況是通過(guò)統(tǒng)計(jì)方式進(jìn)行后續(xù)校正，明顯沒(méi)有隨機(jī)對(duì)比研發(fā)校正的那么徹底，但第二種狀況更靠近咱們臨床實(shí)踐的真正狀況。

3.樣件大小。因?yàn)楝F(xiàn)實(shí)研發(fā)中混同原因較多，須要絕對(duì)的樣件量才能到達(dá)充足的統(tǒng)計(jì)效能，才能分辨混同原因?qū)Y(jié)果的影響。多變量解析篩選變量的1個(gè)簡(jiǎn)潔可行的準(zhǔn)則是，假設(shè)多變量解析中含蓋1個(gè)變量，則有效樣件量應(yīng)為20個(gè)，稱(chēng)為“1：20準(zhǔn)則”。比如，咱們?cè)谧鯟OX回歸解析時(shí)，假設(shè)采集了8個(gè)與預(yù)后有關(guān)的變量，那么起碼理應(yīng)有160個(gè)患者爆發(fā)了咱們定論的終點(diǎn)事情，如滅亡。注重是起碼160個(gè)滅亡患者，而不是160個(gè)患者，未顯現(xiàn)終點(diǎn)事情的樣件咱們通常不可稱(chēng)其為有效樣件。

4.臨床研發(fā)洞察力。創(chuàng)建臨床預(yù)判模型是為了解決臨床問(wèn)題。要發(fā)掘有價(jià)值的臨床問(wèn)題，就須要進(jìn)行全面閱讀和臨床實(shí)踐。預(yù)判模型研發(fā)現(xiàn)在所面對(duì)的問(wèn)題：

1.臨床運(yùn)用率低。首要原因是預(yù)判模型的臨床運(yùn)用須要在模型的確切性和簡(jiǎn)捷性之間獲得平衡。假設(shè)有1個(gè)模型，它與TNM分期同樣易于應(yīng)用，但比TNM分期更確切，您會(huì)做出甚麼選?。?/p>

2.大多數(shù)臨床預(yù)判模型全是基于回首性信息集來(lái)建立和驗(yàn)證的，很少在前瞻性信息中進(jìn)行驗(yàn)證。因而，模型預(yù)判的安穩(wěn)性相對(duì)較差。

3.大多數(shù)臨床預(yù)判模型的驗(yàn)證全是基于內(nèi)部信息。大多數(shù)文章唯獨(dú)1個(gè)信息集?？v然有2個(gè)信息集，1個(gè)要建立，另1個(gè)要驗(yàn)證，但這2個(gè)信息集通常來(lái)自同1個(gè)研發(fā)中心。假設(shè)該預(yù)判模型的有效功能夠進(jìn)一步擴(kuò)展到另1個(gè)研發(fā)中心的信息集，那么該模型的運(yùn)用價(jià)值將會(huì)大大提升?？紤]文獻(xiàn)

Zhou ZR, Wang WW, Li Y, et al. In-depth mining of clinical data: the construction of clinical prediction model with R. Ann Transl Med. 2019;7(23):796. doi:10.21037/atm.2019.08.63

本文網(wǎng)址：http://m.sem136.com/news/2731.html

相關(guān)標(biāo)簽：打印模型導(dǎo)航,比率模型

上一篇：3D人體打印技術(shù)導(dǎo)航，精確撤除腹部16斤較大“定期炸彈”
下一篇：學(xué)校展開(kāi)“解剖與藝術(shù)”第三屆影像解剖模型制造大賽作品展

新聞分類(lèi)