回归诊断

2024-09-30

回归诊断(精选5篇)

回归诊断 篇1

1 Logistic回归模型

1.1 Logistic回归方程

设响应变量y为二值定性变量, 用0, 1分别表示两个不同的状态, y=1的概率p是我们研究的对象。自变量为x1, …, xm, 可以是定性变量, 也可以是定量变量。

Logistic回归拟合的回归方程为[3]

lnp1-p=β0+i=1mβixi (1)

式 (1) 中:m是自变量个数, β0, β1, …, βm是待估参数, p是在自变量取值为X= (x1, …, xm) T时, 原响应量Y取值为1时的概率。Logistic回归方程的另一种形式为

p=exp (z) 1+exp (z) (2)

式 (2) 中

Ζ=β0+i=1mβixiΖ=lnp1-p (3)

显然, Z是自变量X的线性函数。通常称 (3) 式为Logistic变换, 它有很强的统计意义, 如它表示了y取值1 (如成功) 的概率与取值为0 (如失败) 的概率的比值的对数。Logit变换使回归函数线性化, 并满足了0≤E (y) =p≤1, 但没有消除误差项的方差不同性质。这时若用普通最小二乘法估计参数, 估计的回归系数仍然是无偏的, 但不再具有最小方差的性质, 这样用普通最小乘法可能导致无效估计, 因此要使用加权最小二乘法。

1.2Logistic回归方程中的参数估计—加权最小二乘法

加权最小二乘法估计参数是求解使剩余平方和

Q=j=1nWj (yj-y^j) 2=j=1nW[yj- (β0+β1x1++βmxm) ]2 (4)

最小的正则方程组Qβi=0 (i=0, 1, , m) 。其中Wj是给定的第j次观察的权重, y1和y^1分别是因变量y的第j次观察值和预测值, 观察值的权数一般取观察值误差项方差的倒数。

这样就可用最小二乘估计得到β的估计值β^i, 记作bi。例如, 在一元Logistic回归中, 得到加权最小二乘估计量b1和b2:

{b1=WjXjΖj-WjXjWjΖjWjWjXj2- (WjXj) 2Wjb0=WjΖj-b1WjXjWj (5)

同样可得到多元Logistic回归中的加权最小二乘估计β^为:

β^= (XΤV-1X) -1XΤV-1Ζ (6)

2Logistic回归模型诊断肺癌患者的生存时间

随机调查了40名肺癌病人的生存资料如表1所示[5], 该生存资料包含患者的5项重要指标, 其中X1表示生活行动能力评分 (1—100) ;X2表示病人的年龄;X3表示由诊断到进入研究时间 (月) ;X4表示肿瘤类型 (“0”是鳞癌, “1”是小型细胞癌, “2”是腺癌, “3”是大型细胞癌) ;X5表示两种化疗方法 (“1”是常规, “0”是试验新法) ;Y表示病人的生存时间 (“0”是生存时间短, 即生存时间小于200 d;“1”是生存时间长, 即生存时间大于或等于200 d) 。

2.1 建立Logistic回归模型

通过建立Logistic回归模型分析病人生存时间长短的概率p与其影响指标X1, X2, X3, X4, X5的关系, 即回归方程为[6]:

lnp1-p=β0+i=15βixi (7)

运用R语言中的函数glm () 估计式 (7) 中的参数βi (i=0, 1, …, 5) , 结果如下:

lnp1-p=-7.0114+0.0999x1+0.0142x2+0.0175x3-1.0830x4-0.6131x5 (8)

实际上, 用式 (8) 回归方程做预测还存在一些问题, 因为在得到Logistic回归模型时, 参数β2, β3, β5没有通过检验, 其P值分别为0.763 1, 0.748 6, 0.523 3。在R语言中可以用函数step () 作变量筛选, 拟合出最优的回归方程为[7]:

lnp1-p=-6.13755+0.09759x1-1.12524x4 (9)

方程 (9) 中的所有参数均通过了检验, 可以此方程作预测分析, 若患者的生活行动能力评分相同, 当X1=70时, 在4种不同的肿瘤类型下, 患者生存时间大于等于200 d的概率可如下计算:

> pre<-predict (glm.new, data.frame

(x1=70, x4=0 (1、2、3) )

>p<-exp (pre) / (1+exp (pre) ) ;p

(0.666 7、0.393 7、0.174 0、0.064 0)

以上结果表明:若患者的生活行动能力评分相同, 当X1=70时, 鳞癌患者生存时间大于等于200 d的概率最大, 为66.7%;大型细胞癌患者生存时间大于等于200 d的概率最小, 为6.4%, 小型细胞癌、腺癌患者生存时间大于等于200 d的概率介于鳞癌和大型细胞癌之间, 分别为39.4%和17.4%, 且鳞癌患者的生存概率是大型细胞癌患者生存概率的11倍。

3 结论

通过对肺癌患者的5个指标及生存时间长短的概率p建立Logistic回归模型, 分析病人生存时间长短的概率p与其影响指标之间的关系。结果表明[8]病人的年龄, 由诊断到进入研究时间及化疗方法三个因素对患者生存时间的影响不显著, 生活行动能力评分和肿瘤类型对患者的生存时间影响显著, 由回归方程预测结果可知:当生活行动能力评分相同, (X1=70) , 鳞癌患者生存时间大于等于200 d的概率最大, 为66.7%, 是大型细胞癌患者生存概率的11倍, 小型细胞癌、腺癌患者的生存概率介于鳞癌和大型细胞癌之间, 分别为39.4%和17.4%。由此可知, 当肿瘤类型确定时, 医学工作者可对患者生存时间作出相应的预测。

摘要:近年来, 肺癌发病率一直居高不下, 研究肺癌病人的生存时间, 帮助医学工作者制定相应的医疗方案就显得尤为重要。就随机调查的40名肺癌病人的生存资料建立Logistic回归方程, 对患者的生存时间进行预测和控制, 从量的角度分析患者的生存时间, 对医学工作者具有一定的借鉴作用。

关键词:Logistic回归,肺癌,生存时间,预测,控制

参考文献

[1]袁志发, 周静芋.多元统计分析.北京:科学出版社, 2002:151—157

[2]陈希孺.概率论与数理统计.安徽:科学出版社, 2002:288—300

[3]王济川, 郭志刚.Logistic回归模型:方法与应用.北京:高等教育出版社, 2001:88—95

[4]王黎明, 陈颖.应用回归分析.上海:复旦大学出版社, 2008:270—280

[5]薛毅, 陈立萍.统计建模与R软件.北京:清华大学出版社, 2006:309—316, 334

[6]王斌会.多元统计分析及R语言建模.广东:暨南大学出版社, 2010:130—138

[7]汤银才.R语言与统计分析.北京:高等教育出版社, 2008:265—270

[8]陈锋.医用多元统计分析方法.北京:中国卫生统计出版社出版社, 2001:109—124

回归诊断 篇2

失业率是指失业人口 (一定时期有工作意愿而仍未有工作的劳动力人口) 占劳动人口的比率。失业是市场经济不可避免的一种经济社会现象。但失业人员数量过多, 失业率过高, 不仅会给失业者本人及家庭带来极大冲击, 也会对经济发展和社会稳定构成重大威胁。因此, 把失业率控制在社会可承受的范围内, 是市场经济环境下国家政府的重要目标之一。

目前国内关于失业率的研究已取得一定的成果。田力 (2003) 研究了影响失业率的主要因素及降低失业率的对策, 利用数学的穷举法, 就影响供给的因素、影响需求的因素以及同时影响供求双方的因素三个方面, 分析了与失业密切相关的七大因素, 但其研究缺乏一个量化的统计模型。程红莉和刘强 (2003) 以全国30个省市的相关数据为样本研究了区域失业率差异影响因素。陈幼芳和张天会 (2006) 对云南的失业率进行了预测和研究, 其贡献在于给出了比较全面的预测模型, 但是缺乏对模型的检验。本文使用线性回归模型对云南省失业率的影响因素进行实证研究, 通过变量选择方法, 筛选得到了对失业率具有显著影响的因素, 并建立了拟合模型, 该模型通过了异方差性、序列相关性和异常值检验。

二、数据与变量选择

1、数据来源

本数据来源于云南统计局网站 (http://www.stats.yn.gov cn/TJJMH_Model/default.aspx) 上统计公报公布的2001—2011的相关数据。

2、变量选择

本文的失业率的影响因素的研究主要考察在众多因素中哪些因素对失业率具有显著的影响。我们首先给出自变量的待选变量集。奥肯定律认为经济增长与失业率是负相关的, 故首先考虑把GDP引入待选变量集中。此外, 由于失业保险是解决失业所产生的不利因素的社会机制, 故考虑把享受失业保险人数、失业保险参保人数、失业保险金收入额也引入待选变量集中。云南劳动力资源供给的潜力相当大, 这将给云南的就业形势造成不容忽视的压力, 故而把人口总数也引入变量集。固定资产投资是生产规模的重要表征, 对就业情况产生着重要影响, 故此, 应将其也引入变量集中。综上, 我们选取失业保险参保人数 (十万人) 、享受失业保险人数 (万人) 、GDP (千亿元) 、人口总数 (千万人) 、失业保险金收入额 (亿元) 、生产性固定投资总额 (百亿元) 为自变量, 以城镇登记失业率 (%) 为响应变量。

三、模型的建立

1、用普通最小二乘法 (OLS) 估计模型

综上分析, 我们建立云南省失业率影响因素分析的六元回归预测模型:

其中, x1系参保人数 (十万人) 、x2系享受失业保险人数 (万人) 、x3系GDP (千亿元) 、x4系人口总数 (千万人) 、x5系失业保险金收入额 (亿元) 、x6系生产性固定投资总额 (百亿元) 、y系城镇登记失业率 (%) 。

回归方程的F检验的p值为0.016<0.05, 这意味着, 在5%的显著性水平下, 解释变量对被解释变量的联合线性影响是显著的。而系数的t检验中, p值最小的为0.208, 故在5%显著性水平下所有系数均不显著, 即每个解释变量对被解释变量的线性影响均是不显著的。这说明模型自变量间很可能存在多重共线性。事实上, t-检验中解释变量都不显著, 可能是由于某些自变量对因变量的影响被其他自变量掩盖了。为了检验多重共线性的存在, 先求出自变量的样本协方差矩阵, 并求得该协方差矩阵的条件数 (最大特征值与最小特征值之比) 为1.7914*104, 这说明六个变量之间存在很严重的多重共线性。故此, 分别通过逐步回归法和AIC准则进行自变量的选择。

2、使用逐步回归法进行变量选择

对六个自变量采用逐步回归方法进行变量筛选, 用SPSS软件逐步回归的结果如表1所示。

逐步回归结果显示选择的自变量应当为失业保险参保人数 (x1) 和人口总数 (x4) 。在5%的显著性水平下, 他们的p值分别为.000和.000, 表明这两个解释变量对方程的影响是显著的。为了进一步确证上述变量选择结果, 我们使用AIC准则对一些重点待选模型进行比较。比较结果如下:仅包含x1、仅包含x4和包含x1和x4两个自变量和其他任意自变量搭配的模型, 其AIC值均大于只包含x1和x4两个自变量的模型的AIC值。可见, AIC准则提供的变量选择的结果与逐步回归法一致, 均选择x1和x4。

以y为因变量, 以x1和x4为自变量的回归模型拟合结果如下:

在5%的显著性水平下, 所有解释变量系数的t统计量的P值均小于0.05, 故所有系数均不显著为0, 即每个解释变量对被解释变量的线性影响均是显著的。F检验 (p=0.000<0.05) 的结果显示方程显著, 即在5%的显著性水平下解释变量对被解释变量的联合线性影响是显著的。

四、异方差性的White检验

由异方差性的White检验来看, F统计量的p值为0.3869, 在5%的显著性水平下, 落在接受域内。所有的交叉项和独立项的p值也都落在接受域内, 说明无法拒绝原假设, 所以模型中不存在明显的异方差性。

五、序列相关的检验

由于e軇t-1-e軇t散点图没有明显的上升或下降趋势, 故序列之间没有明显的序列自相关。另一方面, 使用拉格朗日乘数检验 (LM) 方法, 得到F统计量的p值为0.3869, 虽然在问题中样本量较小, 但p值达到0.3869, 仍在一定程度上说明随机误差项之间不存在明显的序列相关。

六、异常点检验

异常点即为在预设统计模型下明显与大多数数据点的统计规律不一致的数据点。在线性模型下, 异常点可采用下述的均值漂移模型来检验, 该模型的向量形式可表示为Y=Xβ+hiγ+ε, hi= (0, …, 1, …, 0) T。其中hi中第i个元素为1, 其余元素为0, X为自变量矩阵, Y为因变量向量。若γ显著, 说明第i个点的均值有漂移, 则该点不符合既定的线性回归方程yi=xiTβ+εi, 从而说明第i个点为异常点。为了检验γ是否显著, 我们采用参数显著性检验方法。

对异常点的检验过程如下:新增加一个自变量z, 可疑点所对应的取值为1, 其他元素取值为0, 在模型 (1) 加入变量z再进行线性回归, 若z的系数显著, 则判定相应的样本点为异常值点。经过计算, 在5%的显著性水平下, 2000年和2002年的数据中变量z通过了系数的显著性检验 (其p值分别是0.014和0.006) , 故判定其为异常值点。

将2000年和2002年的数据点剔除, 利用剩余十个年度的数据重新进行逐步回归得到由x1和x4组成的模型, 并得到以下的拟合方程:

可见, 剔除2000年和2002年的异常点后, R2adj变大了, 表明模型的拟合优度得到了改善。F检验 (p=0.000<0.05) 的结果显示方程显著, 即在5%的显著性水平下解释变量对被解释变量的联合线性影响是显著的。该模型也通过了异方差和序列相关检验。上述拟合模型即为我们最终所得的失业率对失业保险参保人数和总人数的线性回归模型。

七、模型的解释与几点启示

从上述模型看, 在失业保险参保人数、享受失业保险人数、GDP、人口总数、失业保险金收入额和生产性固定投资总额这些自变量中, 对失业率影响最显著的是参保人数和人口总数。失业保险参保人数和失业率呈负相关, 这说明失业保险对保障失业人员的基本生活、降低失业者的再就业成本具有显著意义, 对就业起到积极的促进作用。人口总数和失业率呈正相关, 说明人口增长给就业带来了不可忽视的压力。虽然, 本文中使用的失业率是城镇登记人口的失业率, 而云南省是一个农业大省, 农村人口占大多数, 然而, 近几年进城务工的农村劳动者人口数的不断攀升, 仍给城镇劳动者的就业带来一定压力。某一地区流动人口的大量增长会在短期内造成该地区劳动力市场的失衡, 对本地区居民就业产生压力, 但流动人口也对本地区经济增长提供了劳动力的支撑。面对由于这种原因造成的失业, 各地区应采取的措施是有效完善劳动力市场、加快劳动力市场的信息化建设、促进经济增长带动就业以降低失业率。模型表明GDP对失业率的影响不显著, 这表明云南省经济增长对降低失业率的贡献不大, 这似乎与奥肯定律相违背, 奥肯定律认为针对整个国家而言, 经济增长会引起失业率的下降。GDP对失业率的影响不显著的原因除了经济增长地区吸引劳动力而造成就业压力以外, 还可能与云南省GDP质量有关。此外, 2000年和2002年的样本点对于模型而言是异常值点, 其异常的原因值得进一步研究。

摘要:本文基于统计年鉴中云南省2000—2011年失业率和与之相关的数据, 运用线性回归方法, 建立了用于描述云南省失业率与相关变量之间定量关系的拟合模型, 并对模型进行了异方差检验、序列自相关分析和异常点的检验。该模型对于探讨造成云南省失业率影响因素具有一定的启示作用。

关键词:失业率,影响因素,线性回归模型

参考文献

[1]程红莉、刘强:区域失业率差异影响因素的实证分析[J].统计与信息论坛, 2003 (3) .

[2]田力:影响失业率的主要因素及降低失业率的对策[J].哈尔滨金融高等专科学校学报, 2003 (1) .

[3]陈幼芳、张天会:云南失业率预测和研究[J].经济问题探索, 2006 (6) .

回归诊断 篇3

1 场景再现

案例1 教师呈现本节课的学习内容和学习目标后, 直接进入主题.展示三线八角的图形, 标示出不同的角, 开门见山明确定义:……的角, 叫同位角, 像∠1 和∠5, ∠4 和∠8;……的角, 叫内错角, 像∠3 和∠5, ∠4和∠6.讲述概念后, 教师小结3种角的图形特点, 之后便是巩固练习、变式练习, 不断地进行习题轰炸, 以达熟能生巧的目的.若有学生不解, 便重复概念, 直至明辨为止.练习过程中, 尤其是图形改变后, 多数学生眉头紧锁, 少见师生互动交流.

案例2 教师首先布置本节课的学习内容, 出示问题:

(1) 什么叫同位角?什么叫内错角?什么叫同旁内角?

(2) 3种角的图形特点是怎样的?

教师要求学生带着问题阅读教材, 自我学习并尝试独立解决课后练习.10 分钟后, 分小组请学生上台扮演教师, 解答上述问题.几个学得较快的学生抢着上台讲解, 遗憾的是自己理解却无法准确表达, 或者只能按照课本说法一字不漏念出来, 讲了甚久依然未能抓住知识本质.下面的学生开始哄闹、出现嘘声.不得已, 教师只好叫停台上的学生, 重新讲解.

2 追因诊断

《数学课程标准》指出, 教师要帮助学生“在自主探索和合作交流的过程中真正理解和掌握基本的数学知识, ”体现以学生发展为本的主体教育观.因此, 教师要让学生自己思考问题, 参与知识的获得过程, 而不是向学生提供现成的知识.

案例1中, 教师直奔主题, 直接讲解概念、归纳3种角的异同之处, 确是讲解透彻.这种做法, 教师比较注重教法的设计, 能快速完成学习内容, 课堂教学能按照教师的预设有序进行.但学生未能真正经历对概念的探索和体验, 其观察、比较、猜想、概括、归纳的过程都让教师专制地取消了, 节省时间的同时, 连学生的积极思考也节省了.学生应有的“火热的思考”被教师所代替, 学生得到的只是“毫无温度的知识”.于是, 对于同位角等概念的形成缺乏体验, 虽然得到知识, 但是因为体验不深刻, 难以内化成自我的认知.所以, 教师讲过的, 学生不一定能理解;教师没讲的, 多数学生必定不理解.

很多老师只是对概念、定理进行简单的照本宣科, 而把更多的时间用在做题上, 一味套用概念解题应付各种考试.张奠宙教授早就批判这种现代教育的功利化, 将之称为“去两头, 烧中段”, 一针见血地指出数学教学中的症状.案例1表面上是高效课堂, 实是剥夺了学生的自主空间、思考能力.学生“听从老师的教诲”, 被教师牵着鼻子走, 而完全体验不到探索的乐趣, 从根本上是为考而学, 彻底成为了“知识的接收器”.长此以往, 学生可能获得暂时性的分数, 但牺牲的是他们对数学的兴趣, 得不偿失.

案例2中, 教师鼓励学生自主学习、自主探索, 发挥学生的能动性, 值得肯定.但是, 对此课而言, 没有教师指导的一厢情愿的探究, 并不符合七年级学生的认知规律.七年级学生形象思维能力比较突出, 处理抽象问题的能力还欠缺, 要从一两个直观图形中, 抽象出几何概念难度较大.少数数学悟性较高或训练有素的学生, 可能达到要求, 但对于大多数学生而言, 显然是不可行的.七年级学生还有一个特点是, 比较喜欢和善于模仿学习.教材呈现出来的都是知识的精华, 文字表述严谨、简洁.3种角均是仅举一例说明概念, 对于多数学生而言, 不知从何模仿, 实难举一反三.自学时, 除了出示的问题外, 没有其它材料辅助思考.而且出示的问题不够细化, 思维的途径缺乏方向, 加之没有具体的学习指导, 双基得不到落实, 最后还得教师重新组织、再次讲解.这是浮于表面的自主探究, 或者是“伪探究”.另一方面, 在对概念没有足够认识之前, 学生分析、讲解出错或者不到位, 又会招致同学的不信任甚至喝倒彩, 这样会严重挫伤上台学生的积极性.

案例2的教师没有直接把概念传递给学生, 有意让学生通过自己的学习发现新知, 却过度放任学生, 忽视教师的引导作用, 有矫枉过正的嫌疑.学习过程中, 学生的观察、思考、推理等活动, 不全是他们能独自完成的, 关键时候还是需要教师给予必要的、适当的点拨.

3 改进策略

建构主义强调:学习不是由教师把知识简单地传递给学生, 而是由学生自己建构知识的过程.而这种建构是无法由他人来代替的.概念的建立必须有个形成过程, 在这个过程中去揭示知识的内在联系, 强化知识体系, 才能形成牢固的知识结构.加强定义发生过程的教学才是符合学生认知规律的教学.学生学习的认识过程与人类获取知识的过程是基本相同的, 需要经历从具体到抽象、从感性到理性的循序渐进的过程.

根据概念的形成规律, 改进策略如下:

3.1 精心设置问题, 驱动学习动机

通过设置情景, 提出有思考路径、指向明确的问题, 造成认知冲突, 激发探究新知的动力.

可创设问题情境, 让学生欣赏直线相交成角的实物图片.

再引导学生思考, 当更多的直线相交时, 会出现怎样的情况, 让学生根据自己的理解和认识, 动手画图, 看3条直线的位置有哪几种.

展示学生所画图形, 大概有以下几种:

(4) , (5) , (6) 3 个图形之间有什么样的关系?通过老师的点拨, 学生很容易发现图形 (5) , (6) 和图形 (4) 是一样的, 都是3条直线两两相交且不交于一点的情况, 引发思考:除了对顶角、邻补角之外, 还有一些角与角之间是什么关系.

通过图片展示导入新课, 使数学学习与学生的生活融合起来, 从学生的生活经验和已有的知识背景出发, 容易激发学生浓厚的学习兴趣, 让他们在生活中去发现数学、探究数学、认识并掌握数学, 同时为引入新课作了铺垫.

3.2 借鉴西蒙理论, 予以学法指导

教无定法, 但是任何一种教法、学法, 都离不开教师的指导.否则, 学生极易偏离方向, 浪费时间, 事倍功半.

人类的学习方式是多种多样的, 一般可分为示教学习 (lecture learning) 、操练学习 (drill learning) 和自适应学习 (adaptive learning) 3 种类型.美国认知科学家西蒙 (H.A.Simon) 与中国科学院心理研究所的朱新明教授合作, 探讨出自适应学习的一种重要形式———“例中学和做中学”的示例演练学习, 并提出了一整套有效促进自适应学习的原则和方法.其教学思想是根据学生获取知识的心理机制, 以有指导的发现法、引导学生进行主动的学习, 使他们当堂消化知识并能运用这些知识解决具体问题.

根据西蒙教学理论“例中学和做中学”的理念, 设计同位角导学案, 问题编排如下:

(1) 如图1, ∠1 和∠5, 分别在直线AB, CD的___, 在直线EF的___.∠1和∠5是同位角.

(2) ∠2和∠6, 分别在直线AB, CD的___, 在直线EF的___.∠2和∠6是同位角.

(3) ∠3和∠7, 分别在直线AB, CD的___, 在直线EF的___.∠3和∠7是___角.

(4) 图1中的同位角还有___和___.

小结:___的一对角叫同位角.

后面依此方法解决内错角、同旁内角的概念.

学生通过示例学习, 加上及时的反馈, 在题组演练中逐步发现同位角、内错角、同旁内角的位置特点, 进而体会概念的形成.通过“例中学和做中学”, 学生可以不必经过陈述性知识阶段而是通过程序式获得感知.学生会逐步熟悉问题情境中的条件线索, 从而发展出基于条件再认识方法的问题解决技能.这是学生从演练到顿悟的发现式学习, 是一种人类自适应学习, 它是典型的现场认知行为.它既能让学生在发现学习中体验成功的快乐, 又能获得大量的隐性知识, 增强题感, 培养学生的直觉思维, 这种自主学习发现的知识印象深刻, 有利于知识的记忆、保持和提取, 它有效地促进了学生对知识的获取和认知技能的发展.导学案中的问题编排、设置, 遵循学生的认知规律, 按照“低起点、小步子”循序渐进的原则进行, 因此学生在演练中进行的有指导的发现法学习更容易见成效.

3.3 合作互助学习, 共享成功喜悦

解决概念后, 让学生观察、讨论交流、概括3种角的图形特点, 便于记忆, 也多一条路径让学生理解3种角的异同.再由学生提出困惑, 学生互相补充互解疑惑, 再由教师点评, 并举反例, 通过比较来强化理解, 深化概念.巩固练习时, 可让学得快的教慢的, 小组内互教互助, 以点带面帮助大部分学生落实知识点, 共同体验学习新知的成功感.概念的教学, 尤其是抽象概念的教学, 应是学生在教师的引导下, 在问题的启发下, 积极地参与观察、寻求概念的形成过程, 主动学习、积极思考, 变被动接受为主导探索, 既发挥教师的主导作用, 又体现学生的学习主体地位.死记硬背抽象的数学概念, 不但难收效果, 还会令到学生觉得数学枯燥乏味, 逐渐失去对数学的乐趣.反之, 让其多感官的参与活动, 动手动脑, 又有亲身体验, 定会使其乐在其中, 不知不觉中加深对概念的理解.

参考文献

[1]李铁安.义务教育课程标准 (2011年版) 案例式解读:初中数学[M].北京:教育科学出版社, 2012.

[2]伊红, 钟旭天, 陈士军.初中数学教学案例专题研究[M].杭州:浙江大学出版社, 2005.

[3]朱新明, 李亦菲, 朱丹.人类的自适应学习——示例学习的理论与实践[M].北京:中央广播电视大学出版社, 1998.

[4]谢明初, 朱新明.认知心理学视角下的数学教育[J].数学教育学报, 2007, (2) .

回归诊断 篇4

1资料与方法

1.1临床资料

100例肺癌组病例为2012年1月 -2013年12月在本院住院患者。其中,男73例,女27例,年龄35~77岁,平均48岁。所有病例均经临床病理确诊, 其中,腺癌41例,鳞癌37例,小细胞癌22例;正常对照组为本院体检的健康成人,共30例,其中,男19例,女11例,年龄24~60岁,平均46岁。肺癌组和健康对照组间的年龄、性别具有可比性。

1.2检测方法

清晨空腹抽取静脉血3 ml,分离血清,采用Roche E170电化学发光仪测定CEA,酶免法测定SCC-Ag,免疫比浊法测定SF,所用试剂均为相应配套试剂,严格按说明书操作,各指标正常参考范围为CEA:0.0 ~5.2μg/L,SCC-Ag:0.0 ~1.5μg/L,SF: 女10.0~120.0μg/L;男20.0~300.0μg/L。

1.3统计学方法

应用SPSS 13.0软件对数据进行统计分析。非正态分布者的指标给予对数转换,两两比较采用LSD-t检验;两独立样本的计量资料采用t检验;计数资料以百分率表示,采用 χ2检验。检验水准为 α=0.05,用Logistic回归筛选变量并建立回归方程, 对新变量及各单项指标进行ROC曲线分析。

2结果

2.1 3种肿瘤标志物在肺癌组与正常对照组中的分布

经分析发现血清CEA、SCC-Ag和SF浓度呈偏态分布,以中位数和范围分别表示其在两组人群中的分布情况,见表1。指标给予对数转换后呈正态分布,经分析肺癌组3种肿瘤标志物与正常对照组比较,差异有统计学意义(分别为t =4.21、P =0.000;t =3.02、P =0.000;t =9.85、P =0.000)。

2.2 3种肿瘤标志物在不同病理类型肺癌中的分布

不同病理类型肺癌之间,腺癌组CEA水平明显高于鳞癌组和小细胞癌组 (F =12.23,P =0.000),鳞癌组SCC-Ag水平明显高于腺癌组和小细胞癌组(F =16.13,P =0.000),而SF水平在3组肺癌间差异无统计学意义(F =0.51,P =0.561)。见表2。

2.3 3种肿瘤标志物在肺癌不同临床分期的分布

经分析,Ⅲ+Ⅳ期3种肿瘤标志物水平明显高于Ⅰ+Ⅱ期,分别为t =2.98、P =0.018;t =3.30、P = 0.002;t =3.90、P =0.001。见表3。

注:1)与鳞癌、小细胞癌组比较,P <0.01;2)与腺癌、小细胞癌组比较,P <0.01

注:1)与Ⅰ+Ⅱ期比较,P <0.05;2)与Ⅰ+Ⅱ期比较,P <0.01

2.4 3种肿瘤标志物在肺癌不同淋巴结转移组的阳性率比较

经手术证实,100例肺癌患者中有65例有淋巴结转移,无淋巴结转移者35例,χ2检验分析发现, CEA和SCC-Ag在转移组阳性率比无转移组高(分别为 χ2=12.60,P =0.001;χ2=5.24,P =0.021),而SF在两组间阳性率比较差异无统计学意义(χ2=0.47, P =0.490)。结果见表4。

2.5 3种肿瘤标志物对肺癌的诊断价值

经统计分析,CEA、SCC-Ag和SF对肺癌诊断的敏感性分别为47.0%(47/100)、47.0%(47/100)和70.0%(70/100),特异性分别为93.3%(28/30)、96.7% (29/30)和76.7%(23/30),而3项联合检测敏感性为92.0%(92/100),特异性为76.7%(23/30)。

2.6 3种肿瘤标志物的回归分析

经Logistic回归分析,3种肿瘤标志物均与肺癌诊断密切相关(P <0.01),设X1=CEA,X2=SCC-Ag, X3=SF,得肺癌预测概率值回归模型Y=1/[1+EXP (2.261 X1+3.459 X2+4.267 X3-1.082)],生成一组新变量Y。见表5。

2.7 3种肿瘤标志物和Logistic回归生成新变量Y的ROC曲线分析

Y的ROC曲线下面积AUC明显大于3种肿瘤标志物任一指标的AUC。见表6和附图。

注:1)与无转移组比较,P <0.01;2)与无转移组比较,P <0.05;3) 与无转移组比较,P >0.05

3讨论

CEA主要存在于胎儿消化道上皮组织、胰腺和肝脏,在肿瘤患者组织中CEA能分泌入血液和淋巴液中,引起血清中CEA水平升高,在肺癌患者中阳性率亦较高[2,3]。SCC-Ag是鳞状细胞产生的一种特异性抗原,与鳞状细胞癌的发生发展关系密切。文献[4,5,6]报道,血清SCC-Ag水平与疾病分期、切除程度、肿瘤侵袭程度、是否有淋巴结转移以及预后密切相关;血清铁蛋白是一种无机铁化合物的糖蛋白,是铁缺少的最为敏感的指标。因此,多数学者认为[7,8]SF作为检查机体Fe含量最灵敏的一项指标。最近的研究显示[9,10]出SF一些新的除铁贮存以外的功能, 如:已经识别出SF受体、转SF受体1,且发现肿瘤患者血清SF水平升高,它虽然不是肺癌的特异诊断指标,但对肺癌的诊断敏感性较高,在临床上结合其他检查,对肺癌诊断有较好的应用价值。

本文资料显示,肺癌患者血清CEA、SCC-Ag和SF水平明显高于正常组(P <0.01),并且随着肿瘤临床分期的升高而升高;CEA和SCC-Ag在有淋巴结转移组阳性率比无淋巴结转移组高(P <0.05),提示该3项肿瘤标志物的血清水平变化可用于肺癌的诊断,并可作为判断病情进展、监控复发和转移的指标。本资料中,CEA在肺腺癌中阳性率最高,SCC-Ag在肺鳞癌中明显高于腺癌和小细胞癌,各组比较差异有统计学意义(P <0.01),表明CEA和SCC-Ag对肺癌临床诊断分型有指导意义,与文献报道[11]一致。

Logistic回归属于概率型非线性回归,具有判别和预测功能。经Logistic回归分析,3种肿瘤标志物均与肺癌诊断密切相关 (P <0.01),逐步筛选出SCC-Ag为最佳单一指标;在标志物组合模式的拟合优度检验中,CEA+SCC-Ag+SF组合模式的正确诊断指数最高。因此,使用Logistic回归模型可客观地实现特异度和敏感度的平衡。经ROC曲线分析显示,选择CEA、SCC-Ag和SF等肺癌常用的肿瘤标志物通过Logistic回归构建的回归模型与ROC曲线结合,建立新变量模型的AUC为0.905,95%CI为0.835~0.975,均高于单一指标,且诊断的敏感度优于单项指标。

回归诊断 篇5

1 资料和方法

1.1 一般资料

选取肺癌患者99例,并将其作为肺癌组。纳入标准:(1)所有患者均符合国际抗癌联盟肺癌诊断标准[5];(2)均经临床病理确诊;(3)肿瘤-淋巴结-转移(TNM)分期为Ⅰ~Ⅳ期者[6];(4)患者及家属均知情同意,并签署知情同意书。排除其他类型的原发性恶性肿瘤及心、肝、肾等功能障碍者。在上述99例患者中,男70例,女29例,年龄34~75岁,平均(47.9±4.1)岁。所有患者均经临床病理确诊,并将肺癌组患者分为腺癌组、鳞癌组、小细胞癌组,各为39、37、23例。另外,选取南通市肿瘤医院体检中心29例健康人作为对照组,其中男18例,女11例,年龄31~76岁,平均(47.4±3.9)岁。对上述肺癌组及对照组患者在性别、年龄上进行对比结果显示差异无统计学意义(P>0.05),具有可比性。

1.2 样本采集

所有受试人员均清晨8:00空腹抽取静脉血液5 ml,高速低温离心10 min,取血清,以备测定CEA、SCC-Ag和SF用。

1.3 指标检测方法

采用罗氏cobase 601电化学发光仪对CEA进行测定,所需试剂盒由上海酶联生物科技有限公司提供;采用酶联免疫吸附测定法对SCC-Ag进行测定,所需试剂盒由上海沪震实业有限公司提供;采用免疫比浊法对SF进行测定,所需试剂盒由北京东方迈润医疗器械公司提供。上述操作步骤均严格按照试剂盒说明进行。

1.4 统计学处理

使用SPSS 20.0软件进行统计分析,符合正态分布的定量指标采用±s表示,组间比较使用t检验,多组间对比采用方差分析;计数资料用百分率表示,采用χ2检验。用Logistic分析建立方程,并进行ROC曲线分析。P<0.05表示差异具有统计学意义。

2 结果

2.1 肺癌组及对照组肿瘤标志物CEA、SCC-Ag及SF的水平对比

与对照组相比,肺癌组肿瘤标志物CEA、SCC-Ag及SF水平均明显升高且差异具有统计学意义(P<0.01)。见表1。

μg·L-1

2.2 不同病理类型肺癌患者中3种肿瘤标志物CEA、SCC-Ag及SF的水平对比

腺癌组患者CEA水平明显高于鳞癌组及小细胞癌组且差异具有统计学意义(P<0.01),鳞癌患者SCC-Ag水平明显高于腺癌和小细胞癌患者且差异具有统计学意义(P<0.01),而3种病理类型肺癌患者间SF水平差异无统计学意义(F=0.529,P>0.05)。见表2。

μg·L-1

a与腺癌组相比,P<0.01;b与鳞癌组相比,P<0.01

2.3 在肺癌不同分期3种肿瘤标志物CEA、SCC-Ag及SF的水平对比

与Ⅰ+Ⅱ分期相比,Ⅲ+Ⅳ分期3种肿瘤标志物CEA、SCC-Ag及SF明显升高且差异具有统计学意义(P<0.05或<0.01)。见表3。

μg·L-1

2.4 肿瘤标志物CEA、SCC-Ag及SF对肺癌的诊断价值对比

以对照组为参照,CEA、SCC、SF对肺癌的敏感性分别为46.5%、46.5%、70.0%,特异性分别为93.1%、96.6%、86.6%,而3项联合检测的敏感性为89.9%,特异性为75.9%。见表4。

%

2.5 肿瘤标志物CEA、SCC-Ag及SF的Logistic分析

结果显示,CEA、SCC-Ag及SF与肺癌均具有相关性(P<0.01),假定X1=CEA、X2=SCC-Ag、X3=SF,则得出回归方程Y=1/[1+EXP(2.236 X1+3.461X2+4.258 X3-1.083)],生成一组新变量Y。见表5。

2.6 肿瘤标志物CEA、SCC-Ag和SF及新变量Y的ROC分析

CEA诊断肺癌的AUC为0.699,SCC-Ag的AUC为0.711,SF的AUC为0.831,Y的AUC为0.902,Y的AUC高于CEA、SCC-Ag和SF(Z=2.843、2.178、1.974,均P<0.05)。见表6、图1。

3 讨论

肺癌是临床常见的疾病,发病率和死亡率较高,给人们的健康带来了很大的威胁[7],早期发病不太明显,容易出现漏诊,待被确诊时大多数患者已到了癌症的中晚期。因此,对肺癌患者进行早期诊断意义重大[8]。研究发现,CEA、SCC-Ag、SF是临床常见的肿瘤标志物[9],在肺癌的诊断中日益受到关注[10]。为探讨CEA、SCC-Ag、SF联合检测在肺癌中的价值,本研究采用Logistic回归及ROC曲线对其进行评价。

CEA是一种人类胚胎抗原特异性酸性糖蛋白[11],常见于结肠癌、乳腺癌中,另外在肺腺癌中也有明显表现[12]。血清SCC-Ag是从子宫颈癌中分离得到的肿瘤相关抗原(TA-4)的提纯亚单位[13],在肺、咽、食管等肿瘤中也有发现,特别是鳞状细胞癌。研究[14]发现SF在恶性肿瘤细胞中有明显表达,虽然临床不把SF作为肺癌的特异性诊断指标,但具有较高的敏感性[15],与其他检查的联合应用可以用于肺癌的诊断且价值较高。

本组研究结果显示,与对照组相比肺癌组3种肿瘤标志物CEA、SCC-Ag及SF水平均明显升高,提示CEA、SCC-Ag及SF 3种肿瘤标志物的检测可用于肺癌的诊断。腺癌组患者的CEA水平明显高于鳞癌组及小细胞癌组,且差异有统计学意义,鳞癌患者SCC-Ag水平明显高于腺癌及小细胞癌患者,且差异有统计学意义。与Ⅰ+Ⅱ分期相比,Ⅲ+Ⅳ分期3种肿瘤标志物CEA、SCC-Ag及SF明显升高且差异有统计学意义。提示CEA、SCC-Ag及SF肿瘤标志物的血清水平有助于判断病情进展。以对照组为参照,CEA、SCC-Ag、SF对肺癌的敏感性分别为46.5%、46.5%、70.0%,特异性分别为93.1%、96.6%、86.6%,而3项联合检测的敏感性为89.9%,特异性为75.9%。经Logistic回归分析,3种肿瘤标志物均与肺癌诊断密切相关。经统计分析可知,Y的ROC曲线的AUC明显大于3种肿瘤标志物CEA、SCC-Ag及SF任一指标的AUC。提示Logistic回归及ROC曲线分析有助于提高肺癌的诊断准确性。

综上所述,血清CEA、SCC-Ag和SF 3项指标对肺癌诊断意义重大,同时借助Logistic回归及ROC曲线分析可提高诊断的准确性。然而,由于本研究所用样本量有限,加之研究条件的禁锢,疏漏之处在所难免,因此,有望今后扩大样本量对其进行更深入的研究,以期为临床寻求更加有力的证据。

摘要:目的:探讨肺癌患者血清癌胚抗原(CEA)、鳞状细胞癌抗原(SCC-Ag)和铁蛋白(SF)经Logistic回归及ROC曲线综合分析的诊断价值。方法:采用电化学发光仪对受试者的CEA进行测定,采用酶联免疫吸附测定法对受试者的SCC-Ag进行测定,采用免疫比浊法对受试者的SF进行测定,并对其进行Logistic回归及ROC曲线综合分析。结果:与对照组相比,肺癌组3种肿瘤标志物CEA、SCC-Ag及SF水平均明显升高且差异具有统计学意义(P<0.01)。腺癌组患者CEA水平明显高于鳞癌组及小细胞癌组且差异具有统计学意义(P<0.01),鳞癌患者SCC-Ag水平明显高于腺癌和小细胞癌患者且差异具有统计学意义(P<0.01),而3种病理类型肺癌患者间SF水平差异无统计学意义(F=0.529,P>0.05)。与Ⅰ+Ⅱ分期相比,Ⅲ+Ⅳ分期3种肿瘤标志物CEA、SCC-Ag及SF明显升高且差异具有统计学意义(P<0.05或<0.01)。以对照组为参照,CEA、SCC-Ag、SF对肺癌的敏感性分别为46.5%、46.5%、70.0%,特异性分别为93.1%、96.6%、86.6%,而3项联合检测的敏感性为89.9%,特异性为75.9%。Logistic分析结果显示CEA、SCC-Ag及SF与肺癌具有相关性(P<0.01)。经统计分析可知,Y的ROC曲线的面积AUC明显大于3种肿瘤标志物CEA、SCC-Ag及SF任一指标的曲线下的面积AUC。结论:血清CEA、SCC-Ag和SF 3项指标对肺癌诊断意义重大,同时借助Logistic回归及ROC曲线分析有助于提高诊断的准确性。

【回归诊断】推荐阅读:

理性回归07-18

立足回归05-14

回归算法05-15

回归方法05-24

回归真实05-26

回归05-30

回归检验06-06

回归简约06-20

本色回归06-25

稳健回归07-28

上一篇:网络文化品牌下一篇:经济效益分析与评估