朱家祥教授散文读后感

时间:2023-04-24 22:39:10 读后感 我要投稿
  • 相关推荐

朱家祥教授散文读后感

  朱家祥教授散文读后感 这里的散文就是指非学术文章,或者是非技术性的分析。读后感也不是什么长篇大论,而是一点小体会。 1,·  对朱教授“简单的机率运算”自己动手算了一算。 A=要吸烟  B=肺癌 已知:P(A)=0.376  P(B)=2.2/10000  P(A|B)=0.7 求解:P(B|A), 解: P(B|A)=P(A|B)*P(B)/P(A)=0.7*2.2/10000/0.376=0.00041也即是说已知一人吸烟,在不考虑其它因素的条件下,那么他得肺癌的可能性为0.041%。注意这同70%的区别有多大。   2,·  想起原来看过的一则新闻,自己还就此写过博客。新闻大概是讲:某种非法网站与少年犯罪的问题。该节目的大致逻辑是:青少年因为浏览改种类型的非法网站,于是产生犯罪。因此,我们应该关闭该类网站。关于犯罪与网站之间因果关系的证据在于记者采访少管所,发现几乎所有的少年犯都浏览过改种类型的网站。政府依法关闭这种类型的网站,我们当然坚决拥护。但是这则新闻报道却有着与吸烟-致癌这一论述的相似问题。首先我们要注意,节目中提供的是哪一类概率。如果我们像吸烟-致癌一例中一样,令A=浏览某种网站  B=犯罪的话,那么节目中只提供了P(A|B),也即我们已知一个人是少年犯,那么他浏览某种网站的概率。注意该报道中丝毫也没有讲到我们实际上真正关心的问题P(B|A)——已知一少年浏览过该类型网站,那么他犯罪的概率是多大。而我们自己也算不出,因为根本就没有提供P(A),也即所有少年中,究竟有多少人浏览过该类网站。第二,该报道 也存在非随机取样的问题。在WOOLDRIDGE计量经济学导论第17章中专门讲到了取样的问题。非随机取样,如果能满足外生取样的条件,那么估计量也可能是无偏的,或者是一致的。但是这里的选样,只选取少年犯作为样本,这里的选样标准显然和扰动项相关,这里的估计肯定是有偏的。第三,这里明显的存在遗漏变量偏误。我们只以浏览网站与否这一个解释变量来解释是否犯罪,这样的回归几乎肯定存在遗漏变量偏误。其实,从WOOLDRIDGE的犯罪计量学的简单介绍中,我们都可以看到,犯罪率的解释变量通常有,如定罪率、失业率等等。我们就少年犯罪可以想象到的还可能包括,辍学率等等。这些变量不控制,根本无法得出因果推断。 3,·  立场与论证的区别。注意朱教授是赞成环保和戒烟的,但是反对他们的论证。这两者之间并不矛盾。当然,从这里或许我们也看到如何用所学知识去批判性的思维,拒绝媒体的洗脑。朱教授的这两篇文章并不深奥,但却很有意义。 以下是朱教授的原文: 吸烟致癌? 如果这个叙述为真, 其中的因果关系不言可喻: 吸烟是因, 肺癌是果. 要检定这个因果关系, 定义被解释变量为Y=0 或 1 (Y=1, 代表有肺癌; Y=0, 无肺癌). 解释变量为X1, X2,…其中X1是每日吸烟的数量(单位, 支/天). 想法很简单: 用横剖面数据来估计二元回归如Logit 或Probit, 然后检定X1系数的显着性. 如果显着, 我们不但可以确认此因果关系, 还可以计算, 例如, 每日吸烟量为10支的人(X1=10), 会比完全不吸烟的人(X1=0)提高了多少得肺癌的机率.  二个重点: <!--[if !supportLists]-->(1)    <!--[endif]-->如果除了X1之外的其他变量, X2, X3,…(其他可影响得肺癌的因子)没有选好, X1系数的估计将产生偏误(inconsistency), 于是显着性检验变得毫无意义, 因果关系将受到扭曲. <!--[if !supportLists]-->(2)    <!--[endif]-->横剖面数据必须要避免取样的偏误(sample selection bias). 样本一定要包含有肺癌及无肺癌这二类的观察值.  在这二个问题上, 哎…多少人犯了错误!! 在官方与非官方讨伐吸烟的声明中, 我们看到的全是一面倒的言论. 血淋淋吸烟有害的数据根本就是统计的谎言. 但是一般人没有统计知识, 任由媒体操弄洗脑. 就算没有统计知识, 运用常识推断, 也不至于对媒体的报道, 毫不犹豫的照单全收. 我不是鼓吹吸烟无害, 只是感慨媒体的强大洗脑能力. 类似的问题, 二氧化碳导致温室效应的说法也是统计的谎言, 一般人也被洗脑洗的没脑了. 别弄错了, 我也是赞成环保的. 但是始终没看到合理的统计证据. 这些把温室效应当口号的人居然还可以预测200年后地球的气温会上升若干度!! 你相信有人可以预测如此遥远未来的事? 你相信只用二氧化碳排放量就可以预测200年后地球的气温??我是根本不相信的. 不然, 把预测模型端上来辩论呀! 把预测标准误也公布嘛…我非常怀疑他们有预测的标准误. 吸烟与肺癌的关联(Association, or correlation)早在1940年代就观察到不少死于肺癌的人, 他们的肺都是黑黑的. 再一追究, 发现这些人都有吸烟. 于是吸烟与肺癌的相关性就产生了. 但是从相关性到因果性, 基本统计学告诉我们, 这之间是有极大的距离. 例如, 假设数据又显示, 死于肺癌的人大都居住在城市. 请问城市是否为肺癌的因?? 口才好的会说, 城市不是因, 城市的空气污染才是因! 是吗? 我也可以想象另一个原因, 住在城市的压力大,生活步调比较紧张, 所以致癌. 说真的, 我可以有一大堆想当然耳的原因. 这些都可以和肺癌有相关性, 但却不一定有因果性. 请问: 一个住在城市的吸烟者死于肺癌, 究竟何者才是因? 你要如何解释一个住在乡下的吸烟者没有肺癌? 这些关于因果性的问题, 仅靠相关性(不管它多么显著)是无法回答的. 关键是: 如果要探讨吸烟与肺癌的因果关系, 其他X2,X3,...的变量若没控制好, 终究是徒劳无功的. 还有, 别忘了 “取样的偏误”, 只检视死于肺癌的人的样本能有说服力?  美国官方, US National Institute of Health的 National Cancer Institute (http://www.cancer.gov/cancertopics/factsheet/Tabacco/cancer)在首页上就看的到: "Cigarette smoking causes 87% of lung cancer death." 这就是误导的统计数字! 计算方法很简单.就从死于肺癌的人计算他们之中有吸烟的比例. 这种数据也拿出来忽弄人?? 我干脆也说空气污染造成了100%肺癌死亡. 于是要活命的全搬去乡下吧! 因果性是要有理论的. 可是,吸烟导致肺癌的过程仍然没有医学根据(有谁知道更新的医学发现,还请告知). 据我所知, 没有人能解释吸烟是如何导致肺癌. 假设, 有一种致癌因子X会因为吸烟而更活跃, 请问, 肺癌的因是致癌因子X, 还是吸烟? 答案当然是致癌因子X。可是当致癌因子X没发现之前,吸烟就会被误认为是因。医学上若不把肺癌搞清楚, 仅用统计数据分析来支持吸烟会致癌是有很大的困难度的. 如果在 “所有” 吸烟人口中有87%的人得了肺癌, 不需要太多的统计分析, 我也会很认真地去考虑因果关系存在. 但是就美国的数据来看,在所有吸烟人口中大约有6%的人得了肺癌. 另外有94%没有耶!! 就从这个数据来看, 你认为吸烟与肺癌因果关系有多强?? 在这6%的人,他们的饮食,居住环境,运动习惯. . .有多少异同?谁可够勇敢地立下结论说:他们全是因为吸烟导致肺癌?同样地, 纵然死于肺癌的人全住在城市, 我们也得看看“所有”的城市人口有多少比例是死于肺癌. 有思考的人都会明白这个简单的道理吧!  吸烟致癌的统计分析大致上比较了二种样本: 吸烟人样本和不吸烟人样本(controlled sample). 事实上, controlled sample根本没control好. 也就是说, X2,X3…等其他因子没控制好. 这样的比较分析, statistically unsound. 还请高人提供这方面有严谨的统计分析的期刊论文参考. 其他有“取样的偏误”的分析, 根本不值一看. 用这二个重点(其他致癌因子的控制,与取样的偏误)来批判, 我还未看到可接受的统计分析. 我写这些, 并没有接受烟草公司的赞助. 我赞成戒烟(不是因为致不致癌,而是吸烟会上瘾), 也赞成环保(我讨厌脏乱)。但是, 我看不慣媒体以及卫道人士用粗造的统计数据来洗大家的脑. 算是職業病吧!     后记 -May 2nd 吸烟致不致癌? 我不知道. 因为我只是从统计学的角度来看这个问题, 只是 “一个” 角度而已. 仅由一个角度是不好断言吸烟致不致癌的. 我很清楚以偏槪全的危险. 我想说的只是: 现有的统计证据不足以支撑吸烟致癌的主张. “不足以支撑” 和 “反对” 是有很大的距离的.我完全没有误导吸烟无害或鼓励吸烟的意思. 有个评论说的不错: “吸不吸烟是个人价值取向问题,媒体的舆论是为了引导健康的生活方式.” 或许我该说: 吸烟致癌是媒体善意的统计谎言吧. 然而, 媒体在其他很多问题上脱不了misinform的责任, 温室效应/全球暖化就是另一个例子. 从婚外情到肺癌 标签: 条件机率  根据 “调查”, 有过婚外情的男人, 其中有70% 认为自己的婚姻不幸福. 首先,基于这个统计数据,你可以说婚姻不幸福导致了婚外情吗? (如果你认为 “可以”, 我觉得男人分明是居心不良地把婚外情的责任推卸了一半给女人, 因为婚姻的维持毕竟是二个人共同的事). 调查又说,每一万个中国男人中有2.2个坦诚有过婚外情; 同时, 有37.6% 的中国男人自认婚姻并不幸福. 这些数据 “可以” 说明什么?? (1)   如果我站在天安门广场, 随意遇见一位陌生的男人, 我们可以估计他有婚外情的机率是 2.2/10000. (2)   如果我遇见一位脸上写着婚姻不幸福的男人, 他有婚外情的机率是多少? 是70% 吗? 绝对不是! 请注意: 有婚外情的男人估计是有70%的机率是个婚姻不幸福的男人. 但是, 婚姻不幸福的男人会有多少机率发生婚外情呢? 这完完全全是另外一个问题! 用统计术语来说, 若A=婚姻不幸福, B=发生婚外情, 条件机率 P(A|B)=0.7. 然而, 我们更关心另一个条件机率, P(B|A), 即是: 一位自认婚姻不幸福男人, 他有婚外情的机率是多少? 这二个条件机率绝不相同, 无庸争论! 简单的机率运算得到: (1)  一位自认婚姻不幸福的男人, 他有婚外情的机率是 4/10000. 请比较一下, 这和被误解的70%的有多巨大的差异! (2)  一位自认婚姻幸福中国男人, 他有婚外情的机率是 1.06/10000. (3) 

【朱家祥教授散文读后感】相关文章:

祥字怎么读04-23

刘秀祥人物事迹10-11

刘秀祥先进事迹01-12

朱之歌作文08-11

朱湘的资料12-29

朱厚熜07-21

教授邀请函02-20

于丹教授人生格言04-05

给教授的感谢信12-24

2021刘秀祥人物事迹10-11