前言:一篇好文章的诞生,需要你不断地搜集资料、整理思路,本站小编为你收集了丰富的妈妈和儿子主题范文,仅供参考,欢迎阅读并收藏。
公证处以协议不合法为由不予公证,妈妈含泪在“绝情书”上按指印
2008年10月27日上午10时许,在河南省郑州市南阳路和生产路交叉口王丽的五金店里,王丽和豪豪的继父王涛刚从郑州市公证处回来。王丽手里拿的这份协议,是一份和儿子的“绝情书”。协议上显示:王丽从此和儿子豪豪断绝母子关系,豪豪由其姑姑刘红抚养,长大后对母亲王丽不履行赡养义务。这份协议书上,签着母亲王丽、儿子豪豪和姑姑刘红的名字。
因为这份协议不合法,郑州市公证处不予公证。为了让协议具有效力,刘红和王丽在签字上面按上指印。王丽匆匆在一张协议上按了指印后,突然咬着嘴唇,泪珠大颗大颗掉了下来,她死活不愿在另外两张上面按了,并开始大骂她的丈夫王涛。门了一圈邻居,大家七嘴八舌劝道:“何必这样呢,两家人商量个办法,一块来照顾孩子。不管怎样,要为孩子想想。”王涛把其他人往店外推:“没事没事,放心吧,她现在不按,回头我会劝她。”
王丽捂着脸哭了,指着王涛说:“我什么都不知道,我不当家,有什么事你们问他!”然后,把自己反锁在屋里。
姑姑指责侄子的亲妈没尽到做母亲的义务,侄子的继父称对签协议没有反对意见
12岁的豪豪是河南省郑州市铭功路小学三年级学生。瘦瘦的,很腼腆的样子。按理说,和他同龄的孩子早已上了五六年级了,而他却成了班上的“大龄”学生。
豪豪1岁多时,父母就协议离婚了。豪豪的姑姑刘红说,豪豪父母离婚后,豪豪一直跟着爸爸生活,以前,她也常帮弟弟照顾这个侄子。“他除了不是我生的,跟我的孩子都一样了。”豪豪6岁时,被送到河南省登封市一家武校学习武术,每年只能回来一两次。在这期间,豪豪的母亲王丽和豪豪的父亲分别组织了新家庭。
2008年1月,豪豪的父亲突然去世了。去世前,他留给家里几份遗嘱,其中一份写着“存折上留有1万元,拜托姐姐刘红照顾豪豪。”这1万元钱,刘红说她替孩子存着,等到豪豪18岁时就交给他。
2008年夏天,豪豪从武校退学,插班到铭功路小学上三年级。而回家后的豪豪跟谁过,就成了一个问题。刘红自己有3个孩子,其中一对双胞胎正在上高中,而王丽在大石桥开了个五金店,有能力照顾豪豪。刘红认为王丽根本没有尽到做母亲的义务。“前两天豪豪因为一点事和同学打架,老师让叫家长,豪豪给母亲打电话,王丽却不接,豪豪就离家出走了3天。”刘红说,听说豪豪不见了,他们一家人都急疯了,发动亲戚邻居都上街找,她也给王丽打电话,但打了五六十个,王丽都不接。他们又到王丽的店里找,谁知王丽他们听说豪豪不见了,竟无动于衷,还说不用找,过几天就回来了。
刘红觉得,把孩子送回王丽那里她不放心,就要求王丽每个月出600元,作为孩子的抚养费,由她来照顾孩子。刘红说:“但他们不同意,要双方各出一半。你们想想,让我出一半合理吗?”
因为双方谈不拢,大家就共同写了这样一份断绝母子关系的协议书。刘红说,王丽既然不愿抚养孩子,不如干脆由她来抚养。豪豪的继父王涛说,他们没反对意见,这样也是为了孩子好,一年多来,孩子夹在中间,已经够难受了。
王涛说,他们也给豪豪尽义务了,豪豪上学的4000元费用是他们出的,还给豪豪买了500多元的自行车。对于那次豪豪出走他们不接电话,王涛说只是因为生孩子气,“他非要穿名牌鞋,要100多元一双的。孩子出走,按我的教育方法,出去几天自然会回来,如果出走一次就满足孩子一次,那还咋教育?”
豪豪表示愿意跟姑姑,律师认为姑姑可申请抚养孩子
豪豪坐在椅子上,经常会不经意地皱眉。对于双方的争吵,他低着头,漠不关心的样子。问他想跟谁过,他开口就说:“愿意跟姑姑。”豪豪说,他总是会特别想妈妈,但每次去找妈妈时,一定会引发妈妈和继父的一场大战,“每次去,他们都吵架,我再也不愿上门了。”
豪豪还说,他不想去的另一个原因是,一去继父就说他“又来混饭吃”。他说,有一次他的鞋子破了,想让妈妈买一双,并没有说要名牌鞋。但妈妈没给买,最后姑姑给买了一双。
豪豪低着头,把红领巾反复缠在手里玩。他说他想上学,特别喜欢在学校,继父喜欢玩游戏和打麻将,妈妈每次不仅不给他辅导功课,还经常把他往麻将桌上带,“我不喜欢那里。”
豪豪的姑姑说,如果协议无效,为了孩子她会考虑走法律途径。对此,河南春秋律师事务所律师回新生说,因为豪豪的姑姑已有3个孩子,不具收养条件,她可以申请抚养孩子,但不能形成收养关系。收养关系不是一种单独的财产关系,而是一种民事行为,需办理收养登记手续,还需要收养人、被收养人以及送养人都符合有关的法定条件。
1、首先打开机顶盒,选择遥控器的设置,输入1000或6321进入。
2、找到网络设置,输入wifi密码,然后记录一下IP地址。
3、解压附件中的stb 7.5.8,运行StbCfgTool_Crack.exe,按下图,先点下1的按钮,获取注册码,接着将2中的所有字符全部复制,ctrl+c,然后选择Next。
4、在框中粘帖刚刚的注册码,输入机顶盒的IP地址,选择连接,接着打开ADB。
5、打开TV盒子助手,输入对应的盒子IP地址,连接。
1、儿子和父亲打架是不正常的。要从多方面的来看待这个问题,最重要的就是家庭的原因,为什么孩子会和父亲打架。
2、孩子处于青春期,有什时候会很冲动的。做事的时候不考虑后果,只顾当前和自己,以自我为中心。
3、父亲在处理孩子事情的时候,一定要理智,一定要处理得当,讲究处理的方式方法。
(来源:文章屋网 )
1、自制的豆浆可以放入冰箱里面保存到第二天,因为冰箱冷藏柜中的温度较低,可有效遏制细菌的滋生,在这样的环境下豆浆仅放置一夜并不会出现变质、变味等问题,可放心饮用。
2、我们在保存自榨豆浆时,要将它装入干净的容器中密封起来,这样不仅可以防止豆浆和冰箱中的其他物品出现串味的问题,还能够将豆浆和外界的细菌隔开,防止它受到更多的污染。
(来源:文章屋网 )
程曼丽在扩展传统传播学中的传播过程模式的基础上提出,如果说,普通的传播只需要一次编码―――将原始信息转换成可被一般受众接受的信息,那么国际传播的编码就需要有两次,第二次编码是将本国一般受众接受的信息转换成为可被他国受众或全球受众接受的信息。
作者指出,“二次编码就是语言的转换和文化的对接”。如果说,语言转换更多的还只是一种技术性的手段和浅层次的转换,那么文化对接就是一种深层次的转换。作者认为,国际传播中的文化对接包括两个方面:一是与国际通行的认知、规范体系对接,即人们常说的“国际接轨”问题;二是与传播对象国的社会文化习俗对接,这涉及传播的针对性问题。作者在书中就这两个问题进行了深入探讨,并且明确指出:绝大部分的二次编码必须由媒介完成。
我感到,作者正是以传播学者特有的学术话语回答了前政府公关总管提出的“赤字”问题。“赤字”的一个重要原因正是出在这个“第二次编码”上,我们的大众媒介虽然也把进入国际舞台作为目标并且作了很多努力,但既不熟悉国际通行的认知和规范体系,又没有很好研究人家的社会文化习俗,难免事倍功半。那些不成功的事例是大家知道的。对此赵启正是这样说的:“一方面由于中外文化存在着很大差距,另一方面则是中国人在国际文化市场上还缺乏推销能力”。他们所涉及的其实是同一个话题,不过赵是指出问题,而程则是探求规律;而学术专著自比演讲更具有系统性和完整性。
“二次编码”论只是《国际传播学教程》论述体系中提出的一个问题。国际传播学在我国是一门年轻的学科。有关的理论探讨活动和文集、专著的出版都还只是本世纪的事情。作者经潜心研究,在国际传播学的研究对象、国际传播主体、国际传播的基本原则、国际传播效果测量方法等方面都形成了自己独到的见解。例如她认为一般大众传播学研究重点主要集中在“控制研究”、“内容分析”、“媒介分析”、“受众分析”和“效果分析”这样五大领域,而国际传播作为以大众传播为手段的跨越国界的传播,有着明确的主体―――国家和代表国家行使传播职能的政府,它们利用媒介进行传播,并对整个传播过程产生至关重要的影响。同时,她也承认企业、社会组织、个人也是参与国际传播的另外一些主体。据此,她认为国际传播学研究必须增添一项:对传播主体进行专门的研究。所以,程曼丽推出的这部“教程”,自辟蹊径,具有独特的理论框架,在以上诸方面,都不乏理论亮点。我举出“二次编码”论来介绍,仅仅是因为它具有明显的实务意义,对于读者有较大的接近性,利于举例说明。而且“二次编码”论是全书的有机组成部分,所以有关提升“第二次编码”水平的话题,也只有在阅读和体会全书论述的基础上,才能得到完整的启示。例如既然政府是国际传播的主体,那么“第二次编码”虽然要由媒介来完成,而政府无疑也负有重要的甚至是关键的责任,如制定合理的传播政策、改善控制手段、开发技术等等,都有许多工作要做。中国国际传播提升水平、克服“赤字”,有赖于科学的指导,《国际传播学教程》以及其他同类研究成果,就可以发挥这样的效用。
Ben: How much are these puzzles?
Jack: They're thirty-nine yuan each .
Ben: How much are those cars?
Jack: They're fifty yuan each.
Ben: Oh, it is too expensive. Mmm...I like those bears, but I do not like
the dolls. Can I have a bear, please?
Jack: Forty-six yuan, please.
Ben: OK. Here you are.
Jack: Here is your change.
Ben: Thank you. Good bye!
[关键词] 艾滋病;马尔尼菲青霉菌;临床研究;感染
[中图分类号] R512.91 [文献标识码] A [文章编号] 1674-4721(2012)10(a)-0019-02
马尔尼菲青霉菌(PM)感染引起马尔尼菲青霉菌病(PSM),在免疫功能正常时发病率极低且病灶局限,但在免疫功能缺陷人群,尤其艾滋病(AIDS)患者发病率明显升高,易形成播散性感染。此病在东南亚地区发病率高,广东地区由于较温暖、潮湿,适合该菌生长,同时随着HIV的流行增加,PSM的发病率呈现逐年上升趋势[1]。本文笔者对本院确诊为AIDS合并马尔尼菲青霉菌感染的19例患者的临床资料进行分析,现报道如下:
1 资料与方法
1.1 一般资料
2003年1月~2011年12月本院确诊为AIDS合并马尔尼菲青霉菌感染共19例,其中,男15例,女4例,年龄36~69岁,其中,合并呼吸道细菌感染10例,肠道细菌感染2例,乙型肝炎病毒携带者2例。
1.2 诊断标准
HIV诊断符合2006年《中国艾滋病诊断与治疗指南》,所有标本均经过本院和广东省疾病预防控制中心(CDC)确证为HIV阳性,马尔尼菲青霉菌感染的诊断以血或者骨髓培养阳性为金标准[2]。采用NCCLS推荐的浓度梯度法检测氟康唑、伊曲康唑、两性霉素B和5-氟胞嘧啶对马尔尼菲青霉菌的敏感性。
1.3 检验方法
分析19例患者的临床表现、体征、实验室检查结果、胸部影像学特点,并对病例进行血和骨髓培养及药敏试验。
2 结果
2.1 临床症状及体征
本组所有病例均有发热,多为高热,热型呈弛张热及不规则热。临床表现为咳嗽、咳痰13例(68.42%),表现为皮疹10例(52.63%),均为多个,多发生在头面部和躯干上部,初为斑丘疹,高出皮肤,渐发展为疱疹、脓疱疹,伴瘙痒,易破溃,破溃后溢出脓性分泌物,干燥后结痂。全部病例都有中度以上贫血、消瘦,体重下降均达10%以上。有12例(63.16%)患者伴有不同程度的淋巴结肿大,其中包括颈部淋巴结肿大9例(47.37%),腹股沟淋巴结肿大3例(15.79%)。肝大5例(26.32%),腹痛4例(21.05%),脾大2例(10.53%),腹泻2例(10.53%),腹水2例(10.53%)。
2.2 实验室检查
19例患者中,血常规WBC>10×109/L有3例(15.79%),
2.3 影像学检查
胸片或胸部CT发现肺部异常病变11例(57.89%),但均缺乏特征性,其中,表现为肺野斑片状浸润阴影5例(26.32%),肺间质性改变2例(10.53%),肺门肿大2例(10.53%),双肺弥漫多发结节1例(5.26%),双侧胸腔积液1例(5.26%)。
2.4 病原学检查
入院时根据患者病情,收集血和骨髓培养检查。结果全部病例的血培养均可发现PM,提示为播散型PSM,8例(42.11%)骨髓穿刺行骨髓培养为阳性,2例(10.53%)腹腔穿刺行腹水培养为阳性。对血培养检出的PM进行体外药敏检测,结果所有病例对伊曲康唑均敏感,18例(94.73%)对两性霉素B敏感,15例(78.94%)对氟康唑敏感,14例(73.68%)对5-氟胞嘧啶敏感。
3 讨论
青霉菌属共有300多种,其中多数不致病,马尔尼菲青霉菌(PM)是少数能使人体致病的青霉菌之一,它在正常健康人群感染率极低,在艾滋病患者中感染率较高。AIDS合并PM感染易在体内广泛播散,病情发展快,导致治疗成本高,是PM对人体致命的主要原因,因此,艾滋病与马尔尼菲青霉菌双重感染越来越受到关注。
本组病例年龄以青中年为主,追踪流行病学可知传播途径以性接触为主,提示目前HIV 感染正在向一般人群蔓延。随着AIDS发生率的增加,马尔尼菲青霉菌感染病例也随之增多,已成为艾滋病患者最常见的机会性感染,故现已把马尔尼菲青霉菌感染作为艾滋病诊断的一个重要诊断线索[3]。
AIDS合并PSM缺乏典型的临床表现,常因感染部位不同、疾病进展不同而有各种不同的临床特征,故临床容易漏诊。AIDS患者免疫力下降,PM进入血液循环后向全身播散,最常累肺部和皮肤黏膜,内脏各器官如肝、脾、肾,浆膜腔如心包、腹膜及骨髓等受侵犯后可出现相应脏器损害的症状。本组资料显示发热、贫血、消瘦等为其共同临床表现,以呼吸道感染为主的病例症状主要为发热、咳嗽、咳痰,胸部影像学的改变无特异性特征,病原学可合并细菌、真菌感染,与细菌性肺炎、真菌性肺炎、结核不易区分,临床较难鉴别[4]。皮肤受侵犯可有典型的皮疹,对诊断有一定提示意义,可通过取病理活检及破溃分泌物培养以明确诊断。消化系统表现主要为腹泻、腹痛、肝脾肿大、肝功能损害,需与肠道细菌感染相鉴别。血液系统常表现为不同程度的贫血、浅表淋巴结肿大,部分病例骨髓培养PM阳性,临床需要注意与淋巴瘤相鉴别。由此总结,确诊为AIDS的患者,出现发热、贫血、消瘦,临床出现呼吸道症状或者消化道症状、特异性皮疹以及肝、脾、淋巴结肿大,使用一般抗细菌治疗效果不佳者,宜早行PSM相关的病原学检查,对早期诊断和预后的改善至关重要。
本组病例中,大部分患者白细胞不高,小于4×109/L有12例,可能与晚期艾滋病患者免疫功能极度低下有关,也可能与细胞免疫功能被严重毁坏或者青霉菌对骨髓的抑制有关[5]。
PSM可分为局限型和播散型。PM的致病机制与宿主机体的免疫防御状况密切相关,PM感染人体后可累及多个脏器,导致的病理改变包括化脓性炎症、无反应性坏死性炎症、肉芽肿等。马尔尼菲青霉菌在37℃人体温度条件下适合生长繁殖,且易侵犯血管,艾滋病患者由于T淋巴细胞免疫缺陷,极容易通过血液发生播散型感染[6],使得PSM的凶险程度及病死率明显高于其他真菌感染。本组病例血液中马尔尼菲青霉菌均为阳性,提示血培养阳性率高,可作为马尔尼菲青霉菌播散最重要的诊断依据。李凌华等[6]报道CD4+淋巴细胞计数小于50个/μL时容易发生PM播散感染,本组病例中CD4+细胞计数小于50×106/L的15例患者不仅血培养全部为阳性,并且其中8例骨髓培养和2例腹水培养找到该菌,可见马尔尼菲青霉菌全身播散感染易发生在免疫功能极度低下的艾滋病患者,并累及多个器官,因此,临床上对HIV感染患者出现前述临床表现,并且CD4+细胞计数小于50×106/L,抗细菌治疗效果不佳时,应尽早进行多部位取材培养或活检,以提高诊断率。
播散性马尔尼菲青霉菌病病情发展快,未经治疗病死率高,及时、足量、有效的抗真菌治疗,可使PSM长期缓解或治愈。咪唑类如氟康唑等由于价格相对较低且副作用较小,目前作为临床治疗的首选,但本组患者中体外培养敏感率仅为78.94%,Supparatpinyo K等[7]报道单用氟康唑治疗AIDS合并PSM易复发。美国CDC推荐AIDS合并PSM的治疗方案为两性霉素B-伊曲康唑序贯疗法[8],不能耐受AMB副作用者可选用两性霉素B脂质体,可明显减轻毒副作用。
[参考文献]
[1] 欧汝志,卢祥婵,李伟新,等. 艾滋病合并马尔尼菲青霉菌感染研究进展[J]. 中国热带医学,2010,10(8):1027-1028.
[2] Gottfried TD,Mink RW,Phanuphak P. Calypte Aware HIV-1/2 OMT antibody test using oral fluid:special challenges of rapid HIV testing in the developing world[J]. Expert Rev Mol Diagn,2006,6(2):1439-1441.
[3] Jan IS,Chung PF,Wang JY,et al. Cytological Diagnosis of Penicillium marneffei Infection[J]. J Formos Med Assoc,2008,107(6):443-447.
[4] Nguyen K,Taylor S,Wanger A,et al. A case of Penicillium marneffei in a US hospital[J]. J Am Acad Dermatol,2006,54(4):730-732.
[5] 唐振祥. 艾滋病合并马尔尼菲青霉菌感染52例临床分析[J]. 中国皮肤性病学杂志,2008,22(5):291-293.
[6] 李凌华,唐小平,蔡卫平. 101例艾滋病合并马尔尼菲青霉病的临床研究[J]. 中国艾滋病性病,2008,14(1):12-14.
[7] Supparatpinyo K,Schlamm HT. Voriconazole as therapy for system in Penicillium marneffei infections in AIDS patients[J]. Am J TropMed Hyg,2007,77(2):350-353.
摘 要:问答系统能用准确、简洁的答案回答用户用自然语言提出的问题,很明显系统中问答对的规模是影响问答系统最终性能的主要因素。为了提高问答对的规模、充分利用互联网资源,本文提出了一种基于决策树和马尔科夫链的在互联网上自动抽取问答对的算法。先根据网页中的HTML标记把网页表示成一棵DOM树;然后利用树中每个节点的结构和文字信息,抽取相应的特征;最后将得到的节点特征通过由决策树和一阶马尔可夫链结合得出的分类模型进行分类。试验结果表明准确率达到了90.398%,召回率达到了86.032%。对大量网页抽取的结果表明该分类模型能够适应对各种各样的网页的抽取。
关键词:人工智能;模式识别;信息抽取;DOM树;决策树;马尔可夫链
中图分类号:TP391 文献标识码:A
1 概述
伴随着互联网的迅速发展,理论上人类所需要的大部分知识都可能存在于互联网的某些网页上,但如何快速有效的从庞大的网络中检索出用户所需要的信息,已经成为了互联网应用中一个倍受大家关注的技术难题,自动问答系统、个性化搜索、社区搜索、搜索结果自动归类等相关技术和服务的提出,都是面向这样技术难题开展的卓有成效的研究路线。本文是面向基于问答对库的自动问答系统的需要,开展互联网上问答对的自动抽取研究。
自动问答系统是一种支持用户以自然语言方式给出自己问题(或需要搜索的知识)的答案搜索系统,同时反馈给用户更直接、更精简的答案。例如当用户希望了解“哪个国家是最大的内陆国”时,用户可以直接将上述自然语言的句子输入自动问答系统,则系统将直接给出答案:“哈萨克斯坦”,而不需要再从通用搜索引擎上搜索“内陆国最大”得到的大量网页链接中去找寻真正的答案。基于大规模问答对库的自动问答系统是问答系统中比较简单和有效的技术路线,此种技术对用户输入的问题,从预先保存好的大规模已经回答过的问题中寻找最为合适的,并将其答案部分直接反馈给用户,所以对答案生成和问题理解技术相对来说依赖得比较少。
问答对的规模是影响基于问答对的自动问答系统最终性能的主要因素,因此如何搜集大规模高质量的问答对是一项具有实际意义和研究价值的科研课题。现实中,互联网上已经积累了非常大规模的问答对,这些问答对大多以FAQ页面或者某些类似于BBS的网站上一问多答方式存在,如图1所示的是一个典型的包含多个问答对的FAQ页面。如果能自动收集起来这些问答对,将对基于问答对的自动问答系统提供非常有利的支撑。然而互联网上的问答对只是面向网页浏览用户而设计和书写的,一般仅仅是以HTML甚至简单文本方式存储,书写格式更是没有统一的规范,因此如何从这些不规范的问答对网页中,抽取出格式化的问答对,是一个比较典型的信息抽取问题,也是一个比较有挑战的问题。我们在网上搜集了500个网页(为了得到更多的问答对,这里的网页通过在商用搜索引擎上搜索关键字“FAQ”获得的),经过统计,明显带有表征问题对的关键字(如:“问”、“答”)的问答对只有651对,只占全部2113个问答对的30.81%。本文计划聚焦这一问答对抽取问题,提出一种基于决策树和马尔科夫链的自动抽取算法。实验结果表明,我们的方法效果显著,准确率达到了98.97%。就我们的调研范围,目前还没有此方面的研究成果发表。
2 相关工作
一般来说,在信息抽取领域主要存在两种信息抽取的方法:基于规则的方法和基于机器学习的方法。由于互联网网页的格式不统一,基于规则的方法存在规则不易构造且普适性很难保证等问题,因此目前的研究更多采用基于机器学习方法进行信息抽取[1~4]。在本文中我们也采用了基于机器学习的方法进行问答对的自动抽取研究。
互联网上信息抽取领域前人已经做了很多研究:比如新闻信息的提取[4];文献[5]提出了一种在网页中提取标题的方法,本文在特征选择上部分借鉴了文献[5]的方法;文献[6]给出了一种采用统计方法结合受限自然语言理解技术的模糊关键词集合提取方法。
3 基于决策树的分类模型
本文将采用机器学习和马尔可夫链相结合的方法进行问答对抽取工作。本方法适用于互联网上大多数的网页。主要分为两步来完成:训练和抽取。在训练过程中我们首先把HTML文件转变为DOM树的形式,然后针对DOM树中每一个有内容的叶子节点提取特征,通过C4.5决策树算法建立分类模型。具体各部分工作如下:
3.1建立网页的DOM树
由于HTML的“标记”只是告诉浏览器如何显示所定义的信息,故由HTML语言所表述的Web页面不适合由机器处理。当前主要采用DOM树来进行信息抽取[2,7,8]。
预处理的目标是将新闻网页的HTML脚本转化为只包含有意义信息的树状结构。具体步骤如下:
(1)删除新闻网页HTML脚本中的与正文抽取不相关的信息,如注释、Java代码等;
(2)建立树状结构。网页的HTML脚本本身是嵌套的,因此我们可以比较容易的根据HTML的脚本建立成对应的树状结构(即DOM树),并将所有的文字信息挂接在叶子节点,同时把HTML的转义字符都变换为正常的字符,如“& 1t;”变换为“
(3)合并段落。我们通过观察发现,问答对的问题或答案本身部分一般都不会跨越网页的段落,因此我们的实验以段落为最小决策单元。这里的段落指网页中在同一行内显示.而未被、(h1>等HTML分段指示标记分隔开的文字片段。但是因为一个段落中有时会因为包含一些字体约束标记等HTML标记而在建立树状结构时被拆分成了多个叶子节点,因此我们需要进行段落合并处理,使得每个叶子对应一个段落。合并段落就是把所有中间没有段落边界标记的相邻叶子节点合并为一个节点。依据HTML的标记定义,通过分析网页在浏览器中的显示与该页面的源代码的对应关系,可以发现下列的标记是分段指示标记
3.2分类模型建立
DOM树建立之后,本文以DOM树上每一个叶子节点作为问答对的问题或答案的候选,于是文本的研究目标就具体化为一个典型的分类决策问题, 决策每个叶子节点是三种类别中的哪一种,三种类别分别是:问题部分、答案部分以及什么都不是(以下分别记为Q,A和N三个类别)。本文计划引入机器学习的方法来建立这样分类器。
基于机器学习的分类器构建一般被称为训练阶段,一般需要经过三个阶段:训练数据标注、特。征提取和分类器训练。本文的训练阶段具体操作如下:
(1)收集了一批网页,并生成对应的DOM树,并在专门研发的标注工具支持下,人工标注了每个叶子节点分别是Q、A和N三类别中的哪一类,完成用于训练的标注网页集构建;
(2)对于这些DOM树中的每一个节点,本文提取多维特征组成的一个特征向量,并与人工标记的类别组合在一起形成一个训练例子,所有这些样例就组成了训练数据文件;
(3)基于训练数据文件,完成分类器训练。有多种机器算法可以从这些训练数据中训练得到分类模型,本文采用了其中的一种,决策树算法,具体的本文采用了C4.5算法,具体算法参见文献[9]。通过C4.5算法的训练程序,我们可以训练得到一棵分类决策树。
当我们需要对一个新网页进行问答对抽取时,这一问题可以同理转换为新网页所对应的DOM树每个叶子节点分别是哪个类别,这一阶段一般被称为决策或测试阶段。这一阶段具体操作如下:对每个叶子节点提取一个同训练阶段一样的特征向量,然后把这一向量输入到训练过程得到的分类决策树进行判决,以得到这一叶子节点分别属于Q、A及N三个类别的决策概率;最后把决策概率最大的类作为判断结果输出。
与大部分机器学习算法相似,对于C4.5算法来说最重要的是特征的选择,特征能否反映分类问题的本质,决定了整个分类器构建的成败。
3.3特征的选择
在3.2小节中提到的,要想利用分类模型算法得到很好的分类效果,关键就是找到能够反映分类问题本质的特征。本文中,针对问答对抽取的分类问题,本文最多一共尝试提取了71维的特征,但考虑到效率和特征对于判断结果的影响,最终我们选择了其中的31维特征,实验表明这31维特征能够很好的从所有的DOM树的叶子节点中区分出问题部分以及答案部分。
在特征的提取过程中,本文主要考虑了以下信息和结构特征,具体31维特征定义如表1所示。
(1)网页的纯文本信息;
网页的结构、格式信息,如当前节点文字的颜色、字体信息,链接信息以及相邻节点是否有相同结构,即两个节点的XPath中是否仅仅差别一个索引号,如图2中选中的“Q第五大区(电信一上海)…”节点与其上下并排的几个节点就都属于具有相同结构的节点,简称同构节点。XPath的具体定义参见文献[10];
(2)全局信息,利用了BhnI等的研究工作,在文献[11]中BhnI利用在归纳学习过程中加入了上下文规则较大幅度的提高了查准率。
4 问答对的抽取
4.1 基于决策树方式的缺陷
基于决策树的问答对抽取算法实现了对每个DOM树叶子节点的类别判决,但整个判决过程中假设各个节点的类别决策之间相互独立。然而这一假设显然不成立,因为,在一个网页中比较Q、A和N之间存在一定的顺序关系,如A之前一般必须有Q,而Q之后往往也会有A,同时由于一般而言问题极少跨越多个段落(即Q后一般不接Q),而答案部分则比较容易因为内容较长而分割成多个段落(因此会有多个A连续出现的情况)。因此为了修正决策树的独立决策的不当,这些不同的概率特性可以很好。为了克服仅仅基于决策树的问答对自动抽取技术的缺陷,同时考虑到上述类别之间的相互关系可以用马尔科夫链来描述,因此本文加入了一阶马尔可夫链模型对决策树的决策结果进行修正。
4.2 利用一阶马尔可夫链修正结果的方法
这里假设训练集内的每个标注页面都可以按其DOM树叶子节点的类别表示为一个Q、A和N三个字母组成的长串,则我们可以从这些长串中统计得到三个类别之间的3*3的转移矩阵,
这种方法的实验结果与没有加入马尔科夫链修正的结果相比效果不但没有上升,反而下降比较明显。通过分析发现,这是由于在大部分网页中问答对存在的数目与所有的节点数目相比要少的多,这使得求出的条件概率中T(N|N)特别大,在(2)式中占主导地位,结果很容易就把所有的节点被判为N类。
针对这一问题,我们通过大量的观察统计,发现了这样的一条规律:一般情况下答案(问题)有多行时所对应的叶子节点会集中在一个相同的父节点之下,这为我们的研究指明了方向,本文正是利用当前节点与其前一节点是否具有相同结构这一信息来对我们3*3转移概率矩阵T(d|f)进行了修正:
实验表明,同构这一限制使得大部分的N节点被排除在分母的统计之中,实现了Q、A和N三种类别之间的有效平衡。
4.3对整个网页的所有判断结果进行问答对的选择
当我们根据上面的决策和修正算法得到叶子节点所对应的类别序列(c1,…ci,…,cL)*之后,我们将按Q、A顺序出现的相隔最近的一对Q、A定义并抽取为一个问答对,这是由于一般情况下答案都会紧跟在所回答的问题的后面,这样做在最后的选择结果中过滤掉了分类结果不能构成问答对的节点,如比所有Q都先出现的A或是比所有A都后出现的Q。
4.4面向准确率的问答对取舍
为了能把抽取到的问答对应用到实际的自动问答系统中,问答对抽取必须保证有一个很高的准确率,因此为了进一步提高抽取的准确率,我们对上一小节得到的问答对我们采用基于以下简单规则的取舍操作:
(1)删除最后的问答对,这是由于往往最后一个问答对可能会存在多余的信息;
(2)当一个网页的问答对数目小于两个时,忽略抽取结果;
(3)当答案为多段时,为了得到的答案很完整,当答案的段数大于3时,舍弃这个问答对。
这样操作之后,将在舍弃一部分问答对的基础上,较明显的提高抽取出的问答对的准确率。我们提出这一面向准确率的抽取方法是考虑到互联网的网页规模庞大,因此在一个网页中漏掉的信息很可能可以在其他网页中找到。
5 实验结果
5.1 评测指标
为了对比不同问答对自动抽取的效果,本文采用准确率(Precision)、召回率(Recall)及F1-Score指标来进行抽取性能的评价。这里我们记A为人工判断为问答对的集合,B为机器自动抽取得到问答对的集合。这里我们定义当且仅当机器抽取的问答对的Q和A都与人工标注的Q和A完全一致时,才认为此问答对被正确的抽取。准确率、召回率及F1-Score定义如下:
F1-Score是准确率与召回率结合起来进行评判的方法,更能够客观的反映实验模型的效果。
5.2数据集
为了实验本文提出的基于决策树和马尔科夫链的问答对自动抽取技术,本文数据集为以“FAQ”为关键词利用Google中文搜索引擎搜索得到前500个网页(2005年9月收集)。我们对这500个网页转化为DOM树并基于自行研发的标注工具在DOM树上标注出所有的Q和A类型的叶子节点,形成了标注网页集。统计表明,此500个网页的标注集上,人工一共标注了2113个问答对。
鉴于本文建设的数据集规模较小以及问答对标注工作量较大,因此本文采用4-Fold的交叉集测试方法[12]进行试验。
5.3 实验结果
这里我们采用的基线系统是“带有表征问题对的关键字的方法”,具体是指通过规则的方式,将带有表征问答对的关键的问答对抽取出来的方法。如表2所示,与基线系统相比,只用决策树的方法可以大幅度提升抽取效果,F1-Score绝对提升幅度达到34.71%。同时,基于决策树和一阶马尔可夫链相结合的方法可以进一步提高问答对抽取性能,相比决策树方法提升幅度达到6.34%。
同时面向准确率的问答对取舍方法在保证召回率达到50.21%的前提下准确率更是提高到了98.97%,完全可以达到实际应用的需要。
为了验证本文抽取算法的实际有效性,本文通过将“电脑”、“影视”、“饮食”、“医疗”、“计算机”等分类型词汇(从百度知道的分类列表中获得)和关键字“FAQ”进行组合后送入搜索引擎搜索,共收集得到18万的网页。我们将我们的算法在这18万网页上也进行了实验,并最终抽取出12万高质量的问答对,这一实验充分说明了我们方法的有效性。
6 结论
关键词:四君子汤;耳穴压豆;妇科手术;胃肠功能
妇科手术对胃肠道虽无直接损伤,但由于手术中对腹腔脏器的干预,胃肠应激及物的暂时抑制而易发生术后肠麻痹。而肠蠕动的减弱导致腹胀、恶心、呕吐,常影响进食、睡眠、切口愈合和机体恢复[1]。因此术后不少患者出现腹胀、排便困难,既增加了患者的痛苦,推迟了进食时间,又影响了机体的康复。为了促进术后患者胃肠蠕动尽早恢复,本院对妇科手术后出现腹胀的患者给予四君子汤联合耳穴压豆治疗,取得良好疗效,现报道如下。
1 资料与方法
1.1一般资料 选择我院2012年10月~2013年12月我院妇科进行腹部手术的患者135例,其中子宫次全切除术20例,子宫全切术65例,卵巢切除术50例,麻醉方式均为静脉复合麻醉,术后止痛泵镇痛,年龄33~65岁。随机分为观察组75例,对照组60例。两组患者一般资料无统计学意义(P均>0.05)。
1.2方法 在西医常规方法(包括抗生素预防感染、补液及维持水电解质平衡)治疗基础上,术后8h给予四君子汤煎剂,方药组成:人参(去芦)10g、白术10g、茯苓(去皮)10g、甘草(炙)10g,加水800ml,浓煎200ml,分4次口服,50ml/次,2h后重复,1剂/d,直到排便,恢复进食。同时术后复苏回病房后立刻进行耳穴压豆,使用王不留行耳穴贴贴耳穴。由于耳穴与腑脏肢体的联系是多条途径的,是通过多途径使耳穴与腹脏肢体在多个层次上联系起来[2],鉴于患者手术后腹胀,排气困难是由于胃肠蠕动减慢所致,故选用了三焦、小肠穴等与消化功能有关的穴位。首先找准穴位,大肠为耳轮脚上方的1/3处,小肠为耳轮脚上方的中1/3处,三焦位于外耳道孔后下方与对耳屏内侧下1/2连线中点。用棉签压迫定位点有感觉以确保定位准确,酒精消毒耳廓,将耳穴贴用镊子扯下帖于穴位,用拇指和食指指腹前后按压,出现痛、麻、胀及耳廓潮红为度,每个穴位30~40s,并指导及教会家属按摩的方法。以后每隔4h/次,两耳交替,直至排气。对照组常规给予抗生素预防感染补液治疗,维持水电解质平衡,鼓励早期活动。
1.3观察项目 观察患者术后首次排气、首次排便时间,观察有无腹胀,以了解肠功能恢复情况。
2 结果
两组手术者48h首次排气时间比较见表1,两组手术患者72h首次排便时间见表2,观察组48h首次排气,72h首次排便均高于对照组。观察组75例无1例出现腹胀,而对照组出现腹胀8例,其中1例出现不全肠梗阻。
3 讨论
腹部手术后由于麻醉、腹膜刺激、术中操作、术后腹腔内少量渗血渗液及手术本身的创伤,水电解质失衡,胃肠激素调节紊乱都不同程度抑制了胃肠功能,导致胃肠蠕动减弱和消失[3]。胃肠功能恢复迟缓易引起机体内环境紊乱及诱发各种并发症如肠麻痹、肠梗阻和肠粘连的发生。所以如何促进肠胃功能恢复,及时进食,对改善机体营养,增进机体抵抗力。促进切口愈合,减少术后并发症非常有利[4]。术后肠道功能恢复情况及是否发生肠粘连,虽然与患者个体差异、年龄、疾病程度、手术持续时间、水电解质及酸碱平衡维持情况、术中手术者操作等多种因素紧密相关,但术后早期活动和促使肠蠕动及早期恢复有利于防止肠粘连形成[5]。胃肠动力功能与"脾胃"的状态密切相关。"脾升胃降"是脾胃系统内气道津液的运动规律,脾胃气机紊乱可导致脾病或胃病。胃不降则发生呕吐、嗳气和反胃,脾气虚可导致脾升不足或不升反降,出现腹胀和泄泻[6]。四君子汤,方中人参甘温益气,补益脾胃,生化气血。脾气虚弱,以白术益气健脾,助人参补益中气,人参偏于补益脾胃,白术偏于建立脾胃,一补一建,生化气血。脾虚湿生,以茯苓渗湿,助人参、白术建脾益气。甘草补益脾胃,调和诸药。诸药相互为用,以奏补气健脾和胃之效用。
耳穴是耳廓上与人体各脏腑组织器官相互沟通,并能反映人体生理机能和病理变化的部位。通过耳穴治疗,可以反馈性调节脏功能平衡,达到治疗疾病的目的[7]。王不留行籽具有活血通经、消痈,下乳的作用。中医认为患者因手术创伤,元气大伤,气血无力运化,脏腑功能失调。选穴的目的为大肠穴主有促进肠蠕动的作用;小肠穴治疗消化不良、腹胀;三焦穴治疗便秘、腹胀。本研究结果显示,两组患者术后平均排气、排便时间有显著性差异。我们给患者口服四君子汤,同时使用质地较坚硬的中药王不留籽压迫耳部与胃肠功能相关的穴位,起到调节胃肠功能的作用,可达到促进肠蠕动、早通气。故四君子汤联合耳穴压豆对促进全麻下妇科手术胃肠功能恢复效果显著,值得推广、应用。
参考文献:
[1]苏应宽.妇产科手术学[M].第2版.北京:人民出版社,1999:1.
[2]管遵信.中国耳针学[M].上海:上海科学技术出版社,1995:419.
[3]叶薇.促进腹部术后胃肠功能恢复的中医药治疗概况[J].河北中医,2004,26(12):951-952.
[4]金伟飞,王仲迪.复方大承气汤灌胃促进腹部手术后胃肠功能恢复的疗效观察[J].现代中西医结合杂志,2004,13(10):1301-1302.
[5]吴在德,吴肇汉.外科学[M].第7版.北京:人民卫生出版社,2008:457.