收藏 分享(赏)

基于CLR的玻璃文物成分分析与分类模型.pdf

上传人:哎呦****中 文档编号:3036569 上传时间:2024-01-18 格式:PDF 页数:11 大小:2.58MB
下载 相关 举报
基于CLR的玻璃文物成分分析与分类模型.pdf_第1页
第1页 / 共11页
基于CLR的玻璃文物成分分析与分类模型.pdf_第2页
第2页 / 共11页
基于CLR的玻璃文物成分分析与分类模型.pdf_第3页
第3页 / 共11页
亲,该文档总共11页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

1、第1 2卷 第2期2023年6月数学建模及其应用M a t h e m a t i c a l M o d e l i n g a n d I t s A p p l i c a t i o n sV o l.1 2 N o.2J u n.2 0 2 3教学与竞赛基于C L R的玻璃文物成分分析与分类模型邓天宇,邱奕珲,池正昊(复旦大学 管理学院,上海 2 0 0 4 3 3)摘 要:对具有成分数据特征的古代玻璃成分数据集进行风化前成分含量预测以及类别划分.首先,对成分数据进行中心对数比变换预处理,从“成分相对重要性”的角度提取了成分数据的信息,并通过对变换后的玻璃文物化学成分数据分析:一方面

2、,实现了对已风化的铅钡和高钾两类玻璃风化前化学成分的预测,即成分还原;另一方面,在铅钡和高钾两大类的基础上,拣选出可用于对玻璃文物进一步分出亚类的化学成分,构建了稳健的玻璃亚类分类模型.该模型可以实现在风化导致玻璃文物偏移其原始化学成分的情况下,对玻璃的亚类有大致正确的判断,即对风化文物原始成分的预测偏差不会显著影响分类结果.关键词:风化;玻璃文物;成分还原;中心对数比变换;层次聚类;文物亚类划分中图分类号:O 2 9 文献标志码:A 文章编号:2 0 9 5-3 0 7 0(2 0 2 3)0 2-0 0 4 1-1 1 D O I:1 0.1 9 9 4 3/j.2 0 9 5-3 0 7

3、 0.j mm i a.2 0 2 3.0 2.0 4收稿日期:2 0 2 3-0 1-2 4通讯作者:邱奕珲,E-m a i l:2 0 3 0 7 1 0 0 0 5 5 f u d a n.e d u.c n引用格式:邓天宇,邱奕珲,池正昊.基于C L R的玻璃文物成分分析与分类模型J.数学建模及其应用,2 0 2 3,1 2(2):4 1-5 1.D E N G T Y,Q I U Y H,CH I Z H H.C l a s s i f i c a t i o n m o d e l f o r g l a s s r e l i c s b a s e d o n c o m p

4、o s i t i o n a l d a t a a n a l y s i s t h r o u g h C L R t r a n s f o r m a t i o n(i n C h i n e s e)J.M a t h e m a t i c a l M o d e l i n g a n d I t s A p p l i c a t i o n s,2 0 2 3,1 2(2):4 1-5 1.0 引言丝绸之路是古代中西方文化交流的通道,其中玻璃是早期贸易往来的宝贵物证.玻璃的主要原料是石英砂,主要化学成分是S i O2.由于纯石英砂的熔点较高,为了降低熔化温度,玻璃在炼制

5、时需要添加助熔剂.古代常用的助熔剂有草木灰、天然泡碱、硝石和铅矿石等,并添加石灰石作为稳定剂.石灰石煅烧以后转化为C a O.添加的助熔剂不同,玻璃的主要化学成分也不同.然而,古代玻璃极易受埋藏环境的影响而风化.在风化过程中,内部元素与环境元素进行大量交换,导致其成分比例发生变化,从而影响对其类别的正确判断.因此,考古工作者需要一种分析风化后玻璃文物化学成分的方法,让他们能在风化导致玻璃文物偏移其原始化学成分的情况下,对该玻璃的类别有大致正确的判断.该方法至少包含如下两个步骤:其一,通过风化后的玻璃文物的化学成分预测其风化前的化学成分;其二,构建基于玻璃文物化学成分的文物分类模型,且由于步骤1

6、的预测可能存在偏差,该模型需要具有较好的鲁棒性.2 0 2 2年“高教社杯”全国大学生数学建模竞赛C题1以我国古代玻璃制品为研究背景,着重分析其在风化前后的颜色、纹饰以及化学成分变化.该赛题旨在引导参赛者探究成分数据集所适用的分析方法,并针对小样本数据集进行有监督、无监督的分类.赛题根据逻辑顺序由易到难设置了4个问题,在此不再赘述.14教学与竞赛基于C L R的玻璃文物成分分析与分类模型2 0 2 3年6月1 数据预处理成分数据(c o m p o s i t i o n a l d a t a)是一类特殊的数据,具有正定性,且当成分数据以百分比形式呈现时,各成分比例累加和应为1 0 0%(定

7、和约束).另外,成分数据具有尺度不变性(s c a l e i n v a r i a n c e)2,因此其信息全部蕴含在各成分相对大小之中,仅考察某成分比例的绝对大小具有误导性.最后,一般来说,成分数据具有高维、稀疏、分布严重右偏的特点3,这也是题目所给数据集的特点.综合以上特点,并结合参考文献,数据预处理主要从缺失值处理、对数据作中心对数比变换(c e n t e r e d l o g-r a t i o t r a n s f o r m a t i o n,C L R)两方面着手.1.1 数据说明数据集有6 9行,2 0列,共有来自5 8个文物上6 9个采样点的1 4种化学成分占比

8、,以及5 8个玻璃文物的纹饰、文物类型和颜色等信息.将成分比例累加和介于8 5%1 0 5%之间的数据视为有效数据,删除两条不符合此要求的数据.1.2 缺失值处理根据实际意义,成分数据中缺失值为“表示未检测到该成分”.对于本数据集,缺失值统一用0.0 4 填充,其合理性体现在两方面:其一,查阅文献发现,成分数据的缺失(或零值)通常可能由检测仪器测量下限值导致4.比如对于含量为0.0 1%的某化学成分,可能因为仪器无法检出而被视作不含有该成分.考察本数据集,发现所有成分数据中的最小值为0.0 4%,可认为0.0 4%为仪器的测量下限值.其二,在后续作数据中心对数比变换时,大量的缺失值、零值将导致

9、转换后大量缺失值、I n f的出现,因此对缺失值和零值作合理的填充很有必要.1.3 中心对数比变换(C L R)针对数据集,定义某文物的化学成分为x=x1,x2,xD SD,其中:D=1 4表示化学成分的种类数;xi表示第i 种化学成分在该文物所有成分中的占比.记为经C L R变换后的数据,i为变换后第i种成分(即xi)的对应值,C L R变换公式如下5:c l rx =l nx1gm(x),l nx2gm(x),l nxDgm(x)=1,2,D ,(1)其中,gm(x)是几何平均,即:gm(x)=DDk=1xk=e x p1DDk=1l n xk .(2)对c l r(x)的分量进行简单代数

10、运算后发现:i=l nxigm(x)=l n xi-l n gm(x)=l n xi-1DDk=1l n xk,(3)易得C L R变换的逆变换为:xi=e x pi /Dk=1e x pk,i=1,2,D.(4)C L R变换的必要性和意义在于解决了定和约束带来的分析困难问题,直观反映了成分的相对重要性.从式(1)可以看出,C L R变换后的指标不仅考虑了某成分占比的绝对大小,更考虑了该成分相比其他成分的相对大小,即相对重要性.例如,分别对物品一3 0,3 0,4 0 与物品二3 0,1 0,6 0 两条成分数据作C L R变换,结果分别为-0.1 0,-0.1 0,0.1 9 与0.1 3

11、,-0.9 6,0.8 2.可以发现,两条数据的第1个分量虽然都是3 0,但是由于其他成分组成不同,因此经过C L R变换后的分量值并不同.从两条数据也可以直观看出,第1种成分在物品二的构成的相对重要性要高于物品一.从式(2)可以看出,C L R的实质是对数据取对数后进行中心化处理(即C L R的命名由来),其不仅可以解决成分数据严重右偏的问题,而且经过C L R处理后的指标分量与0的大小关系体现了该成分的相对重要性是高于平均还是低于平均.24第1 2卷 第2期数学建模及其应用V o l.1 2 N o.2 J u n.2 0 2 3另外,成分数据的重要特点是其定和约束的存在,这导致对原始成分

12、数据直接作统计分析时存在大量不便.C L R变换通过构建一种欧氏空间与另一与之同构的赋范线性空间之间的等距变换的方式,在理论上为合理操作、解释成分数据提供保障 可以用熟悉的欧氏空间中的运算方法来处理C L R变换得到的数据后,再通过式(3)得到处理后的成分数据.2 利用文物风化后的化学成分预测其风化前的化学成分2.1 玻璃表面风化与其类型、纹饰和颜色的关系首先考察类型、纹饰和颜色是否与玻璃表面风化有关,若是,则后续构建成分还原模型时需要考虑这些因素对文物风化效果的影响.玻璃表面是否风化以及玻璃类型、纹饰和颜色均为定类变量,考虑以表面风化为结果变量,分别与类型、纹饰、颜色构造列联表.对于rc的列

13、联表,若其总样本数大于4 0且每个类别的理论频数大于等于5,则使用卡方检验;对于不符合卡方检验要求的小样本数据,利用F i s h e r精确检验.表面风化与类型、纹饰和颜色构造的列联表,以及使用的假设检验方法和检验结果如表1所示.表1 表面风化与纹饰、类型、颜色的独立性检验(=0.0 5)变量名称表面风化无风化风化总计假设检验方法P值纹饰A1 11 12 2F i s h e r精确检验0.0 8 3 6B606C1 71 33 0合计3 42 45 8类型高钾61 21 8卡方检验0.0 1 9 5铅钡2 81 24 0合计3 42 45 8颜色黑202F i s h e r精确检验0.6

14、 1 6 0蓝绿961 5绿011浅蓝1 282 0浅绿123深蓝022深绿437紫224合计3 02 45 4结论:从独立性检验的结果可知,给定显著性水平=0.0 5,针对纹饰与风化、颜色与风化的假设检验,均没有充足理由拒绝原假设,即不能认为颜色和纹饰对玻璃是否风化有显著影响,符合直观认识.而玻璃类型与风化的假设检验中,p值充分小,有充足理由拒绝原假设,认为玻璃类型与是否风化具有关联性.接下来将结合玻璃的类型分析文物样品表面有无风化时的化学成分含量的统计规律,并根据风化点检测数据,预测其风化前的化学成分含量.2.2 预测模型:根据风化点数据,预测其风化前各成分含量根据风化文物的化学成分含量数

15、据预测其风化前的成分是一项现实且重要的工作.化学成分含量信息是考古学家推定文物的具体年代、地域以及制造工艺的重要基础,是考古学中文物鉴定的重要手段.本模型的预测目标是:针对文物某一部位,根据其风化后的成分数据预测其风化前的成分.但是在已给出的数据集中,只有4 9号文物有风化前后的成分数据,其他文物都是不同部位在不同风化状态34教学与竞赛基于C L R的玻璃文物成分分析与分类模型2 0 2 3年6月下的数据.这导致在已有数据中,无法精确将某一风化后的成分数据对应到另一风化前的成分数据,因此在建立预测模型时,无法使用传统回归模型.两类玻璃风化前后的化学成分相对含量的均值见表2.可以看出,对于高钾、

16、铅钡两种类型的玻璃,它们风化前后化学成分含量的变化呈现出不同的统计规律.比如,高钾玻璃和铅钡玻璃风化前后的N a2O含量呈相反的变化趋势 风化后,高钾玻璃中钠的相对含量上升较多,而铅钡玻璃的钠相对含量则小幅下降.表2 两类玻璃风化前后各化学成分相对含量均值表化学成分铅钡风化铅钡无风化高钾风化高钾无风化铅钡玻璃风化前后均值差高钾玻璃风化前后均值差S i O23.1 3 04.1 6 85.8 8 64.4 3 01.0 3 8-1.4 5 6N a2O-2.6 4 3-1.1 0 4-1.8 7 6-1.9 4 51.5 3 9-0.0 6 9K2O-2.4 4 9-1.8 1 00.1 2 0

17、2.0 4 30.6 3 91.9 2 3C a O0.7 1 2-0.1 1 81.0 3 41.1 7 2-0.8 3 00.1 3 8M g O-1.3 1 4-0.9 7 6-0.9 8 0-0.1 7 10.3 3 80.8 0 9A l2O30.8 4 11.4 8 31.8 9 32.0 4 00.6 4 20.1 4 7F e2O3-1.4 1 6-1.4 3 4-0.0 1 60.1 8 5-0.0 1 80.2 0 1C u O0.1 4 6-0.2 2 41.6 3 90.6 5 4-0.3 7 0-0.9 8 5P b O3.7 6 33.2 2 0-1.8 7 6-1

18、.5 7 6-0.5 4 30.3 0 0B a O1.7 8 02.2 1 6-1.8 7 6-1.7 6 00.4 3 60.1 1 6P2O50.9 5 7-1.1 0 0-0.1 9 70.0 1 9-2.0 5 70.2 1 6S r O-1.0 9 3-1.4 8 9-1.8 7 6-2.6 6 8-0.3 9 6-0.7 9 2S O2-2.4 1 2-2.8 3 1-1.8 7 6-2.4 2 3-0.4 1 9-0.5 4 7基于以上原因,分别求出高钾、铅钡玻璃风化前后各成分相对含量均值差m e a n,并通过风化后成分加上均值差的方法预测该部位风化前的相对含量:e r o

19、d e+m e a n=p r e d i c t,(5)其中:e r o d e为风化后的相对含量;p r e d i c t为预测后的含量.这样做的合理性和好处有5点:考虑了风化对不同类型玻璃相对成分的影响;在响应变量和解释变量的样本不具有明确一一对应关系的情况下,防止盲目套用回归模型导致过大的预测偏差;充分利用了风化前的数据信息;预测方法相对直观,解释性强;不易受严重风化点的干扰.通过以上方法得到的已风化铅钡、高钾玻璃文物风化前化学成分预测结果如表3和表4所示.经检验,预测结果满足成分数据的定和约束.表3 已风化铅钡玻璃文物风化前化学成分预测结果表%文物采样点S i O2N a2OK2O

20、C a OM g OA l2O3F e2O3C u OP b OB a OP2O5S r OS O226 9.0 20.1 31.3 40.6 91.1 17.3 31.2 30.1 21 8.5 80.0 40.3 10.0 90.0 284 2.1 20.1 40.0 60.4 80.0 41.8 80.0 35.3 21 2.3 53 5.7 90.3 40.1 81.2 60 8严重风化点1 3.4 90.1 90.0 81.4 40.0 62.1 80.0 42.2 51 9.5 54 9.1 01.0 00.3 7 1 0.2 51 16 5.2 50.1 30.2 71.0 50

21、.6 83.5 10.0 32.3 41 0.1 61 5.5 50.8 30.1 70.0 21 96 3.8 80.1 40.0 60.9 80.6 35.1 71.0 01.8 51 9.0 06.3 20.8 60.1 00.0 244第1 2卷 第2期数学建模及其应用V o l.1 2 N o.2 J u n.2 0 2 3续表3文物采样点S i O2N a2OK2OC a OM g OA l2O3F e2O3C u OP b OB a OP2O5S r OS O22 64 1.5 30.1 40.0 60.4 70.0 40.9 90.0 35.4 21 2.7 63 7.0 80

22、.3 00.2 30.9 62 6严重风化点1 0.3 50.1 80.7 51.2 90.0 62.2 10.0 42.4 51 7.1 45 4.0 30.7 60.4 1 1 0.3 43 46 7.6 10.1 20.3 20.2 30.0 42.0 60.3 10.7 01 8.1 11 0.3 50.0 30.1 00.0 23 66 6.7 06.1 80.1 60.1 00.0 31.8 10.1 90.2 81 4.4 41 0.0 00.0 10.0 90.0 23 86 2.1 24.3 00.0 50.2 00.0 43.2 60.1 90.3 41 9.1 51 0.

23、1 20.0 40.1 80.0 23 95 9.8 90.1 50.0 60.3 90.0 50.7 70.0 30.4 92 8.6 79.0 30.1 20.3 30.0 24 04 6.5 90.1 80.0 70.8 10.0 60.8 40.1 80.0 34 0.3 11 0.2 20.2 20.4 50.0 34 14 7.6 50.1 70.7 61.9 83.5 05.7 81.6 10.1 22 3.4 51 3.8 00.8 70.2 90.0 24 3部位13 7.2 40.2 00.0 82.4 31.3 34.5 40.7 93.9 33 6.9 81 1.9 9

24、0.0 10.4 60.0 34 3部位25 6.9 50.1 70.0 72.5 91.2 46.0 21.2 70.9 72 4.1 84.6 91.5 30.2 90.0 24 87 3.0 81.8 10.2 90.6 01.0 51 2.5 80.4 90.0 14.4 35.4 90.0 70.0 80.0 14 96 2.5 00.1 40.0 61.5 41.5 87.8 52.0 70.3 71 5.2 87.2 61.0 90.2 40.0 25 04 7.6 40.1 70.0 71.3 10.6 23.3 30.3 00.7 32 4.0 12 0.6 20.7 60.

25、4 20.0 25 1部位15 6.2 10.1 50.0 61.2 61.3 58.0 60.9 50.7 71 8.9 31 1.1 90.8 40.2 10.0 25 1部位25 9.3 40.1 80.0 72.2 02.0 04.6 90.4 10.5 12 9.3 80.0 61.1 00.0 30.0 35 25 8.1 04.5 50.0 60.7 90.6 21.7 60.1 80.3 92 2.0 41 0.6 80.5 80.2 40.0 25 45 2.5 70.1 60.5 11.1 61.5 06.5 80.0 30.4 82 6.9 49.1 00.4 50.4

26、90.0 25 4严重风化点5 1.0 30.2 00.0 80.0 21.6 47.3 20.0 40.9 83 5.9 00.0 71.9 10.8 00.0 35 66 0.7 40.1 40.0 60.3 90.0 42.5 90.0 30.4 01 7.7 01 7.6 40.2 40.0 20.0 25 75 4.9 20.1 40.0 60.4 40.0 43.1 70.0 30.6 12 0.0 62 0.4 80.0 00.0 20.0 25 86 3.5 50.1 40.4 81.1 30.8 24.9 50.6 31.6 01 6.9 48.7 80.8 50.1 20.

27、0 2表4 已风化高钾玻璃文物风化前化学成分预测结果表%文物采样点S i O2N a2OK2OC a OM g OA l2O3F e2O3C u OP b OB a OP2O5S r OS O277 7.5 90.1 30.9 84.4 10.3 28.2 40.7 54.3 50.1 90.1 62.7 20.0 70.0 897 3.6 00.1 21 3.4 12.3 60.3 05.0 81.3 01.9 20.1 80.1 51.4 40.0 60.0 81 07 2.8 20.1 22 0.3 10.7 80.2 93.0 31.0 31.0 10.1 70.1 40.1 60.0

28、 60.0 71 26 6.9 60.1 12 1.0 42.5 20.2 75.1 51.0 81.8 80.1 60.1 40.5 70.0 60.0 72 26 1.4 10.1 11 4.4 45.4 44.1 01 1.5 61.2 20.5 90.1 50.1 30.7 40.0 50.0 72 77 5.7 60.1 30.9 63.7 84.2 51 0.1 90.8 62.0 20.1 90.1 61.5 70.0 60.0 83 高钾、铅钡玻璃划分依据及其亚类划分依据现有数据集已经给出玻璃文物所属类别.根据已有信息,尝试采用有监督的支持向量机(s u p p o r t v

29、 e c t o r m a c h i n e,S VM)方法来寻找划分高钾和铅钡玻璃的依据.在此基础上,又选取了关键指标,利用无监督的聚类算法划分亚类,并进一步采用S VM算法获得具体分类标准.3.1 界定数据范围在进行类别划分前,首先需要界定分析数据的范围,该规则同样适用于后续亚类的划分.1)只使用未风化点的数据倘若使用风化点数据,由于在部分成分的相对含量上风化前与风化后存在较大差距(如S i O2),使用聚类算法时风化样本和未风化样本的组内距离小于组间距离,尽管能得到很好的轮廓系数,但区分出的簇与样本风化状态有关而与品类无关;若利用问题1中得到的映射将风化点的数据变换为未风化点,求平均

30、的过程模糊了亚类特征,会使得大量数据中的信息含量减少,对聚类模型产生噪声.2)包含变量:N a2O、C a O、M g O、A l2O3、F e2O3 不包含问题1中含量较高的成分,例如S i O2、B a O和P b O,避免其较高的对数比对距离计算的影54教学与竞赛基于C L R的玻璃文物成分分析与分类模型2 0 2 3年6月响;不包含含量过低、非零样本量过少的成分,例如S r O和Z n O,简化模型;不包含分布过于均匀的成分,例如P2O5,根据问题1中描述型统计的分析,这部分均匀分布的变量很难作为聚类依据.3.2 有监督条件下的分类方法选择 支持向量机考虑到本题可使用的数据量有限,基于

31、决策树的机器学习效果较差,首先尝试以L o g i s t i c回归对样本分类.L o g i s t i c回归的模型呈现出明显的过拟合,这意味着样本线性可分.因此,在分析各成分分布特征后,选取B a O和P b O作为高钾玻璃、铅钡玻璃分类的主要依据.为了给出更明确的分类依据,选取适用于小样本、高维模式识别的支持向量机(S VM)6,如图1所示.相较于决策树分类,S VM利用拉格朗日乘数法求解得到的最佳决策边界可以使各点距离该边界尽可能远,从而获取更为精确稳定的分类标准.图1 S VM分类器 高钾、铅钡分类规律由于高钾玻璃和铅钡玻璃中B a O和P b O含量所构成的散点图线性可分,直接

32、选择线性函数作为支持向量机的核函数,分析过程如下.首先确定优化目标与约束条件,得到如下规划方程:m i n 2+Ni=1i s.t.i0,yi(TXi+b)1-i,(6)其中:Xi表示每个样本点各种成分含量(经过C L R转化后的)组成的多维向量,i=1,2,N;与b为待求解的参数.将铅钡玻璃与高钾玻璃的样本数据代入规划方程(6),得到如下结果.此时,解得最优边界的函数表达式为:P b O=-3.5 1B a O+5.9 7,(7)由此,高钾玻璃和铅钡玻璃的分类规律可以概括为:若P b O+3.5 1B a O-5.9 70,则样本属于铅钡玻璃;若P b O+3.5 1B a O-5.9 70

33、,则样本属于高钙低镁玻璃;若M g O+2.1 0B a O-1.5 10,则样本属于高钠玻璃;若N a2O+0.1 0C a O-0.7 50,则样本属于低钠玻璃.3.4 亚类划分敏感性分析针对支持向量机得到的分类标准,选用梯度来反映分类边界对于某个样本成分改变的敏感性8.给样本i的数据Xi一个微小扰动,其中,的维数与Xi一致.改变后的约束条件表达式如下:yiwTXi+b 1-i.(9)对原有数据添加扰动后,在改变后的约束条件下重新求得最优分类曲线,得到新的和b.定义反映灵敏度的梯度焊i :焊i =d(,b)/d.(1 0)为了求焊i 的最大值,多次取,控制模长一致,将与b的变化量的模长(分

34、别表述为|d|和|db|)最大值加总焊i m a x=|d|m a x+|db|m a x.(1 1)分别对现有分类样本中的各点计算梯度焊i m a x,得到图5所示结果.图中点的半径大小表示其梯度大小,越大说明分类边界对该样本点扰动越敏感.为了更清晰地呈现结果,图5中梯度小于最大梯度十分之一的点统一采用最大点半径的十分之一表示.图5 两类玻璃分类结果敏感性分析观察图5可以发现,S VM算法的特性导致距离分类边界最近的点具有较高梯度,其余点的微小变化对模型影响小,模型整体稳定性较好.在高钾玻璃的分类结果中,采样点1 8、2 7以及采样点0 6部位1具有较高梯度,分别为0.3 1 8 2、0.1

35、 6 4 5和0.1 4 5 9.同理,铅钡玻璃的分类结果中,2 3未风化点、采样点4 8和5 4严重风化点具有较高梯度,分别为1.2 3 3 5、1.0 5 4 5以及0.3 9 4 5.在对数据的审查中应当着重关注以上高梯度点,因为其成分即使只有微小的不确定性,也将极大地影响分类标准.3.5 亚类划分结果与合理性分析表5和表6分别给出了各亚类所包含的样本点编号及其对应的主要特征.表5 铅钡玻璃亚类划分结果及主要特征表亚类包含样本点主要特征高钠2 3,2 5,3 6,3 8,4 2,4 4,4 5,4 7,4 8,5 2,5 3,5 4,5 4(严重风化)多数呈浅蓝色,更加容易风化低钠2,8

36、,1 1,1 9,2 0,2 4,2 6,2 8,2 9,3 0,3 1,3 2,3 3,3 4,3 5,3 7,3 9,4 0,4 1,4 3,4 6,4 9,5 0,5 1,5 6,5 7,5 8颜色相对深,风化比例小84第1 2卷 第2期数学建模及其应用V o l.1 2 N o.2 J u n.2 0 2 3表6 高钾玻璃亚类划分结果及主要特征亚类包含样本点主要特征低钙高镁6,1 8多数呈深蓝色,不易风化高钙低镁1,3,4,5,7,9,1 0,1 2,1 3,1 4,1 6,2 1,2 2,2 7多数呈蓝绿色 从以上亚类划分结果来看,不同亚类在颜色、抗风化程度上体现出不同特征,说明当前

37、分类具有合理性.4 未知类别文物亚类划分根据上文S VM分类器得到的大类与亚类划分标准,可以通过两次判定对未知类别文物作出亚类划分.相关数据和划分结果如表7和表8及图6所示.表7 未知类别文物化学成分数据表文物编号表面风化S i O2N a2OK2OC a OM g OA l2O3F e2O3C u OP b OB a OP2O5S r OS O2A 1无风化7 8.4 50.0 40.0 46.0 81.8 67.2 32.1 52.1 10.0 40.0 41.0 60.0 30.5 1A 2风化3 7.7 50.0 40.0 47.6 30.0 42.3 30.0 40.0 43 4.3

38、0.0 41 4.2 70.0 40.0 4A 3无风化3 1.9 50.0 41.3 67.1 90.8 12.9 37.0 60.2 13 9.5 84.6 92.6 80.5 20.0 4A 4无风化3 5.4 70.0 40.7 92.8 91.0 57.0 76.4 50.9 62 4.2 88.3 18.4 50.2 80.0 4A 5风化6 4.2 91.20.3 71.6 42.3 41 2.7 50.8 10.9 41 2.2 32.1 60.1 90.2 10.0 4A 6风化9 3.1 70.0 41.3 50.6 40.2 11.5 20.2 71.7 30.0 40.

39、0 40.2 10.0 40.0 4A 7风化9 0.8 30.0 40.9 81.1 20.0 45.0 60.2 41.1 70.0 40.0 40.1 30.0 40.1 1A 8无风化5 1.1 20.0 40.2 30.8 90.0 42.1 20.0 49.0 12 1.2 41 1.3 41.4 60.3 12.2 6表8 未知类别文物化学成分数据表(C L R变换后)文物编号表面风化S i O2 N a2OK2OC a OM g OA l2O3F e2O3C u OP b OB a OP2O5S r OS O2A 1无风化4.8 8-2.7 0-2.7 02.3 21.1 42

40、.5 01.2 81.2 6-2.7 0-2.7 00.5 8-2.9 9-0.1 6A 2风化4.6 3-2.2 2-2.2 23.0 4-2.2 21.8 5-2.2 2-2.2 24.5 4-2.2 23.6 6-2.2 2-2.2 2A 3无风化2.9 9-3.6 9-0.1 61.5 0-0.6 80.6 01.4 8-2.0 33.2 11.0 70.5 2-1.1 2-3.6 9A 4无风化2.9 6-3.8 3-0.8 50.4 5-0.5 61.3 41.2 5-0.6 52.5 81.5 11.5 2-1.8 8-3.8 3A 5风化3.8 7-0.1 1-1.2 90.2

41、 00.5 62.2 5-0.5 0-0.3 52.2 10.4 8-1.9 5-1.8 5-3.5 1A 6风化5.7 0-2.0 51.4 70.7 2-0.3 91.5 9-0.1 41.7 2-2.0 5-2.0 5-0.3 9-2.0 5-2.0 5A 7风化5.6 9-2.0 41.1 61.3 0-2.0 42.8 1-0.2 41.3 4-2.0 4-2.0 4-0.8 6-2.0 4-1.0 2A 8无风化3.8 5-3.3 1-1.5 6-0.2 0-3.3 10.6 6-3.3 12.1 12.9 72.3 40.2 9-1.2 60.7 3图6 将S VM所得的分类模型

42、应用于新数据集后的文物分类结果94教学与竞赛基于C L R的玻璃文物成分分析与分类模型2 0 2 3年6月 在图6中,“X_B e f o r e”为根据公式(5)所推测的样本X风化前成分的相对含量数据.可以看出,除了A 5样品以外,其他文物样品均能被分类器完美区分,尤其是已风化样品A 2、A 6的A 7,经过还原其原始相对成分含量数据以后(即考虑了风化对其相关化学成分相对含量的影响趋势),依然能够被分类器划分.该分类器可以有效地对风化后的玻璃文物作亚类区分.样品A 5在第一次分类中被判定为铅钡玻璃,从铅钡玻璃的总体风化情况看,其钠的相对含量会有所上升,而钙的相对含量会显著下降.因此,铅钡玻璃

43、的风化倾向于朝低钠亚类发展.而A 5经过风化后依然保持了相对较高的钠含量,则分类器据此判定A 5在风化前属于铅钡高钠亚类.综上所述,未分类样品的分类结果表明该分类器可以有效地对风化后的玻璃文物作亚类区分,并且结果具有较好的合理性与可解释性.5 不同种类玻璃成分相关性分析5.1 高钾玻璃成分相关性图7 C L R后高钾玻璃数据集的相关系数矩阵热力图(彩图见封三)图8 C L R后铅钡玻璃数据集的相关系数矩阵热力图(彩图见封三)对数中心化(C L R)处理过的成分数据对线性运算是封闭的,因此分别对铅钡玻璃和高钾玻璃对数中心化之后的数据 集(均 根 据 第1问 结 果 还 原 为 风 化 前 数 据

44、)计 算P e a r s o n相关系数矩阵5,基于此进行两种玻璃成分的相关性分析,并基于分析结果给出可能的化学原理解释9-1 0.针对高钾玻璃数据集计算P e a r s o n相关系数矩阵,得到如图7所示的热力图,颜色反映了相关系数的大小.1)不考虑对数比方差偏小的变量:C a O、S r O、F e2O3和B a O;2)高度线性相关的变量组合为S i O2-A l2O3、N a2O-K2O-S O2和F e2O3-C u O;3)以上组合中,组间几乎正交,即相关性不强部分理论解释:对于S i O2和A l2O3,两者之间易以络合的方式形成S i-O-S i 键、S i-O-A l 键

45、,形成铝硅酸盐,即硅酸盐中的S i O4四面体的一部分由A l O4四面体取代组成,故两者之间含量可能存在一定的相似性.对于N a2O和K2O,钠和钾作为同族元素性质相似,在制造高钾玻璃的过程中会加入草木灰(碳酸钾和少量磷)、泡碱(水合碳酸钠)、硝石(硝酸钾)等物质,故钠和钾的含量具有一定的相关性.5.2 铅钡玻璃成分相关性针对铅钡玻璃数据集计算P e a r s o n相关系数矩阵,得到如图8所示的热力图,颜色反映了相关系数大小.1)对数比变化偏小的变量:K2O、S r O.2)高度线性相关的变量组合为:B a O-C u O-M g O 负相关-F e2O3 负相关;P2O5-C a O-

46、N a2O 负相关.3)以上组合中,组间几乎正交,即相关性不强.部分理论解释:关于B a O-C u O-M g O组合,由于镁钡作为同族元素,性质具有相似性,故具有强线性关系,而铜和镁都能提供氧化层保护以阻碍金属离子移动,达到05第1 2卷 第2期数学建模及其应用V o l.1 2 N o.2 J u n.2 0 2 3防风化的目的,在功能上相互有替代性(混合碱效应和阻塞效应).5.3 高钾玻璃和铅钡玻璃成分关系对比变量对数比的大小方面,铅钡玻璃整体上是高度变化的,但作为铅钡玻璃主要成分之一的P b O的相对含量却基本上没有变化,K2O和S r O也基本保持稳定;高钾玻璃变化大的变量相对较少

47、,除去C a O、S r O、F e2O3和B a O,其他的成分相对含量都基本稳定.变量对数比的相关性方面,铅钡玻璃有强相关性的是B a O-C u O-M g O 负相关-F e2O3 负相关、P2O5-C a O-N a2O 负相关;高钾玻璃是S i O2-A l2O3、N a2O-K2O-S O2、F e2O3-C u O.并且相对而言,高钾玻璃存在线性相关关系的变量对数比之间的相关系数更接近 1 或-1(余弦值绝对值更大).参考文献1 全国大学生数学建模组委会.2 0 2 2“高教社杯”全国大学生数学建模竞赛赛题E B/O L.2 0 2 2-0 9-1 5.h t t p:/w w

48、 w.m c m.e d u.c n/h t m l_c n/n o d e/5 2 6 7 f e 3 e 6 a 5 1 2 b e c 7 9 3 d 7 1 f 2 b 2 0 6 1 4 9 7.h t m l.2E g o z c u e J J.A n a l y s i s o f c o m p o s i t i o n a l d a t aM.W e s t S u s s e x:W i l e y,2 0 1 5.3G e r a l d K.A n a l y z i n g c o m p o s i t i o n a l d a t a w i t h RM

49、.N e w Y o r k:S p r i n g e r,2 0 1 1.4F i l z m o s e r P.A p p l i e d c o m p o s i t i o n a l d a t a a n a l y s i sM.N e w Y o r k:S p r i n g e r,2 0 1 8.5F i l z m o s e r P.C o r r e l a t i o n a n a l y s i s f o r c o m p o s i t i o n a l d a t aJ.M a t h G e o s c i,2 0 0 9,4 1:9 0 5

50、-9 1 9.6 张学工.关于统计学习理论与支持向量机J.自动化学报,2 0 0 0,2 6(1):3 6-4 6.7 居红云,张俊本,李朝峰,等.基于K-m e a n s与S VM结合的遥感图像全自动分类方法J.计算机应用研究,2 0 0 7,2 4(1 1):3 1 8-3 2 0.8P a r k J.U n c e r t a i n t y a n d s e n s i t i v i t y i n s u p p o r t v e c t o r m a c h i n e sD.O k l a h o m a:U n i v e r s i t y o f O k l a

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 专业资料 > 其它

copyright@ 2008-2023 wnwk.com网站版权所有

经营许可证编号:浙ICP备2024059924号-2