系统仿真学报 ›› 2019, Vol. 31 ›› Issue (9): 1755-1762.doi: 10.16182/j.issn1004731x.joss.19-0401
刘擘龙1, 李喆2
收稿日期:
2019-07-31
修回日期:
2019-08-02
发布日期:
2019-12-12
通讯作者:
李喆(1977-),女,江苏,硕士,副教授,研究方向为大数据分析。
作者简介:
刘擘龙(1993-),男,甘肃,硕士生,研究方向为深度学习、数据挖掘
基金资助:
Liu Bolong1, Li Zhe2
Received:
2019-07-31
Revised:
2019-08-02
Published:
2019-12-12
摘要: 针对传统数据分析方法寻找高维复杂数据间隐藏模式存在局限性的问题,提出基于拓扑数据分析的高维数据隐藏模式挖掘方法,通过提取复杂高维数据的特征,分析其形状和样本的相互关系来获得数据集隐藏模式。利用拓扑数据分析对高维数据集-声音的性别识别进行实例验证, 同时对数据集数据子组以及相关数据子组之间关系进行可视化分析,结果表明所提方法可发现传统方法无法发现的数据子组之间隐含的关系和模式,得到了比传统方法更精细有效的结果,验证了所提方法对高维数据隐藏模式挖掘的强大性和有效性。
中图分类号:
刘擘龙, 李喆. 基于拓扑数据分析的高维数据隐藏模式挖掘[J]. 系统仿真学报, 2019, 31(9): 1755-1762.
Liu Bolong, Li Zhe. High-dimensional data hiding pattern mining based on topology data analysis[J]. Journal of System Simulation, 2019, 31(9): 1755-1762.
[1] 海沫. 大数据聚类算法综述[J]. 计算机科学, 2016, 43(增1): 380-383. Hai Mo.Overview of Big Data Clustering Algorithms[J]. Computer Science, 2016, 43(S1): 380-383. [2] 王光宏, 蒋平. 数据挖掘综述[J]. 同济大学学报(自然科学版), 2004(2): 246-252. Wang Guanghong, Jiang Ping.A Survey of Data Mining[J]. Journal of Tongji University (Natural Science), 2004(2): 246-252. [3] 孙喜利. 高维数据的降维及聚类方法研究[D]. 兰州: 兰州大学, 2016. Sun Xili.Research on Dimensionality Reduction and Clustering Method of High Dimensional Data[D]. Lanzhou: Lanzhou University, 2016. [4] Treshansky A, Mcgraw R M.Overview of clustering algorithms[J]. Proceedings of SPIE - The International Society for Optical Engineering, 2001, 4367: 41-51. [5] Medina P S, Doerge R W. Statistical Methods in Topological Data Analysis for Complex, High-Dimensional Data[J]. arXiv:1607.05150 [stat] (S2331-8422), 2016. https://arxiv.org/abs/1607.05150. [6] Lum P Y, Singh G, Lehman A, et al.Extracting insights from the shape of complex data using topology[J]. Scientific Reports (S2045-2322), 2013, 3(1): 1236 [7] Khasawneh F A, Munch E, Perea J A.Chatter Classification in Turning Using Machine Learning and Topological Data Analysis[J]. IFAC-Papers On Line (S2405-8963), 2018, 51(14): 195-200. [8] 马昱欣, 曹震东, 陈为. 可视化驱动的交互式数据挖掘方法综述[J]. 计算机辅助设计与图形学学报, 2016, 28(1): 1-8. Ma Yuxin, Cao Zhendong, Chen Wei.A Review of Visualized Driven Interactive Data Mining Methods[J]. Journal of Computer-Aided Design & Computer Graphics, 2016, 28(1): 1-8. [9] Carlsson G.Topology and data[J]. Bulletin of the American Mathematical Society (S0273-0979), 2009, 46(2): 255-308. [10] Liu S, Maljovec D, Wang B, et al.Visualizing High-Dimensional Data: Advances in the Past Decade[J]. IEEE Transactions on Visualization and Computer Graphics (S1077-2626), 2017, 23(3): 1249-1268. [11] Chazal F, Michel B. An introduction to Topological Data Analysis: fundamental and practical aspects for data scientists[J]. arXiv:1710.04019 [cs, math, stat] (S2331-8422), 2017. https://arxiv.org/abs/1710.04019. [12] Wasserman L. Topological Data Analysis[J]. arXiv:1609.08227 [stat] (S2331-8422), 2016. https://doi.org/10.1038/s41566-018-0148-x. [13] Dey T K, Memoli f, Wang Y. Mutiscale MAPPER: A Framework for Topological Summarization of Data and Maps[J]. arXiv:1504.03763 [cs, math] (S2331-8422), 2015. https://arxiv.org/abs/1504.03763. [14] Singh G, Mémoli F, Carlsson G E. Topological methods for the analysis of high dimensional data sets and 3d object recognition[C]// SPBG.2007: 91-100. https://www.ayasdi.com/wp-content/uploads/2015/02/Topological_Methods_for_the_Analysis_of_High_Dimensional_Data_Sets_and_3D_Object_Recognition.pdf. |
[1] | 李智杰, 石昊琦, 李昌华, 张颉. 基于改进遗传算法的影像中心布局优化方法[J]. 系统仿真学报, 2022, 34(6): 1173-1184. |
[2] | 陈斌, 刘悦, 杨亚磊. 基于STN的机场航班过站保障时间协同规划建模[J]. 系统仿真学报, 2022, 34(6): 1196-1207. |
[3] | 杨凯, 陈纯毅, 胡小娟, 于海洋. 蒙卡渲染画面多特征非局部均值滤波降噪算法[J]. 系统仿真学报, 2022, 34(6): 1259-1266. |
[4] | 陈麒, 崔昊杨. 基于改进鸽群层级的无人机集群视觉巡检模型[J]. 系统仿真学报, 2022, 34(6): 1275-1285. |
[5] | 王沐晴, 张磊, 范秀敏, 骆晓萌, 朱文敏. VR外设驱动的虚拟人姿态优化仿真方法[J]. 系统仿真学报, 2022, 34(6): 1296-1303. |
[6] | 陆承, 靳学胜. 基于Steam VR的交互仿真水枪灭火训练系统设计[J]. 系统仿真学报, 2022, 34(6): 1312-1319. |
[7] | 高宏鼐, 付丽疆, 夏倩, 郭亚. 可观测度在光合作用模型性能评估中的应用[J]. 系统仿真学报, 2022, 34(6): 1330-1342. |
[8] | 倪凌佳, 黄晓霞, 李红旮, 张子博. 基于协作式深度强化学习的火灾应急疏散仿真研究[J]. 系统仿真学报, 2022, 34(6): 1353-1366. |
[9] | 蒙盾, 胡卓, 张华军. 基于改进A*算法的多层邮轮疏散系统仿真[J]. 系统仿真学报, 2022, 34(6): 1375-1382. |
[10] | 郭宇飞, 赵康, 海永清. 面向有限元分析的三角网格布尔运算方法[J]. 系统仿真学报, 2022, 34(5): 1003-1014. |
[11] | 吴桐, 王清辉, 徐志佳. 三周期极小曲面多孔材料渗透率尺度特性研究[J]. 系统仿真学报, 2022, 34(5): 1015-1024. |
[12] | 蒋阳升, 王思琛, 高宽, 刘梦, 姚志洪. 混入智能网联车队的混合交通流元胞自动机模型[J]. 系统仿真学报, 2022, 34(5): 1025-1032. |
[13] | 梁江涛, 王慧琴. 基于改进蚁群算法的建筑火灾疏散路径规划研究[J]. 系统仿真学报, 2022, 34(5): 1044-1053. |
[14] | 张其文, 张斌. 基于教学优化算法求解置换流水车间调度问题[J]. 系统仿真学报, 2022, 34(5): 1054-1063. |
[15] | 邢根上, 鲁芳, 李书山, 罗定提. 基于产品体验性的供应链交货模型与仿真研究[J]. 系统仿真学报, 2022, 34(5): 1064-1075. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||