系统仿真学报 ›› 2019, Vol. 31 ›› Issue (9): 1755-1762.doi: 10.16182/j.issn1004731x.joss.19-0401
刘擘龙1, 李喆2
收稿日期:2019-07-31
修回日期:2019-08-02
发布日期:2019-12-12
通讯作者:
李喆(1977-),女,江苏,硕士,副教授,研究方向为大数据分析。
第一作者简介:刘擘龙(1993-),男,甘肃,硕士生,研究方向为深度学习、数据挖掘
基金资助:Liu Bolong1, Li Zhe2
Received:2019-07-31
Revised:2019-08-02
Published:2019-12-12
摘要: 针对传统数据分析方法寻找高维复杂数据间隐藏模式存在局限性的问题,提出基于拓扑数据分析的高维数据隐藏模式挖掘方法,通过提取复杂高维数据的特征,分析其形状和样本的相互关系来获得数据集隐藏模式。利用拓扑数据分析对高维数据集-声音的性别识别进行实例验证, 同时对数据集数据子组以及相关数据子组之间关系进行可视化分析,结果表明所提方法可发现传统方法无法发现的数据子组之间隐含的关系和模式,得到了比传统方法更精细有效的结果,验证了所提方法对高维数据隐藏模式挖掘的强大性和有效性。
中图分类号:
刘擘龙,李喆 . 基于拓扑数据分析的高维数据隐藏模式挖掘[J]. 系统仿真学报, 2019, 31(9): 1755-1762.
Liu Bolong,Li Zhe . High-dimensional data hiding pattern mining based on topology data analysis[J]. Journal of System Simulation, 2019, 31(9): 1755-1762.
| [1] 海沫. 大数据聚类算法综述[J]. 计算机科学, 2016, 43(增1): 380-383. Hai Mo.Overview of Big Data Clustering Algorithms[J]. Computer Science, 2016, 43(S1): 380-383. [2] 王光宏, 蒋平. 数据挖掘综述[J]. 同济大学学报(自然科学版), 2004(2): 246-252. Wang Guanghong, Jiang Ping.A Survey of Data Mining[J]. Journal of Tongji University (Natural Science), 2004(2): 246-252. [3] 孙喜利. 高维数据的降维及聚类方法研究[D]. 兰州: 兰州大学, 2016. Sun Xili.Research on Dimensionality Reduction and Clustering Method of High Dimensional Data[D]. Lanzhou: Lanzhou University, 2016. [4] Treshansky A, Mcgraw R M.Overview of clustering algorithms[J]. Proceedings of SPIE - The International Society for Optical Engineering, 2001, 4367: 41-51. [5] Medina P S, Doerge R W. Statistical Methods in Topological Data Analysis for Complex, High-Dimensional Data[J]. arXiv:1607.05150 [stat] (S2331-8422), 2016. https://arxiv.org/abs/1607.05150. [6] Lum P Y, Singh G, Lehman A, et al.Extracting insights from the shape of complex data using topology[J]. Scientific Reports (S2045-2322), 2013, 3(1): 1236 [7] Khasawneh F A, Munch E, Perea J A.Chatter Classification in Turning Using Machine Learning and Topological Data Analysis[J]. IFAC-Papers On Line (S2405-8963), 2018, 51(14): 195-200. [8] 马昱欣, 曹震东, 陈为. 可视化驱动的交互式数据挖掘方法综述[J]. 计算机辅助设计与图形学学报, 2016, 28(1): 1-8. Ma Yuxin, Cao Zhendong, Chen Wei.A Review of Visualized Driven Interactive Data Mining Methods[J]. Journal of Computer-Aided Design & Computer Graphics, 2016, 28(1): 1-8. [9] Carlsson G.Topology and data[J]. Bulletin of the American Mathematical Society (S0273-0979), 2009, 46(2): 255-308. [10] Liu S, Maljovec D, Wang B, et al.Visualizing High-Dimensional Data: Advances in the Past Decade[J]. IEEE Transactions on Visualization and Computer Graphics (S1077-2626), 2017, 23(3): 1249-1268. [11] Chazal F, Michel B. An introduction to Topological Data Analysis: fundamental and practical aspects for data scientists[J]. arXiv:1710.04019 [cs, math, stat] (S2331-8422), 2017. https://arxiv.org/abs/1710.04019. [12] Wasserman L. Topological Data Analysis[J]. arXiv:1609.08227 [stat] (S2331-8422), 2016. https://doi.org/10.1038/s41566-018-0148-x. [13] Dey T K, Memoli f, Wang Y. Mutiscale MAPPER: A Framework for Topological Summarization of Data and Maps[J]. arXiv:1504.03763 [cs, math] (S2331-8422), 2015. https://arxiv.org/abs/1504.03763. [14] Singh G, Mémoli F, Carlsson G E. Topological methods for the analysis of high dimensional data sets and 3d object recognition[C]// SPBG.2007: 91-100. https://www.ayasdi.com/wp-content/uploads/2015/02/Topological_Methods_for_the_Analysis_of_High_Dimensional_Data_Sets_and_3D_Object_Recognition.pdf. |
| [1] | 董志明, 胡忠奇, 戴浩然, 高建成. 基于大语言模型的作战仿真想定自动化生成方法[J]. 系统仿真学报, 2026, 38(5): 1129-1145. |
| [2] | 李校男, 晁涛, 马萍, 杨明, 王玉轩. 基于期望最大化方法的非线性SSM黑箱鲁棒辨识[J]. 系统仿真学报, 2026, 38(5): 1146-1158. |
| [3] | 刘银钢, 马明, 张荣华. 基于大语言模型的兵棋推演动态任务规划[J]. 系统仿真学报, 2026, 38(5): 1187-1204. |
| [4] | 苏泓嘉, 张成, 刘飞. 基于模糊功能依赖网分析的体系效能评估方法[J]. 系统仿真学报, 2026, 38(5): 1224-1238. |
| [5] | 梅华威, 杨鹏慧, 余洋. 计及数据漂移改进PatchTST的超短期光伏功率预测[J]. 系统仿真学报, 2026, 38(5): 1239-1254. |
| [6] | 李权, 苏鹏, 万海英, 张承玺, 何志坚, 倪艺洋, 赵忠盖, 刘飞. 基于多阶段LHS-EPRCC方法的青霉素发酵过程建模[J]. 系统仿真学报, 2026, 38(5): 1255-1276. |
| [7] | 周子聪, 曾俊杰, 胡越, 朱正秋, 尹全军. 基于次优示例引导的兵棋推演多智能体强化学习方法[J]. 系统仿真学报, 2026, 38(5): 1277-1289. |
| [8] | 石敏, 郭诗盛, 王素琴, 李兆歆, 朱登明. 融合物理与几何先验的无抓取标注6-DoF抓取检测方法[J]. 系统仿真学报, 2026, 38(5): 1290-1302. |
| [9] | 姜彦吉, 肖星佚, 董浩, 于淼, 黄金山, 刘大千, 费博雯. 融合点线特征的图关系优化3D车道线检测方法[J]. 系统仿真学报, 2026, 38(5): 1303-1319. |
| [10] | 张鑫, 张平, 张琛, 刘威, 韩博阳. 非均质土壤条件下挖掘阻力计算模型研究[J]. 系统仿真学报, 2026, 38(5): 1320-1332. |
| [11] | 王伟, 刘东, 崔新豪, 李博, 肖依永, 任羿. 复杂项目多级动态挣值管理数字化模型及应用[J]. 系统仿真学报, 2026, 38(5): 1350-1364. |
| [12] | 彭莉峻, 苏庭琪, 刘沛津, 何林, 周协武, 张闽心. 融合人体关键点的实验室PPE规范穿戴检测方法[J]. 系统仿真学报, 2026, 38(5): 1365-1382. |
| [13] | 滕靖, 童文聪, 张中杰, 姚幸, 李君羡. 有轨电车交叉口速度自动引导方法及仿真评价[J]. 系统仿真学报, 2026, 38(5): 1426-1439. |
| [14] | 蒋圣超, 裴云庆, 翟宏营, 吴国键, 高放. 基于块编码绝热量子牛顿‒拉夫逊法的潮流计算[J]. 系统仿真学报, 2026, 38(5): 1453-1465. |
| [15] | 秦浪, 谢嘉成, 乔晓军, 王学文, 肖智杰. 执行器位姿异常的机器人轨迹规划调整方法[J]. 系统仿真学报, 2026, 38(5): 1466-1483. |
| 阅读次数 | ||||||
|
全文 |
|
|||||
|
摘要 |
|
|||||