系统仿真学报 ›› 2019, Vol. 31 ›› Issue (9): 1755-1762.doi: 10.16182/j.issn1004731x.joss.19-0401
刘擘龙1, 李喆2
收稿日期:2019-07-31
修回日期:2019-08-02
发布日期:2019-12-12
通讯作者:
李喆(1977-),女,江苏,硕士,副教授,研究方向为大数据分析。
第一作者简介:刘擘龙(1993-),男,甘肃,硕士生,研究方向为深度学习、数据挖掘
基金资助:Liu Bolong1, Li Zhe2
Received:2019-07-31
Revised:2019-08-02
Published:2019-12-12
摘要: 针对传统数据分析方法寻找高维复杂数据间隐藏模式存在局限性的问题,提出基于拓扑数据分析的高维数据隐藏模式挖掘方法,通过提取复杂高维数据的特征,分析其形状和样本的相互关系来获得数据集隐藏模式。利用拓扑数据分析对高维数据集-声音的性别识别进行实例验证, 同时对数据集数据子组以及相关数据子组之间关系进行可视化分析,结果表明所提方法可发现传统方法无法发现的数据子组之间隐含的关系和模式,得到了比传统方法更精细有效的结果,验证了所提方法对高维数据隐藏模式挖掘的强大性和有效性。
中图分类号:
刘擘龙,李喆 . 基于拓扑数据分析的高维数据隐藏模式挖掘[J]. 系统仿真学报, 2019, 31(9): 1755-1762.
Liu Bolong,Li Zhe . High-dimensional data hiding pattern mining based on topology data analysis[J]. Journal of System Simulation, 2019, 31(9): 1755-1762.
| [1] 海沫. 大数据聚类算法综述[J]. 计算机科学, 2016, 43(增1): 380-383. Hai Mo.Overview of Big Data Clustering Algorithms[J]. Computer Science, 2016, 43(S1): 380-383. [2] 王光宏, 蒋平. 数据挖掘综述[J]. 同济大学学报(自然科学版), 2004(2): 246-252. Wang Guanghong, Jiang Ping.A Survey of Data Mining[J]. Journal of Tongji University (Natural Science), 2004(2): 246-252. [3] 孙喜利. 高维数据的降维及聚类方法研究[D]. 兰州: 兰州大学, 2016. Sun Xili.Research on Dimensionality Reduction and Clustering Method of High Dimensional Data[D]. Lanzhou: Lanzhou University, 2016. [4] Treshansky A, Mcgraw R M.Overview of clustering algorithms[J]. Proceedings of SPIE - The International Society for Optical Engineering, 2001, 4367: 41-51. [5] Medina P S, Doerge R W. Statistical Methods in Topological Data Analysis for Complex, High-Dimensional Data[J]. arXiv:1607.05150 [stat] (S2331-8422), 2016. https://arxiv.org/abs/1607.05150. [6] Lum P Y, Singh G, Lehman A, et al.Extracting insights from the shape of complex data using topology[J]. Scientific Reports (S2045-2322), 2013, 3(1): 1236 [7] Khasawneh F A, Munch E, Perea J A.Chatter Classification in Turning Using Machine Learning and Topological Data Analysis[J]. IFAC-Papers On Line (S2405-8963), 2018, 51(14): 195-200. [8] 马昱欣, 曹震东, 陈为. 可视化驱动的交互式数据挖掘方法综述[J]. 计算机辅助设计与图形学学报, 2016, 28(1): 1-8. Ma Yuxin, Cao Zhendong, Chen Wei.A Review of Visualized Driven Interactive Data Mining Methods[J]. Journal of Computer-Aided Design & Computer Graphics, 2016, 28(1): 1-8. [9] Carlsson G.Topology and data[J]. Bulletin of the American Mathematical Society (S0273-0979), 2009, 46(2): 255-308. [10] Liu S, Maljovec D, Wang B, et al.Visualizing High-Dimensional Data: Advances in the Past Decade[J]. IEEE Transactions on Visualization and Computer Graphics (S1077-2626), 2017, 23(3): 1249-1268. [11] Chazal F, Michel B. An introduction to Topological Data Analysis: fundamental and practical aspects for data scientists[J]. arXiv:1710.04019 [cs, math, stat] (S2331-8422), 2017. https://arxiv.org/abs/1710.04019. [12] Wasserman L. Topological Data Analysis[J]. arXiv:1609.08227 [stat] (S2331-8422), 2016. https://doi.org/10.1038/s41566-018-0148-x. [13] Dey T K, Memoli f, Wang Y. Mutiscale MAPPER: A Framework for Topological Summarization of Data and Maps[J]. arXiv:1504.03763 [cs, math] (S2331-8422), 2015. https://arxiv.org/abs/1504.03763. [14] Singh G, Mémoli F, Carlsson G E. Topological methods for the analysis of high dimensional data sets and 3d object recognition[C]// SPBG.2007: 91-100. https://www.ayasdi.com/wp-content/uploads/2015/02/Topological_Methods_for_the_Analysis_of_High_Dimensional_Data_Sets_and_3D_Object_Recognition.pdf. |
| [1] | 黄涛, 张智, 丁玉杰, 陈艳波, 王晶, 张文倩. 考虑动态频率安全与N-k故障的鲁棒应急调度方法[J]. 系统仿真学报, 2025, 37(12): 2981-2993. |
| [2] | 张润昭, 陈艳波, 黄涛, 田昊欣, 强涂奔, 张智. 基于异构负荷特征解析预测的虚拟电厂调度方法[J]. 系统仿真学报, 2025, 37(12): 2994-3006. |
| [3] | 于祥星, 赵艳东, 张宝琳. 基于电涡流NES的海上风机塔架振动控制[J]. 系统仿真学报, 2025, 37(12): 3007-3017. |
| [4] | 李斌, 王于绰. 基于多策略融合的光伏系统故障诊断方法[J]. 系统仿真学报, 2025, 37(12): 3018-3032. |
| [5] | 李孝斌, 胡冰, 尹超, 李波, 马军. 基于时空图卷积的汽车配件供应链需求预测与仿真分析[J]. 系统仿真学报, 2025, 37(12): 3060-3074. |
| [6] | 彭艺, 雷云揆, 杨青青, 李辉, 王健明. 改进PID搜索算法的山地环境无人机路径规划[J]. 系统仿真学报, 2025, 37(12): 3075-3086. |
| [7] | 陈逸, 邱思航, 朱正秋, 季雅泰, 赵勇, 鞠儒生. 基于启发式的人-大模型协作寻源方法[J]. 系统仿真学报, 2025, 37(12): 3112-3127. |
| [8] | 索婧怡, 卢柏宏, 屈澈. 影视LED光源光强分布测定及其在游戏引擎中的仿真研究[J]. 系统仿真学报, 2025, 37(12): 3140-3151. |
| [9] | 龚建兴, 胡海, 任海慧, 吴瑞祥. 面向虚实结合的军事训练系统互操作模型与运用[J]. 系统仿真学报, 2025, 37(12): 3161-3175. |
| [10] | 徐智霞, 王蕊, 孙楠, 何兵, 沈晓卫, 朱晓菲. 基于改进遗传算法的协同干扰资源分配问题研究[J]. 系统仿真学报, 2025, 37(12): 3176-3189. |
| [11] | 刘翔, 金乾坤. 基于PAC-Bayes的多目标强化学习A2C算法研究[J]. 系统仿真学报, 2025, 37(12): 3212-3223. |
| [12] | 杨兰英, 李超, 邹海锋, 万江涛, 张仁强, 刘惠, 卢宏. 基于改进蚁群算法与A*算法相融合的机器人路径规划优化[J]. 系统仿真学报, 2025, 37(11): 2956-2965. |
| [13] | 苏筱婷, 张小威, 田义, 李奇, 王帅豪. 星光导航动态仿真场景时序设计方法研究[J]. 系统仿真学报, 2025, 37(11): 2946-2955. |
| [14] | 张志利, 刘瑾, 周召发, 梁哲, 张云昊. 基于ISCSO-BP神经网络模型的光纤陀螺温度补偿技术研究[J]. 系统仿真学报, 2025, 37(11): 2904-2917. |
| [15] | 陈际同, 周佳加, 吴迪, 江海龙. 基于TD3-RRT的特殊环境下USV路径规划算法研究[J]. 系统仿真学报, 2025, 37(11): 2888-2903. |
| 阅读次数 | ||||||
|
全文 |
|
|||||
|
摘要 |
|
|||||