[1] |
孟小峰, 慈祥. 大数据管理: 概念、技术与挑战[J]. 计算机研究与发展, 2013, 50(1): 146-169.
|
[2] |
刘则渊, 陈悦, 候海燕, 等. 科学知识图谱:方法与应用 [M]. 北京: 人民出版社, 2008: 19-20.
|
[3] |
杨思洛, 韩瑞珍. 知识图谱研究现状及趋势的可视化分析[J]. 情报资料工作, 2012, 3(4): 22-28.
|
[4] |
Herl HE, Jr HFO, Chung GKWK, et al.Reliability and validity of a computer-based knowledge mapping system to measure content understanding[J]. Computers in Human Behavior (S0747-5632),1999, 15(3/4): 315-333.
|
[5] |
Keim D A.Information Visualization and Visual Data Mining[J]. IEEE Transactions on Visualization (S1077-2626),2002, 8(1): 1-8.
|
[6] |
张卓, 宣蕾, 郝树勇. 可视化技术研究与比较[J]. 现代电子技术, 2010, 33(17): 133-138.
|
[7] |
周德懋, 李舟军. 高性能网络爬虫: 研究综述[J]. 计算机科学, 2009, 36(8): 26-29.
|
[8] |
肖毅, 张林, 聂笑一. 基于WEB挖掘的网络爬虫设计与实现[J]. 计算机系统应用, 2013(9): 60-63.
|
[9] |
范珊珊, 李石君. 基于优先级队列的分布式多主题爬虫[J]. 计算机工程与设计, 2015, 6(6): 1630-1636.
|
[10] |
Gupta S, Kaiser G E, Grimm P, et al.Automating Content Extraction of HTML Documents[J]. World Wide Web-internet & Web Information Systems (S1386-145X), 2005, 8(2): 179-224.
|
[11] |
Mane T B, Potdar G P.Template Extraction from Heterogeneous Web Pages[J]. International Journal of Advanced Computer Research (S2249-7277), 2012, 2(6): 2278-0181.
|
[12] |
常育红, 姜哲, 朱小燕. 基于标记树表示方法的页面结构分析[J]. 计算机工程与应用, 2004, 40(16): 129-132.
|
[13] |
Cattell R.Scalable SQL and NoSQL data stores[J]. Acm Sigmod Record (S0163-5808), 2011, 39(4): 12-27.
|
[14] |
王利, 刘宗田, 王燕华, 等. 基于内容相似度的网页正文提取[J]. 计算机工程, 2010, 36(6): 102-104.
|
[15] |
殷彬, 杨会志. 灵活结构网页的正文提取[J]. 计算机技术与发展, 2011, 21(9): 111-113.
|
[16] |
张小欢. 中文分词系统的设计和实现 [D]. 成都: 电子科技大学, 2010.
|
[17] |
姜维. 统计中文词法分析及其强化学习机制的研究 [D]. 哈尔滨: 哈尔滨工业大学, 2007.
|
[18] |
胡金栋. 网页正文提取及去重技术研究 [D]. 杭州: 浙江大学, 2011.
|
[19] |
梁正友, 欧杰, 俞闽敏. 基于图文有效信息量的网页正文定位[J]. 计算机工程, 2011, 37(23): 276-278.
|