HFCAS OpenIR
基于假设检验的多数据源知识发现研究
其他题名Hypothesis Testing Based Knowledge Discovery in Distributed Multi-Data Sources
2005-01-01
发表期刊模式识别与人工智能
ISSN1003-6059
摘要现行的数据挖掘算法大多是针对单一数据源进行挖掘,多数据源挖掘是网络分布式状况下KDD所面临的新问题,是解决基于全局数据分布状态下知识发现问题的有效技术。本文提出了一种多数据源知识发现新方法,该方法通过共享从其它数据源中发现的知识模式,采用抽样检验的方法来判断知识在本地数据源的有效性,大大提高了知识发现的效率。实验结果表明了该方法的有效性,该方法可以进一步推广,作为对已知模式的高效知识发现方法,并可应用于增量式知识发现。
其他摘要Nowadays, the techniques of data mining focus on single data source. Mining from multi-data sources is a new problem in Web environment and is also an efficient technique for solving knowledge discovery in distributed databases. A new method for mining multi-data sources is presented in this paper. By sharing knowledge patterns discovered in other similar data sources, hypothesis testing is employed for verifying whether the patterns are also suitable for local data source. The efficiency of KDD can be improved greatly. Finally, the effectiveness of this method is analyzed and experimental result is given. This method can be extended as an efficient data mining algorithm in case of apriori hypothesizes are provided. And it can be also used for incremental data mining.
关键词多数据源 假设检验 知识共享 知识发现
收录类别CSCD
语种中文
CSCD记录号CSCD:2044925
引用统计
文献类型期刊论文
条目标识符http://ir.hfcas.ac.cn:8080/handle/334002/66115
专题中国科学院合肥物质科学研究院
推荐引用方式
GB/T 7714
. 基于假设检验的多数据源知识发现研究[J]. 模式识别与人工智能,2005,018.
APA (2005).基于假设检验的多数据源知识发现研究.模式识别与人工智能,018.
MLA "基于假设检验的多数据源知识发现研究".模式识别与人工智能 018(2005).
条目包含的文件
条目无相关文件。
个性服务
推荐该条目
保存到收藏夹
查看访问统计
导出为Endnote文件
谷歌学术
谷歌学术中相似的文章
百度学术
百度学术中相似的文章
必应学术
必应学术中相似的文章
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。