检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南京财经大学电子商务实验室,南京210003 [2]复旦大学计算机与信息技术系,上海200433
出 处:《计算机研究与发展》2004年第2期361-368,共8页Journal of Computer Research and Development
基 金:国家"八六三"高技术研究发展计划基金项目 ( 2 0 0 1AA113 181);上海市科学技术发展基金项目 (0151150 10);信息产业部科研试制计划基金项目 ( 0 1XK3 10 0 12 )
摘 要:量化交易数据与一般交易数据的不同之处在于它在各个维上的值是数值型而不是二值型的 研究这种数据的有效的相似性搜索方法是一个重要而具有挑战性的课题 提出了一个新的相似性度量函数Hsim() ,这个度量函数可以较好地克服Lp 等传统的距离函数在高维空间中的缺点 ,并能将二值型和数值型数据距离的计算整合到一个统一的框架中去 结合量化交易数据的特点 ,构造了定义在该函数上的相似性索引结构 ,并对建立在该索引结构上的相似性查询方法进行了阐述 实验表明 ,这种搜索方法对量化交易数据的相似性搜索有较高的修剪率 。The difference of the quantitative transaction data from the common transaction data is that the value of each dimension is quantitative, not binary. The study of the efficient method for similarity search on the quantitative transaction data is very important and challenging. A new function Hsim() is presented to measure the proximity of objects in high dimensional spaces. The function can overcome the shortcoming of L p-norm and other distance functions, and adapt to binary and numerical data. According to the characteristic of the quantitative transaction data, a similarity indexing structure based on Hsim() is constructed, and an algorithm for similarity search on quantitative transaction data is also described. Experiments demonstrate that this method has very good pruning efficiency for similarity search on the quantitative transaction data, so it can greatly speed the similarity search.
关 键 词:相似性搜索 高维数据 距离函数 量化交易数据 索引结构
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222