
姓名:尚达英 学号: 01126688
练习题目:关于网络信息挖掘方面的相关文献
1.分析检索概念,拟定检索策略:
1)分析检索概念
本课题的主要概念为 “网络”“信息”“挖掘”,对应的英语单词为:
网络:web, web-based, internet, network, networked
信息: information
挖掘: mine, mining
2)拟定检索策略
(web* or internet or net*) and information and min*
2.快速检索界面检索过程和得到的检索结果
逻辑关系选择 键入检索文本框的策略(Search for) 选择的字段(Search in)
web* or internet or net* Subject/title/abstract
AND Information Subject/title/abstract
AND Min* Subject/title/abstract
检索选项设置取默认状态,以上策略结果为21879篇
21879 records in Compendex for 1969-2009
((((web* or internet or net*) WN KY) AND (( information) WN KY)) AND ((min*) WN KY)) 因为检索结果篇数过多,利用检索结果选项,将文献类型为只检索期刊论文(Journal article),文献性质为实验性质的论文(Experimental),语言为英语(English), 年份为2007年。
系统给出的结果篇数和检索策略分别为:
171 records in Compendex for 2007-2007
((((web* or internet or net*) WN KY) AND (( Information) WN KY)) AND (( Min* ) WN KY)), Journal article only, Experimental only
(说明:如果拟定检索策略所得结果篇数不多,可以不作检索结果选项。系统给出的检索策略和结果篇数应从检索结果页复制粘贴)
3. 专家检索界面检索过程和得到的检索结果
考虑到上步检索所得文献篇数偏多,专家检索界面除继续使用年份外,还使用near算符,以作进一步。调整后的检索策略为:
1) (web* onear information onear min*) wn ti
得到的检索结果篇数为:12 records in Compendex for 2007-2007
(web* onear information onear min*) wn ti 注意:下面的检索式是错误的!!
((web* or internet or net*) onear information onear min*)wn ti
这是由于优先算符和位置算符联用所致
选取其中第一篇切题文献的题录信息如下:
Adapting Web information extraction knowledge via mining site-invariant and site-dependent features
Wong, Tak-Lam (City University of Hong Kong); Lam, Wai Source: ACM Transactions on Internet Technology, v 7, n 1, Feb 1, 2007, p 6
(说明:上步检索所得文献篇数偏少,专家检索界面应使用扩展检索范围的算符和使用更多的同义词等)
2)扩展检索范围:
((web* or internet or net*) and information and min*) wn ti
系统给出的结果篇数和检索策略分别为:21 records in Compendex for 2007-2007
((web* or internet or net*) and information and min*) wn ti
