当前位置:首页 >> 初中教育 >>

哈工程-信息检索课件 (4)


这些词你能读懂吗? 发推---推油------推特---------围脖
《当微博遇上Twitter 墙里墙外存在着微妙 区别》 ---南方报业网 美国总统奥巴马--微博打造的政治明星 ---- 中国人民大学新闻学院副院长喻国明

“不用微博说明你out了”
? 微博(迷你博客、微型博客、一句话博客),可 以把你看到、想到的写成一句话,每

次不超过 140个字或一张图片,通过电脑或手机等多种方 式随时随地与朋友分享。 ? 与博客相比,微博更像一种对琐碎杂事或者心情 的自言自语; ? 微博,让表达变得简单、充分、自由; ? 国际上最知名的迷你博客网站:Twitter ? Plurk、嘀咕、做啥、同学网、新浪、分享、随 心微博……

本讲题纲
? Web2.0及相关技术 ? 搜索引擎 ? FTP ? BBS ? 网络学术资源导航 ? 免费学术网站

何谓Web2.0?
? Web2.0是相对Web1.0的新的一类互联网应 用的统称。 ? 是以Flickr、43Things.com等网站为代表, 以Blog、TAG、SNS、RSS、wiki等社会软件 的应用为核心的新一代互联网模式。 ? Web2.0更注重用户的交互作用,用户既是 网站内容的浏览者,也是网站内容的制造 者。

Blog-博客
? 博客,Web Log的缩写,是一种十分简易的个人信 息发布方式。一个Blog就是一个网页,它通常是 由简短且经常更新的Post所构成;这些张帖的文 章都按照年份和日期排列。 ? Blog由以下主要元素构成: 日志内容;日志分类;评论;引用通告; RSS Feed输出

老徐- 刘墉父子-

Podcast-播客
? 出现初期借助一个叫“iPodder”的软件与一些便携播放器相结合 而实现。Podcasting录制的是网络广播或类似的网络声讯节目, 网友可将网上的广播节目下载到自己的iPod、MP3播放器或其它 便携式数码声讯播放器中随身收听,更有意义的是,你还可以自 己制作声音节目,并将其上传到网上与广大网友分享。 ? 就像博客颠覆了被动接受文字信息的方式一样,播客颠覆了被动 收听广播的方式,使听众成为主动参与者。有人说,播客可能会 像博客(Blog)一样,带来大众传媒的又一场革命。 ? 播客与其他音频内容传送的区别在于其订阅模式,它使用RSS 2.0文件格式传送信息。所以通过RSS的方式传播的,才应该称为 播客。如果我们承认播客是一个新事物,承认个人主页和Blog有 一定区别的话,那么单纯录了一段东西放在网上还不能算是播客。 ? “播客”与博客系出同门,2001年,Dave?Winer 在RSS2.0说明 里增加了声音元素,之后,Winer的公司UserLand Software把这 项功能内嵌到其博客软件中。目前几乎所有的Podcaster都是 Blogger。

播客:-土豆网、优酷网

TAG及分众分类
? 分众分类是一种使用用户自由选择的关键 词对网站进行协作分类的方式,而这些关 键词一般称为标签。 ? 标签化运用了像大脑本身所使用的那种多 重的、重叠的关联,而不是死板的分类。 ? 如一幅小狗照片可能被加上“小狗”“可 爱”这样的标签,允许系统依照用户行为 所产生的自然的方式进行检索

美味书签

SNS:Social Networking Service
? 社会性网络服务,是Web2.0体系下的一个 技术应用架构。放在Web2.0的背景下,每 个用户都拥用自己的Blog、自己维护的 Wiki、社会化书签或者Podcast.用户通过 Tag、RSS或者IM、邮件等方式连接到一起, 每个个体的社交圈都不断放大,最后成为 一个大型网络,这就是SNS.

43Things.com是一个新生的SNS,它收集人们想要做的
事情,根据作者设置的tag分类,把有相同想法的人们聚集到一起

? RSS Really Simple Syndication Rich Site Summary RDF(Resource Description Framework) Site Summary ? RSS是与数据库结合最早、最普遍的Web2.0应用技术。利 用它完成数据书目推送或其它的定题查询定制。 ? 时下流行的中英文数据平台,如CNKI、万方、EI、SD等数 据库都支持RSS定制。 ? RSS定订也广泛应用于新闻、博客等网络信息的订制。 ? RSS在线与离线客户端阅读器。

RSS

RSS阅读器-google reader

Wiki
? Wiki是一种由用户共同编辑、保存编辑历 史、不断丰富与改进内容的超文本系统。 这种超文本系统支持面向社群的协作式写 作,同时也包括一组支持这种写作的辅助 工具。 ? 它供多人编写、上载和发布内容的一种网 络服务,可以构建知识网络系统,支持在 一个社群内共享领域知识。

本讲题纲
? Web2.0及相关技术 ? 搜索引擎 ? FTP ? BBS ? 网络学术资源导航 ? 免费学术网站

1、什么是搜索引擎?
? 简单地说,所谓搜索引擎,就是采用信息 自动跟踪标引等技术、建立在因特网上专 门提供网络信息资源导航服务检索工具。 ? 它能够通过Internet 接受用户的查询指令, 并向用户提供符合其查询要求的信息资源 网址。

2、搜索引擎的工作原理
? 搜索引擎由网上机器人(Spider 或 Robot)自动在网页上按某种策略进行远 程数据的搜索与获取,并生成本地索引。 ? Spider 或Robot 是一种软件,它沿着 WWW文件的链接在网上漫游,记录URL、 文件的简明摘要、关键字或索引,形成 一个很大的数据库,这种数据库包括标 题、摘要、关键词和URL、文件的大小、 语种以及词出现的频率。

3、搜索引擎的主要任务
(1) 信息搜集。 蜘蛛(Spider)或机器人(Robots) (2) 信息处理

将“网页搜索软件”带回的信息进行 分类整理,建立搜索引擎数据库,并定 时更新数据库内容。 (3) 信息查询
分类目录浏览与关键词查询。

4、搜索引擎的种类
? 检索型搜索引擎:它使用自动索引软件来发现、收集并标 引网页,建立数据库,并以Web形式让用户找到所需信息资 源。比较著名的有:AltaVista、Google、天网、百度、悠 游等。 ? 目录型搜索引擎:这类引擎将信息系统地分门归类,经过 人工整理后形成庞大而有序的分类目录体系,用户可以在 目录体系的导引下通过逐级浏览,发现、检索到有关的信 息。雅虎就是以卓越的分类目录型导航服务而称誉全球。 ? 混合型搜索引擎:它兼有检索型和目录型两种方式。如: 新浪、搜狐、网易、中华等门户网站。 ? 多元搜索引擎:也称为集合型搜索引擎。它是将多个搜索 引擎集成在一起,通过统一的检索界面进行网络信息多元 搜索 的检索工具。按照工作方式的不同可分为并行处理式 和串行处理式两大类。著名的有:Dogpile、Mamma和万维 搜索(Http:///www.widewaysearch.com)等。

5、检索型搜索引擎 Google 网址:http://www.google.cn.hk

(1)概述
Google 是从第一代搜索引擎中脱颖而出的第二代搜索引擎的 代表。1998 年,两位斯坦福大学的博士生Larry Page 和Sergey Brin 创立了Google,它的使命就是要为用户提供网上最好的查询 服务,促进全球信息的交流。Google 开发出了世界上最大的搜索 引擎,提供了最便捷的网上信息查询方法。通过对40 多亿网页进 行整理,可为世界各地的用户提供适合需要的搜索结果,而且搜 索时间通常不到半秒。现在Google 每天需要提供1.5亿次查询服 务。

(2)特点
? ? ? ?

支持多达132种语言;提供40多亿个搜索网页,涵盖内容齐全;搜索 速度快;结果命中率高; 搜索结果摘录查询网页的部分具体内容,而不仅是网站简介; 智能化的“手气不错”功能,提供可能最符合要求的网页; “网页快照”功能,能从Google服务器里直接取出缓存的网页。

(3)检索功能

基本检索:
? 逻辑“与”:检索框中的两个关键词之间用空格隔

开则默认为是“AND”(“与”运算)连接。 ? 逻辑“非”:用“—”(减号)表示,同时要求在减号 前保留一个空格。 ? 逻辑“或”:用“OR”表示。 ? 双引号、斜线、问号、等号、省略号都可以作为短 语的连接符号查找名言或专有名词。

逻辑“与”
中间是空格

中间是空格,第二 个词前有“-”号连接

逻辑“非”

连接两个关键词

逻辑“或”

? 字段限定检索 site:限定在某个特定的域或站点中进行检索。 命令格式: 检索词 site:域名 示例:要搜索北京大学招生信息。 检索式:招生简章site:pku.edu.cn inurl:表示限定搜索结果,网页的URL必须包含所规定 的字符串。 命令格式: inurl:限定的字符串检索词 示例:搜索电子商务软件环境的专题资料。许多中文网站 都以“dzsw”作为电子商务专题目录或频道名称。 检索式: inurl:dzsw软件环境 filetype:用来限定命中文件的类型。 命令格式:filetype:文件类型检索词 试析检索式: filetype:ppt信息检索

指定网域查询

(4)使用时应注意的问题:
? 不区分英文字母的大小写,所有字母均作小写对待。例 如:输入“george washington”(乔治· 华盛顿),或是 “George Washington”, 再或是“gEoRgE wAsHiNgToN”, 结果都是一样的。 ? 通配符问题。Google对通配符的支持有限,只能用“*” 代替单个字符,而且必须将检索词用引号引起来,如 “以*治国”。 ? 忽略的字符与强制检索。Google对一些出现频率极高的 英文单词,如“i”、“com”、“www”等,以及一些符号如 “*”、“.”等,作忽略处理。如果必须进行强制检索, 在这些字符前后用“+”,如“+www+的历史”,或用英文 的引号。

手气不错
? 按下“手气不错”按钮将自动进入Google 查询到的第一个网页。您将完全看不到其它 的搜索结果。使用“手气不错”进行搜索表 示用于搜索网页的时间较少而用于检查网页 的时间较多。 ? 例如,要查找哈尔滨工程大学的主页,只需 在搜索字段中输入“哈尔滨工程大学”,然 后单击“手气不错”按钮。Google 将直接 带您进入哈尔滨工程大学的官方主页

1、输入检索词 “哈尔滨工程大 学”

2、点“手气不错” 按钮

Google地图

北京站到北京大学

Google图书

6、目录型搜索引擎 雅虎Yahoo (http//www.Yahoo.com)
? Yahoo!是Internet 上最受欢迎的搜索引 擎,也是访问频率最高的一个门户网站。 它是由美国斯坦福大学的华裔博士杨致远 与他的同学David Filo 于1994 年开发的, 目前,由美国多家公司与个人资助。Yahoo 具有覆盖范围广、连接速度快、数据容量 大、使用方法简单等特点。

7、专题型搜索引擎
? 专题型搜索引擎是专门提供某一学科、主题范围的 网络信息资源导航系统。 ? 塞迪网“IT罗盘” (http://itsearch.ccidnet.com)塞迪网是国内 著名的面向IT行业提供全面信息服务的垂直门户站 点。 ? 因特网法律资源指南(Internet Legal Resource Guide ,简称ILRG。(http://www.ilrg.com)是 1995年 美国推出的第一家系统、全面提供法律网 络信息资源导航网站。它选择收集了来自238个国 家、地区的4000多个与法律密切相关的网站,提供 了较全面的法律信息检索。

8、中文多元型搜索引擎
? 多元搜索引擎又称为集合式搜索引擎。它是将多个搜索 引擎集成在一起,通过一个统一的检索界面方便、快速、 全面获取网络信息的检索工具。 ? 中文搜索引擎指南(www.sowang.com)

9、英文多元型搜索引擎
? Dogpile(http://www.dogpile.com):是因特网 上最早出现也是影响最大的多元搜索引擎。 Dogpile集成了21个不同类型的搜索引擎,按 照检索对象可以将这些检索工具分成6种类型: Web页、图像、FTP文件、新闻组、多媒体。系 统支持的运算功能与运算符主要有4种:AND, +;OR;NOT,-;词组短语(用双引号)。 ? MetaCrawler (http://www.metacrawler.com) :是因特网 上最有影响的多元搜索引擎之一,也是最典型 的综合型集成搜索引擎。

本讲题纲
? Web2.0及相关技术 ? 搜索引擎 ? FTP ? BBS ? 网络学术资源导航 ? 免费学术网站

FTP
? FTP是英文File Transfer Protocol(文件传 输协议)的缩写,和TCP/IP一样是因特网上 广泛使用的一种通信协议,是在互联网上 传送文件的标准。通过FTP协议,我们就可 以通过跟互联网上的FTP服务器进行文件的 上传或下载等动作。 ? FTP服务器并不是可以随意使用的,登录 FTP服务器往往需要用户账号与口令。 ? 互联网上也有很多匿名的FTP服务器,向全 世界所有用户开放。

访问FTP信息资源的主要方法 ? FTP内部命令 ? 利用Web浏览器访问FTP ? 利用专用FTP软件(CuteFTP)

哈尔滨工程大学的FTP服务

CERNET内的主要的FTP搜索引擎
? 北大天网的FTP搜索引擎 http://bingle.pku.edu.cn ? 星空互联之FTP星空搜索 http://sheenk.com/ftpsearch/search.html ? 西安交通大学思源搜索引擎 http://search.xjtu.edu.cn ? 中国科技大学天狼中英文搜索引擎 http://search.ustc.edu.cn

国外FTP搜索引擎
? http://www.alltheweb.com ? http://www.filesearching.com ? http://www.ftpfind.com

本讲题纲
? Web2.0及相关技术 ? 搜索引擎 ? FTP ? BBS ? 网络学术资源导航 ? 免费学术网站

BBS
? BBS全称是Bulletin Board System(电子公 告牌),是Internet最早的功能之一。顾名思 义,其早期只是发表一些信息,如股票价 格,商业信息等,并且只能是文本形式。 而现在,BBS主要是为用户提供一个交流 意见的场所,能提供信件讨论,软件下载, 在线游戏,在线聊天等多种服务,还出现 了图形方式的BBS。

哈工大紫 丁香BBS

研学论坛http://bbs.matwav.com/

零点花园http://www.soudoc.com/

小木虫:http://www.emuch.net/

阿果资源网http://www.agpr.net/bbs/

网上读书园地:
www.readfree.net/bbs/index.php

本讲题纲
? Web2.0及相关技术 ? 搜索引擎 ? FTP ? BBS ? 网络学术资源导航 ? 免费学术网站

? 中国开放教育资源协会 http://www.core.org.cn/core/default.aspx ? 博士家园http://www.bossh.net/ ? CALIS重点学科网络资源导航门户 http://202.117.24.168/cm/main.jsp ? 清华大学中文系学术网站 http://cn.zhanjun.net/sort.php?sortid=123 ? 复旦大学学术网站 http://www.fudan.edu.cn/research/sitelist.ht ml


相关文章:
信息检索实验4
项目代码 实验目的:通过上机操作,掌握网络信息检索工具的使用,并掌获取全文的技巧...检索工具 4 搜索 策略 检索词/式 检索途径 “水工钢结构”相关课件 水工钢...
信息检索
搜试试 3 帮助 全部 DOC PPT TXT PDF XLS 百度文库 专业资料 IT/计算机 ...4.计算机信息检索经历了 脱机检索阶段、联机检索阶段、光盘检索阶段、网络检索阶段...
...与利用(工具书与文献检索)网上作业1-4答案
搜试试 3 帮助 全部 DOC PPT TXT PDF XLS ...(工具书与文献检索)网上作业1-4答案_理学_高等教育...(BIOSIS Previews,BP) C、工程索引 D、科学引文...
信息检索作业及答案
三条记录的参考文献格式:无 1、选择的检索工具:CNKI 数据库 2、检索词:当代大学生价值观研究 3、检索式:关键词 4、其他检索限制(如:模糊、精确、时间等) 5...
信息检索考试题汇总(附答案)
4.利用 baidu 搜索信息时,要将检索范围限制在网页...CNKI 是指(中国基础知识 设施工程),它是以实现全...46.在百度搜索引擎中,查找关于网络技术的课件,可用...
信息检索与利用作业
检索表达式:信息检索*清华大学 filetype:PPT 检索结果: 【PPT】信息资源与信息...(改名为:环境工程学报) 环境科学研究 4.请利用百度检索自己所需的任意一种 ...
信息检索导论-王斌 第一次课后练习(1-4)
搜试试 2 悬赏文档 全部 DOC PPT TXT PDF XLS 广告 百度文库 教育专区 ...信息检索导论-王斌 第一次课后练习(1-4)_工学_高等教育_教育专区。信息检索...
信息检索实验报告
搜试试 3 帮助 全部 DOC PPT TXT PDF XLS ...4.检索主题分析检索主题的分析就是对各个检索词进行...根据实验报告的要求,通过湖南工程学院图书馆科 技...
信息检索习题及答案
(){第 4 页}专利说明书属一次信息 附加题: I)...得到的检索{第 73 页} 81、 工程索引的缩写为 (...索 幻灯片 教育网 A、信息检索 课件 教育网 B、...
信息检索作业
搜 试试 7 帮助 全部 DOC PPT TXT PDF XLS ...好检索策略的检索框界面截图 3.4、 执行检索命令后...工业工程, 2011, 硕士 以上文献是通过对居室装修甲醛...
更多相关标签:
信息检索课件 | 信息检索ppt课件 | 信息检索 黄如花课件 | 武汉大学信息检索课件 | 网络信息检索课件 | 信息检索与利用课件 | 文献检索ppt课件 | 文献检索课件 |