当前位置:首页 » 课程设计 » 网络搜索引擎课程难点

网络搜索引擎课程难点

发布时间: 2020-11-18 08:43:02

⑴ 搜索引擎营销这门课程模块三各搜索引擎商业化产品的知识点有哪些

搜索引擎营销这门课模块三各搜索引擎商业化产品的知识点包含模块导引,单元一网络,单元二好搜,单元三搜狗。

⑵ 百度文库课程怎么没有搜索功能啊

文库的课程现在还没有搜索功能,现在课程还不多,以后多了就会有了。
你可以按照分类找你想要的课程。

⑶ 搜索引擎优化这门课程模块四网站关键词及内容优化的知识点有哪些

搜索引擎优化这门课模块四网站关键词及内容优化的知识点包含模块导引,单元一关键词研究,单元二关键词策略,单元三关键词选取,单元四内容体系建设,单元五关键词部署,单元六内容编辑优化,单元七多媒体优化,单元八博客营销,单元九站群优化。

⑷ 如何评价慕课网课程《Python分布式爬虫打造搜索引擎 》

爬虫本质上不需要分布式。因为你要爬一个网站通常5-10个线程足够了,再多就是对网站压力测试了。你只需要将任务分配到不同的机器上,然后各运行各自己的,结果合并一下就可以。这个与nutch人map,rese也没有什么差别。只是手工分,手工合并。当然也可以用脚本分,脚本合并,脚本远程启动。有一个远程控制模块,似乎叫rpy。很简单,很容易上手。可以远程控制一个模块。数据库用postgresql不是很好。因为爬行结果放在关系型数据库里太吃力。特别是网页内容。通常是URL放在redis里。内容放在文件系统里,你可以用hadoop+hdfs+thrift方案放在hadoop里。如果使用了hadoop,就干脆模仿nutch的流程,把python脚本也交给hadoop去管理好了。至于控制与通信这个都让hadoop来处理好了。当然我个人觉着rpy方式更简单。里面控制与通信都是现成的。10分钟就学会了。还是回到原来的说法,大部分情况下,单机多线程跑爬虫足够用了。不需要分布式。而且效率甚至比分布式更高。

⑸ 如何评价慕课网课程《Python分布式爬虫打造搜索引擎 》

内容很不错 讲得很深入 提高爬虫水平
内容很好。
目录就是老师讲的, 多种方法,讲的很好

⑹ 《搜索引擎优化》课程讲什么内容

《搜索引擎优化》是SEO的实际应用技术,深度剖析了搜索引擎的工作原理、关键词研究、代码优化、网站构架优化、链接建设、策略更正及网络整合营销,同时SEO是一门受众非常广泛的学科,每天都会有成千上万的人在网络搜索SEO这个关键词,这里面有学生,有站长,有公司相关岗位从业者和创业者。我们知道搜索广告(PPC)投放需要比较多的资金投入,这就意味着PPC天生有一个无形的进入门槛,但SEO不存在这个门槛,希望通过本节课程的介绍,可以有更多的同学可以从事SEO的学习和实践,并从中获益。
该网络课程为学习者提供了教师教学的视频、教学内容的文字部分、可供学习的教科书、检验学习效果的试题等,适合在职或者远程学习者学习。

⑺ 如何评价慕课网课程《Python分布式爬虫打造搜索引擎 》

很好的一门课,讲师bobby讲的很不错,如果能有耐心听完这门课,收获肯定不是一点两点。相比于慕课网其他的收费课程,这门课算顶尖的了。

⑻ 最近有个搜索引擎的课程设计,求推荐几本开发方面的书

打算用C#开发的话,推荐这本书《使用C#开发搜索引擎》,作者罗刚,清华大学出版社2012年出版的。
大致内容介绍:从c#基础开始,逐渐深入,是学习搜索引擎开发的首选。应众多公司的实际需求,《使用C#开发搜索引擎》介绍如何以c#作为工具开发搜索引擎。全书以完成一个网站搜索\垂直搜索作为目标,从网络爬虫抓取数据开始,然后到中文分词、文本排重等文本挖掘技术和搜索结果展现。本书是市面上介绍业界热门的lucene.net、使用webbrowser做爬虫以及结合solr开发asp.net搜索的第一书。本书适合专业软件开发人员,也适合于希望学习搜索引擎工作原理的读者学习使用。本书对于在校学生学习复杂数据结构和应用动态规划等常用算法也有参考价值。

书目如下:
第1章 使用c#开发搜索引擎快速入门
1.1 各种搜索引擎
1.1.1 通用搜索
1.1.2 垂直搜索
1.1.3
站内搜索
1.2 搜索引擎整体结构
1.3 搜索引擎基本技术
1.3.1 网络爬虫
1.3.2 文本挖掘
1.3.3
全文索引
1.3.4 搜索语法介绍
1.3.5 搜索用户界面
1.4 c#开发快速入门
1.4.1 准备开发环境
1.4.2
基本语法
1.4.3 多维数组
1.4.4 位运算
1.4.5 枚举类型
1.4.6 面向对象
1.4.7
集合类
1.4.8 泛型
1.4.9 委托和事件
1.4.10 类库
1.5 本章小结
1.6 术语表

第2章
使用c#开发网络爬虫
2.1 网络爬虫抓取原理
2.2 爬虫架构
2.2.1 基本架构
2.2.2 分布式爬虫架构
2.2.3
垂直爬虫架构
2.3 下载网页
2.3.1 http协议
2.3.2 下载静态网页
2.3.3 下载动态网页
2.4
网络爬虫遍历与实现
2.5 网站地图
2.6 连接池
2.7 url地址查新
2.7.1 嵌入式数据库
2.7.2
布隆过滤器
2.8 抓取rss
2.9 解析相对地址
2.10 网页更新
2.11 信息过滤
2.12
垂直行业抓取
2.13 抓取限制应对方法
2.13.1 更换ip地址
2.13.2 抓取需要登录的网页
2.13.3
抓取asp.net网页
2.14 保存信息
2.14.1 存入数据库
2.14.2 存成图像
2.15 日志
2.16
本章小结
2.17 术语表

第3章 索引各种格式文档
3.1 从html文件中提取信息
3.1.1
识别网页的编码
3.1.2 正则表达式
3.1.3 html agility pack介绍
3.1.4 网页正文提取
3.1.5
结构化信息提取
3.1.6 查看网页的dom结构
3.1.7 网页结构相似度计算
3.2 从非html文件中提取文本
3.2.1
text文件
3.2.2 pdf文件
3.2.3 office文件
3.2.4 rtf文件
3.3 本章小结
3.4
术语表

第4章 自然语言处理
4.1 统计机器学习
4.2 文档排重
4.3 中文关键词提取
4.3.1
关键词提取的基本方法
4.3.2 从网页中提取关键词
4.4 相关搜索
4.5 拼写检查
4.5.1
拼写检查的概率模型
4.5.2 模糊匹配问题
4.5.3 英文拼写检查
4.5.4 中文拼写检查
4.6 文本摘要
4.6.1
文本摘要的设计
4.6.2 实现文本摘要技术
4.6.3 lucene.net中的动态摘要
4.7 文本分类
4.7.1
自动分类的接口定义
4.7.2 自动分类的实现
4.8 自动聚类
4.8.1 文档相似度
4.8.2 k均值聚类方法
4.8.3
k均值实现
4.9 拼音转换
4.10 句法分析树
4.11 信息提取
4.12 本章小结
4.13 术语表

第5章
用c#实现中文分词
5.1 汉语中的词
5.2 文本切分的基本方法
5.3 有限状态机
5.4 查找词典算法
5.4.1
标准trie树
5.4.2 三叉trie树
5.5 中文分词的原理
5.6 中文分词流程与结构
5.7 切分词图
5.7.1
保存切分词图
5.7.2 生成全切分词图
5.8 概率语言模型的分词方法
5.8.1 一元模型
5.8.2 n元模型
5.9
最大熵
5.10 未登录词识别
5.11 词性标注
5.12 地名切分
5.12.1 地址类性标注
5.12.2
未登录词识别
5.13 本章小结
5.14 术语表

第6章 lucene.net原理与应用
6.1
lucene.net快速入门
6.1.1 索引文档
6.1.2 搜索文档
6.1.3 lucene.net结构
6.2
lucene.net深入介绍
6.2.1 索引原理
6.2.2 分析文本
6.2.3 遍历索引库
6.2.4 检索模型
6.2.5
收集最相关的文档
6.3 索引中的压缩算法
6.3.1 变长压缩
6.3.2 差分编码
6.4 创建和维护索引库
6.4.1
设计一个简单的索引库
6.4.2 创建索引库
6.4.3 向索引库中添加索引文档
6.4.4 删除索引库中的索引文档
6.4.5
更新索引库中的索引文档
6.4.6 索引的优化与合并
6.5 查找索引库
6.5.1 布尔查询
6.5.2
同时查询多列
6.5.3 跨度查询
6.5.4 通配符查询
6.5.5 过滤
6.5.6 按指定列排序
6.5.7
查询大容量索引
6.5.8 函数查询
6.5.9 定制相似性
6.5.1 0评价搜索结果
6.6 中文信息检索
6.6.1
lucene.net中的中文处理
6.6.2 lietu中文分词的使用
6.6.3 定制tokenizer
6.6.4
解析查询串
6.6.5 实现字词混合索引
6.7 抓取数据库中的内容
6.7.1 读取数据
6.7.2 数据同步
6.8
概念搜索
6.9 本章小结
6.10 术语表

第7章 实现搜索用户界面
7.1 搜索页面设计
7.1.1
用于显示搜索结果的asp.net
7.1.2 搜索结果分页
7.1.3 设计一个简单的搜索页面
7.2 实现搜索接口
7.2.1
lucene.net搜索接口
7.2.2 指定范围搜索
7.2.3 搜索页面的索引缓存与更新
7.3 实现关键词高亮显示
7.4
实现分类统计视图
7.4.1 搜索结果分类统计与导航
7.4.2 层次树
7.5 相关搜索词
7.6
实现ajax自动完成
7.6.1 总体结构
7.6.2 服务器端处理
7.6.3 浏览器端处理
7.7 集成其他功能
7.7.1
拼写检查
7.7.2 再次查找
7.7.3 黑名单
7.7.4 搜索日志
7.8 本章小结

第8章
使用solr开发网站搜索
8.1 搜索服务器端
8.8.1 solr结构
8.1.2 启动solr服务器
8.1.3
配置支持中文的solr
8.1.4 索引数据
8.1.5 查询功能
8.1.6 高亮
8.2 solr的.net客户端
8.2.1
使用solrnet
8.2.2 实现多分类
8.2.3 分类统计
8.3 查询语法
8.3.1 对空格的支持
8.3.2
日期加权
8.4 索引分布
8.5 本章小结

至于Lemur和Lucene,选Lucene吧,和书配套

另外如果需要随书光盘,可以留下你的邮箱地址啊

⑼ 《搜索引擎营销》课程讲什么内容

搜索营销在广告主的投放预算中占比越来越大,传统的电视广告、平面媒体、户外媒体的投放在不断地转至线上。传统行业电商化已经成为必然趋势。 课程以实战型、可落地为主要目的,通过课程的学习,提升动手操作能力,从网络、好搜、搜狗的国内三大搜索引擎各个商业化产品来作出详细的讲解。《SEM课程》是线上营销类专业的核心课程。随着搜索引擎广告媒体商业化步伐的不断加快,商业产品的不断更新迭代,广告数数量的不断增加,技术的不断升级,搜索营销行业的不断成熟,对SEM从业人员的要求也越来越高。通过课程学习,使学员一方面可尽快掌握竞价账户的实际操作操作,另一方面可从理论进阶到实践,从执行层进阶到战略层。

⑽ 谁知道最近出现的教育资源搜索引擎是怎么工作的

《教育资源建设技术规范》体系结构与应用模式

来源:北京师范大学现代教育技术研究所 余胜泉、朱凌云 阅读:470 2006-01-04 10:30:31

为了避免教育资源建设属性标注混乱的情况,教育部于2000年组织了专门的研究小组起草制订了指导我国教育资源建设的技术规范,现在已经第二次颁布了征求意见稿,本文介绍了《教育资源建设技术规范》(征求意见稿)的主要内容,并对它可能的应用层次做了阐述。

教学资源建设是教育信息化的基础,是需要长期建设与维护的系统工程。由于教学资源的复杂性和多样性,使得人们对它的理解各不相同,便会出现大量不同层次、不同属性的教学资源,因而不易管理和利用。为了更有效地建设好各级各类教学资源库,促进不同资源库系统之间的数据共享,提高教育资源检索的效率与准确度,保证资源建设的质量,制订《教育资源建设规范》(以下简称规范)是十分必要的。

教学资源建设可以有四个层次的含义,一是素材类教学资源建设,主要分八大类:媒体素材、试题、试卷、文献资料、课件、案例、常见问题解答和资源目录索引;二是网络课程建设;三是资源建设的评价;四是教育资源管理系统的开发;在这四个层次中,网络课程和素材类教学资源建设是基础,是需要规范的重点和核心;第三个层次是对资源的评价与筛选,需要对评价的标准进行必要的规范;第四个层次是工具层次的建设,网络课程和素材类资源的具体内容千变万化,各具特色,对应的管理系统必须适应这种形式的变化,充分利用它们的特色。

一、《规范》的目标定位

《规范》的目的是为资源的开发者提供一致的标准,以统一开发者的行为,达到资源基本属性结构的一致性,以实现资源在区域内的广泛共享,并为学习者或教育者等对教育资源的查找、评估、获取和使用能获得最大效率而提供支持。同时也为不同资源库系统实现数据的共享和互操作提供支持。

《规范》提供强制的资源技术最低要求和推荐的资源评价指标,以保障教育资源的质量和使用价值。

《规范》是一个较为宽泛的标准,主要侧重点在于统一资源开发者的开发行为、开发资源的制作要求、管理系统的功能要求,而不是规定软件系统的数据结构,主要从四个角度进行规定:一是从资源的技术开发的角度,提出一些最低的技术要求;二是从使用用户的角度,为方便地使用这些素材,需要对素材标注哪些属性,并从可操作性的角度,规范了属性的数据类型及编写类型,这一部分将主要参考国内颁布的元数据模型及IEEE的LOM模型,从制作素材简便性,使用素材的方便性的角度上选取一些最为普通的元素,另外,根据不同教育资源的具体特色,设置一些特色属性。资源的属性可以作为资源库管理系统数据结构的直接依据,也可以作为教育资源的XML编码的标记;三是从资源评审者的角度,提出教学资源的评价标准,作为用户筛选资源的直接依据。四是从管理者的角度,提出了管理这些素材的管理系统的体系结构以及所应具备的一些基本功能

二、《规范》的范围

《规范》适用于学习对象中与教育资源开发、应用和管理有关的领域,对教育资源技术开发、属性标注、资源管理系统开发、教育资源的质量控制等有直接的指导意义。

《规范》定义了一个概念上的数据模型,用于定义教育资源实例的结构。《规范》所界定的教育资源是指:以数字信号在互联网上进行传输的教育信息,它属于学习对象的一个子集。

《规范》以学习对象元数据规范(LOM)为核心,并针对不同类型的教育资源的特性的建立了扩展属性集。

《规范》中,教育资源的属性用于描述该资源的相关特征。各类资源的统一特征使用学习对象元数据进行描述,资源的特色属性主要根据资源特性分类描述。

《规范》可以被别的标准所引用,例如用于定义数据模型实现(即绑定)的标准。这样,教育资源属性实例就能被各种学习教育系统所使用,如管理、定位、评估和交换教育资源等等。

三、《规范》的主要内容

1.资源建设范围的界定

《规范》从教育资源建设的实际出发,确定所面向的资源主要包括以下几类:

(1)媒体素材:媒体素材是传播教学信息的基本材料单元,可分为五大类:文本类素材、图形(图像)类素材、音频类素材、视频类素材、动画类素材。

(2)题库:题库是按照一定的教育测量理论,在计算机系统中实现的某个学科题目的集合,是在数学模型基础上建立的教育测量工具。

(3)试卷素材:用于进行多种类型测试的典型成套试题。

(4)课件与网络课件:课件与网络课件是对一个或几个知识点实施相对完整教学的用于教育、教学的软件,根据运行平台划分,可分为网络版的课件和单机运行的课件,网络版的课件需要能在标准浏览器中运行,并且能通过网络教学环境被大家共享。单机运行的课件可通过网络下载后在本地计算机上运行。

(5)案例:案例是指由各种媒体元素组合表现的有现实指导意义和教学意义的代表性的事件或现象。

(6)文献资料:文献资料是指有关教育方面的政策、法规、条例、规章制度,对重大事件的记录、重要文章、书籍等。

(7)常见问题解答:常见问题解答是针对某一具体领域最常出现的问题给出全面的解答。

(8)资源目录索引:列出某一领域中相关的网络资源地址链接和非网络资源的索引。

(9)网络课程:网络课程是通过网络表现的某门学科的教学内容及实施的教学活动的总和,它包括两个组成部分:按一定的教学目标、教学策略组织起来的教学内容和网络教学支撑环境。

2.资源开发的质量要求

教育资源是指蕴涵了特定的教育信息,能创造出一定教育价值的各类信息资源,特别是能以数字信号在互联网上进行传输的教育信息。数字化和教育价值是它的核心特征,它的开发,有相当高的技术要求和教育性要求,《规范》从资源开发的角度,定义了各类资源应符合的技术性要求与教育性要求,所有开发者都应以此为标准,以保证教育资源建设工程的质量。

3.资源属性的标注

教育资源建设技术规范的基本结构如图1所示,共包括三大部分,分别为严格遵守的必须数据元素、作为参考的可选数据元素和针对资源特色属性的扩展数据元素。

(1)必需数据元素(LOM核心集)

这类数据元素与学习对象元数据规范中的必需数据元素一致。它是任何类型的资源都必须具备的属性标注。开发者应严格遵循。

(2)可选数据元素(通用可选集)

这类数据元素是与教育资源密切相关、并对各类教育资源都适用的属性集合。可根据用户需求和开发者自身的工作过程作为参考属性有选择的使用,如果《规范》没有推荐的属性取值,要求与学习对象元数据规范的取值相一致。

(3)扩展数据元素(分类扩展集)

这类数据元素根据每类资源各自的特点,制定了与某类资源技术或教学等特征密切相关的属性。并补充了一些基本的、必要的特殊资源分类属性。

图1 教育资源建设技术规范基本结构

4.资源管理系统的功能要求

教育资源管理系统是对存储于资源库介质中的教育资源进行管理、维护和更新的功能性设施,主要包括三个子系统:资源管理(媒体素材库的管理、题库管理、试卷库管理、案例库管理、课件库管理、文献库管理、常见问题解答库管理、资源目录索引库管理和网络课程的管理等);系统管理(安全管理、网络性能管理、计费管理、故障管理等),资源建设与使用交流(资源更新、邮件列表订阅、资源定制、异步交流、同步交流)。这三个子系统为三类用户(管理员、审核员、一般用户)提供资源检索、资源发布、资源审核、权限管理、计费、用户信息交流等多个方面的服务。《规范》从这三个方面定义了资源库管理系统的基本功能。

5.教学资源的评价

教学资源的评价是对资源建设质量的把关,在资源建设和使用过程中,是一个不可缺少的重要环节。主要从以下几个方面来对它们进行评价:(1)资源的教育性 :考虑所整合的资源的教育意义,看它是否对学生的身心发展起到正面的促进作用,是否符合教学大纲和课程标准,是否有利于激发学生的学习动机和提高学习兴趣;(2)资源的科学性:资源的整合是否客观、科学,资源提供的知识性是否比较强,能否为日常的教学活动提供相关参考,是否有错别字或使人产生歧义的科学性错误;(3)技术性:资源提供的清晰度与画面结构以及课件、文本等运行的技术要求是否与现行浏览器相符;(4)艺术性:主要是针对多媒体素材而言,主要从表现手法的多样性、情节的生动性、构图的合理性以及画面的灵活性等几方面来考虑。

评价的方法必须采取多种方法相结合的原则,在资源的整合中我们既要注意资源整合过程的评价,也要注意资源在后期试用与使用中的评价。

6.教学资源的分类体系

良好的分类机制能高效地实现对教育资源的组织管理与使用,根据具体程度的不同,可以分为通用分类(一级分类)和二级分类,甚至三级、四级分类等。《规范》针对教育资源建设的具体领域,建立了更为详细的分类标准,既包括对每类资源都适用并与资源组织建设过程密切相关的通用分类,即一级分类,又根据不同资源的特殊属性,提供了更细一级的分类。对于已有的国家标准分类法并适用于教育资源领域的,本规范直接将其引用进来,并纳入编码表中。在实际的开发建设工作中,每个分类都可作为教育资源的一个属性,具体取值方法参见《规范》正文。

《规范》只列出了最具通用性的分类方法,对于有特殊用途的分类法,允许用户按照预定义的格式自行扩展,必要时可向有关部门提出申请,将该分类法纳入本规范之中。下图列出了本规范中所提供的分类体系,长方形代表分类方法,椭圆形代表具体的分类内容,对于每一个资源有三个主要分类属性,即学科、适用对象和素材类型,这三种属性是对资源进行组织的基本依据,将这三种属性按先后顺序进行排列组合,共产生六种基本的分类体系,如图所示,可作为资源资源建设内容规划和具体实施阶段的组织建设方法。

图1 分类组合示例

每一种分类组合代表了不同的资源组织线索,体现了资源组织方式的多样性,适用于不同类型的资源库建设。如:建立学科资源库,则建设者可先以学科为总的分类依据,确定每个学科应含盖的具体内容,在根据适用对象和素材类型进行详细划分。对于其它类型的资源建设模式,也可以适用对象或素材类型为优先分类依据。

7.数据编码

编码表主要具有两个功能:(1)对于某些数据元素的取值,是一个有限元的枚举类型值,即词汇表类型,为了统一这些值的设定,特设立属性值编码表,此表是一个开放的结构,未能列入之中的值与编码,请向标准制定机构提交,审定之后纳入资源属性编码表中;(2)为分类(Classification)提供依据,主要包括两种分类,通用分类(任何类型的资源都可用的分类方法)和二级分类(主要针对不同类型的资源提供特有的分类方法)。

为了保证编码的唯一性、稳定性和可扩充性,《规范》采用对象编码方式,即每一个属性值,都由三个部分唯一确定:类、对象、属性,编码ID就是这三个组成部分的编码(表中括号部分)的组合。对于存在国家编码的属性值,同样纳入此体系,但编码ID采用国家编码。

四、应用模式

《教育资源建设技术规范》在对开发者的行为进行约束的同时,从可操作的角度为教育资源的建设提供了重要的指导和方法,根据资源库共享的水平,《规范》的应用模式可以划分为基本的应用层次和扩展的应用层次。

1.《教育资源建设技术规范》基本的应用层次

基本的应用层次主要是资源的整合指导,资源库管理系统的开发与建设以及实现不同资源库之间数据的互换,达到教育资源大范围内的共享。它可以保证资源建设顺利的实施,以及区域范围内教育资源的高效利用和共享。

(1)《教育资源建设技术规范》中提供的教育资源分类是进行内容规划的依据。

资源建设的首要步骤就是要明确具体的建设内容,进行详细的规划,界定学科范围,按照教学大纲和课程目录的顺序来细化建设任务,并以教学的实际需求为依托确定合理的内容比例。附录中的资源分类为这一步骤提供了确实的依据,不仅包括对学科的一级分类,并根据国家标准分类法细化到二级分类。为了使这一规范更具可操作性,每一分类都提供了具体的取值,即词汇表,并从技术的角度进行编码,便于实现数据库存储的规范性。

由于我国刚刚迈出教育资源建设标准化与国际接轨的第一步,该规范还存在有待完善的地方,特别是分类体系与编码表,只提供了最基本的类别,但基础教育、高等教育、成人教育和职业教育各个领域间彼此有不同的分类方法,所以在具体使用这个规范时往往需要开发者利用LOM模型的第九类信息——分类信息自行扩展分类体系。随着反馈意见的吸收,《规范》将不断扩充细化分类表及其编码,以对具体教育领域的资源建设起到更有针对性的指导作用。

(2)《教育资源建设技术规范》中定义的属性标注是资源库系统数据结构的基本依据、也是资源数据可管理的基本前提。

LOM模型的九类信息是一个庞大的元数据集合,面向的是任意一个数字的或非数字的、在技术支撑的学习中能使用的、可重复使用的或被引用的实体,教育资源可以看作学习对象的一个应用实例。《教育资源建设技术规范》中所定义的元数据信息映射到资源建设领域,是对教育资源各种属性的标识。但过多的属性会为资源库的设计与实现带来很大障碍,更会降低数据表的检索效率和准确性。为此,《规范》吸收了LOM规范中必需的数据元素作为自己的核心集,在LOM规范的可选数据元素中抽取出了与教育资源密切相关、并对各类教育资源都适用的通用可选集,又针对九类资源的特性定义了分类扩展集。一旦资源属性确定下来,资源库的基本结构也随之确定。教育资源库大都采用关系型数据库,关系模型中数据的逻辑结构是一张二维表,横向为字段,纵向是记录。而教育资源的属性标识就可作为关系表中字段的名称。

虽然资源的使用一般以学科和内容为划分依据,但在物理存储时,由于同类资源具有相同特性,所以分类扩展集可作为资源的分类存储结构的依据。良好的存储结构是资源管理系统的高效处理事务的前提,任何资源的管理都是基于对不同资源属性的管理,包括上载、检索、评审、发布等操作。

(3)资源制作的基本要求为资源建设提供了指南

由于教育资源有其特定的应用领域和目的,在技术上必定存在一些特殊要求,要考虑到不同学科和不同教育层次(如:基础教育、高等教育或职业教育等)的特色,保证教育资源携带足够的信息量,同时带宽的限制也要求资源的技术品质和数据量支持远程传输。《教育资源建设技术规范》中根据不同资源的技术特性提出了最基本的技术要求,特别是各类媒体素材的制作者在进行开发工作时以技术要求作为开发工具的输入参数,从而保证资源的可用性。

(4)资源库系统的体系结构定义了各系统的必须具备的基本功能。

《规范》中节定义了教育资源管理系统应具备的最基本的功能结构,在以属性标识为依据的数据结构基础之上,为保障资源管理系统实现对资源的高效管理和利用,提出了一些最基本的结构和功能,这就为管理系统的设计和开发提供了明确的思路和基本的系统框架。无论采用何种程序语言及其逻辑结构,所实现的功能应该是一致的,并可根据实际需求适当扩展。

(5)资源评价指标是筛选与验收资源的基本依据。

教育资源库不仅仅是资源在数量上的积累,更需要可靠的质量保证,才能真正为教育教学起到服务作用,这就要求在资源入库时必须通过审核验收的环节,确保资源的技术指标和教育价值。如果只依靠学科专家基于经验的判断,会因为人的主观性产生一定的偏差,因此该规范中制定的教育资源评价指标目的在于实现客观公正的评价,也为开发者的开发工作提供了参考,开发者可依据评价指标来制作高质量的教育资源。

《教育资源建设技术规范》中的评价指标在对实践工作具有指导意义的同时,必须保持一定的高度和通用性。因而评价指标并没有针对特定领域的评价对象,而是从一般通用的角度提出了建议性的总则。根据教育评价理论,评价工作必须围绕评价的对象和评价目标展开,在具体应用时需要根据资源的应用领域制定更为专门的指标体系。如面向基础教育领域时要着重强调在内容上必须与教学大纲密切相关,并符合中小学生的认知特点;高等教育资源应具有一定的开放性,能为研究者提供广阔的思路,并能产生学术上的争议和思想碰撞;而成人教育,则应注重教学的规模和效益。

2.《教育资源建设技术规范》扩展的应用层次

《规范》的扩展应用层次,则提出了更高水平的要求,它为教育资源实现跨区域共享以及高效的基于内容的检索提供了指导。扩展应用层次主要基于XML标记语言而展开,用于对资源库的高效使用和大规模的数据互换方面。对于常态形式的教育资源,通过资源属性的XML绑定,可以:

(1)实现对资源进行基于内容的定向检索,以提高在互联网上搜索教育资源的效率。

规范提供了对教育资源属性进行XML(Extensible Markup Language,可扩展标记语言)标记的格式约束,提供编写相应DTD文档或Schema文档的依据,用于实现对资源进行基于内容的定向检索,以提高在互联网上搜索所需教育资源的效率,并可根据要求细化到不同层次,如细化到某道试题或某幅图片的粒度上。

教育资源属性集以LOM为基本框架,同时针对每类资源不同的特点提供了扩展的属性集合,这些属性的一个重要作用就是为用户对资源进行检索时提供依据。将教育资源属性与XML标记一一对应,根据教育资源建设技术规范编写具有良好结构的XML文档,以标记和标记中的内容准确表达该属性所反映的教育资源某一方面的信息。由于XML语言没有对平台的依赖性,并且在全球范围内是公开的,因而使对资源的描述具有一套能与国际接轨、通用性广的标准。

因为资源的属性本身携带着关于该资源内容方面的信息,这样用户就可根据自己的需求,使用搜索引擎借助XML文档中标记和内容之间的依存关系对教育资源进行定向检索。教育资源标注属性的XML文档不仅可用于文本类型的资源,也可利用标记和标记之间的文字描述多媒体资源的内容。样例文档如下表:检索关于植物的视频资源,搜索引擎会根据“< VIDEO >”和 “”标记进行定位,在根据“”和“”之间的信息确定视频的内容。

植物

……

图2 XML文档样例

(2)提供标准的文件互换格式,为不同系统之间互换数据提供标准接口。

从我国目前教育资源建设的现状来看,造成重复建设的一个重要原因就是基本数据结构上的差异使得各个资源库系统之间难以实现资源数据的互通。虽然不同地区开发的教育资源在内容上是互补的,通过互换数据可以节省开发资本和人力,避免重复建设,但由于资源库系统中存储资源的属性和属性取值没有遵循统一规范,造成数据库基本结构存在差异,要实现共享和互换会存在很大障碍。如进行复杂的转换工作,仍会造成人力和物力的消耗。《规范》为每类资源都定义了必需数据元素(即属性),和可选与扩展的数据元素,资源库的开发者可以此为基准,将资源的属性作为数据库的字段,由于遵循了统一的规范,从而决定了数据库中的字段名、字段的数据类型都是一致的,尽管不同地区所采用的开发程序和代码各异,但由于底层的数据结构一致,不同应用程序都可实现对资源数据的调用。

在进行异地数据互换时,可以将数据库中的信息以通用的XML文档格式输出,利用DOM(Document Object Model,文档对象模型),对其中的节点(元素)进行遍历,每个节点的文本属性值作为资源数据信息导入其它符合此标准的数据库中,以实现不同资源库中数据的互换、流通。具体流程如下图:

图3 数据互换流程图

(3)为教育资源的多种加工处理方式和表现形式提供了可能

XML技术语义描述和格式描述是分离的,对于同一语义描述可以有多种格式描述,它只与被标记对象的内容有关,与显示细节无关,由XSL(eXtensible Style Language 可扩展样式语言)来描述数据的显示格式,XSL是一种XML表达语言,与文档的内容相对独立,可以用来描述任意一个XML文档或其中的一部分。因此,同一套XML文档可以由多种XSL定义显示方式,这意味着利用XML技术、按照《规范》所定义的属性对教育资源绑定后,教育资源在显示时,对于同样一个资源和同样的属性标注,定义不同情况下显示格式文档,就可以采用不同的显示处理方式,在不同的环境下,则会有不同的显示,比如在个人数字助理(PDA)和台式计算机上,对于同一条图片数据,就可以有不同的显示格式。

(4)为建立专业化、具有自扩充能力的开放教育资源库系统提供了可能

随着互联网上数据的不断膨胀,其中不乏大量有价值的教育信息。但是这类教育资源处于一种零散的分布状态,且形式、内容各异,尽管可以通过搜索引擎指向目标地址,但不利于用户的直接检索和使用。将常见的教学资源集中在一起形成集中式的教学资源库是比较好的解决办法。目前所有的教学资源库系统都是一种封闭的系统,系统资源的更新都是通过人工录入数据库,并对资源属性进行标记后,工作烦琐,系统更新慢。现有的一些搜索引擎,由于技术的限制,无法提取没有进行语义标注的资源信息,比如无法知道一副图片的内容、一个试题的难度等,无法为用户提供有价值的检索信息,因而无法形成有良好结构的资源库。如果在将来所有以常态形式存在的资源(如网页)都对教育资源按照《规范》进行XML语义绑定后,教育资源库系统就可以通过搜索代理,自动在网络上搜索围绕特定主题的教育资源,并提取教育资源的属性标注,纳入到资源数据库中,供用户检索和提取,它可以大大提高资源库的针对性、开放性和更新速度。开放的教育资源库不仅体现在能通过其搜索机制,将互联网上的资源地址收录到索引数据库中,更能通过录入接口,将零散、不规范的网络教育资源进行统一标识,纳入到更为完整的资源体系之中,这将是教育资源库的一大发展趋势。

热点内容
幼师专业怎么样 发布:2021-03-16 21:42:13 浏览:24
音乐小毛驴故事 发布:2021-03-16 21:40:57 浏览:196
昂立中学生教育闸北 发布:2021-03-16 21:40:47 浏览:568
建筑业一建报考条件 发布:2021-03-16 21:39:53 浏览:666
2017年教师资格注册结果 发布:2021-03-16 21:39:49 浏览:642
中国教师资格证查分 发布:2021-03-16 21:39:41 浏览:133
踵什么成语有哪些 发布:2021-03-16 21:38:20 浏览:962
东营幼师专业学校 发布:2021-03-16 21:35:26 浏览:467
机械电子研究生课程 发布:2021-03-16 21:33:36 浏览:875
杭州朝日教育培训中心怎么样 发布:2021-03-16 21:33:28 浏览:238