當前位置:首頁 » 課程設計 » 網路搜索引擎課程難點

網路搜索引擎課程難點

發布時間: 2020-11-18 08:43:02

⑴ 搜索引擎營銷這門課程模塊三各搜索引擎商業化產品的知識點有哪些

搜索引擎營銷這門課模塊三各搜索引擎商業化產品的知識點包含模塊導引,單元一網路,單元二好搜,單元三搜狗。

⑵ 百度文庫課程怎麼沒有搜索功能啊

文庫的課程現在還沒有搜索功能,現在課程還不多,以後多了就會有了。
你可以按照分類找你想要的課程。

⑶ 搜索引擎優化這門課程模塊四網站關鍵詞及內容優化的知識點有哪些

搜索引擎優化這門課模塊四網站關鍵詞及內容優化的知識點包含模塊導引,單元一關鍵詞研究,單元二關鍵詞策略,單元三關鍵詞選取,單元四內容體系建設,單元五關鍵詞部署,單元六內容編輯優化,單元七多媒體優化,單元八博客營銷,單元九站群優化。

⑷ 如何評價慕課網課程《Python分布式爬蟲打造搜索引擎 》

爬蟲本質上不需要分布式。因為你要爬一個網站通常5-10個線程足夠了,再多就是對網站壓力測試了。你只需要將任務分配到不同的機器上,然後各運行各自己的,結果合並一下就可以。這個與nutch人map,rese也沒有什麼差別。只是手工分,手工合並。當然也可以用腳本分,腳本合並,腳本遠程啟動。有一個遠程式控制制模塊,似乎叫rpy。很簡單,很容易上手。可以遠程式控制制一個模塊。資料庫用postgresql不是很好。因為爬行結果放在關系型資料庫里太吃力。特別是網頁內容。通常是URL放在redis里。內容放在文件系統里,你可以用hadoop+hdfs+thrift方案放在hadoop里。如果使用了hadoop,就乾脆模仿nutch的流程,把python腳本也交給hadoop去管理好了。至於控制與通信這個都讓hadoop來處理好了。當然我個人覺著rpy方式更簡單。裡面控制與通信都是現成的。10分鍾就學會了。還是回到原來的說法,大部分情況下,單機多線程跑爬蟲足夠用了。不需要分布式。而且效率甚至比分布式更高。

⑸ 如何評價慕課網課程《Python分布式爬蟲打造搜索引擎 》

內容很不錯 講得很深入 提高爬蟲水平
內容很好。
目錄就是老師講的, 多種方法,講的很好

⑹ 《搜索引擎優化》課程講什麼內容

《搜索引擎優化》是SEO的實際應用技術,深度剖析了搜索引擎的工作原理、關鍵詞研究、代碼優化、網站構架優化、鏈接建設、策略更正及網路整合營銷,同時SEO是一門受眾非常廣泛的學科,每天都會有成千上萬的人在網路搜索SEO這個關鍵詞,這裡面有學生,有站長,有公司相關崗位從業者和創業者。我們知道搜索廣告(PPC)投放需要比較多的資金投入,這就意味著PPC天生有一個無形的進入門檻,但SEO不存在這個門檻,希望通過本節課程的介紹,可以有更多的同學可以從事SEO的學習和實踐,並從中獲益。
該網路課程為學習者提供了教師教學的視頻、教學內容的文字部分、可供學習的教科書、檢驗學習效果的試題等,適合在職或者遠程學習者學習。

⑺ 如何評價慕課網課程《Python分布式爬蟲打造搜索引擎 》

很好的一門課,講師bobby講的很不錯,如果能有耐心聽完這門課,收獲肯定不是一點兩點。相比於慕課網其他的收費課程,這門課算頂尖的了。

⑻ 最近有個搜索引擎的課程設計,求推薦幾本開發方面的書

打算用C#開發的話,推薦這本書《使用C#開發搜索引擎》,作者羅剛,清華大學出版社2012年出版的。
大致內容介紹:從c#基礎開始,逐漸深入,是學習搜索引擎開發的首選。應眾多公司的實際需求,《使用C#開發搜索引擎》介紹如何以c#作為工具開發搜索引擎。全書以完成一個網站搜索\垂直搜索作為目標,從網路爬蟲抓取數據開始,然後到中文分詞、文本排重等文本挖掘技術和搜索結果展現。本書是市面上介紹業界熱門的lucene.net、使用webbrowser做爬蟲以及結合solr開發asp.net搜索的第一書。本書適合專業軟體開發人員,也適合於希望學習搜索引擎工作原理的讀者學習使用。本書對於在校學生學習復雜數據結構和應用動態規劃等常用演算法也有參考價值。

書目如下:
第1章 使用c#開發搜索引擎快速入門
1.1 各種搜索引擎
1.1.1 通用搜索
1.1.2 垂直搜索
1.1.3
站內搜索
1.2 搜索引擎整體結構
1.3 搜索引擎基本技術
1.3.1 網路爬蟲
1.3.2 文本挖掘
1.3.3
全文索引
1.3.4 搜索語法介紹
1.3.5 搜索用戶界面
1.4 c#開發快速入門
1.4.1 准備開發環境
1.4.2
基本語法
1.4.3 多維數組
1.4.4 位運算
1.4.5 枚舉類型
1.4.6 面向對象
1.4.7
集合類
1.4.8 泛型
1.4.9 委託和事件
1.4.10 類庫
1.5 本章小結
1.6 術語表

第2章
使用c#開發網路爬蟲
2.1 網路爬蟲抓取原理
2.2 爬蟲架構
2.2.1 基本架構
2.2.2 分布式爬蟲架構
2.2.3
垂直爬蟲架構
2.3 下載網頁
2.3.1 http協議
2.3.2 下載靜態網頁
2.3.3 下載動態網頁
2.4
網路爬蟲遍歷與實現
2.5 網站地圖
2.6 連接池
2.7 url地址查新
2.7.1 嵌入式資料庫
2.7.2
布隆過濾器
2.8 抓取rss
2.9 解析相對地址
2.10 網頁更新
2.11 信息過濾
2.12
垂直行業抓取
2.13 抓取限制應對方法
2.13.1 更換ip地址
2.13.2 抓取需要登錄的網頁
2.13.3
抓取asp.net網頁
2.14 保存信息
2.14.1 存入資料庫
2.14.2 存成圖像
2.15 日誌
2.16
本章小結
2.17 術語表

第3章 索引各種格式文檔
3.1 從html文件中提取信息
3.1.1
識別網頁的編碼
3.1.2 正則表達式
3.1.3 html agility pack介紹
3.1.4 網頁正文提取
3.1.5
結構化信息提取
3.1.6 查看網頁的dom結構
3.1.7 網頁結構相似度計算
3.2 從非html文件中提取文本
3.2.1
text文件
3.2.2 pdf文件
3.2.3 office文件
3.2.4 rtf文件
3.3 本章小結
3.4
術語表

第4章 自然語言處理
4.1 統計機器學習
4.2 文檔排重
4.3 中文關鍵詞提取
4.3.1
關鍵詞提取的基本方法
4.3.2 從網頁中提取關鍵詞
4.4 相關搜索
4.5 拼寫檢查
4.5.1
拼寫檢查的概率模型
4.5.2 模糊匹配問題
4.5.3 英文拼寫檢查
4.5.4 中文拼寫檢查
4.6 文本摘要
4.6.1
文本摘要的設計
4.6.2 實現文本摘要技術
4.6.3 lucene.net中的動態摘要
4.7 文本分類
4.7.1
自動分類的介面定義
4.7.2 自動分類的實現
4.8 自動聚類
4.8.1 文檔相似度
4.8.2 k均值聚類方法
4.8.3
k均值實現
4.9 拼音轉換
4.10 句法分析樹
4.11 信息提取
4.12 本章小結
4.13 術語表

第5章
用c#實現中文分詞
5.1 漢語中的詞
5.2 文本切分的基本方法
5.3 有限狀態機
5.4 查找詞典演算法
5.4.1
標准trie樹
5.4.2 三叉trie樹
5.5 中文分詞的原理
5.6 中文分詞流程與結構
5.7 切分詞圖
5.7.1
保存切分詞圖
5.7.2 生成全切分詞圖
5.8 概率語言模型的分詞方法
5.8.1 一元模型
5.8.2 n元模型
5.9
最大熵
5.10 未登錄詞識別
5.11 詞性標注
5.12 地名切分
5.12.1 地址類性標注
5.12.2
未登錄詞識別
5.13 本章小結
5.14 術語表

第6章 lucene.net原理與應用
6.1
lucene.net快速入門
6.1.1 索引文檔
6.1.2 搜索文檔
6.1.3 lucene.net結構
6.2
lucene.net深入介紹
6.2.1 索引原理
6.2.2 分析文本
6.2.3 遍歷索引庫
6.2.4 檢索模型
6.2.5
收集最相關的文檔
6.3 索引中的壓縮演算法
6.3.1 變長壓縮
6.3.2 差分編碼
6.4 創建和維護索引庫
6.4.1
設計一個簡單的索引庫
6.4.2 創建索引庫
6.4.3 向索引庫中添加索引文檔
6.4.4 刪除索引庫中的索引文檔
6.4.5
更新索引庫中的索引文檔
6.4.6 索引的優化與合並
6.5 查找索引庫
6.5.1 布爾查詢
6.5.2
同時查詢多列
6.5.3 跨度查詢
6.5.4 通配符查詢
6.5.5 過濾
6.5.6 按指定列排序
6.5.7
查詢大容量索引
6.5.8 函數查詢
6.5.9 定製相似性
6.5.1 0評價搜索結果
6.6 中文信息檢索
6.6.1
lucene.net中的中文處理
6.6.2 lietu中文分詞的使用
6.6.3 定製tokenizer
6.6.4
解析查詢串
6.6.5 實現字詞混合索引
6.7 抓取資料庫中的內容
6.7.1 讀取數據
6.7.2 數據同步
6.8
概念搜索
6.9 本章小結
6.10 術語表

第7章 實現搜索用戶界面
7.1 搜索頁面設計
7.1.1
用於顯示搜索結果的asp.net
7.1.2 搜索結果分頁
7.1.3 設計一個簡單的搜索頁面
7.2 實現搜索介面
7.2.1
lucene.net搜索介面
7.2.2 指定范圍搜索
7.2.3 搜索頁面的索引緩存與更新
7.3 實現關鍵詞高亮顯示
7.4
實現分類統計視圖
7.4.1 搜索結果分類統計與導航
7.4.2 層次樹
7.5 相關搜索詞
7.6
實現ajax自動完成
7.6.1 總體結構
7.6.2 伺服器端處理
7.6.3 瀏覽器端處理
7.7 集成其他功能
7.7.1
拼寫檢查
7.7.2 再次查找
7.7.3 黑名單
7.7.4 搜索日誌
7.8 本章小結

第8章
使用solr開發網站搜索
8.1 搜索伺服器端
8.8.1 solr結構
8.1.2 啟動solr伺服器
8.1.3
配置支持中文的solr
8.1.4 索引數據
8.1.5 查詢功能
8.1.6 高亮
8.2 solr的.net客戶端
8.2.1
使用solrnet
8.2.2 實現多分類
8.2.3 分類統計
8.3 查詢語法
8.3.1 對空格的支持
8.3.2
日期加權
8.4 索引分布
8.5 本章小結

至於Lemur和Lucene,選Lucene吧,和書配套

另外如果需要隨書光碟,可以留下你的郵箱地址啊

⑼ 《搜索引擎營銷》課程講什麼內容

搜索營銷在廣告主的投放預算中佔比越來越大,傳統的電視廣告、平面媒體、戶外媒體的投放在不斷地轉至線上。傳統行業電商化已經成為必然趨勢。 課程以實戰型、可落地為主要目的,通過課程的學習,提升動手操作能力,從網路、好搜、搜狗的國內三大搜索引擎各個商業化產品來作出詳細的講解。《SEM課程》是線上營銷類專業的核心課程。隨著搜索引擎廣告媒體商業化步伐的不斷加快,商業產品的不斷更新迭代,廣告數數量的不斷增加,技術的不斷升級,搜索營銷行業的不斷成熟,對SEM從業人員的要求也越來越高。通過課程學習,使學員一方面可盡快掌握競價賬戶的實際操作操作,另一方面可從理論進階到實踐,從執行層進階到戰略層。

⑽ 誰知道最近出現的教育資源搜索引擎是怎麼工作的

《教育資源建設技術規范》體系結構與應用模式

來源:北京師范大學現代教育技術研究所 余勝泉、朱凌雲 閱讀:470 2006-01-04 10:30:31

為了避免教育資源建設屬性標注混亂的情況,教育部於2000年組織了專門的研究小組起草制訂了指導我國教育資源建設的技術規范,現在已經第二次頒布了徵求意見稿,本文介紹了《教育資源建設技術規范》(徵求意見稿)的主要內容,並對它可能的應用層次做了闡述。

教學資源建設是教育信息化的基礎,是需要長期建設與維護的系統工程。由於教學資源的復雜性和多樣性,使得人們對它的理解各不相同,便會出現大量不同層次、不同屬性的教學資源,因而不易管理和利用。為了更有效地建設好各級各類教學資源庫,促進不同資源庫系統之間的數據共享,提高教育資源檢索的效率與准確度,保證資源建設的質量,制訂《教育資源建設規范》(以下簡稱規范)是十分必要的。

教學資源建設可以有四個層次的含義,一是素材類教學資源建設,主要分八大類:媒體素材、試題、試卷、文獻資料、課件、案例、常見問題解答和資源目錄索引;二是網路課程建設;三是資源建設的評價;四是教育資源管理系統的開發;在這四個層次中,網路課程和素材類教學資源建設是基礎,是需要規范的重點和核心;第三個層次是對資源的評價與篩選,需要對評價的標准進行必要的規范;第四個層次是工具層次的建設,網路課程和素材類資源的具體內容千變萬化,各具特色,對應的管理系統必須適應這種形式的變化,充分利用它們的特色。

一、《規范》的目標定位

《規范》的目的是為資源的開發者提供一致的標准,以統一開發者的行為,達到資源基本屬性結構的一致性,以實現資源在區域內的廣泛共享,並為學習者或教育者等對教育資源的查找、評估、獲取和使用能獲得最大效率而提供支持。同時也為不同資源庫系統實現數據的共享和互操作提供支持。

《規范》提供強制的資源技術最低要求和推薦的資源評價指標,以保障教育資源的質量和使用價值。

《規范》是一個較為寬泛的標准,主要側重點在於統一資源開發者的開發行為、開發資源的製作要求、管理系統的功能要求,而不是規定軟體系統的數據結構,主要從四個角度進行規定:一是從資源的技術開發的角度,提出一些最低的技術要求;二是從使用用戶的角度,為方便地使用這些素材,需要對素材標注哪些屬性,並從可操作性的角度,規范了屬性的數據類型及編寫類型,這一部分將主要參考國內頒布的元數據模型及IEEE的LOM模型,從製作素材簡便性,使用素材的方便性的角度上選取一些最為普通的元素,另外,根據不同教育資源的具體特色,設置一些特色屬性。資源的屬性可以作為資源庫管理系統數據結構的直接依據,也可以作為教育資源的XML編碼的標記;三是從資源評審者的角度,提出教學資源的評價標准,作為用戶篩選資源的直接依據。四是從管理者的角度,提出了管理這些素材的管理系統的體系結構以及所應具備的一些基本功能

二、《規范》的范圍

《規范》適用於學習對象中與教育資源開發、應用和管理有關的領域,對教育資源技術開發、屬性標注、資源管理系統開發、教育資源的質量控制等有直接的指導意義。

《規范》定義了一個概念上的數據模型,用於定義教育資源實例的結構。《規范》所界定的教育資源是指:以數字信號在互聯網上進行傳輸的教育信息,它屬於學習對象的一個子集。

《規范》以學習對象元數據規范(LOM)為核心,並針對不同類型的教育資源的特性的建立了擴展屬性集。

《規范》中,教育資源的屬性用於描述該資源的相關特徵。各類資源的統一特徵使用學習對象元數據進行描述,資源的特色屬性主要根據資源特性分類描述。

《規范》可以被別的標准所引用,例如用於定義數據模型實現(即綁定)的標准。這樣,教育資源屬性實例就能被各種學習教育系統所使用,如管理、定位、評估和交換教育資源等等。

三、《規范》的主要內容

1.資源建設范圍的界定

《規范》從教育資源建設的實際出發,確定所面向的資源主要包括以下幾類:

(1)媒體素材:媒體素材是傳播教學信息的基本材料單元,可分為五大類:文本類素材、圖形(圖像)類素材、音頻類素材、視頻類素材、動畫類素材。

(2)題庫:題庫是按照一定的教育測量理論,在計算機系統中實現的某個學科題目的集合,是在數學模型基礎上建立的教育測量工具。

(3)試卷素材:用於進行多種類型測試的典型成套試題。

(4)課件與網路課件:課件與網路課件是對一個或幾個知識點實施相對完整教學的用於教育、教學的軟體,根據運行平台劃分,可分為網路版的課件和單機運行的課件,網路版的課件需要能在標准瀏覽器中運行,並且能通過網路教學環境被大家共享。單機運行的課件可通過網路下載後在本地計算機上運行。

(5)案例:案例是指由各種媒體元素組合表現的有現實指導意義和教學意義的代表性的事件或現象。

(6)文獻資料:文獻資料是指有關教育方面的政策、法規、條例、規章制度,對重大事件的記錄、重要文章、書籍等。

(7)常見問題解答:常見問題解答是針對某一具體領域最常出現的問題給出全面的解答。

(8)資源目錄索引:列出某一領域中相關的網路資源地址鏈接和非網路資源的索引。

(9)網路課程:網路課程是通過網路表現的某門學科的教學內容及實施的教學活動的總和,它包括兩個組成部分:按一定的教學目標、教學策略組織起來的教學內容和網路教學支撐環境。

2.資源開發的質量要求

教育資源是指蘊涵了特定的教育信息,能創造出一定教育價值的各類信息資源,特別是能以數字信號在互聯網上進行傳輸的教育信息。數字化和教育價值是它的核心特徵,它的開發,有相當高的技術要求和教育性要求,《規范》從資源開發的角度,定義了各類資源應符合的技術性要求與教育性要求,所有開發者都應以此為標准,以保證教育資源建設工程的質量。

3.資源屬性的標注

教育資源建設技術規范的基本結構如圖1所示,共包括三大部分,分別為嚴格遵守的必須數據元素、作為參考的可選數據元素和針對資源特色屬性的擴展數據元素。

(1)必需數據元素(LOM核心集)

這類數據元素與學習對象元數據規范中的必需數據元素一致。它是任何類型的資源都必須具備的屬性標注。開發者應嚴格遵循。

(2)可選數據元素(通用可選集)

這類數據元素是與教育資源密切相關、並對各類教育資源都適用的屬性集合。可根據用戶需求和開發者自身的工作過程作為參考屬性有選擇的使用,如果《規范》沒有推薦的屬性取值,要求與學習對象元數據規范的取值相一致。

(3)擴展數據元素(分類擴展集)

這類數據元素根據每類資源各自的特點,制定了與某類資源技術或教學等特徵密切相關的屬性。並補充了一些基本的、必要的特殊資源分類屬性。

圖1 教育資源建設技術規范基本結構

4.資源管理系統的功能要求

教育資源管理系統是對存儲於資源庫介質中的教育資源進行管理、維護和更新的功能性設施,主要包括三個子系統:資源管理(媒體素材庫的管理、題庫管理、試卷庫管理、案例庫管理、課件庫管理、文獻庫管理、常見問題解答庫管理、資源目錄索引庫管理和網路課程的管理等);系統管理(安全管理、網路性能管理、計費管理、故障管理等),資源建設與使用交流(資源更新、郵件列表訂閱、資源定製、非同步交流、同步交流)。這三個子系統為三類用戶(管理員、審核員、一般用戶)提供資源檢索、資源發布、資源審核、許可權管理、計費、用戶信息交流等多個方面的服務。《規范》從這三個方面定義了資源庫管理系統的基本功能。

5.教學資源的評價

教學資源的評價是對資源建設質量的把關,在資源建設和使用過程中,是一個不可缺少的重要環節。主要從以下幾個方面來對它們進行評價:(1)資源的教育性 :考慮所整合的資源的教育意義,看它是否對學生的身心發展起到正面的促進作用,是否符合教學大綱和課程標准,是否有利於激發學生的學習動機和提高學習興趣;(2)資源的科學性:資源的整合是否客觀、科學,資源提供的知識性是否比較強,能否為日常的教學活動提供相關參考,是否有錯別字或使人產生歧義的科學性錯誤;(3)技術性:資源提供的清晰度與畫面結構以及課件、文本等運行的技術要求是否與現行瀏覽器相符;(4)藝術性:主要是針對多媒體素材而言,主要從表現手法的多樣性、情節的生動性、構圖的合理性以及畫面的靈活性等幾方面來考慮。

評價的方法必須採取多種方法相結合的原則,在資源的整合中我們既要注意資源整合過程的評價,也要注意資源在後期試用與使用中的評價。

6.教學資源的分類體系

良好的分類機制能高效地實現對教育資源的組織管理與使用,根據具體程度的不同,可以分為通用分類(一級分類)和二級分類,甚至三級、四級分類等。《規范》針對教育資源建設的具體領域,建立了更為詳細的分類標准,既包括對每類資源都適用並與資源組織建設過程密切相關的通用分類,即一級分類,又根據不同資源的特殊屬性,提供了更細一級的分類。對於已有的國家標准分類法並適用於教育資源領域的,本規范直接將其引用進來,並納入編碼表中。在實際的開發建設工作中,每個分類都可作為教育資源的一個屬性,具體取值方法參見《規范》正文。

《規范》只列出了最具通用性的分類方法,對於有特殊用途的分類法,允許用戶按照預定義的格式自行擴展,必要時可向有關部門提出申請,將該分類法納入本規范之中。下圖列出了本規范中所提供的分類體系,長方形代表分類方法,橢圓形代表具體的分類內容,對於每一個資源有三個主要分類屬性,即學科、適用對象和素材類型,這三種屬性是對資源進行組織的基本依據,將這三種屬性按先後順序進行排列組合,共產生六種基本的分類體系,如圖所示,可作為資源資源建設內容規劃和具體實施階段的組織建設方法。

圖1 分類組合示例

每一種分類組合代表了不同的資源組織線索,體現了資源組織方式的多樣性,適用於不同類型的資源庫建設。如:建立學科資源庫,則建設者可先以學科為總的分類依據,確定每個學科應含蓋的具體內容,在根據適用對象和素材類型進行詳細劃分。對於其它類型的資源建設模式,也可以適用對象或素材類型為優先分類依據。

7.數據編碼

編碼表主要具有兩個功能:(1)對於某些數據元素的取值,是一個有限元的枚舉類型值,即詞彙表類型,為了統一這些值的設定,特設立屬性值編碼表,此表是一個開放的結構,未能列入之中的值與編碼,請向標准制定機構提交,審定之後納入資源屬性編碼表中;(2)為分類(Classification)提供依據,主要包括兩種分類,通用分類(任何類型的資源都可用的分類方法)和二級分類(主要針對不同類型的資源提供特有的分類方法)。

為了保證編碼的唯一性、穩定性和可擴充性,《規范》採用對象編碼方式,即每一個屬性值,都由三個部分唯一確定:類、對象、屬性,編碼ID就是這三個組成部分的編碼(表中括弧部分)的組合。對於存在國家編碼的屬性值,同樣納入此體系,但編碼ID採用國家編碼。

四、應用模式

《教育資源建設技術規范》在對開發者的行為進行約束的同時,從可操作的角度為教育資源的建設提供了重要的指導和方法,根據資源庫共享的水平,《規范》的應用模式可以劃分為基本的應用層次和擴展的應用層次。

1.《教育資源建設技術規范》基本的應用層次

基本的應用層次主要是資源的整合指導,資源庫管理系統的開發與建設以及實現不同資源庫之間數據的互換,達到教育資源大范圍內的共享。它可以保證資源建設順利的實施,以及區域范圍內教育資源的高效利用和共享。

(1)《教育資源建設技術規范》中提供的教育資源分類是進行內容規劃的依據。

資源建設的首要步驟就是要明確具體的建設內容,進行詳細的規劃,界定學科範圍,按照教學大綱和課程目錄的順序來細化建設任務,並以教學的實際需求為依託確定合理的內容比例。附錄中的資源分類為這一步驟提供了確實的依據,不僅包括對學科的一級分類,並根據國家標准分類法細化到二級分類。為了使這一規范更具可操作性,每一分類都提供了具體的取值,即詞彙表,並從技術的角度進行編碼,便於實現資料庫存儲的規范性。

由於我國剛剛邁出教育資源建設標准化與國際接軌的第一步,該規范還存在有待完善的地方,特別是分類體系與編碼表,只提供了最基本的類別,但基礎教育、高等教育、成人教育和職業教育各個領域間彼此有不同的分類方法,所以在具體使用這個規范時往往需要開發者利用LOM模型的第九類信息——分類信息自行擴展分類體系。隨著反饋意見的吸收,《規范》將不斷擴充細化分類表及其編碼,以對具體教育領域的資源建設起到更有針對性的指導作用。

(2)《教育資源建設技術規范》中定義的屬性標注是資源庫系統數據結構的基本依據、也是資源數據可管理的基本前提。

LOM模型的九類信息是一個龐大的元數據集合,面向的是任意一個數字的或非數字的、在技術支撐的學習中能使用的、可重復使用的或被引用的實體,教育資源可以看作學習對象的一個應用實例。《教育資源建設技術規范》中所定義的元數據信息映射到資源建設領域,是對教育資源各種屬性的標識。但過多的屬性會為資源庫的設計與實現帶來很大障礙,更會降低數據表的檢索效率和准確性。為此,《規范》吸收了LOM規范中必需的數據元素作為自己的核心集,在LOM規范的可選數據元素中抽取出了與教育資源密切相關、並對各類教育資源都適用的通用可選集,又針對九類資源的特性定義了分類擴展集。一旦資源屬性確定下來,資源庫的基本結構也隨之確定。教育資源庫大都採用關系型資料庫,關系模型中數據的邏輯結構是一張二維表,橫向為欄位,縱向是記錄。而教育資源的屬性標識就可作為關系表中欄位的名稱。

雖然資源的使用一般以學科和內容為劃分依據,但在物理存儲時,由於同類資源具有相同特性,所以分類擴展集可作為資源的分類存儲結構的依據。良好的存儲結構是資源管理系統的高效處理事務的前提,任何資源的管理都是基於對不同資源屬性的管理,包括上載、檢索、評審、發布等操作。

(3)資源製作的基本要求為資源建設提供了指南

由於教育資源有其特定的應用領域和目的,在技術上必定存在一些特殊要求,要考慮到不同學科和不同教育層次(如:基礎教育、高等教育或職業教育等)的特色,保證教育資源攜帶足夠的信息量,同時帶寬的限制也要求資源的技術品質和數據量支持遠程傳輸。《教育資源建設技術規范》中根據不同資源的技術特性提出了最基本的技術要求,特別是各類媒體素材的製作者在進行開發工作時以技術要求作為開發工具的輸入參數,從而保證資源的可用性。

(4)資源庫系統的體系結構定義了各系統的必須具備的基本功能。

《規范》中節定義了教育資源管理系統應具備的最基本的功能結構,在以屬性標識為依據的數據結構基礎之上,為保障資源管理系統實現對資源的高效管理和利用,提出了一些最基本的結構和功能,這就為管理系統的設計和開發提供了明確的思路和基本的系統框架。無論採用何種程序語言及其邏輯結構,所實現的功能應該是一致的,並可根據實際需求適當擴展。

(5)資源評價指標是篩選與驗收資源的基本依據。

教育資源庫不僅僅是資源在數量上的積累,更需要可靠的質量保證,才能真正為教育教學起到服務作用,這就要求在資源入庫時必須通過審核驗收的環節,確保資源的技術指標和教育價值。如果只依靠學科專家基於經驗的判斷,會因為人的主觀性產生一定的偏差,因此該規范中制定的教育資源評價指標目的在於實現客觀公正的評價,也為開發者的開發工作提供了參考,開發者可依據評價指標來製作高質量的教育資源。

《教育資源建設技術規范》中的評價指標在對實踐工作具有指導意義的同時,必須保持一定的高度和通用性。因而評價指標並沒有針對特定領域的評價對象,而是從一般通用的角度提出了建議性的總則。根據教育評價理論,評價工作必須圍繞評價的對象和評價目標展開,在具體應用時需要根據資源的應用領域制定更為專門的指標體系。如面向基礎教育領域時要著重強調在內容上必須與教學大綱密切相關,並符合中小學生的認知特點;高等教育資源應具有一定的開放性,能為研究者提供廣闊的思路,並能產生學術上的爭議和思想碰撞;而成人教育,則應注重教學的規模和效益。

2.《教育資源建設技術規范》擴展的應用層次

《規范》的擴展應用層次,則提出了更高水平的要求,它為教育資源實現跨區域共享以及高效的基於內容的檢索提供了指導。擴展應用層次主要基於XML標記語言而展開,用於對資源庫的高效使用和大規模的數據互換方面。對於常態形式的教育資源,通過資源屬性的XML綁定,可以:

(1)實現對資源進行基於內容的定向檢索,以提高在互聯網上搜索教育資源的效率。

規范提供了對教育資源屬性進行XML(Extensible Markup Language,可擴展標記語言)標記的格式約束,提供編寫相應DTD文檔或Schema文檔的依據,用於實現對資源進行基於內容的定向檢索,以提高在互聯網上搜索所需教育資源的效率,並可根據要求細化到不同層次,如細化到某道試題或某幅圖片的粒度上。

教育資源屬性集以LOM為基本框架,同時針對每類資源不同的特點提供了擴展的屬性集合,這些屬性的一個重要作用就是為用戶對資源進行檢索時提供依據。將教育資源屬性與XML標記一一對應,根據教育資源建設技術規范編寫具有良好結構的XML文檔,以標記和標記中的內容准確表達該屬性所反映的教育資源某一方面的信息。由於XML語言沒有對平台的依賴性,並且在全球范圍內是公開的,因而使對資源的描述具有一套能與國際接軌、通用性廣的標准。

因為資源的屬性本身攜帶著關於該資源內容方面的信息,這樣用戶就可根據自己的需求,使用搜索引擎藉助XML文檔中標記和內容之間的依存關系對教育資源進行定向檢索。教育資源標注屬性的XML文檔不僅可用於文本類型的資源,也可利用標記和標記之間的文字描述多媒體資源的內容。樣例文檔如下表:檢索關於植物的視頻資源,搜索引擎會根據「< VIDEO >」和 「」標記進行定位,在根據「」和「」之間的信息確定視頻的內容。

植物

……

圖2 XML文檔樣例

(2)提供標準的文件互換格式,為不同系統之間互換數據提供標准介面。

從我國目前教育資源建設的現狀來看,造成重復建設的一個重要原因就是基本數據結構上的差異使得各個資源庫系統之間難以實現資源數據的互通。雖然不同地區開發的教育資源在內容上是互補的,通過互換數據可以節省開發資本和人力,避免重復建設,但由於資源庫系統中存儲資源的屬性和屬性取值沒有遵循統一規范,造成資料庫基本結構存在差異,要實現共享和互換會存在很大障礙。如進行復雜的轉換工作,仍會造成人力和物力的消耗。《規范》為每類資源都定義了必需數據元素(即屬性),和可選與擴展的數據元素,資源庫的開發者可以此為基準,將資源的屬性作為資料庫的欄位,由於遵循了統一的規范,從而決定了資料庫中的欄位名、欄位的數據類型都是一致的,盡管不同地區所採用的開發程序和代碼各異,但由於底層的數據結構一致,不同應用程序都可實現對資源數據的調用。

在進行異地數據互換時,可以將資料庫中的信息以通用的XML文檔格式輸出,利用DOM(Document Object Model,文檔對象模型),對其中的節點(元素)進行遍歷,每個節點的文本屬性值作為資源數據信息導入其它符合此標準的資料庫中,以實現不同資源庫中數據的互換、流通。具體流程如下圖:

圖3 數據互換流程圖

(3)為教育資源的多種加工處理方式和表現形式提供了可能

XML技術語義描述和格式描述是分離的,對於同一語義描述可以有多種格式描述,它只與被標記對象的內容有關,與顯示細節無關,由XSL(eXtensible Style Language 可擴展樣式語言)來描述數據的顯示格式,XSL是一種XML表達語言,與文檔的內容相對獨立,可以用來描述任意一個XML文檔或其中的一部分。因此,同一套XML文檔可以由多種XSL定義顯示方式,這意味著利用XML技術、按照《規范》所定義的屬性對教育資源綁定後,教育資源在顯示時,對於同樣一個資源和同樣的屬性標注,定義不同情況下顯示格式文檔,就可以採用不同的顯示處理方式,在不同的環境下,則會有不同的顯示,比如在個人數字助理(PDA)和台式計算機上,對於同一條圖片數據,就可以有不同的顯示格式。

(4)為建立專業化、具有自擴充能力的開放教育資源庫系統提供了可能

隨著互聯網上數據的不斷膨脹,其中不乏大量有價值的教育信息。但是這類教育資源處於一種零散的分布狀態,且形式、內容各異,盡管可以通過搜索引擎指向目標地址,但不利於用戶的直接檢索和使用。將常見的教學資源集中在一起形成集中式的教學資源庫是比較好的解決辦法。目前所有的教學資源庫系統都是一種封閉的系統,系統資源的更新都是通過人工錄入資料庫,並對資源屬性進行標記後,工作煩瑣,系統更新慢。現有的一些搜索引擎,由於技術的限制,無法提取沒有進行語義標注的資源信息,比如無法知道一副圖片的內容、一個試題的難度等,無法為用戶提供有價值的檢索信息,因而無法形成有良好結構的資源庫。如果在將來所有以常態形式存在的資源(如網頁)都對教育資源按照《規范》進行XML語義綁定後,教育資源庫系統就可以通過搜索代理,自動在網路上搜索圍繞特定主題的教育資源,並提取教育資源的屬性標注,納入到資源資料庫中,供用戶檢索和提取,它可以大大提高資源庫的針對性、開放性和更新速度。開放的教育資源庫不僅體現在能通過其搜索機制,將互聯網上的資源地址收錄到索引資料庫中,更能通過錄入介面,將零散、不規范的網路教育資源進行統一標識,納入到更為完整的資源體系之中,這將是教育資源庫的一大發展趨勢。

熱點內容
幼師專業怎麼樣 發布:2021-03-16 21:42:13 瀏覽:24
音樂小毛驢故事 發布:2021-03-16 21:40:57 瀏覽:196
昂立中學生教育閘北 發布:2021-03-16 21:40:47 瀏覽:568
建築業一建報考條件 發布:2021-03-16 21:39:53 瀏覽:666
2017年教師資格注冊結果 發布:2021-03-16 21:39:49 瀏覽:642
中國教師資格證查分 發布:2021-03-16 21:39:41 瀏覽:133
踵什麼成語有哪些 發布:2021-03-16 21:38:20 瀏覽:962
東營幼師專業學校 發布:2021-03-16 21:35:26 瀏覽:467
機械電子研究生課程 發布:2021-03-16 21:33:36 瀏覽:875
杭州朝日教育培訓中心怎麼樣 發布:2021-03-16 21:33:28 瀏覽:238