資源簡介 (共22張PPT)5.2數據的采集高中信息技術必修1新知導入本節主要內容:1、數據采集的方法和工具2、數據的存儲和保護新知講解5.2.1數據采集的方法和工具新知講解數據采集的基本步驟新知講解數據采集的方法新知講解網絡爬蟲的工作過程采集類型:支持圖片、音頻、視頻等文件或附件的采集,附件與正文可以自動關聯。新知講解Python網絡數據采集程序使用的擴展庫新知講解Python模塊庫。在Python模塊庫中有大量模塊可供使用,要想使用這些文件,就需要用import語句把指定模塊導入當前程序中。使用import語句導入模塊的語法如下:新知講解fromimport語句也是導入模塊的一種方法,是導入指定模塊內的指定函數方法。使用fromimport語句導入模塊內指定方法的語法如下:新知講解其他數據采集法應用領域:企業生產經營或科學研究等保密性要求較高的數據。使用方法:與企業或研究機構合作,使用特定系統接口等相關方式收集數據。例如:科學研究的數據是通過科學實驗的各種傳感器采集,并傳輸到數據庫管理系統中的。新知講解5.2.2數據的存儲和保護新知講解數據的存儲的方式(1)把數據存在本地內部。(2)把數據放在第三方公共或私有的“云端”存儲。新知講解云存儲是把各類數據存儲在虛擬的邏輯模型里,其物理空間存儲在跨越多個地域放置的眾多服務器中,為用戶提供統一、靈活、安全的“云存儲服務”。云存儲供應商的作用:擁有并管理這些服務器,負責管理數據的使用和訪問權限,以及云存儲環境的日常運營和維護。數據的存儲的方式:采用分布式文件存儲或NoSQL數據庫存儲。新知講解數據安全保護指數據不被破壞、更改、泄露或丟失。防備數據安全隱患的常規方法:殺毒軟件和防火墻。數據保護的有效方法:拷貝、備份、復制、鏡像、持續備份。新知講解數據安全保護技術的使用特點。數據安全保護技術適用場合備份介質備份距離管理拷貝/FTP簡單小數據量備份,個人不定期的文件保護等磁盤近手動執行,占用人力資源。?備份?有歸檔需求的用戶等磁帶機磁帶庫磁盤近,以本地備份為主備份軟件對使用者要求較高,需要掌握數據庫、文件系統等綜合知識。復制技術?企業等?磁盤?遠近皆可。設定策略后無須人工干預,復制與恢復的過程都很簡單。?鏡像技術企業等?磁盤近,帶寬和距離影響延遲時間和性能,因此多以本地為主?簡單。持續備份企業等磁盤遠近皆可連續備份,可以實現過去任意一個時間點的數據恢復。新知講解隱私泄露的途徑新知講解數據的隱私保護方法(1)技術手段常用的隱私保護有:①數據收集時進行數據精度處理;②數據共享時進行訪問控制;③數據發布時進行人工加擾;④數據分析時進行數據匿名處理等。(2)提高自身的保護意識。(3)要對數據使用者進行道德和法律上的約束。新知講解數據的隱私的實踐(1)了解cookiesCookies是指用戶瀏覽網頁時,網絡服務器以文本格式存儲在用戶電腦硬盤上的少量數據。Cookies的主要目的是幫助網站記憶用戶之前可能進行的操作網站通過獲取并分析屬于用戶的Cookies,為用戶提供設置或推送服務,使得網站更人性化,操作更方便快捷。新知講解(2)設置cookies①選擇網頁瀏覽器,右鍵選擇“屬性”。②在彈出的“Internet選項”窗口選擇“設置”按鈕。新知講解(2)設置cookies③在彈出的新窗口“網站數據設置”中,當前位置就是Cookies所在的位置,可以選擇“查看文件”按鈕找到文件所在處。謝謝21世紀教育網(www.21cnjy.com)中小學教育資源網站有大把高質量資料?一線教師?一線教研員?歡迎加入21世紀教育網教師合作團隊!!月薪過萬不是夢!!詳情請看:https://www.21cnjy.com/help/help_extract.php中小學教育資源及組卷應用平臺5.2數據的采集一、選擇題1、大數據時代,數據使用的關鍵是(?)。?A、數據收集??B、數據存儲??C、數據分析??D、數據再利用2、智能健康手環的應用開發,體現了(?)的數據采集技術的應用。?A、統計報表??B、網絡爬蟲??C、API接口??D、傳感器3、數據采集的基本方法包括()、網絡數據采集法和其他數據采集法。A、數據庫采集法B、訪問記錄采集法C、數據目錄采集法D、系統日志采集法4、網絡數據采集法,主要通過網絡爬蟲或網站公開API的方式獲取,網絡爬蟲從網頁的()開始獲取。A、HTMLB、WWWC、URLD、XML5、下列()不屬于Python網絡數據采集程序使用的擴展庫。A、SystemB、SciPyC、PandasD、Matplotlib6、在Python模塊庫中有大量模塊可供使用,要想使用這些文件,就需要用()語句把指定模塊導入當前程序中。A、moveB、inC、importD、print7、下列()不是數據保護的有效方法。A、剪切B、復制C、拷貝D、鏡像8、下列(?)數據安全保護技術可以進行遠距離使用。?A、拷貝?B、備份?C、復制??D、鏡像9、下列()不屬于隱私保護的手段。?A、數據收集時進行數據精度處理B、數據共享時進行訪問控制C、不使用任何智能化設備D、數據發布時進行人工加擾10、我們一般說的cookies是(?)。A、數據收集程序?B、數據應用程序?C、數據存儲程序?D、數據處理程序二、判斷題1、要完成數據的采集工作,首先需要明確數據需求選定項目主題。()2、網絡數據采集法:在目標主機上安裝一個小程序,將目標主機的文本、應用程序、數據庫等日志信息有選擇地定向推送來進行管理。(????)3、只要刪除掉上網的瀏覽記錄就可以避免信息泄露。(????)4、我們可以把數據放在第三方公共或公有的“云端”存儲。(????)5、數據的存儲的方式:采用分布式文件存儲或NoSQL數據庫存儲。(????)試題答案一、選擇題12345678910DDDCACACCC解析:1、大數據時代,數據使用的關鍵是數據再利用。2、智能健康手環可以通過傳感器采集人的血壓、心跳、步數等數據采。3、數據采集的基本方法包括系統日志采集法、網絡數據采集法和其他數據采集法。4、網絡爬蟲從網頁的URL開始獲取,采集類型支持圖片、音頻、視頻等文件或附件的采集,附件與正文可以自動關聯。5、Python網絡數據采集程序使用的擴展庫主要有:NumPy、SciPy、Pandas、Matplotlib。6、在Python模塊庫中有大量模塊可供使用,要想使用這些文件,就需要用import語句把指定模塊導入當前程序中,格式:importmodule。7、數據保護的有效方法:拷貝、備份、復制、鏡像、持續備份。8、復制、持續備份遠近皆可,拷貝、備份、鏡像主要是進行近距離備份。9、常用的隱私保護有數據收集時進行數據精度處理、數據共享時進行訪問控制、數據發布時進行人工加擾、數據分析時進行數據匿名處理。10、Cookies是指用戶瀏覽網頁時,網絡服務器以文本格式存儲在用戶電腦硬盤上的少量數據。二、判斷題12345√×××√解析:1、數據采集的基本步驟:明確數據需求選定項目主題;制訂數據采集清單內容大綱;適當的方法和工具進行采集。2、網絡數據采集法:指通過網絡爬蟲或網站公開API(ApplicationProgrammingInterface,應用程序接口)等方式從網站上獲取數據信息。系統日志采集法:在目標主機上安裝一個小程序,將目標主機的文本、應用程序、數據庫等日志信息有選擇地定向推送到日志服務器進行存儲、監控和管理。3、信息泄露的途徑非常多,在上網訪問的同時我們的信息已經被收集記錄,所以通過清除訪問記錄,并不能避免信息泄露,正確的做法是不要將敏感信息在不安全的網絡環境下傳播發送。4、我們可以把數據放在第三方公共或私有的“云端”存儲,是私有的云存儲,不是公有。5、數據的存儲的方式:采用分布式文件存儲或NoSQL數據庫存儲。21世紀教育網www.21cnjy.com精品試卷·第2頁(共2頁)HYPERLINK"http://21世紀教育網(www.21cnjy.com)"21世紀教育網(www.21cnjy.com) 展開更多...... 收起↑ 資源列表 5.2數據的采集.doc 5.2數據的采集.pptx 縮略圖、資源來源于二一教育資源庫