資源簡介 (共29張PPT)手機APP希望獲得你的哪些信息?如果有監聽,獲得的數據規模巨大已經很難用傳統方式進行處理。大數據技術應運而生改變生活數據與大數據第一章 1.41.5大數據時代2016年,數據科學家將大數據正式定義為:大數據代表著信息量大、速度快、種類繁多的信息資產,需要特定的技術和分析方法將其轉化為價值。閱讀書本26-27頁,思考:1、什么是大數據?2、大數據的特征是什么?學生學籍系統中存放著大量的學生數據,這些數據是否是屬于大數據?為什么?不是。1、通常指100 TB( 1TB=1024 GB )規模以上的數據量,數據量大是大數據的基本屬性;2、大數據往往包含多種類型數據;3、大數據超出以往常用的數據采集、組織、管理和加工等軟件的處理能力,要求新型集成技術從多元、復雜和巨量規模的數據集里洞察規律。閱讀書本26-27頁,思考:1、什么是大數據?2、大數據的特征是什么?身邊的大數據應用安心出行路線規劃精準推送廣告投放大數據的特征Volume數量Velocity速度Variety多樣Value價值數據體量巨大:以PB、EB或ZB為計量單位速度快:數據產生速度快數據處理速度快數據類型多:結構化、半結構化和非結構化數據共存價值密度低:價值大、數量大,可能發揮價值的是非常小的部分閱讀書本26-27頁,認識大數據的特征(存儲單位從過去的GB到TB,乃至現在的PB、EB級別。)大數據的特征數據體量巨大1 KB = 1024 B (KB - kilobyte)1 MB = 1024 KB (MB - megabyte)1 GB = 1024 MB (GB - gigabyte)1 TB = 1024 GB (TB - terabyte)1 PB = 1024 TB (PB - petabyte)1 EB = 1024 PB (EB - exabyte)傳統的個人電腦,處理的數據是GB/TB級;淘寶網近4億的會員每天產生的商品交易數據約20TB;臉書約10億的用戶每天產生的日志數據超過300TB。數據正在快速增長,根據預測,到2024年全世界每年產生的數據總量將會達到143ZB(數據產生速度快、數據處理速度快)大數據的特征速度快每天處理過百億條信息;每秒峰值幾百萬條;數據輸入、處理與丟棄立刻見效。數據的生產和傳播速度是非常迅速的(結構化、半結構化和非結構化數據共存)大數據的特征數據類型多結構化數據,如表格、財務系統數據、信息管理系統數據、醫療系統數據等,其特點是數據間因果關系強;非結構化數據,如視頻、圖片、音頻等,其特點是數據間沒有因果關系;半結構化數據,如HTML文檔、郵件、網頁等,其特點是數據間的因果關系弱。(價值大、數量大,可能發揮價值的是非常小的部分)大數據的特征價值密度低以視頻為例,一部1小時的視頻,在連續不間斷的監控中,有用數據可能僅有一二秒。以小組為單位,討論 “手機APP是否在‘監聽’我們的生活?”這一話題,并派代表發言。課堂活動要求:1.確定發言人;2.明確記錄者;3.完成匯報單;4.限時5分鐘。以小組為單位,討論 “手機APP是否在‘監聽’我們的生活?”這一話題,并派代表發言。課堂活動1.技術上來說,并不存在于二十四小時能記錄你每一句話,然后上傳分析,還能智能解讀的語音技術;2.監聽手機是屬于違法行為;3.APP只需要向你索要定位,讀取聯系人、WiFi、相冊權限就可以對你進行精準的畫像和追蹤;4.讀取剪貼板是系統賦予每個APP與生俱來的權利,剪貼板中又透漏出大量信息;……手機APP有多種途徑獲取我們的數據,進而起到“認識”我們的效果大數據對社會的影響大數據帶來新的社會問題具備信息安全意識1、正確使用權限管理,如非必要,建議不要對APP開啟手機的全部權限。2、甄別與遠離危險APP,通過正規渠道下載軟件;3、重要資料謹慎留存,避免將身份證、銀行卡等證件拍照留存在手機相冊中;4、不同軟件盡量不要使用同一組賬號密碼;5、妥善處置快遞單等包含個人信息的單據;……大數據對社會的影響大數據帶來新的社會問題除手機的使用外,計算機數據管理與安全也需注意!!2020年,各種新型勒索病毒不斷涌現。勒索病毒,是一種新型電腦病毒,主要以郵件、程序木馬、網頁掛馬的形式進行傳播。這種病毒利用各種加密算法對文件進行加密,被感染者一般無法解密,必須拿到解密的私鑰才有可能破解。1.4.1數據管理文本文件常見的文件格式圖像文件聲音文件動畫文件視頻文件文件管理文本文件:txt;doc;wps;html;pdf圖形像文件:jpg;bmp;gif;psd;png聲音文件:wav;mid;mp3;wma動畫文件:fla;gif;swf視頻文件:avi;mpg;flv;mov1.4.1數據管理不要隨意打開他人發送的網頁鏈接、可執行程序(exe)或安裝未知源的軟件。數據庫管理意義:①解決數據冗余的問題。②解決維護、更新數據時需要大量的人工干預的問題。1.4.1數據管理數據管理是利用 計算機硬件 和 軟件技術 對數據進行有效 收集 、存儲、 和 應用 的過程,其目的在于充分、有效地發揮數據的作用。計算機數據的管理已經經歷了 人工管理 、文件管理和 數據庫管理 三個階段。現代社會數據管理的主要方式——傳統數據庫技術(1)基礎:基于結構化數據開發。(2)特點:數據獨立性、數據可共享(3)應用領域:政府、軍工、教育、電力、金融、農業、衛生、交通、科技等行業。1.4.1數據管理2021年6月3日丘市睢(suī)陽區人民法院在裁判文書網,公開了一份刑事判決書,顯示一名住在河南商丘市的本科畢業的大學生逯(lù)某自2019年11月起,對淘寶實施了長達八個月的數據爬取并盜走大量用戶數據。在阿里巴巴注意到這一問題前,已經有超過11億8千多萬條用戶信息泄露。。威脅數據安全的因素硬盤驅動器損壞、操作失誤、黑客入侵、感染計算機病毒、遭受自然災害……1.4.2數據安全保護數據安全的方法(1)做好防護上的安全保護存儲數據的介質。對于政府部門或企業的數據,目前主要采取主動防護的手段,如通過磁盤列陣、數據備份、異地容災。(2)提高數據本身的安全可通過數據加密、數據校驗等方法提高數據的保密性和完整性。(3)個人保護數據的手段數據備份;定期殺毒;不訪問危險網址;不打開危險郵件、鏈接;定期升級系統;安裝系統補丁大數據思維分析的是全體數據,而不是抽樣數據數據不再追求精確性,而是能夠接受數據的混雜性不一定強調對事物因果關系,而是更加注重相關性大數據是一場變革, 改變的不僅是數據,還有人們的思維。大數據分析的是全體數據,而不是抽樣數據全樣本數據分析數據太多,無法保存和分析,統計學采用抽樣;抽樣數據能否取得重大成功,依賴于采樣的“絕對隨機性”。更加科學地得出結論,分析方法精準、全面;但存在技術門檻高,數據獲取要求高等情況。抽樣數據分析對于數據不再追求精確性,而是能夠接受數據的混雜性對于傳統的數據庫,數據有嚴謹的結構,人們追求數據的準確性,通過各種技術或人工手段,來保證每個數據準確無誤。而在大數據處理過程中,數據的來源多種多樣,這些數據可以是結構化的、半結構化的,也可以是非結構化的。當數據量大到一定程度時,個別數據的不準確就顯得不那么重要。不一定強調對事物因果關系,而是更加注重相關性相關關系通過識別有用的關聯物來幫助人們分析一個現象,而不是揭示其內部機理。如果能夠知道因果關系固然也好,但如果能夠指導我下一步該做些什么,也就足夠了。大數據對社會的影響大數據帶來新的社會問題大數據已經滲入到社會的各個層面,不斷提高工作效率與生活便利性大數據讓決策更加精準大數據帶來新的就業機會課堂小結課堂小結作業信息技術作業本《1.4數據管理與安全》及《1.5數據與大數據》的基礎訓練部分改變生活數據與大數據討論匯報單匯報人:記錄員:組員:內容:本小組經過討論,一致認為:手機APP (是/否)在“監聽”我們的生活?證據如下(請簡要概括):1、2、3、我們認為,手機APP是通過以下途徑 (“監聽”/“了解”)我們的:1、2、3、4、手機APP的使用,我們的總體感受是:對于手機APP在使用中給部分人帶來的恐慌,我們的建議是:我們小組匯報結束。 展開更多...... 收起↑ 資源列表 必修一1.41.5 數據與大數據.pptx 匯報單.docx 縮略圖、資源來源于二一教育資源庫