資源簡介 (共36張PPT)數據與信息第一章知識體系學習目標數據是對客觀事物的符號表示。是信息的載體。數據的定義文字、圖形、圖像、音頻、視頻等。數據的表現形式在計算機科學中,數據是指所有能輸入到計算機并被計算機程序處理的符號總稱。數字是最簡單的數據。1.1數據造紙術和印刷術、攝影術、留聲機、第一臺計算機。這些大小不一、數量不同的繩結是數據。文字和數字的出現,數據以更加明確的形式被記錄下來。互聯網技術的發展,加速了數據的傳輸與處理原始人就用石器或骨器在墻壁上刻畫圖案1.1數據及其演變楔形文字各種發明結繩記事遠古時代計算機數據自古就有,且無處不在。數據與生活數據的表現形式越來越多樣化,給人們的生活習慣帶來了巨大的轉變。人們在利用數據的同時,自身的行為也在產生數據。數據與科學科學研究離不開數據數據的客觀性為科學研究提供了可靠依據1.1數據與生活科學信息論奠基者香農:信息是用來消除隨機不確定性的東西。信息的定義(1)載體依附性(2)時效性(3)共享性(4)可加工處理性、真偽性(5)價值性信息特征1.2信息的定義知識是人們在社會實踐中所獲得的認識和經驗的總和,是人類在實踐中認識世界的成果。知識的定義知識是可以繼承和傳遞的。不同人構建的知識不同。1.2知識的定義數據信息知識數據可以是數字、文字、圖像、符號等,如 3.14,單獨寫在紙上,其本身沒有明確的意義。信息是數據經過儲存、分析及解釋后所產生的意義,通常是在某一特定情境脈絡下的具體呈現。人們通過歸納、演繹、比較等手段對信息進行挖掘,將萬千信息中有價值的部分沉淀下來,與已存在的人類知識體系相結合,形成知識。智慧智慧是一種更高層次的綜合能力,它是在知識的基礎之上,通過認識的累積,而形成的對事物的認識、遠見體現為一種卓越的判斷力。1.2數據、信息、知識、智慧的關系1.2數據、信息、知識、智慧的關系1.3數據采集人工方式為主;通過觀察,實驗等方式傳統采集方式機器獲取為主;傳感器獲取自然信源的數據;網絡爬蟲獲取網絡數據現代采集方式網絡爬蟲:按照一定規則,按特定關鍵字,自動抓取網頁上數據的程序或腳本。傳感器:能感應被測量(物理量,化學量,生物量等)并按一定的規律轉換成可用輸出信號(電信號)的器件和裝置。基與權基又叫基數,是組成該數制的數碼個數,一般來說,k 進制的基數就是 k,包含 k 個數字;權又叫權值,是指每一個數位上的 1 對應的數值,可以表示為基數的若干次冪。1.3進制進制是一種記數方式,亦稱進位計數法或位值計數法。利用這種記數法,可以使用有限種數字符號來表示所有的數值。任何一種數制都包含兩個基本要素:基和權。由0、1、2、3、4、5、6、7、8、9共十個數字符號組成,同一個數字在不同位上表示不同的數值,例如33中的兩個1表示不同數值。“逢十進一”由0、1共兩個數字符號組成,同一個數字在不同位上表示不同的數值,例如11中的兩個1表示不同數值。“逢二進一”由0、1、2、3、4、5、6、7共八個數字符號組成,同一個數字在不同位上表示不同的數值,例如22中的兩個1表示不同數值。“逢八進一”由0、1、 2、3、4、5、6、7、8、9、A、B、C、D、E、F共16個數字符號組成,同一個數字在不同位上表示不同的數值,例如AA中的兩個1表示不同數值。“逢十六進 一”1.3計算機中的進制十(D)二(B)八(O)十六(H)基礎知識(9)101.3二進制與十進制二進制轉十進制:按權展開求和十進制整數轉二進制:除二取余直至商為0,逆序輸出二進制與十進制23 22 21 201 0 1 1(1011)2= 1* 20 + 1* 21 + 0 * 22 + 1 * 23= (11)109214202201210= (1001)2基礎知識1.3二進制與八進制二進制轉八進制:從右向左,每3位二進制數按權展開相加得到1位八進制數,高位不足三位時補0八進制轉二進制:將八進制數的每一位分解成三位二進制數,如果某位沒有足夠的二進制數,則在最左邊補零。最后舍棄最高位的0二進制與八進制(11011110)22 3 60 1 1 0 1 1 1 1 0高位不足補0=(236)83 7 20 1 1 1 1 1 0 1 0(372)8=(11111010)2高位不足補0高位不足補0舍棄最高位0八進制轉十進制: 按權展開求和例:(647) 8 = 6*82 + 4 * 81 +7 * 80 =(423)10基礎知識1.3二進制與十六進制二進制轉十六進制:從右向左,每4位二進制數按權展開相加得到1位十六進制數,高位不足四位時補0十六進制轉二進制:十六進制數通過除2取余法,得到二進制數,對每個十六進制為四個二進制,不足時在最左邊補零。最后舍棄最高位的0二進制與十六進制(1011110)25 E0 1 0 1 1 1 1 0高位不足補0=(5E)16A 71 0 1 0 0 1 1 1(A7)8=(10100111)2高位不足補0十六進制轉十進制: 按權展開求和例:(AF4) 16 = 10*162 + 15 * 161 +4 * 160 =(2804)101.3數字化采樣是將信號從連續時間(空間)域上的模擬信號轉換到離散時間(空間)域上的離散信號的過程。對于同一模擬信號,采樣的時間間隔越小,采集到的信號樣本數量越多。在相同的時間內,采樣頻率越高,采集的樣本數量越多。在對模擬信號采樣時提高采樣頻率能提高保真度。采樣1.3數字化量化是指將信號的連續取值近似為有限個離散值的過程量化就是將采樣到的信號用數字表示出來量化的過程是先將整個幅度劃分成有限個小幅度的集合,把落入某個范圍內的樣值歸為一類,并賦予相同的量化值。縱坐標劃分得越細,量化就越精細,與實際數據也越接近量化1.3數字化編碼是信息按照某種規則或格式,從一種形式轉換為另一種形式的過程。解碼是編碼的逆過程。編碼time每隔一段時間進行一段采樣,一共采11次。例如:對音頻信號,每秒鐘音頻信號采取44100個采樣點,則采樣頻率為44100hz(赫茲)將采樣后的數據進行分段,一共分8段。采樣量化Signal將時間連續的模擬信號進行采樣,轉化為時間上離散、幅度上連續的模擬信號將信號幅度劃分若干量化等級,將采樣后模擬信號與各量化等級比較,向下取最接近的量化等級的數值1.3音頻數字化time采樣量化Signal模擬音頻數字化001010011100101110111000編碼將采樣后的數據進行分段,一共分8段。將量化的8個等級,用二進制數碼表示將信號幅度劃分若干量化等級,將采樣后模擬信號與各量化等級比較,向下取最接近的量化等級的數值1.3音頻數字化聲音的保真度的影響因素有哪些?模擬信號數字化的三個步驟是什么?若某段音頻需要表示的聲音的幅度等級為248,則聲音的量化位數為多少?10分鐘的聲音信號數字化時,采樣頻率為44.1Khz,量化位數為8且是雙聲道,求該聲音文件未壓縮時文件的大小?1.3聲音編碼存儲容量(B=采樣頻率(Hz)×量化位數(bit)×聲道數×時長(s)聲音文件大小(B)采樣頻率、量化位數、聲道數采樣、量化、編碼844.1*1000*8*2*10*60/81.3字符編碼1ASCII碼(單字節碼)1960年,香農創立了數字計算機的基本字符編碼系統,即ASCII碼,用8位二進制碼為所有英文字母(大小寫共52個)、阿拉伯數字(10個)和常用的不可見控制符(33個)以及標點符號、運算符號等(33個)建立了轉換碼,第一次將符號轉換為“0”和“1”構成的編碼。48-57:數字0-965-90:大寫字母A-Z97-122:小寫字母a-z標準ASCII碼右7位二進制編碼最高位為0形式先列后行二進制轉十進制(0100 0001)2=1×26+1×20=(65)101.3字符編碼1.3字符編碼輸入內部處理機內碼(二進制編碼)輸出如通過鍵盤進行英文、漢字輸入法編碼常用拼音碼、五筆字形碼如漢字字模碼輸入輸出輸入交換碼(國標碼)2漢字編碼(雙字節碼)1.3條形碼條形碼(barcode)是將寬度不等的多個黑條和白條,按照一定的編碼規則排列,用以表達一組信息的圖形標識符。目前國際上有多種條形碼編碼方式,圖 1.3.6 為我國普遍采用的 EAN13 條形碼。這種條形碼由 13 位數字組成,前 3 位數字表示國家代碼,圖中的“690”表示中國大陸地區。最后一位叫校驗碼,用來檢查掃描到的數字是不是有錯誤,這個數字由前 12 位數字按一定規律計算得到。條形碼1.3二維碼二維條碼 / 二維碼是用某種特定的幾何圖形按一定規律在平面上(二維方向)分布的黑白相間的圖形記錄數據符號信息,二維碼的信息存儲量更大,功能也更加強大。不隨意掃描非官方的二維碼或安裝未經驗證的應用,是信息社會的基本常識。二維碼1.3圖像編碼位圖圖像(圖像)特點放大后會失真會有多個像素點,每個像素點的顏色值可以用二進制表示。矢量圖(圖形)特點放大后不會失真,文件大小與圖形的大小無關用點、直線或者多邊形等基于數學方程的幾何圖元表示的圖像。存儲容量 = 總像素 × 顏色位深度(單位:位)① 總像素 →水平像素點的個數×垂直像素點的個數。5×5② 顏色位深度→每個像素點所占的位數 → 圖像的顏色數黑白圖像:1位 2種顏色存儲容量= 5×5×1位0 1 0 1 01 0 1 0 11 0 1 0 01 1 0 1 11 0 1 0 11.3圖像編碼3 3 3 3 3 3 3 33 2 2 2 2 2 2 33 2 1 1 1 1 2 33 2 1 0 0 1 2 33 2 1 0 0 1 2 33 2 1 1 1 1 2 33 2 2 2 2 2 2 33 3 3 3 3 3 3 311 11 11 11 11 11 11 1111 10 10 10 10 10 10 1111 10 01 01 01 01 10 1111 10 01 00 00 01 10 1111 10 01 00 00 01 10 1111 10 01 01 01 01 10 1111 10 10 10 10 10 10 1111 11 11 11 11 11 11 11① 總像素 →水平像素點的個數×垂直像素點的個數。8×8② 顏色位深度→每個像素點所占的位數 → 圖像的顏色數2位 4種顏色存儲容量 = 8×8×2位1.3圖像編碼存儲容量 = 總像素 × 顏色位深度(單位:位)靜態的圖像連續播放就形成視頻視頻的編碼一般是指通過特定的壓縮技術對視頻進行壓縮。常見的視頻編碼方式有 MPEG-1、MPEG-2、MPEG-4 等1.3視頻編碼數據管理是利用計算機硬件和軟件技術對數據進行有效收集、存儲、處理和應用的過程,其目的在于充分、有效地發揮數據的作用。數據管理的定義人工管理、文件管理和數據庫管理數據管理的三個階段利用數據庫管理計算機中數據的意義:①解決數據冗余的問題。②解決維護、更新數據時需要大量的人工干預的問題。在計算機中,數據一般以文件形式存儲。計算機采用樹形目錄結構來管理文件,在widows系統中,則采用文件夾來管理文件。1.4數據管理1.4威脅數據安全因素及解決方案硬盤損壞操作失誤黑客入侵感染病毒自然災害數據本身的安全磁盤陣列防火墻/漏洞殺毒軟件異地容災加密/校驗數據備份威脅數據安全因素主動防護MD5\CRC\SHA-1校驗方法校驗是為了保證數據完整性加密是為了保證數據保密性大數據代表著信息量大、速度快、種類繁多的信息資產,需要特定的技術和分析方法將其轉化為價值。大數據的概念(1)數據體量巨大:大數據收集和分析的數據量非常大。(2)速度快:數據產生的速度快,數據處理的速度快。(3)數據類型多。(4)價值密度低。大數據的特征1.5大數據(1)大數據要分析的是全體數據,而不是抽樣數據。(2)對于數據不再追求精確性,而是能夠接受數據的混雜性。(3)不一定強調對事物因果關系的探求,而是更加注重它們的相關性。大數據思維(1)大數據讓生活更便利。(2)大數據讓決策更加精準。(3)大數據帶來新的就業需求。(4)大數據帶來新的社會問題。如信息泄露、數據安全等。大數據對社會的影響1.5大數據感謝您的觀看2024 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫