資源簡介 第一章知識點梳理姓名: 班級:【第一節(jié):感知數(shù)據(jù)】數(shù)據(jù)及其演變:早在遠(yuǎn)古時代,為了記數(shù),居住在洞穴中的原始人就用石器或骨器在 ,這些圖案就是最原始的“數(shù)據(jù)”;后來,人們發(fā)明了 的方式來記事或記數(shù);隨著 ,數(shù)據(jù)以更加明確的形式被記錄下來; ,使得數(shù)據(jù)的記錄與傳輸變得便捷高效; 的發(fā)明使得保存真實的圖像變得更加便捷;直到 世紀(jì),愛迪生發(fā)明了 ,才得以將聲音記錄下來;20世紀(jì)40年代誕生了 ,成為了數(shù)據(jù)處理的主要工具; 的發(fā)展,加速了數(shù)據(jù)的傳輸與處理;隨著移動網(wǎng)絡(luò)與傳感器的普及, 進(jìn)入了人們生活的方方面面。數(shù)據(jù)與生活相比于生活中的傳統(tǒng)數(shù)據(jù),在互聯(lián)網(wǎng)時代,人們生活中的數(shù)據(jù)形式也在發(fā)生改變, , , 等技術(shù)陸續(xù)融入生活。數(shù)據(jù)的 技術(shù)迅速發(fā)展,數(shù)據(jù)的 也越來越多樣化,給人們的生活習(xí)慣帶來了巨大的改變。人們在 的同時,自身的行為也在 。互聯(lián)網(wǎng)加速了數(shù)據(jù)的 ,通過與傳統(tǒng)行業(yè)的深度融合,發(fā)展成了一種新的社會經(jīng)濟(jì)形態(tài)—— ,給傳統(tǒng)行業(yè)注入了活力。數(shù)據(jù)與科學(xué)科學(xué)研究離不開 ??茖W(xué)強(qiáng)調(diào)證據(jù),而 正好為科學(xué)研究提供了可靠的依據(jù)。世界上最大的粒子物理學(xué)實驗室: (簡稱: )。【第二節(jié):數(shù)據(jù)、信息與知識】數(shù)據(jù)數(shù)據(jù)是對 ,如 等,其中數(shù)字是最簡單的一種 ,但數(shù)據(jù)不等于 。在計算機(jī)科學(xué)中,數(shù)據(jù)是指 ,是用于 到計算機(jī)中進(jìn)行處理,具有一定意義的 等的通稱。數(shù)據(jù)的表現(xiàn)形式可以是 。單純的數(shù)據(jù)是 的,因為數(shù)據(jù)的表現(xiàn)形式還不能完全表達(dá)其內(nèi)容,經(jīng)過解釋,數(shù)據(jù)才變得有意義,數(shù)據(jù)和 是密不可分的。信息信息是指數(shù)據(jù)、 和 中所表達(dá)的 。信息是數(shù)據(jù)經(jīng)過 、 及 后產(chǎn)生的意義。信息的特征:(1) :信息是不能獨立存在的,必須 。如果存儲信息的載體遭到破壞,那么其承載的信息就消失。同一信息也可以 ,因此人們獲取信息的途徑與方法也可以不同。但信息可以脫離 被存儲和傳播,這體現(xiàn)了信息的 性。(2)時效性:信息往往反映的是 ,他會隨著時間的推移而變化,但超過時效的信息 (選填:一定/不一定)沒有價值。(3) :信息是可以共享的,同一種信息可以同時被不同的接受者獲取,人們也可以 。與 、 不同的是,信息 (選填:會/不會)因為被別人獲取而發(fā)生損耗。(4) :信息是可以加工處理的,信息經(jīng)過加工、處理、分析后,可以更好地被人們所使用。這一特征使信息具有 。(5) :信息的價值包括顯性價值與隱形價值, 指的是信息內(nèi)容本身具有價值,一般可被人們直接了解或體會; 指的是初信息內(nèi)容外的價值,包括與信息緊密相關(guān)的所有價值。信息的價值也是 ,對于不同的人群、不同的時間,其價值可能有所不同。知識知識是 的總和,也是 的成果,它包括對 、 的描述以及在教育和實踐中獲得的技能。知識是可以 和 的。知識的獲得,使人們利用自身已有的知識對信息進(jìn)行 ,進(jìn)而新的信息納入自己的知識結(jié)構(gòu)的過程。智慧智慧是一種更高層次的綜合能力,主要表現(xiàn)為 、 、 、 的能力,以及對事物發(fā)展的 。它是在 的基礎(chǔ)之上,通過認(rèn)識的累積,而形成的對事物的認(rèn)識、遠(yuǎn)見,體現(xiàn)為一種卓越的判斷力。關(guān)系當(dāng)人們孤立地看3.14時,它僅僅是一個 ;當(dāng)人們在討論圓的特性時,3.14是圓周率的近似值,這是 ;當(dāng)人們用3.14乘以半徑的平方來計算圓的面積時,這就是 ;當(dāng)人們用圓的面積的計算公式求解圓形花壇所需草皮面積時,這是 。【第三節(jié) 數(shù)據(jù)采集與編碼】數(shù)據(jù)采集在開展研究時,研究工作者往往需要收集大量的數(shù)據(jù)。早期一般是通過觀察、實驗等 得到數(shù)據(jù),并將其記錄下來,數(shù)據(jù)量較小時,可以用 進(jìn)行處理。現(xiàn)在,互聯(lián)網(wǎng)、物聯(lián)網(wǎng)的發(fā)展使得數(shù)據(jù)的獲取方式變多、獲取速度變快。傳感器隨時獲取來自 的數(shù)據(jù)(傳感器是一種能 的器件或裝置,通常由 和 組成),網(wǎng)絡(luò) 可在短時間內(nèi)獲取大量 數(shù)據(jù)(網(wǎng)絡(luò)爬蟲是一種按照一定規(guī)則, 的程序或腳本)。數(shù)字化信息可以用 和 表達(dá)。以連續(xù)變化的物理量存在,大部分存在于 。數(shù)字信號在取值上是 、 的信號,在信息技術(shù)中,這種信號表示的數(shù)據(jù)是指可被計算機(jī)存儲、處理的 數(shù)據(jù)。模擬信號與數(shù)字信號可相互轉(zhuǎn)換,如將語音通過計算機(jī)的麥克風(fēng)、聲卡等設(shè)備存儲在計算機(jī)中,這一過程實現(xiàn)了 轉(zhuǎn)換為 ,簡稱 ;反之則是 ,其中用到的主要設(shè)備是 轉(zhuǎn)換器(ADC)。數(shù)字化指的就是將 轉(zhuǎn)換成 的過程。從某種意義上說,是信息社會的技術(shù)基礎(chǔ)。將模擬信號轉(zhuǎn)換成數(shù)字信號一般需要經(jīng)過 、 和 。采樣:采樣是將信號從 的模擬信號轉(zhuǎn)換到 的離散信號的過程。對于同一模擬信號,采樣的 越小,采集到的信號樣本數(shù)量越多。叫作采樣頻率,單位用 ( )表示,在相同的時間內(nèi),采樣頻率越好,采集的樣本數(shù)量 。量化:在數(shù)字信號處理領(lǐng)域,量化指將信號的 近似為有限個 的過程。就是將采樣到的信號用 表示出來,即將模擬信號的波形轉(zhuǎn)換為數(shù)字,量化的過程是先將整個幅度劃分成 的集合,把落入某個范圍內(nèi)的樣值 ,并賦予相同的 。連續(xù)信號經(jīng)過 成為離散信號,離散信號經(jīng)過 后可用數(shù)值表示。數(shù)制(1)基本信息進(jìn)制 二進(jìn)制 十進(jìn)制 十六進(jìn)制進(jìn)位規(guī)則基本數(shù)碼位權(quán)(權(quán)值)進(jìn)制表示請在下列括號中填寫合適的標(biāo)識符使等式成立:1( )+1( )=2( ) 1( )+1( )=2( )1( )+1( )=10( ) 9( )+1( )=10( )9( )+1( )=A( ) F( )+1( )=10( )(2)相互轉(zhuǎn)換二進(jìn)制→十進(jìn)制:按權(quán)展開再相加(X進(jìn)制→十進(jìn)制:按權(quán)展開再相加)十進(jìn)制→二進(jìn)制:除二取余倒記(十進(jìn)制→X進(jìn)制:除X取余倒記)二進(jìn)制與十六進(jìn)制之間的轉(zhuǎn)換(8421法)字符編碼(1)存儲容量單位計算機(jī)中存儲容量的最小單位是 ( ) , 二進(jìn)制數(shù)碼表示 個bit,但由于1bit所能表示的值太小,實際上計算機(jī)中以 個bit為一個基本單位,即 ( )常見的單位還有KB,MB,GB等,他們的換算關(guān)系如下:ASCII碼ASCII(American Standard Code for Information Interchange, )是一套基于拉丁字母的計算機(jī)編碼系統(tǒng),主要用于顯示 和其他西歐語言。ASCII碼共有 個,占 字節(jié),利用1個字節(jié)的后 位表示,共有種編碼,二進(jìn)制編碼范圍為 ~ ,其中數(shù)字“0”的十進(jìn)制編碼為 ,大寫字母“A”的十進(jìn)制編碼為 ,小寫字母“a”的十進(jìn)制編碼為 。大小寫字母之間的十進(jìn)制編碼差值為 ,十六進(jìn)制差值為 。(3)漢字編碼漢字編碼:分為 四種。其中,外碼也叫 ,是用來將漢字 到計算機(jī)的一組鍵盤符號,形式 (選填:唯一/不唯一);GB2312屬于 碼,又稱 碼,它用 字節(jié)表示一個漢字;機(jī)內(nèi)碼又稱 碼,在計算機(jī)內(nèi)部漢字代碼都用 ;字形碼則是用于漢字的 。(4)內(nèi)碼查看為了便于查看,使用ultraedit軟件看到的內(nèi)碼用 進(jìn)制表示,查看內(nèi)碼時需要先進(jìn)行劃線分組,劃線規(guī)則是: ,如圖,字符“牛”對應(yīng)的內(nèi)碼是 ,字符“1”對應(yīng)的內(nèi)碼為 ,根據(jù)字符規(guī)則可以推算,字符“10”的內(nèi)碼為 。多媒體編碼(1)條形碼條形碼(barcode)是將寬度不等的多個黑條和白條,按照一定的編碼規(guī)則排列,用以表達(dá)一組信息的 ,條形碼技術(shù)最早產(chǎn)生于 。我國普遍采用的是 條形碼。這種條形碼由 位數(shù)字組成,前3位數(shù)字表示國家代碼,其中“690”表示 ,最后一位叫 ,用來檢查掃描到的數(shù)字是否有錯誤,這個數(shù)字由前12位數(shù)字按一定規(guī)律計算得到。(2)二維碼二維條碼/二維碼(2-dimensional bar code)是用某種特定的幾何圖形按照一定規(guī)律在平面上(二維方向)分布的 詳見的圖形記錄數(shù)據(jù)符號信息,二維碼在為人們的生活提供便利的同時,也帶來了一定的安全隱患,不隨意掃描 或安裝 ,是信息社會的基本常識。(3)聲音編碼聲音的頻率一般以 表示,記為 ,指每秒周期性振動的次數(shù),人耳可以感知到的聲音頻率范圍為 ~ , 是用來表示聲音強(qiáng)度的單位,記為dB。將模擬聲音數(shù)字化需要經(jīng)過 、 和 三個過程。常見的聲音文件類型有 (不壓縮)、 (有損壓縮)、 (微軟自帶)。(4)圖像編碼組成 文件大小相對 放大效果 常見格式位圖矢量圖常見的位圖圖像文件格式: (不壓縮,容量大), (有損壓縮,容量相對小), (背景可透明,可靜態(tài)可動態(tài)), (背景可透明)。色位關(guān)系: ,例如:黑白2色= 位,16色= 位,256色= 位,RGB顏色模式= 位。(5)視頻編碼視頻是由靜態(tài)圖像 形成的。彩色電視制式,PAL制式 幀/秒,即每秒播放 幀圖像,NTSC制式 幀/秒,即每秒播放 幀圖像。(6)數(shù)據(jù)壓縮由于數(shù)據(jù)量大,不便于存儲與傳輸,往往需要對其進(jìn)行壓縮,壓縮分為 壓縮和無損壓縮:無損壓縮指的是壓縮后的文件可完全還原,如常見的壓縮(打包)軟件rar格式,zip格式都屬于無損壓縮; 指的是壓縮后的文件無法完全還原,如聲音的壓縮格式 ,圖像的壓縮格式 ,視頻的壓縮格式 ,都屬于有損壓縮。壓縮比= : ,因此,壓縮比一定比1 (選填:大/?。?br/>【第四節(jié) 數(shù)據(jù)管理與安全】數(shù)據(jù)管理數(shù)據(jù)管理是利用計算機(jī)硬件和軟件技術(shù)對數(shù)據(jù)進(jìn)行有效 、 、 和的過程,其目的在于 。計算機(jī)數(shù)據(jù)的管理已經(jīng)經(jīng)歷了 、 和 三個階段。在人們?nèi)粘J褂玫挠嬎銠C(jī)中,數(shù)據(jù)一般以 的形式存儲。根據(jù)編碼規(guī)則的不同,文件格式也不同,用以區(qū)分不同類型的存儲數(shù)據(jù),在windows操作系統(tǒng)中,用 來表示某些特定的文件類型。常見文件格式對應(yīng)擴(kuò)展名如下表:計算機(jī)一般采用 結(jié)構(gòu)來管理文件,在windows系統(tǒng)中,則采用了更為形象的 來管理文件。每個應(yīng)用程序都有自己的數(shù)據(jù)文件,數(shù)據(jù)可能在多個文件中重復(fù)出現(xiàn),造成 。同時數(shù)據(jù)文件之間的相互關(guān)聯(lián),需要大量的人工干預(yù),給數(shù)據(jù)的 和 造成不便,這些問題直到 的出現(xiàn)才得以解決。傳統(tǒng)數(shù)據(jù)庫技術(shù)基于 數(shù)據(jù)開發(fā),憑借其數(shù)據(jù) 、 等特點,已經(jīng)成為現(xiàn)代社會數(shù)據(jù)管理的主要方式。隨著數(shù)據(jù)采集技術(shù)的提高,數(shù)據(jù)量急劇增長,大量 、 數(shù)據(jù)被源源不斷地采集起來,對于這些數(shù)據(jù),已經(jīng)很難用傳統(tǒng)的 進(jìn)行管理。現(xiàn)在,借助 、 等技術(shù),數(shù)據(jù)管理水平正不斷提高。分類 數(shù)據(jù)特點 常見文件結(jié)構(gòu)化數(shù)據(jù)非結(jié)構(gòu)化數(shù)據(jù)半結(jié)構(gòu)化數(shù)據(jù)數(shù)據(jù)安全威脅數(shù)據(jù)安全的因素有很多,如 、 、 、、 等,都有可能造成計算機(jī)中數(shù)據(jù)的損壞。保護(hù)數(shù)據(jù)安全需要保護(hù) 。主要采用主動防護(hù)的手段,如 、數(shù)據(jù)備份、 等手段,保證數(shù)據(jù)的安全。對于數(shù)據(jù)安全,不僅僅要做好防護(hù)上的安全,還應(yīng)提高 ,如通過數(shù)據(jù)加密、 等方法來提高數(shù)據(jù)的 和完整性。 ,指通過加密算法和加密密鑰將明文變成 ,而解密則是通過 將密文變成明文。數(shù)據(jù)校驗,是為保證數(shù)據(jù)的 進(jìn)行的一種驗證操作,常見的數(shù)據(jù)校驗方法有 、 、 等。【第五節(jié) 數(shù)據(jù)與大數(shù)據(jù)】大數(shù)據(jù)的概念大數(shù)據(jù)代表著 的信息資產(chǎn),需要特定的技術(shù)和分析方法將其轉(zhuǎn)換為價值。大數(shù)據(jù)的本質(zhì)是 。大數(shù)據(jù)的特征① 。即 (Volume),大數(shù)據(jù)收集和分析的數(shù)據(jù)量非常大,現(xiàn)在傳感器、互聯(lián)網(wǎng)、智能終端等每天都在源源不斷地產(chǎn)生海量數(shù)據(jù)。② 。即 (Velocity),有兩種含義,一是指 。二是指 ,在信息社會中,數(shù)據(jù)往往 變化,數(shù)據(jù)的價值也會隨著時間的推移而變化,只有高效率的數(shù)據(jù)護(hù)理技術(shù)才能充分發(fā)揮數(shù)據(jù)的價值。③ 。即 (Variety),大數(shù)據(jù)的數(shù)據(jù)來源多,既有 ,也有 。正因為大數(shù)據(jù)來自多種數(shù)據(jù)源,其數(shù)據(jù) 不可能保持一致,各種 、 和 數(shù)據(jù)共存是大數(shù)據(jù)的普遍現(xiàn)象。④ 。即 (Vaule),大數(shù)據(jù)蘊含著巨大的價值,但因其數(shù)據(jù)量龐大,可能發(fā)揮價值的僅是其中非常小的部分,價值密度相對 。價值密度的高低與數(shù)據(jù)總量的大小成 。大數(shù)據(jù)思維大數(shù)據(jù)是一場變革,改變的不僅僅是數(shù)據(jù),還有人們的思維。首先,大數(shù)據(jù)要分析的是 ,而不是 。其次,對于數(shù)據(jù)不在追求 ,而是能夠接受數(shù)據(jù)的 。在大數(shù)據(jù)處理過程中,數(shù)據(jù)的來源多種多樣,這些數(shù)據(jù)可以是 、 、也可以是。當(dāng)數(shù)據(jù)量大到一定程度時,個別數(shù)據(jù)的不準(zhǔn)確就顯得 。再次,不一定強(qiáng)調(diào)對事物 ,而是更加注重他們的 。大數(shù)據(jù)對社會的影響大數(shù)據(jù)讓生活 ;大數(shù)據(jù)讓決策 ;大數(shù)據(jù)帶來新的 ;大數(shù)據(jù)帶來新的 ,如信息泄露、 等方面社會問題。 展開更多...... 收起↑ 資源預(yù)覽 縮略圖、資源來源于二一教育資源庫