資源簡介 第1章 認識數據與大數據一、選擇題1.十進制數124轉換成二進制數是( ) 。A.1111010 B.1111100 C.1011111 D.11110112.十進制正整數n轉換為二進制數,該二進制數末位是“1”。下列說法正確的是( )A.無法確定n是奇數還是偶數B.若該二進制數的位數是4,轉換為十六進制后n的最小值是AC.n與n+1分別轉換為二進制數,這兩個二進制數的位數可能不同D.該二進制數末位的“1”去掉后,再轉換為十進制數,所得的值是(n/2)-13.某大型購物網站收集了用戶瀏覽網站的數據用于廣告個性化實時推薦,下列處理方式中合理的是( )A.應當使用統計分析軟件進行數據分析B.應當選用針對流數據的實時計算C.應當選用針對圖結構數據的圖計算D.應當選用針對靜態數據的批處理計算4.關于數制的說法,正確的是( )A.二進制數1111001轉換為十六進制數是F1B.最大的7位二進制數轉換為十進制數是128C.若十六進制數n末位為9,則十六進制數n+1末位是0D.若在一個十六進制數的末尾補1個0,則新數是原數16倍5.大數據改變的不僅是數據,還有人們的思維。針對于此,以下描述正確的是( )。A.大數據要分析的是抽樣數據 B.不接受數據的混雜性C.強調對事物因果關系的探究 D.更加注重事物的相關性6.將下列的數轉換為二進制,包含“1”的個數最多的是( )A.32H B.31D C.A0H D.256D7.下列有關數據、信息的描述不正確的是( )A.“0.618”是數據B.數據的價值往往取決于其所承載的信息C.信息是不能獨立存在的,必須依附于一定的載體D.數據是指所有能輸入到計算機并被計算機程序處理的符號總稱8.在ASCII碼表中,字符“a”的ASCII碼值是97,字符“A”的ASCII碼值是( )。A.65 B.97 C.102 D.107二、簡答題9.一篇文章有1024個漢字組成(不包括空格、標點符號等),每個漢字均采用24×24點陣的漢字字形碼表示,本篇文章全部的漢字字形碼將占用多少KB?10.什么是ASCII碼和Unicode碼?三、操作題11.哈夫曼編碼:哈夫曼編碼(Huffman Coding),又稱霍夫曼編碼,是一種編碼方式,哈夫曼編碼是可變字長編碼(VLC)的一種,該方法完全依據字符出現概率來構造異字頭的平均長度最短的碼字,有時稱之為最佳編碼,也稱霍夫曼(Huffman)編碼。霍夫曼編碼的基本方法是先對數據(如:文章)掃描一遍,計算出各數據元素(文字)出現的概率,按概率的大小指定不同長度的唯一碼字,由此得到的一張霍夫曼碼表。如:某文章只包含了“我”、“愛”、“中”、“國“四個字,它們出現的概念分別為0.125、0.125、0.2、0.3,那么它們的編碼可以分別設為1000、1001、101和11。問題:(1)計算機科學中,數據編碼是將數據轉換為幾進制數?(2)如果不采用哈夫曼編碼,你知道還有哪些漢字編碼系統?(3)你能把四個漢字的哈夫曼碼轉換為十進制數嗎?四、判斷題12.向新冠肺炎防疫人員出示健康碼,屬于信息的發布。(_______)13.圖結構中數據元素是多對多的關系。(_____)14.計算機模擬實驗也稱作“干式實驗”,不但節約器材費,而且更為有效,并能解除進行某些真正實驗所具有的危險性和不可能性。(______)15.關于新冠肺炎疫情的信息,由疫情實時大數據報告(如圖為部分數據截圖)獲知,其中用漢字、數值、加減符號描述疫情確診、治愈、死亡等情況;還可以用顏色、數據表、圖描述疫情地區分布、境外輸入確診趨勢等情況。請運用數據信息、知識與智慧之間的相互關系完成下列判斷。(1)同一客觀事物(如新冠肺炎疫情)可以用不同的數據描述。(_____)(2)在計算機科學中,僅有文字數字、數值、字符、顏色、表、圖可作為數據。(_____)(3)疫情實時數據記錄的形式有漢字、顏色、圖等,因此數據具有二進制性特征。(_____)(4)圖21-1中用深紅色突出顯示確診人數在10000以上的地區,深紅色是數據,也是載體,它所承載的信息是“新冠肺炎確診人數≥10000”。(_____)(5)信息是經過加工處理的,具有意義的數據,所以信息和數據是等價的。(_____)(6)由圖21-2可獲知“新型冠狀病毒肺炎國外新增確診人數呈上升趨勢”。(_____)(7)由圖21-1中“數據更新至2020.10.21 15:26”表明信息具有時效性,一旦超過其“生命周期”就失去原有的效用,成為歷史記錄。(_____)(8)從圖中獲取新冠疫情數據和信息,不僅能幫助我們了解疫情情況,還能幫助我們解決個人防護問題。(_____)(9)知悉新冠肺炎具有傳染性后,我們需要學習新冠肺炎預防知識進行個人防護。(_____)(10)疫情爆發后,鐘南山院士趕赴武漢,以其在病理學、流行病學等領域淵博的知識和智慧,指導抗疫工作,危難之中顯身手,為全國醫療界戰勝疫情增添了信心和力量。(_____)16.1個字節可以存放2個0~255之間的整數。(______)17.分別使用44.1kHz和22.05kHz的采樣頻率對同一段聲音進行數據編碼,前者的聲音保真度更高。(______)五、填空題18.將一個田字格的一格或幾格涂上黑色或不涂色,可以代表0~15這16個數.請你根據下面前4個圖形表示數的規律,寫出后面2個圖形表示的數,則最后兩個圖形分別表示_________ 、________。19.在微型計算機系統中,一個英文字符占1個字節,一個漢字占______ 字節20.二進制數10111011.0101對應的八進制數表示為__________。21.字符“f”的ASCII碼值的十進制為102,ASCII碼值十進制為98的字符的二進制______。22.1GB=______ B, 1TB=______ GB。23.通常先對模擬聲音信號按給定的時間間隔進行(______),然后對采樣數據進行(_______),最后將量化后的數據用計算機能夠存儲和處理的(________)表示,即(_________)。試卷第1頁,共3頁試卷第1頁,共3頁參考答案1.B2.C3.B4.D5.D6.B7.D8.A9.72KB10.參考:ASCII碼:美國信息交換標準代碼,是用8位二進制碼為所有英文字母52、阿拉伯數字10、不可見控制符33以及標點符號、運算符號33等字符提供的編碼。Unicode:又稱統一碼、萬國碼、單一碼,是計算機科學領域里的一項業界標準,包括字符集、編碼方案等。Unicode是為了解決傳統的字符編碼方案的局限而產生的,它為每種語言中的每個字符設定了統一并且唯一的二進制編碼,以滿足跨語言、跨平臺進行文本轉換、處理的要求11.(1)二進制(2)GB2312 GBK1.0(3)(1000)2=8 (1001)2=9 (101)=5 (11)=312.錯13.正確14.對15.正確 錯誤 錯誤 正確 錯誤 正確 正確 錯誤 正確 正確16.錯誤17.正確18.6 1319.220.273.2421.110001022.1024*1024*1024 102423.采樣 量化 二進制數值 編碼答案第1頁,共2頁 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫