資源簡(jiǎn)介 第一章 認(rèn)識(shí)數(shù)據(jù)與大數(shù)據(jù) 檢測(cè)練習(xí)一、選擇題1.以下關(guān)于大數(shù)據(jù)描述正確的是( )A.“浙江大學(xué)”近十年來招生匯總數(shù)據(jù)規(guī)模龐大,可以稱之為大數(shù)據(jù)B.大數(shù)據(jù)給生活帶來便利的同時(shí),也帶來了數(shù)據(jù)安全等方面的社會(huì)問題C.大數(shù)據(jù)技術(shù)涉及到的數(shù)據(jù)均是非結(jié)構(gòu)化數(shù)據(jù)D.大數(shù)據(jù)思維著重關(guān)注數(shù)據(jù)之間的因果關(guān)系的探究2.“10月8日上午,中國(guó)隊(duì)結(jié)束了所有參賽項(xiàng)目的爭(zhēng)奪,最終,中國(guó)體育代表團(tuán)本屆亞運(yùn)會(huì)獎(jiǎng)牌數(shù)量為201金、111銀和71銅,共383枚獎(jiǎng)牌。”結(jié)合上述報(bào)道,下列對(duì)數(shù)據(jù)、信息的說法正確的是( )A.在紙上單獨(dú)書寫383,它就已經(jīng)被賦予一定意義B.題干中的文字即信息C.上述報(bào)道發(fā)布于一個(gè)月前,已經(jīng)不具有價(jià)值性D.由金、銀、銅牌數(shù)計(jì)算出獎(jiǎng)牌總數(shù)體現(xiàn)了統(tǒng)計(jì)者對(duì)知識(shí)的運(yùn)用3.若將十進(jìn)制數(shù)n轉(zhuǎn)換為二進(jìn)制數(shù),該二進(jìn)制數(shù)的末位是1,下列說法不正確的是( )A.該十進(jìn)制數(shù)一定是奇數(shù)B.十進(jìn)制數(shù)n和n+1所對(duì)應(yīng)的二進(jìn)制數(shù)的位數(shù)可能不同C.十進(jìn)制數(shù)n*10得到的值與在二進(jìn)制數(shù)末尾添加數(shù)字0得到的值相同D.如在轉(zhuǎn)化后的二進(jìn)制數(shù)的末尾添加一個(gè)“1”,此時(shí)除以4的余數(shù)是34.下列關(guān)于大數(shù)據(jù)的說法,正確的是( )A.大數(shù)據(jù)要分析的是全體數(shù)據(jù),而不是抽樣數(shù)據(jù),且要求數(shù)據(jù)必須是精確無誤的B.處理大數(shù)據(jù)時(shí),一般采用分治思想C.處理大數(shù)據(jù)時(shí),更注重事物的因果關(guān)系而不是相關(guān)性D.實(shí)現(xiàn)對(duì)實(shí)時(shí)數(shù)據(jù)的獲取、傳輸和存儲(chǔ)可以采用分布式系統(tǒng)完成5.2023年杭州舉辦亞運(yùn)會(huì)。在開幕式上,由億萬(wàn)星火匯聚而成的亞運(yùn)數(shù)字火炬人經(jīng)過全網(wǎng)轉(zhuǎn)播,驚艷全球。亞運(yùn)數(shù)字火炬人由來自130多個(gè)國(guó)家和地區(qū)、105791208位數(shù)字火炬手匯聚而成,在萬(wàn)眾矚目中跨越錢塘江,點(diǎn)燃主火炬塔。這是亞運(yùn)歷史上首次由數(shù)字人點(diǎn)燃火炬,也是綜合性國(guó)際體育大賽的首創(chuàng)。對(duì)于材料中的數(shù)據(jù)和信息等,下列說法不正確的是( )A.單獨(dú)的“105791208”是數(shù)據(jù),不具備任何意義B.130多個(gè)國(guó)家和地區(qū)的人民參與傳遞數(shù)字火炬,說明信息是可以共享的C.為了開幕式的點(diǎn)火儀式,技術(shù)團(tuán)隊(duì)寫下了超20萬(wàn)行代碼,是智慧的體現(xiàn)D.為了保護(hù)和提升亞運(yùn)會(huì)數(shù)據(jù)安全,不僅要提高數(shù)據(jù)本身的安全,還要保護(hù)存儲(chǔ)數(shù)據(jù)的介質(zhì)6.下列進(jìn)制運(yùn)算結(jié)果正確的是( )A.14D+1011B=25D B.1001B+9D=1010BC.1101B-1011B=10D D.1001B+1AH=37H7.現(xiàn)如今共享單車已經(jīng)成為人們出行中必不可少的一部分。當(dāng)手機(jī)掃描單車上的二維碼時(shí),會(huì)將車鎖編號(hào)發(fā)送給服務(wù)器,服務(wù)器接收到編號(hào)會(huì)給單車發(fā)送開鎖信號(hào),打開車鎖。已知某黑白二維碼(如第3題圖所示)點(diǎn)陣圖規(guī)模為16×16,若用“1”表示黑,“0”表示白,則下列描述正確的是( )A.存儲(chǔ)該二維碼需要256BB.該二維碼整體上是左右對(duì)稱的C.二維碼的規(guī)模與能夠表示的信息量成正比D.二維碼的應(yīng)用不會(huì)給人們的生活帶來安全隱患8.下列關(guān)于數(shù)字化與信息編碼說法正確的是( )A.模擬信號(hào)數(shù)字化過程需要先量化再采樣B.計(jì)算機(jī)只能處理二進(jìn)制和十六進(jìn)制數(shù)據(jù)C.電流表指針指向的電流值是模擬信號(hào)D.把 bmp 格式圖像改成jpg 格式圖像的過程是數(shù)字化9.小申打算下次與同學(xué)一起乘坐地鐵前往科技館,經(jīng)查詢,目前上海地鐵投入運(yùn)營(yíng)和在建的共有33條線路,小明用n位二進(jìn)制數(shù)對(duì)線路和站點(diǎn)分別進(jìn)行編碼。已知所有線路中站點(diǎn)數(shù)最多為36,那么n最小為( )A.10 B.11 C.12 D.1310.關(guān)于信息數(shù)字化,以下說法錯(cuò)誤的是( )A.小申拍照的過程屬于信息數(shù)字化過程B.小申錄音的過程屬于信息數(shù)字化過程C.小申用畫圖軟件處理照片的過程屬于信息數(shù)字化過程D.信息數(shù)字化是計(jì)算機(jī)處理信息的基礎(chǔ)11.小申用Ultra Edit軟件查看“25分鐘后擁堵”字符內(nèi)碼部分界面如下圖所示。下列說法不正確的是( )A.字符“分”的內(nèi)碼占兩個(gè)字節(jié)B.字符“后”的十六進(jìn)制碼是“D3 BA”C.字符“25”的十六進(jìn)制碼是“32 35”D.字符“8”的二進(jìn)制碼是“00111000”12.小申準(zhǔn)備和父母一起駕車去參觀上海科技館,他用某導(dǎo)航軟件查詢了線路,下面兩張圖是他的手機(jī)截圖,左圖是當(dāng)前路況和用時(shí),右圖是未來用時(shí)。 關(guān)于大數(shù)據(jù),以下說法錯(cuò)誤的是( )A.該導(dǎo)航軟件能預(yù)測(cè)未來用時(shí),使用的是大數(shù)據(jù)技術(shù)B.大數(shù)據(jù)具有海量的數(shù)據(jù)規(guī)模、多樣的數(shù)據(jù)類型、快速的數(shù)據(jù)流轉(zhuǎn)和價(jià)值密度高等特征C.要預(yù)測(cè)未來用時(shí),導(dǎo)航軟件要依次經(jīng)歷數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理和數(shù)據(jù)分析等過程D.大數(shù)據(jù)給生活帶來便利的同時(shí),也會(huì)引發(fā)一些社會(huì)問題13.關(guān)于信息編碼的說法,正確的是( )A.一個(gè)字節(jié)和16位二進(jìn)制的存儲(chǔ)容量相同B.十進(jìn)制數(shù)28D轉(zhuǎn)換為二進(jìn)制數(shù)是11010BC.每個(gè)ASCII碼字符在計(jì)算機(jī)中用1字節(jié)的低7位進(jìn)行編碼D.使用手機(jī)錄音的過程是將數(shù)字信號(hào)轉(zhuǎn)換成模擬信號(hào)14.下列關(guān)于數(shù)制和編碼的說法正確的是( )A.文字“神舟”使用GB2312編碼存儲(chǔ)時(shí)占用2個(gè)字節(jié)B.二進(jìn)制數(shù)1001011轉(zhuǎn)為十六進(jìn)制數(shù)為93C.聲音數(shù)字化的過程中若其他條件不變,采樣頻率越高,則聲音更保真D.64級(jí)灰度圖像的顏色位深度為8位15.下列關(guān)于大數(shù)據(jù)的說法錯(cuò)誤的是( )A.更注重事物的相關(guān)性而不是因果關(guān)系B.速度快是大數(shù)據(jù)的特征之一,僅指數(shù)據(jù)的產(chǎn)生速度快C.不再追求個(gè)別數(shù)據(jù)的精確性,允許數(shù)據(jù)混雜D.大數(shù)據(jù)要分析的是全體數(shù)據(jù),而不是抽樣數(shù)據(jù)二、填空題16.以下是字符“1小時(shí)30分”在計(jì)算機(jī)內(nèi)部的表示形式,其中,字符“3”對(duì)應(yīng)的二進(jìn)制是 、轉(zhuǎn)換成十六進(jìn)制是 。17.小申準(zhǔn)備和父母一起駕車去參觀上海科技館,他用某導(dǎo)航軟件查詢了線路,下面兩張圖是他的手機(jī)截圖,左圖是當(dāng)前路況和用時(shí),右圖是未來用時(shí)。 導(dǎo)航軟件提供了三條線路供小申選擇,小申選擇了公里數(shù)用二進(jìn)制表示為1010111的線路,他選擇的是第 條線路。18.進(jìn)制轉(zhuǎn)換(1)100轉(zhuǎn)換成二進(jìn)制( ) (2)1010 0101轉(zhuǎn)換成十進(jìn)制( )19.進(jìn)制轉(zhuǎn)換100(10)= (2)= (8)= (16)11111111(2)= (8)= (16)20.請(qǐng)完成下列進(jìn)制轉(zhuǎn)換:(10101101)2 = ( )10 (45)10 = ( )2(B5)16 = ( )10三、判斷題21.?dāng)?shù)據(jù)的無損壓縮就是未壓縮或不壓縮。( )22.知識(shí)就是智慧,數(shù)據(jù)就是信息。( )23.?dāng)?shù)字化工具與資源和傳統(tǒng)的學(xué)習(xí)工具與資源相比較,其最大的優(yōu)勢(shì)是互動(dòng)性。( )24.將聲音、文字、圖片等信息轉(zhuǎn)化為二進(jìn)制形式的過程就是信息的數(shù)字化。( )25.大數(shù)據(jù)變化快、多樣化,所以需要通過深入挖掘分析才能找到它的價(jià)值。( )四、操作題26.二維碼是用某種特定的幾何圖形按一定規(guī)律在平面上(二維方向)分布的黑白相間的圖形記錄數(shù)據(jù)符號(hào)信息。現(xiàn)有點(diǎn)陣規(guī)模為 24*24 的二維碼圖像,通過黑、白像素進(jìn)行逐個(gè)編碼,每個(gè)點(diǎn)用 1 個(gè)二進(jìn)制位(bit)表示,如果用“0”表示白點(diǎn),用“1”表示黑點(diǎn),如下圖所示:請(qǐng)回答下列問題:(1)該二維碼的第九行第一個(gè)字節(jié)(如上面左圖加框處,放大后如上面右圖所示),其二進(jìn)制編碼為 B,轉(zhuǎn)化為十六進(jìn)制編碼是 H。(2)存儲(chǔ)該二維碼需要的空間是 Byte。(3)二維碼目前廣泛應(yīng)用于漢字、數(shù)學(xué)、圖片、指紋、聲音等信息的存儲(chǔ)。下列關(guān)于二維碼的說法,正確的是( )(多選)A.二維碼是記錄數(shù)據(jù)符號(hào)信息的圖形,不同黑白相間的組合確定了二維碼的意義B.手機(jī)掃描二維碼,屬于信息的編碼過程C.掃一掃政府部門官方發(fā)布的二維碼,一般不存在安全隱患D.掃描二維碼可能感染病毒是因?yàn)槎S碼本身攜帶病毒E.付款二維碼每隔一定時(shí)間自動(dòng)更新,主要體現(xiàn)了信息的價(jià)值性27.GeoHash 是空間索引的一種方式,其基本原理是將地球理解為一個(gè)二維平面,通過把二維的空間經(jīng)緯度數(shù)據(jù)編碼為一個(gè)字符串,可以把平面遞歸分解成更小的子塊,每個(gè)子塊在一定經(jīng)緯度范圍內(nèi)擁有相同的編碼。以經(jīng)緯度為(121.43737,31.192932)為例。第一步:將經(jīng)緯度轉(zhuǎn)換為二進(jìn)制編碼規(guī)則為:先將緯度范圍(-90, 90)平分成兩個(gè)區(qū)間(-90, 0)和(0, 90),如果目標(biāo)維度位于前一個(gè)區(qū)間,則編碼為 0,否則編碼為 1,然后根據(jù)目標(biāo)緯度所落的區(qū)間再平均分成兩個(gè)區(qū)間進(jìn)行編碼,以此類推,直到精度滿足要求,經(jīng)度也用同樣的算法。4 (22.5, 45.0) (22.5, 33.75) (33.75, 45.0) 05 (22.5, 33.75) (22.5, 28.125) (28.125, 33.75) 1…… …… …… …… ……最后得到緯度的二進(jìn)制編碼為:101011000101110, 用同樣的方式可以得到經(jīng)度(121.43737)的二進(jìn)制編碼:110101100101101第二步:將經(jīng)緯度的二進(jìn)制編碼合并,從偶數(shù) 0 開始,經(jīng)度占偶數(shù)位,緯度占奇數(shù)位。經(jīng)度110101100101101,緯度 101011000101110,得到的二進(jìn)制編碼為:111001100111100000110011110110偶 奇 偶 奇 偶 奇 偶 奇 偶 奇 偶 奇 … 偶 奇 偶 奇 偶 奇 偶 奇 偶 奇索引 0 1 2 3 4 5 6 7 8 9 10 11 … 12 21 22 23 24 25 26 27 28 29經(jīng)緯度 1 1 1 0 0 1 1 0 0 1 1 1 … 0 0 1 1 1 1 0 1 1 0第三步:將合并后的二進(jìn)制數(shù)做 Base32 編碼按照每 5 位一組,分成 6 組,每組計(jì)算其對(duì)應(yīng)的十進(jìn)制數(shù)值,按照 Base32 表進(jìn)行編碼。11100 11001 11100 00011 00111 10110 轉(zhuǎn)換成十進(jìn)制是 28 25 28 3 7 22,查表編碼得到最終結(jié)果,wtw37q。林老師想編寫一個(gè) Python 程序,輸入編碼后的字符串,輸出該編碼對(duì)應(yīng)的經(jīng)緯度范圍,運(yùn)行結(jié)果如圖 a 所示:圖a(1)Python 程序如下,請(qǐng)?jiān)趧澗€處完成填空。def qj(l,r,a):#將二進(jìn)制 a 轉(zhuǎn)成對(duì)應(yīng)的經(jīng)緯度范圍#該代碼省略def find(c):#在 base32 表中查找對(duì)應(yīng)的十進(jìn)制數(shù) for i in ① : if base32[i]==c: return ibase32="0123456789bcdefghjkmnpqrstuvwxyz"s=input("請(qǐng)輸入編碼:")res=""jd=[]wd=[]for i in range(len(s)): ② ans="" j=0 while③ : ans=④ n=n//2 j+=1 res=res+ansfor i in range(len(res)): if i%2==0: jd+=res[i] else: wd+=res[i]print("經(jīng)度對(duì)應(yīng)的二進(jìn)制:",jd,"緯度對(duì)應(yīng)的二進(jìn)制:",wd)print("經(jīng)度范圍:",qj(-180,180,jd),"緯度范圍:",qj(-90,90,wd))(2)若經(jīng)緯度編碼是 wm3,那么對(duì)應(yīng)的經(jīng)度二進(jìn)制是 。五、簡(jiǎn)答題28.常見的壓縮分為哪兩種并各舉2個(gè)例子?29.請(qǐng)簡(jiǎn)述數(shù)據(jù)與信息的區(qū)別與聯(lián)系。30.當(dāng)用戶登錄某網(wǎng)站購(gòu)買、瀏覽、收藏了某些書籍后,再次登錄該網(wǎng)站時(shí),會(huì)發(fā)現(xiàn)網(wǎng)頁(yè)上增加了“你可能感興趣的書”以及“購(gòu)買此商品的顧客也同時(shí)購(gòu)買”之類的推送條目,如下圖所示。問題1:網(wǎng)站給用戶自動(dòng)推薦商品的依據(jù)是什么?采用了什么分析方法?問題2:網(wǎng)站數(shù)據(jù)可能對(duì)用戶產(chǎn)生哪些影響?參考答案:1.B2.D3.C4.B5.C6.A7.C8.C9.C10.C11.B12.B13.C14.C15.B16. 0011 0011 3317.二18. 110 0100 16519. 1100100 144 64 377 FF20. 173 101101 18121.錯(cuò)誤22.錯(cuò)誤23.正確24.正確25.正確26. 11100110 E6 72 AC27. range(0,len(base32))或 range(len(base32))或 range(0,32)或 range(32) n=find(s[i]) j<5或n>0 or j<5 str(n%2)+ans 1100100128.無損壓縮:WAV、FLAC等有損壓縮:mp3、jpg等29.區(qū)別:(1)數(shù)據(jù)是對(duì)客觀事物記錄下來的可以鑒別的符號(hào)。這些符號(hào)不僅指數(shù)字,而且包括字符、文字、圖形等;信息是經(jīng)過加工后并對(duì)客觀世界產(chǎn)生影響的數(shù)據(jù)。(2)數(shù)據(jù)是數(shù)據(jù)采集時(shí)提供的,信息是從采集的數(shù)據(jù)中獲取的有用信息。(3)數(shù)據(jù)反映的是事物的表象,信息反映的是事物的本質(zhì)。(4)數(shù)據(jù)的形式變化多端,很容易受載體的影響,信息則比較穩(wěn)定,不隨載體的性質(zhì)而隨意改變。聯(lián)系:數(shù)據(jù)是反映客觀事物屬性的記錄,是信息的具體表現(xiàn)形式。數(shù)據(jù)經(jīng)過加工處理之后,就成為信息;而信息需要經(jīng)過數(shù)字化轉(zhuǎn)變成數(shù)據(jù)才能存儲(chǔ)和傳輸。30.問題1:網(wǎng)站給用戶自動(dòng)推薦商品的依據(jù)是用戶行為。用戶行為用戶行為也叫做用戶事件,是指用戶作用于產(chǎn)品或網(wǎng)站頁(yè)面的一系列行為。比如用戶在一個(gè)電商網(wǎng)站訪問、注冊(cè)、登陸、搜索商品、瀏覽商品、對(duì)比商品、加入購(gòu)物車、提交訂單、支付訂單等具體的操作行為。采用了 聚類分析,聚類分析是一種探索性的分析,在分類的過程中,人們不必事先給出一個(gè)分類的標(biāo)準(zhǔn),聚類分析能夠從樣本數(shù)據(jù)出發(fā)、自動(dòng)進(jìn)行分類。問題2:任何事物都有兩面性,我們上網(wǎng)瀏覽、出行、購(gòu)物都被記錄了,人人都成了數(shù)據(jù)的生成者和貢獻(xiàn)者。數(shù)據(jù)帶來的整體性變革,也使得數(shù)據(jù)的隱私保護(hù)的形勢(shì)顯得越發(fā)嚴(yán)峻。 展開更多...... 收起↑ 資源預(yù)覽 縮略圖、資源來源于二一教育資源庫(kù)